阿里旗下又一自研大模型发布,夸克将迎来全面升级

2023-11-15 16:50:30 字數 1668 閱讀 2081

国产大模型阵营再添一员。

11月14日,阿里巴巴智能信息事业**布全栈自研、千亿级参数的夸克大模型。据悉,该大模型将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景,夸克app也将借助自研大模型进行全面升级。

资料显示,在一项检测大模型中文能力的测试中,夸克大模型拿到第一。

考虑到夸克大模型目前仍未上线。其实际表现如何,未来有待各界检验。

据github**介绍,cmmlu是一个综合性的中文评估基准,它专门用于评估语言模型在中文语境下的知识和推理能力。“cmmlu中的许多任务具有中国特定的答案,可能在其他地区或语言中并不普遍适用。”

资料显示,cmmlu涵盖了从基础学科知识到高级专业水平能力的67个主题。其中包括需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。

github**截图

观察者网发现,在cmmlu最新的zero-shot测试中,夸克大模型在“未开放测试组”中均分位列第一。

相关**截图。

同为zero-shot测试,“xuanyuan-70b”模型则在“开放测试组”中获得了均分第一名。

何为zero-shot?

有业内人士对观察者网表示,zero-shot(零次训练)是指模型在测试阶段没有接触过与具体任务相关的训练数据的情况下进行**和推理。换句话说,模型在没有进行过与特定任务相关的训练的情况下,通过利用其在其他任务上的训练经验,来解决新的任务。

另一个时常出现的是five-shot(五次训练):模型只能接触到非常有限的数据,然后通过这五个样本来进行**和推理。

five-shot和zero-shot是指在机器学习和自然语言处理中用于描述模型训练和测试的方式。这两个术语常常用于描述模型在小样本学习,比如少样本学习、元学习等等,以及迁移学习中的性能。”该人士表示,在这些情况下,模型需要具备较强的泛化能力,能够从非常有限的数据或没有具体任务相关数据的情况下,进行准确的**和推理。

资料显示,夸克大模型是基于transformer架构、自主研发的多模态大模型,每天会对亿级的**数据进行训练和精调,具有低成本、高响应、综合能力强等特点。同时,夸克大模型还将衍生出通识、医疗、教育等垂类模型,可以提供aigc、智能检索的专业服务。

据悉,夸克大模型将会优先落地在通识问答、专业搜索等信息服务领域,满足年轻人学习知识和提升自我的需求。未来,夸克大模型应用于搜索、智能工具和资产管理助手等场景,一系列ai原生应用将为年轻人工作、学习、生活提供更全面的服务。

ai时代已经来临,大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的aigc技术将会给搜索产品带来全新变化,加速迈向下一代搜索。夸克借助自研大模型将全面升级,全新的夸克很快会和大家见面。

本文系观察者网独家稿件,未经授权,不得**。

手机大模型爆发 vivo 发布自研蓝心大模型,参数追赶 GPT 3

蓝厂,它真的只想当手机厂?作者郭 思 编辑陈彩娴 月日vivo开发者大会上,vivo发布自研ai 蓝心 大模型,并发布大模型矩阵,包括亿 亿 亿 亿 亿五款不同参数规模的大模型,并宣布亿蓝心大模型实现端侧跑通,开源b大模型。其中亿参数已达到gpt 参数水平,同时vivo也是国内首家开源b大模型的手机...

vivo发布自研蓝心大模型及OriginOS 4 多领域创新成果亮相

月日, vivo开发者大会在深圳举办,大会以 同心 同行 为主题,共设有个主会场及个分会场。会上,vivo正式发布自研蓝心大模型bluelm originos 自研蓝河操作系统blueos,以及在人文关怀 生态建设等领域的最新成果,同广大开发者和生态伙伴一道,前瞻时代变革趋势与机遇,共筑产业生态繁荣...

vivo正式发布自研大模型矩阵“蓝心大模型”

月日,vivo开发者大会上,vivo正式发布vivo自研大模型矩阵 蓝心大模型 包含十亿 百亿 千亿等不同参数规模五款大模型,vivo自研操作系统originos将首发搭载,vivo称其大模型矩阵将全面开源。此前,vivo副总裁 os产品副总裁 vivo 人工智能全球研究院院长周围在一场论坛上曾介绍...