夸克下场,自研大模型 超低幻觉重新定义下一代“搜索”

2023-11-29 13:30:02 字數 2786 閱讀 1535

作者:毛烁。

在互联网迅猛发展的“激荡30年中”,搜索技术曾是信息获取的“灵丹妙药”,极大地满足了用户获取信息的需求。然而,随着移动互联网时代的到来,内容的生产和**方式发生了翻天覆地的变化,传统搜索技术逐渐显露出其局限性封闭化、孤岛化显现。此时,基于大模型的aigc技术将会给搜索产品带来全新变化,推进搜索革新已经成为行业共识。

大模型时代,夸克有巨大机会创造出革新性搜索产品。”面对这个人工智能重新绘制世界边界时代,阿里巴巴集团ceo吴泳铭坚定地说。

夸克技术负责人 蒋冠军

这一次它超越gpt3.5

故事还要从2023年说起。当时夸克技术负责人蒋冠军和他的夸克团队有一个宏伟的愿景:打造一个融合搜索、使用和存储功能的智能信息产品,成为人们工作、学习和生活的贴心助手。

2023年,夸克团队开始尝试高级智能技术,对话式应用“夸克宝宝”便是在这一年诞生。

但很快,蒋冠军意识到,经历一段时间市场验证后的夸克宝宝,在智能技术能力和水平方面显得“力不从心”,而要真正成为智能助手,就必须提供更加精准、可靠的信息和服务。于是,伴随着夸克宝宝的关停,夸克团队开始改变策略。

2023年,openai开发并推出了基于gpt-3.5 架构聊天机器人。chatgpt3.5的参数规模让蒋冠军感到震惊。于是,“开发一款超越chatgpt 3.5的大型中文模型”的念头,开始在他脑海中愈发坚定。

如今,“夸克”大模型整体水平已经超越gpt-3.5,成为面向c端打造智能助手,在多语言翻译、写**、安全合规、内容创作等方面处在国内行业头部水平,不仅引入了大量aigc内容,还通过千亿级参数的加持,具备了强大的搜索能力,以及云端编辑和加工信息功能,可以切实帮助用户解决实际问题。

目前,搭载“夸克”大模型的夸克app甚至在年轻人群体中人气极高。questmobile发布的《2023年轻人群智能效率应用研究》报告显示,夸克app在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。

西风变东风 大模型数据从“量”到“质”

蒋冠军则一直坚信,要解决大模型应用的问题,就要先解决知识正确性的问题。而知识正确性正是夸克大模型的最大的差异化“亮点”之一。

在大模型领域中,所谓的“幻觉”是指大模型在回答问题时会出现答非所问的情况。用户最直观的感受就是大模型在“一本正经的胡说八道”。

从清华大学新闻学院教授、博士生导师沈阳处了解到,大模型要减少错误率,一个重要的措施就是要跟搜索引擎进行协同。而对于在搜索场景下累积了大量数据和知识的夸克大模型而言,在降低大模型的错误率方面有很大的优势。

蒋冠军强调说:“搜索引擎本身就是海量的网页数据,我们的数据库里有千亿级网页。这意味着需要有一个非常好的离线系统或工程系统,去处理大规模的网页数据,去做对齐、去重、分析等工作。这个能力本身跟大模型所需要的能力非常匹配,因为大模型就是要大算力,传统搜索引擎就具备大算力。”

事实上,现在的夸克大模型,通过结合知识图谱和丰富的行业数据,已经成功在健康和法律等特定行业中,将纯模型的幻觉率和错误率低至5%以下,处在行业领先水平。

性能“霸榜”健康、教育双管齐下

从数据上不难发现,夸克千亿级参数大模型已经登顶c-eval和cmmlu两大权威榜单,并且夸克百亿级参数大模型同样在法律、健康、问答等领域的性能评测中夺冠。

提及取得这样成绩的原因,蒋冠军坦言,这缘于夸克大模型具有四大优势:第一是全面的通用知识数据和行业知识数据,以及知识理解和评估体系。第二是得益于搜索技术体系的积累,拥有千亿级参数平台的模型训练能力。第三是拥有长期智能化产品经验的智能技术产运团队。第四是拥有全行业的知识增强技术体系及能力。

夸克大模型将全面升级夸克在搜、用、存上的智能化体验,帮助用户进一步提升效率。同时,基于多年累积的搜索优势,夸克将借助ai驱动推进搜索革新,加速迈向下一代搜索。”是夸克大模型现阶段的愿景。

事实上,在健康、教育方向,夸克大模型已经具备了发展策略和技术实力。

据悉,在健康领域,夸克大模型将重点优化信息服务,特别是在健康知识的获取和查询方面。随着大模型技术的发展,其交互能力和推理能力将与健康知识的处理需求高度契合。

蒋冠军透露,夸克未来的产品将专注于提高健康知识获取的准确性、效率以及交互方式。

夸克大模型在教育领域的探索则更为广泛。

未来,随着大模型技术的不断创新,夸克大模型将摒弃传统的搜索引擎和家庭教学方法,转而采用更为先进和高效的教学策略。

尽管当前大模型在推理和理解教育内容方面还存在挑战,夸克大模型正努力通过技术优化来克服这些问题。特别是在图形和多模态学习方面,夸克计划先行开展大量的aigc内容生产,包括文档、历史和英语等领域的教育内容。

谈及夸克大模型的未来,蒋冠军展望说:“基于多年累积的搜索优势,夸克将借助ai驱动推进搜索革新,加速迈向下一代搜索。同时,从用户需求出发,打造工作、学习、生活的ai助手,夸克app持续将迭代进化,全面升级夸克在搜、用、存上的智能化体验,帮助用户进一步提升效率。“

阿里旗下又一自研大模型发布,夸克将迎来全面升级

国产大模型阵营再添一员。月日,阿里巴巴智能信息事业 布全栈自研 千亿级参数的夸克大模型。据悉,该大模型将应用于通用搜索 医疗健康 教育学习 职场办公等众多场景,夸克app也将借助自研大模型进行全面升级。资料显示,在一项检测大模型中文能力的测试中,夸克大模型拿到第一。考虑到夸克大模型目前仍未上线。其实...

真场景炼大模型,夸克借 AI 再次 提速

大模型技术进入人们视野已经 年,带来的生产效率提高有目共睹。然而,真正的现象级应用还没有诞生,留下了极大的机会。阿里 腾讯 字节等公司,纷纷宣布用大模型重构其原有应用,拼多多最近也被 加入自研大模型的行列。而近期,另一个令人期待的玩家,也加入了战局。 月 日,阿里巴巴智能信息事业 布了千亿级参数的自...

夸克大模型 中国AI的新里程碑

相信大家都知道,ai是人工智能的简称,是指让机器具有人类的智能的科学和技术。ai的发展可以说是人类历史上最伟大的创新之一,它已经渗透到了我们生活的方方面面,比如搜索引擎 智能音箱 自动驾驶 人脸识别等等,都是ai的应用。ai的发展也引发了人类对未来的无限想象,比如能不能让机器和人类一样,能够思考 感...