智谱AI推出第三代基座大模型ChatGLM3 适配更多国产芯片

2023-10-29 19:50:15 字數 1562 閱讀 7071

10月27日,智谱ai于2023中国计算机大会上,推出了全自研的第三代基座大模型chatglm3及相关系列产品。截至目前,智谱ai的产品已支持10余种国产硬件生态。

据介绍,通过更丰富的训练数据和更优的训练方案,智谱ai推出的chatglm3性能更加强大。chatglm3瞄向gpt-4v本次实现了若干全新功能的迭代升级,包括多模态理解能力的co**lm-看图识语义,在10余个国际标准**评测数据集上取得sota;**增强模块code interpreter根据用户需求生成**并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强webglm-接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。chatglm3的语义能力与逻辑能力得到了极大的增强。

chatglm3还集成了自研的agenttuning技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于chatglm2提升了1000% ;开启了国产大模型原生支持工具调用、**执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。

此外,chatglm3本次推出可手机部署的端测模型chatglm3-1.5b和 chatglm3-3b,支持包括vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上cpu芯片的推理,速度可达20 tokens/s。精度方面1.5b和3b模型在公开benchmark上与chatglm2-6b模型性能接近。

基于最新的高效动态推理和显存优化技术,chatglm3当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vllm 以及hugging face tgi的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千tokens仅0.5分,成本最低。

在全新升级的chatglm3赋能下,生成式ai助手智谱清言已成为国内首个具备**交互能力的大模型产品。“*功能目前已支持图像处理、数学计算、数据分析等使用场景。

随着webglm大模型能力的加入,智谱清言也具有了搜索增强能力,可以帮助用户整理出相关问题的网上文献或文章链接,并直接给出答案。

此前已发布的co**lm 模型则提高了智谱清言的中文**理解能力,取得了接近gpt-4v的**理解能力,它可以回答各种类型的视觉问题,并且可以完成复杂的目标检测,并打上标签,完成自动数据标注。

据介绍,自2023年初,智谱ai推出的glm系列模型已支持在昇腾、神威超算、海光dcu架构上进行大规模预训练和推理。截至目前,智谱ai的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光dcu、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、昆仑芯、灵汐科技、长城超云等。通过与国产芯片企业的联合创新,性能不断优化,将有助于国产原生大模型与国产芯片早日登上国际舞台。

文/北京青年报记者 温婧。

编辑/田野。

智谱AI推出第三代基座大模型ChatGLM3 性能全面突破

智谱ai推出chatglm 突破性进展在自然语言处理领域智谱ai近日推出了全自研的第三代基座大模型chatglm以及相关系列产品,引起了广泛关注。这款chatglm采用了独创的多阶段增强预训练方法,训练更为充分,在个中英文公开数据集测试中排名国内同尺寸模型首位,展现了其强大的性能和实力。此次发布会上...

智谱AI第三代基座大模型,让人工智能更智能

今天我们要聊聊一个很热门的话题,那就是智谱ai第三代基座大模型。你可能会问,什么是智谱ai?什么是基座大模型?为什么要关注它们?别着急,听我慢慢道来。智谱ai是一家由清华大学计算机系技术成果转化而来的人工智能企业,专注于中文认知大模型的研发和应用。什么是中文认知大模型呢?简单来说,就是一个能够理解中...

专注基座大模型,智谱AI已完成超25亿人民币融资

donews月日消息,近日,北京智谱华章科技 以下简称 智谱ai 宣布今年已累计获得超 亿人民币融资,参与方主要包括社保 中关村自主创新 君联资本为 管理人 美团 蚂蚁 阿里 腾讯 小米 金山 顺为 boss直聘 好未来 红杉 高瓴等多家机构及包括君联资本在内的部分老股东跟投。上述融资将用于基座大模...