金融大模型重磅升级,信创进展迅速

2023-10-23 03:20:30 字數 7378 閱讀 9000

(报告出品方:国泰君安)

恒生大模型lightgpt重磅升级,光子生态全面赋 能金融业务场景

金融大模型 lightgpt 能力全面提升

lightgpt大模型能力持续升级。2023 年 6 月 28 号恒生发布 lightgpt。 通过在模型训练数据中充实更多金融知识,lightgpt 的专业能力得到了 重大提升,大模型的多轮对话能力、**识别以及 json 格式识别取得 了相应进展。如果粗略比较,目前恒生 lightgpt 的能力和去年 11 月发 布的 gpt 3.5 应该大体持平。根据公司在金融技术大会上的介绍,在 2023 年底恒生将继续优化大模型的推理性能和逻辑能力,攻克复杂指令识别 的难关,使得任务的拆解和编排方面能够支持更复杂的业务场景。

lightgpt在各个方面的性能指标都有明显提升。大模型效果整体提升 15%,安全合规性提升 13%,推理速度提升 50%,推理和训练全面适配 华为昇腾系列,且并面向金融机构实现 lightgpt-7b 的开源。

通过投研和投顾相关的训练数据改造大模型,增强了大模型专业性。针 对投研和投顾的应用场景,只在应用或者模型的外部做文章改善是有限 的,有一些东西必须通过训练灌输到大模型中。因此,针对投研和投顾 场景,恒生利用金融专业术语、简称、监管要求等投研和投顾相关的训 练数据改造大模型,提升大模型在抽取观点、识别**和理解专业术语 等方面的能力,不断提高模型专业度。

lightgpt适配了华为腾系列,缓解算力问题。为了解决算力问题, 恒生与华为进行合作,将 lightgpt 适配到华为昇腾系列,并提供了两个 版本的数据。其中,70b 的版本是恒生生产用的大模型,而 13b 的版本 则是方便各机构练手的小规模模型。

lightgpt用专门的金融数据训练,不断提升安全合规性。如果大模型 不用专门的金融数据进行训练,就不能很好地应对安全合规方面的挑战, 会出现幻觉、合规风险和缺乏依据等各种问题。因而,公司基于专业金 融数据,有助于从根本上提升模型的合规性。

光子系列产品打通金融ai 应用的最后一公里

光子生态与大模型强强互补。光子是介于应用场景和大模型中间层的一 个完整生态,是金融应用对接大模型的“中控”部位。光子生态建设包 含三个层次:第一层是适配大模型,中间层是提供公用能力,第三层是 场景落地。光子生态可以与大模型实现优势互补,解决大模型数据的实 效性和事实性问题。另外,大模型本身虽然有一道保险,但仍然存在安 全合规的问题,而光子在应用过程中有双保险提供全面保障机制,可以 实现全流程自动化安全管控和实时高效的安全处理。

光子三大连接构建智能金融。光子有三大连接,首先,连接模型,充分 发挥大模型的能力。其次,连接金融行业专属资源。资源主要来自金融 机构,具有不同于 c 端用户的特点。最后,连接应用场景,对接各种应 用。在连接资源方面,恒生光子结合本地知识、金融数据以及专业知识 站点为用户提供更精准和及时的答案。在连接模型方面,光子可以实现 模型接入统一管控并屏蔽模型对接差异,使其不仅能够连接 lightgpt 本 身,还可以连接国内其他可用的大模型。在连接应用方面,光子提供简 单的配置,使应用与大模型的对接变得非常简单,让几分钟开发一个应 用成为可能。

光子系列产品可以为金融机构的投顾、合规、客服、运营等业务注入ai能力,成为金融从业人员的智能助手。恒生大模型在应用场景的尝试包 括重塑模式和嵌入模式。重构模式是基于大模型能力重构应用。

在重构 模式下,恒生结合数据、资源以及大模型的语言和知识能力打造四大“新 物种”,分别是光子·文曲、光子·方圆、光子·善策和光子·慧营。“新 物种”可以利用人工智能大模型的能力代替人类完成相关岗位的工作, 其中,光子·文曲是面向投资顾问的一站式内容创作平台,光子·方圆 专注于投资合规领域,光子·善策聚焦投顾咨询场景,光子·慧营则定 位于资管与托管产品的运营助手。

嵌入模式是指将大模型的能力作为 copilot 嵌入到原有应用系统中,通过光子对接应用自身的 api 和数据要素进行相应的提取和扩展。恒生嵌入模式下的产品包括光子·问学和光 子·数见。光子·问学是金融业务岗前培训的学习陪伴助手。光子·数 见是在数据中台基础上叠加大模型的语言能力,提供业务数据智能查询 与分析等服务。

恒生将持续构建以光子为核心的生态系统,完善智能产品矩阵。光子生 态包括重塑模式和嵌入模式。重塑模式下,人工智能将替代人类完成工 作,而嵌入模式将变革现有产品的操作交互方式。通过引入大模型,用 户在使用嵌入模式的产品时将能够用语言指令控制既有应用,实现一步 到位的操作。为了打造嵌入模式的产品,恒生计划在原有系统界面中添 加一个对话框,用户可以通过对话框与光子对话。光子能够连接后台 api, 从而提供更加智能和高效的服务。此外,重塑模式和嵌入模式可以交织 在一起,形成 agent 智能体。智能体可以将复杂指令拆解为单个步骤, 调用和组合不同的能力完成任务。大模型赋能后,传统应用可能将变成 一个个服务,而真正的应用可能就是大模型的对话框。

2. warrenq焕新升级,助力投研数智化发展

2.1. warrenq产品升级,一站式投研工具平台持续完善

智能投研平台warrenq全新升级,推出warrenq小程序、chatminerai写作和语音速记别等全新功能。第一,warrenq chat 推出全新移动端应用程序,用户可以随时随地获取金融信息、行业概况、研究报告观点、 公司 f9 数据和行业 edb 数据等信息都可以在微信小程序中轻松获取。

第二,chatminer能力升级。warrenq 针对上百页的大文档场景进行特 殊优化,实现文档解析速度和数据读取速度的大规模提升。在 chatminer 的帮助下仅需十几秒就可以完成对 500 页招股说明书的文档解析。 warrenq 还根据研究员的关注焦点优化问题推荐。完成文档解析后, chatminer 会自动推荐相关问题,如公司主营业务、行业排名以及市场竞 争格局等,用户点击推荐问题即可快速定位到相关信息。

第三,warrenq推出ai写作新功能。ai 写作结合了 warrenq 的三段式 脑图和 gpt 能力,用户只需输入标题,系统就会生成一个大纲。用户可 以查看大纲,确认内容是否符合预期。如果满意,用户可以根据每个子 标题生成相应的段落,每个段落都支持溯源,用户可以清楚了解生成内 容的**。

第四,warrenq发布语音速记新功能。用户可以将录音上传至 warrenq 的语音速记实时进行语音转录。语音速记能够自动识别讲解人,实现录 音片段与文字的一一对应。如果用户不理解某段文字,只需点击对应的 录音片段,系统即可将其定位至录音中的相应时间点。warrenq 还将 chatminer 与语音速记相连接,助力用户提升工作效率。如果录音时间过 长,用户可以直接向 chatminer 提问而无需阅读文字内容,借助 chatminer 的快速解读能力,获取录音的关键信息。

金融行业大模型需求场景调研显示,私有库问答场景需求量最大。私有 库问答属于 rag 类应用,基于大模型和向量数据库将金融机构自有积 累的知识库通过 chat 形式实现友好问答。智能投顾/投研的 chat 助手的 需求量排名次之。恒生聚源首先通过投研方式让大模型能够处理大量金 融数据,再引入话术生成和推荐策略,并结合内部和外部的知识库,最 终形成一个 all in one 的 chat 型小助手。大规模文档的深度挖掘和问答 场景的需求量排名第三。处理大规模文档时,需要将大模型与其他相关 ai 技术结合,从而实现针对招股说明书、公告、研报等的深度问答、比 对、挖掘以及辅助写作功能。

大模型技术使得all in one成为可能,一个大模型底座可以支持n个场 景。在传统的 nop 方法中,针对不同的业务场景通常需要训练和维护多 个小模型,每个小模型都需要针对特定的任务开发。但是大模型的出现 让 all in one 成为可能,基于一个大模型底座就能够支持 n 个场景。面 向落地应用,大模型增强方式主要有两个方向。第一个方向是数据增强, 即类 rag 的方向。第二个方向是外挂工具。warrenq 已经集成了众多投 研领域的常用工具,比如常见的问答形式、脑图形式、笔记形式、语音 速记和** excel 和 word 文档等。由于金融领域的数据是 tb 级别的数 据,因此语控万数成为了大模型+n 场景的一大难点问题,也是技术上必 须攻克的难点和重点问题。只有找到准确的数据,才能打通落地场景的 通道,实现真正的应用。

2.2. warrenq多场景落地,持续加强金融垂域“搜读算写”

恒生聚源参与了工银瑞信最新大模型创新项目fundgpt的建设。在其 中部署了 warrenq chat 和 chatminer 两款落地型产品,并使用向量数据 库技术帮助客户对接内部知识库,成功构建了一个覆盖投研、财富、投 教等大规模场景的 all in one 的智能问答小助手。

公司对券商投行业务场景进行了优化。投行业务涉及众多大规模文档, 如招股说明书和相关底稿等,处理四五百页的大规模文件既耗时又繁杂。 恒生聚源大模型技术可以优化这一场景,首先利用 pdf 解析技术创建智 能目录,对招股说明书和底稿进行结构化处理,从而帮助用户快速找到 所需信息,大大节省文档查找和整理时间。其次,使用大模型+向量库+ 数据库的方式,实现底稿与正文的精确匹配,直接溯源文件内容与数据, 提高文件核查的效率和准确性。

针对固收场景同样进行了性能提升。固收场景同样涉及海量数据,包括 信用数据、地方经济内外部评级和市场资讯等数据。恒生聚源首先将固 收场景的各种数据与大模型建立一一映射,再围绕固收场景其他需要引 用的内容,利用大模型强大处理能力赋能整个固收问答。

恒生聚源也通过使用大模型,针对投顾、投研人员的业务需求,为其业 务过程各关键环节提供内容支持和工作引导,辅助金融从业人员提供更 好的服务,达到提升效率和降低成本的效果。

目前恒生聚源已经与十几家金融客户进行大模型在实际应用场景的共创,未来将进一步赋能业务场景和业务团队。恒生聚源从 2023 年 6 月 28 日开始进行大模型产品的初尝试,到现在已经与十几家金融客户共同 探索了如何将大模型技术应用于实际业务场景。在金融技术大会上,公 司表示也将带来更加深度场景化的产品,真正将大模型技术融入金融从 业者的日常工作流程中,形成数据闭环和数据飞轮。基于 datascience 的 思路,warrenq 将根据数据分布给出更智能的推荐,使大模型真正变成 贴心陪伴的小助手。

比肩微软copilotwarrenq“搜读算写”深入金融垂域,更具特色。“搜”,warrenq chat 对标微软的 new bing,其与 new bing 最大的区别 在于 warrenq chat 的底层可以访问聚源全库,并链接金融库。这些金融 库的数据来自聚源数据库,确保了数据的准确度和权威性,从而避免大 模型胡说八道。“读”,微软 copilot 主要进行自动摘要,而 warrenq 基 于 chatminer 产品,深入招股书、研报、公告等各个场景。warrenq 可 以对 500 多页的招股书进行快速解析,并自动推荐研究员关注的问题。 “算”,微软 copilot 结合 excel与 gpt 提供数据分析等服务,而 warrenq 在演算板上提供金融板的数据浏览器、金融板的变量计算,并且基于金 融域常用场景搭建**估值模型。“写”,warrenq 新上线的三段式脑图 是一个 all in one 的文档,支持 markdown、word 和 ppt 格式的随意切 换,并且可以用 gpt 续写大纲和脑图,其特色是能够插入可自动更新的 活数据,底层由聚源数据库提供支撑,保证用户更好地在金融场景内开 展业务。

本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告**:幻影视界

AI大模型引发金融科技深度变革,博彦科技全速启航

谁将历经千帆成为中国版openai?一切都是未知数。但不可否认的是,随着各种版本的ai大模型相继落地,ai发展新时代已然开启。而面对这一背景,数据的重要性日益凸显。数据与算力 算法,无疑是关系着大模型技术商业化落地成败的关键。多家 也报道称,决定大模型质量和商业化落地的核心要素就是数据。所以,对于既...

重磅!南开迎水道B地块重启!金融街承债式收购!

内部人士透露,本周刚签完协议,金融街承债式收购南开迎水道b地块,这次终于尘埃落定,案名也已经在审批中。月日,金融街控股股份 披露第十届董事会第二次会议决议公告。在该公司第十届董事会第二次会议上,以全员赞成审议通过了关于收购天津房开咨询 股权的议案。具体包括,同意公司全资子公司天津丽湖融景置业 以股权...

国家金融监管总局发布会,重磅发声!

月日,国家金融监管总局召开年三季度银行业保险业数据信息新闻发布会,介绍年三季度银行业保险业运 况,并回应了普惠金融 人身保险 防范化解金融风险 金融对外开放等热点话题。总的来看,三季度末,银行保险机构经营和监管指标处于合理区间,服务实体经济质效不断增强,为经济持续回升向好营造良好的金融环境,银行保险...