金融大模型重磅升级，信创进展迅速

（报告出品方：国泰君安）

恒生大模型lightgpt重磅升级，光子生态全面赋能金融业务场景

金融大模型 lightgpt 能力全面提升

lightgpt大模型能力持续升级。2023 年 6 月 28 号恒生发布 lightgpt。通过在模型训练数据中充实更多金融知识，lightgpt 的专业能力得到了重大提升，大模型的多轮对话能力、**识别以及 json 格式识别取得了相应进展。如果粗略比较，目前恒生 lightgpt 的能力和去年 11 月发布的 gpt 3.5 应该大体持平。根据公司在金融技术大会上的介绍，在 2023 年底恒生将继续优化大模型的推理性能和逻辑能力，攻克复杂指令识别的难关，使得任务的拆解和编排方面能够支持更复杂的业务场景。

lightgpt在各个方面的性能指标都有明显提升。大模型效果整体提升 15%，安全合规性提升 13%，推理速度提升 50%，推理和训练全面适配华为昇腾系列，且并面向金融机构实现 lightgpt-7b 的开源。

通过投研和投顾相关的训练数据改造大模型，增强了大模型专业性。针对投研和投顾的应用场景，只在应用或者模型的外部做文章改善是有限的，有一些东西必须通过训练灌输到大模型中。因此，针对投研和投顾场景，恒生利用金融专业术语、简称、监管要求等投研和投顾相关的训练数据改造大模型，提升大模型在抽取观点、识别**和理解专业术语等方面的能力，不断提高模型专业度。

lightgpt适配了华为昇腾系列，缓解算力问题。为了解决算力问题，恒生与华为进行合作，将 lightgpt 适配到华为昇腾系列，并提供了两个版本的数据。其中，70b 的版本是恒生生产用的大模型，而 13b 的版本则是方便各机构练手的小规模模型。

lightgpt用专门的金融数据训练，不断提升安全合规性。如果大模型不用专门的金融数据进行训练，就不能很好地应对安全合规方面的挑战，会出现幻觉、合规风险和缺乏依据等各种问题。因而，公司基于专业金融数据，有助于从根本上提升模型的合规性。

光子系列产品打通金融ai 应用的最后一公里

光子生态与大模型强强互补。光子是介于应用场景和大模型中间层的一个完整生态，是金融应用对接大模型的“中控”部位。光子生态建设包含三个层次：第一层是适配大模型，中间层是提供公用能力，第三层是场景落地。光子生态可以与大模型实现优势互补，解决大模型数据的实效性和事实性问题。另外，大模型本身虽然有一道保险，但仍然存在安全合规的问题，而光子在应用过程中有双保险提供全面保障机制，可以实现全流程自动化安全管控和实时高效的安全处理。

光子三大连接构建智能金融。光子有三大连接，首先，连接模型，充分发挥大模型的能力。其次，连接金融行业专属资源。资源主要来自金融机构，具有不同于 c 端用户的特点。最后，连接应用场景，对接各种应用。在连接资源方面，恒生光子结合本地知识、金融数据以及专业知识站点为用户提供更精准和及时的答案。在连接模型方面，光子可以实现模型接入统一管控并屏蔽模型对接差异，使其不仅能够连接 lightgpt 本身，还可以连接国内其他可用的大模型。在连接应用方面，光子提供简单的配置，使应用与大模型的对接变得非常简单，让几分钟开发一个应用成为可能。

光子系列产品可以为金融机构的投顾、合规、客服、运营等业务注入ai能力，成为金融从业人员的智能助手。恒生大模型在应用场景的尝试包括重塑模式和嵌入模式。重构模式是基于大模型能力重构应用。

在重构模式下，恒生结合数据、资源以及大模型的语言和知识能力打造四大“新物种”，分别是光子·文曲、光子·方圆、光子·善策和光子·慧营。“新物种”可以利用人工智能大模型的能力代替人类完成相关岗位的工作，其中，光子·文曲是面向投资顾问的一站式内容创作平台，光子·方圆专注于投资合规领域，光子·善策聚焦投顾咨询场景，光子·慧营则定位于资管与托管产品的运营助手。

嵌入模式是指将大模型的能力作为 copilot 嵌入到原有应用系统中，通过光子对接应用自身的 api 和数据要素进行相应的提取和扩展。恒生嵌入模式下的产品包括光子·问学和光子·数见。光子·问学是金融业务岗前培训的学习陪伴助手。光子·数见是在数据中台基础上叠加大模型的语言能力，提供业务数据智能查询与分析等服务。

恒生将持续构建以光子为核心的生态系统，完善智能产品矩阵。光子生态包括重塑模式和嵌入模式。重塑模式下，人工智能将替代人类完成工作，而嵌入模式将变革现有产品的操作交互方式。通过引入大模型，用户在使用嵌入模式的产品时将能够用语言指令控制既有应用，实现一步到位的操作。为了打造嵌入模式的产品，恒生计划在原有系统界面中添加一个对话框，用户可以通过对话框与光子对话。光子能够连接后台 api，从而提供更加智能和高效的服务。此外，重塑模式和嵌入模式可以交织在一起，形成 agent 智能体。智能体可以将复杂指令拆解为单个步骤，调用和组合不同的能力完成任务。大模型赋能后，传统应用可能将变成一个个服务，而真正的应用可能就是大模型的对话框。

2. warrenq焕新升级，助力投研数智化发展

2.1. warrenq产品升级，一站式投研工具平台持续完善

智能投研平台warrenq全新升级，推出warrenq小程序、chatminerai写作和语音速记别等全新功能。第一，warrenq chat 推出全新移动端应用程序，用户可以随时随地获取金融信息、行业概况、研究报告观点、公司 f9 数据和行业 edb 数据等信息都可以在微信小程序中轻松获取。

第二，chatminer能力升级。warrenq 针对上百页的大文档场景进行特殊优化，实现文档解析速度和数据读取速度的大规模提升。在 chatminer 的帮助下仅需十几秒就可以完成对 500 页招股说明书的文档解析。 warrenq 还根据研究员的关注焦点优化问题推荐。完成文档解析后， chatminer 会自动推荐相关问题，如公司主营业务、行业排名以及市场竞争格局等，用户点击推荐问题即可快速定位到相关信息。

第三，warrenq推出ai写作新功能。ai 写作结合了 warrenq 的三段式脑图和 gpt 能力，用户只需输入标题，系统就会生成一个大纲。用户可以查看大纲，确认内容是否符合预期。如果满意，用户可以根据每个子标题生成相应的段落，每个段落都支持溯源，用户可以清楚了解生成内容的**。

第四，warrenq发布语音速记新功能。用户可以将录音上传至 warrenq 的语音速记实时进行语音转录。语音速记能够自动识别讲解人，实现录音片段与文字的一一对应。如果用户不理解某段文字，只需点击对应的录音片段，系统即可将其定位至录音中的相应时间点。warrenq 还将 chatminer 与语音速记相连接，助力用户提升工作效率。如果录音时间过长，用户可以直接向 chatminer 提问而无需阅读文字内容，借助 chatminer 的快速解读能力，获取录音的关键信息。

金融行业大模型需求场景调研显示，私有库问答场景需求量最大。私有库问答属于 rag 类应用，基于大模型和向量数据库将金融机构自有积累的知识库通过 chat 形式实现友好问答。智能投顾/投研的 chat 助手的需求量排名次之。恒生聚源首先通过投研方式让大模型能够处理大量金融数据，再引入话术生成和推荐策略，并结合内部和外部的知识库，最终形成一个 all in one 的 chat 型小助手。大规模文档的深度挖掘和问答场景的需求量排名第三。处理大规模文档时，需要将大模型与其他相关 ai 技术结合，从而实现针对招股说明书、公告、研报等的深度问答、比对、挖掘以及辅助写作功能。

大模型技术使得all in one成为可能，一个大模型底座可以支持n个场景。在传统的 nop 方法中，针对不同的业务场景通常需要训练和维护多个小模型，每个小模型都需要针对特定的任务开发。但是大模型的出现让 all in one 成为可能，基于一个大模型底座就能够支持 n 个场景。面向落地应用，大模型增强方式主要有两个方向。第一个方向是数据增强，即类 rag 的方向。第二个方向是外挂工具。warrenq 已经集成了众多投研领域的常用工具，比如常见的问答形式、脑图形式、笔记形式、语音速记和** excel 和 word 文档等。由于金融领域的数据是 tb 级别的数据，因此语控万数成为了大模型+n 场景的一大难点问题，也是技术上必须攻克的难点和重点问题。只有找到准确的数据，才能打通落地场景的通道，实现真正的应用。

2.2. warrenq多场景落地，持续加强金融垂域“搜读算写”

恒生聚源参与了工银瑞信最新大模型创新项目fundgpt的建设。在其中部署了 warrenq chat 和 chatminer 两款落地型产品，并使用向量数据库技术帮助客户对接内部知识库，成功构建了一个覆盖投研、财富、投教等大规模场景的 all in one 的智能问答小助手。

公司对券商投行业务场景进行了优化。投行业务涉及众多大规模文档，如招股说明书和相关底稿等，处理四五百页的大规模文件既耗时又繁杂。恒生聚源大模型技术可以优化这一场景，首先利用 pdf 解析技术创建智能目录，对招股说明书和底稿进行结构化处理，从而帮助用户快速找到所需信息，大大节省文档查找和整理时间。其次，使用大模型+向量库+ 数据库的方式，实现底稿与正文的精确匹配，直接溯源文件内容与数据，提高文件核查的效率和准确性。

针对固收场景同样进行了性能提升。固收场景同样涉及海量数据，包括信用数据、地方经济内外部评级和市场资讯等数据。恒生聚源首先将固收场景的各种数据与大模型建立一一映射，再围绕固收场景其他需要引用的内容，利用大模型强大处理能力赋能整个固收问答。

恒生聚源也通过使用大模型，针对投顾、投研人员的业务需求，为其业务过程各关键环节提供内容支持和工作引导，辅助金融从业人员提供更好的服务，达到提升效率和降低成本的效果。

目前恒生聚源已经与十几家金融客户进行大模型在实际应用场景的共创，未来将进一步赋能业务场景和业务团队。恒生聚源从 2023 年 6 月 28 日开始进行大模型产品的初尝试，到现在已经与十几家金融客户共同探索了如何将大模型技术应用于实际业务场景。在金融技术大会上，公司表示也将带来更加深度场景化的产品，真正将大模型技术融入金融从业者的日常工作流程中，形成数据闭环和数据飞轮。基于 datascience 的思路，warrenq 将根据数据分布给出更智能的推荐，使大模型真正变成贴心陪伴的小助手。

比肩微软copilotwarrenq“搜读算写”深入金融垂域，更具特色。“搜”，warrenq chat 对标微软的 new bing，其与 new bing 最大的区别在于 warrenq chat 的底层可以访问聚源全库，并链接金融库。这些金融库的数据来自聚源数据库，确保了数据的准确度和权威性，从而避免大模型胡说八道。“读”，微软 copilot 主要进行自动摘要，而 warrenq 基于 chatminer 产品，深入招股书、研报、公告等各个场景。warrenq 可以对 500 多页的招股书进行快速解析，并自动推荐研究员关注的问题。 “算”，微软 copilot 结合 excel与 gpt 提供数据分析等服务，而 warrenq 在演算板上提供金融板的数据浏览器、金融板的变量计算，并且基于金融域常用场景搭建**估值模型。“写”，warrenq 新上线的三段式脑图是一个 all in one 的文档，支持 markdown、word 和 ppt 格式的随意切换，并且可以用 gpt 续写大纲和脑图，其特色是能够插入可自动更新的活数据，底层由聚源数据库提供支撑，保证用户更好地在金融场景内开展业务。

本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

精选报告**：幻影视界

金融大模型重磅升级，信创进展迅速

AI大模型引发金融科技深度变革，博彦科技全速启航

重磅！南开迎水道B地块重启！金融街承债式收购！

国家金融监管总局发布会，重磅发声！

金融大模型重磅升级，信创进展迅速

AI大模型引发金融科技深度变革，博彦科技全速启航

重磅！南开迎水道B地块重启！金融街承债式收购！

国家金融监管总局发布会，重磅发声！

相關推薦