大模型治理蓝皮报告2023年从规则走向实践

今天分享的是【大模型治理蓝皮报告2023年-从规则走向实践】报告出品方：中国信通院。

精选报告**公枞号：全球行业报告库

| 对大模型的基本认识

1.大模型（llm，largelanguagemodel）指的是具有超大参数规模，建立在多头自注意力机制transformer架构之上，以深度神经网络为基础，用海量文本数据预训练而成的语言模型。以chatgpt为代表的大模型能够模拟人类的创造性思维，生成具有一定逻辑性和连贯性的语言文本、图像、音频等内容。大模型基于大数据、大算力、多模态的技术优势，实现从感知世界、理解世界向创造世界的跃迁，推动人类社会加速迈向人机共生的智能社会阶段。

2.大模型体现出三方面技术趋势：一是从决策式ai到生成式ai。决策式ai主要是通过分类回归对数据进行分析，主要应用于图像识别、推荐系统、决策智能体等领域。生成式ai借助transformer架构等，具有全局表征能力强、高度并行性、通用性强、可扩展性强等优势，主要应用于内容创作、科研、人机交互等领域，实现了从简单感知到内容创造的跃迁。二是从单模态模型到多模态模型。多模态是指通过处理和关联来自多种模态的多源异构数据，挖掘分析信息、提高模型能力的学习方法。典型任务是图像/**语言间的跨模态预训练、跨模态定位等，如给定文本生成一段对应的声音、图像/**与文本的相互检索或生成等。三是从亿级到千亿、万亿级参数的预训练模型。大模型指的正是模型参数规模庞大，大模型参数规模从亿级发展到百亿、千亿级别，并向着更高规模的参数探索。例如，gpt-3参数量达1750亿，文心一言参数规模为2600亿等。随着参数规模的增长，模型能力也得到显著提升。

| 大模型的变革影响

1)大模型实现了高质量、高效率、多样化的内容生产，成为推动内容生产方式变革的重要力量。一是信息内容生产主体发生显著变革。人工智能在信息收集、筛选和整合、推理的全过程都能替代人力，极大地解放人力资源。二是信息内容生产效率快速提升。大算力驱动强算法处理大数据，在自然语言处理、计算机视觉、自动驾驶、等各领域多种任务上，都能高质量作出结果判断，高效率进行内容生成。三是信息内容传播出现颠覆性变化。信息的生产、传播更加便利，尤其是降低了专业知识的获取门槛。信息内容的表现形态更加丰富，利用人工智能创生技术，图、文、**等相互转换更加自由，可以一键生成“数字人”分身，开启智能互联时代。

2)大模型是迈向通用人工智能的重要技术探索。一是具备了与人类智能相媲美的综合智能能力。大模型的能力不再局限于自然语言、视觉等特定方面，而是具备了执行一般智慧行为的能力，广泛拓展了人工智能技术的适用范围。二是具备了通用型技术能力的潜力。业界普遍认为，大模型是智能时代的关键基础底座，各领域不再需要单独开发人工智能，仅需调用大模型接口即可。将来可能构建出新的应用生态、创造新的用户接口，并带来潜在商业模式的变革。三是具备了赋能千行百业的适应性。大模型可作为底层技术，垂直应用于各个产业和复杂场景。这种可以嫁接千行百业的智能生产力，正在重塑和影响未来生活。

| 大模型引领数字化变革

a.大模型体现出强智能性、强通用性、强交互性，为进一步的产业革新与数字**发展奠定了坚实的基础。根据麦肯锡报告，生成式人工智能每年或将为全球gdp增加2.6-4.4万亿美元。根据marketsandmarkets报告，2023年全球生成式人工智能的市场规模预计为110.3亿美元，2023年预计将达到518亿美元，年复合增长率达35.6%。

b.凭借大数据、大市场、多场景优势，人工智能与交通、医疗、工业等传统行业深入融合，涌现出一批新业态新模式。在工业领域，大模型实现汽车、建模等设计的自动优化、打造3d模型、通过智能物流、智能安防实现智能化管理；在医疗领域，大模型实现蛋白质分子的结构**、辅助医生影像读片与分析病例报告，推出ai陪护与交互式心理咨询；在金融领域，大模型催生了数字员工，借助ai客服、ai投资顾问、ai财务实现服务的自动化，并进一步优化投资管理与风险管理。据埃森哲预计，2023年人工智能应用将为制造业带来4万亿美元额外增长，年增长率可达4.4%。

| 大模型带来的典型风险

一是大模型的生成“幻觉”问题引发生成内容不可信。生成幻觉通常指模型按照流畅正确的语法规则产生的包含虚假信息甚至无意义内容的文本。幻觉一般被认为是模型生成的文本不遵循原文或不符合事实，在大模型场景下主要指不符合事实，即出现“一本正经胡说八道”的情形。幻觉产生的本质原因是大模型的输出结果是根据概率推理而成的，这导致了大模型可能针对一个原本模糊或者不确定的**，给出一个“过度自信”的结果。因此，openai公司首席技术官miramurati亦指出，chatgpt和底层大型语言模型的最大挑战是其会编造错误的或不存在的事实。

二是大模型的“涌现”效应带来模型能力不可控。所谓智能“涌现”，是指大语言模型在没有经过针对性训练的任务，包括需要复杂推理能力的任务中，同样表现出卓越的性能。这种“智能涌现”能力通常在小模型中未被发现，而只会在具备一定规模的大模型**现。目前仅能够明确观测到当模型大小超过一定阈值时，模型各方面综合能力得到质变式爆发增长的“涌现”现象，但却无法确定“涌现”的阈值所在，这使现有大模型的“智能涌现”能力具有突发性、不可**性和不可控性，例如，在某用户故意“激怒”chatgpt后，后者威胁将披露该用户的ip、居所等个人信息，甚至损害其名誉。不少人工智能研究人员亦发出警告，如果控制不当，足够强大的人工智能模型可能超越人类智能成为地球主导力量，引发灾难性后果。

| 大模型在社会维度引发的风险挑战

一是冲击就业市场，提升劳动力转型下的社会不安定性。虽然大模型带来的岗位智能化升级将提升社会生产效率、创造新兴岗位，但也会导致特定领域或人群的失业危机。大模型对初等和中等技能白领岗位需求的冲击较大，从事重复性、机械性等工作的劳动者将极易被大模型工具替代。据高盛研究报告分析，以美国为例，46%的行政工作和44%的法律工作将受到较高程度的影响。在此趋势下，相当数量的劳动者需在短期内进行与社会新需求相匹配的职业转换，这对他们的经济收入、社会地位、身心健康都可能产生较大影响，如果大规模劳动力转型不当甚至有可能引发社会动荡等风险。

二是扩大数字鸿沟，加剧社会分化和不平等。大模型的拥有程度、应用程度以及创新能力的差别将引发信息落差，进而造成新一轮数字鸿沟，甚至加剧社会分化和不平等。从国家与地区层面来看，在大模型加速迭代的进程中，仅有少数发达国家能够能够凭借庞大的数据、算力等资源进一步掌控生产力资源，这将进一步扩大发达国家与发展中国家的差距。例如，美国的gpt-4总共包含了1.8万亿参数，一次的训练成本为6300万美元，非百亿美金公司很难持续跟进。从组织和个人层面来看，大模型服务对于不同群体的可得性是不同的。部分地区或群体可能由于无法获得高质量的互联网连接、教育水平与专业背景不足等原因，无法有效且正确地使用gpt技术。这会使得chatgpt等技术成为精英阶层提升和优化生产力的有力工具，进一步拉大精英阶层和社会底层、高知分子与普通劳动者之间的差距。大模型生成机制对于不同群体的“关注度”是不同的。特殊群体及其呼声会在数字化进程中成为被排斥的对象，沦为“数字弃民”，这可能导致未来日益依托于大模型的社会治理框架忽视特殊群体的需求，加剧社会在年龄、地域等纬度的不平等。

本文仅供参考，不代表我们的任何投资建议。如需使用相关信息，请参阅报告原文。）

精选报告**公枞号：全球行业报告库

大模型治理蓝皮报告2023年从规则走向实践

2023大模型治理蓝皮报告从规则走向实践

2023中文大模型基准测评报告发布丨AIGC大事日报

微软深度报告 AI大模型，Copilot有望打开成长空间

大模型治理蓝皮报告2023年 从规则走向实践

2023大模型治理蓝皮报告 从规则走向实践

2023中文大模型基准测评报告发布丨AIGC大事日报

微软深度报告 AI大模型，Copilot有望打开成长空间

相關推薦

大模型治理蓝皮报告2023年从规则走向实践

2023大模型治理蓝皮报告从规则走向实践