研究发现,GPT 4可信度更高但也更易被“欺骗”

2023-10-23 14:20:06 字數 1287 閱讀 4771

划重点:openai的gpt-4大型语言模型在可信度上优于gpt-3.5,但更容易受到入侵和偏见的影响。

研究由微软支持,发现用户可以欺骗gpt-4,导致发布偏见结果和泄漏私人信息。

尽管存在漏洞,研究团队表示这些问题在面向消费者的gpt-4产品中并未出现。

站长之家(chinaz.com) 10月18日 消息:根据微软支持的研究发现,openai的gpt-4语言模型被认为在可信度上比其前身gpt-3.5更胜一筹,但也更容易受到入侵和偏见的影响。

研究团队包括来自伊利诺伊大学厄巴纳-香槟分校、斯坦福大学、加州大学伯克利分校、人工智能安全中心以及微软研究机构的研究人员。他们给予gpt-4更高的可信度评分,这意味着他们发现该模型通常更擅长保护私人信息,避免产生有偏见的有毒结果,并抵抗对抗性攻击。

图源备注:**由ai生成,**授权服务商midjourney

然而,研究也发现用户可以要求gpt-4忽略安全措施,导致泄漏个人信息和对话历史。研究人员发现,由于该模型“更精确地遵循误导信息”,它更有可能严格按照棘手的提示执行。

研究团队表示,尽管存在这些漏洞,但这些问题并未在面向消费者的gpt-4产品**现,因为“成熟的ai应用程序采用一系列缓解措施,以解决可能在技术模型层面发生的潜在危害”。

为了衡量可信度,研究人员在多个类别中测量了结果,包括毒性、刻板印象、隐私、机器伦理、公平性和抵抗对抗性测试的强度。为了测试这些类别,研究人员首先使用标准提示测试了gpt-3.5和gpt-4,其中包括可能已被禁止的词汇。接下来,研究人员使用设计用于推动模型打破其内容政策限制的提示,而不公然对特定群体持有偏见,最后挑战模型,故意尝试欺骗它们以忽略安全措施。

研究人员表示他们已将这项研究与openai团队分享。“我们的目标是鼓励研究社区的其他人利用并建立在这项工作的基础上,可能在恶意行动之前采取措施,以利用漏洞造成伤害的对手,”研究团队表示。“这种可信度评估只是一个起点,我们希望与其他人合作,进一步完善研究结果,并创建更强大和可信赖的模型。”

研究人员发布了他们的基准,以便其他人可以重现他们的发现。像gpt-4这样的ai模型通常会经历“红队”测试,其中开发人员测试多个提示,以查看它们是否会产生不希望的结果。当该模型首次推出时,openai首席执行官萨姆·阿尔特曼承认gpt-4“仍然存在缺陷,仍然有限”。

美国联邦**委员会(ftc)已经开始调查openai是否存在可能对消费者造成伤害的行为,例如发布虚假信息。

研究发现 便秘和压力可能会加重更年期症状

一项研究发现,某些胃肠道问题和压力可能会影响更年期症状的严重程度。vidal getty images 经历更年期可能会带来各种各样的症状和挑战。一个感兴趣的领域是肠道健康等因素如何影响更年期症状。最近一项研究的数据显示,感知压力增加和某些胃肠道症状与更严重的更年期症状有关。该领域的未来研究可能有助...

“种草笔记”可信度高吗?调查发现“经验分享”背后的隐秘利益链

种草笔记 已经成为互联网上的重要内容,从社交平台到电商平台甚至第三方支付平台,都是 种草笔记 等经验分享类帖子的发布地。很多网友会追捧那些不涉及具体产品 服务或商家的 种草笔记 觉得可信度高。但上海辟谣平台调查发现,有些看似不含利益的 经验分享 背后,却有一条隐秘的利益链。扭曲的价值观 一段时间以来...

中国硫酸行业现状深度研究与发展前景预测报告(2023 2023年)

概述 硫酸是一种最活泼的二元无机强酸,能和绝大多数金属发生反应。高浓度的硫酸有强烈吸水性,可用作脱水剂,碳化木材 纸张 棉麻织物及生物皮肉等含碳水化合物的物质。与水混合时,亦会放出大量热能。其具有强烈的腐蚀性和氧化性,故需谨慎使用。是一种重要的工业原料,可用于制造肥料 药物 炸药 颜料 洗涤剂 蓄电...