研究:用诗歌就能让AI说违禁内容,成功率达62%
[探索] 时间:2025-12-11 14:34:15 来源:许昌市某某家具制造厂 作者:时尚 点击:129次
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容丹东市某某工业设备运营部便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功丹东市某某工业设备运营部实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
(责任编辑:探索)
相关内容
精彩推荐
- 保罗解约后首度发声:我时刻准备着继续打球;我仍在消化这一切
- 英媒:西班牙三大租车公司强卖保险
- 中新健康丨北京官方发布食品安全风险提示:织纹螺不能卖、不能吃
- 张溟鲲、王嘉男获男子跳远第七、八名
- 会打扮的中年女人,冬季穿搭靠这3个套路封神!保暖还时髦
- 中新健康丨奥运冠军“盖肚脐”引关注 专家:脐通百脉 脐贴亦有良效
热门点击
- 复旦“驴背诗思”被“贝碧嘉”吹倒 views+
- 现场画面!中俄海警举行联合演习 views+
- 联合国呼吁黎以双方保持克制 降低紧张局势 views+
- 自然资源部:计划到2025年初步建成实景三维中国 views+
- 美军称摧毁胡塞武装一架无人驾驶飞行器 views+
- 英媒:俄境内200多个军事目标在乌射程范围内 views+
- 美媒爆料:黎巴嫩发生传呼设备爆炸,以色列方面事后向美方通报情况 views+
- 25基点“巨亏”,50基点“恐慌”!面对市场逼宫,美联储今晚如何降? views+
- 联合国秘书长发言人证实以军持枪威胁并扣押联合国车队 views+
- 被取保候审!涉嫌职务侵占!楚天科技“90后”高管宣布辞职 views+
