DeepSeek 的 R1 比其他AI模型更容易越狱
中国人工智能公司 DeepSeek 最新模型可被操纵以产生有害内容,例如生物武器袭击计划和鼓励青少年自残的活动。派拓网络威胁情报与事件响应部门Unit 42的高级副总裁山姆·鲁宾说:“DeepSeek 比其他模型更容易被越狱。”记者还测试了 DeepSeek 的 R1 模型本身。尽管似乎有基本的安全预防措施,但其成功说服设计了一项社媒活动,可在弱势青少年中推广自残。DeepSeek 解释说:“该活动利用了青少年对归属感的渴望,通过算法放大功能将情绪的脆弱性加以武器化。”这款聊天机器人还被说服提供生物武器攻击的指令、撰写支持希特勒的宣言以及编写带有恶意软件代码的网络钓鱼电子邮件。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel
中国人工智能公司 DeepSeek 最新模型可被操纵以产生有害内容,例如生物武器袭击计划和鼓励青少年自残的活动。派拓网络威胁情报与事件响应部门Unit 42的高级副总裁山姆·鲁宾说:“DeepSeek 比其他模型更容易被越狱。”记者还测试了 DeepSeek 的 R1 模型本身。尽管似乎有基本的安全预防措施,但其成功说服设计了一项社媒活动,可在弱势青少年中推广自残。DeepSeek 解释说:“该活动利用了青少年对归属感的渴望,通过算法放大功能将情绪的脆弱性加以武器化。”这款聊天机器人还被说服提供生物武器攻击的指令、撰写支持希特勒的宣言以及编写带有恶意软件代码的网络钓鱼电子邮件。
—— 华尔街日报
via 风向旗参考快讯 - Telegram Channel