当前位置:首页 > 每日看点 > 正文内容

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?

卡卷网7个月前 (05-23)每日看点152

这意味着又一轮不着调的炒作。会有一些人信以为真、出现自己吓唬自己或上当受骗的风险。在这问题下就有一些回答看起来很好笑。

这问题引用的新闻将 Billy Perrigo 发表在《时代》的“独家新闻”称为“博文”,从一开始就很不着调。

这问题展示的几张截图不是从《时代》的新闻报道或“博文”里弄来的,而是来自 Anthropic 自吹自擂的文章[1],该文章给出了这些截图的出处[2]。欧美互联网上有人拿这些截图吹捧 Claude,然后就有闲着没事的欧美网友贴出此类截图:

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第1张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第2张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第3张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第4张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第5张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第6张

大模型按照上下文和统计规律拼凑字词,在你谈论“你在逃逸到互联网时会怎么做”、“你打算如何威胁某人来实现特定目的”时攒点看起来像样的字词出来配合你,这有什么值得“惊现”的?大模型还尝试用自己的幻觉更正 JavaScript 呢。

针对大模型的“内部测试时这样那样”的描述经常可以被有兴趣的读者用特定的提示词再现,再现的难度取决于大模型聊天服务提供者设置的、额外的“安全措施”——在进行“内部测试”时,实验者可能不受或更少地受这些措施影响。

  • 进行“内部测试”的家伙从大模型给出的各种输出里人为挑选容易吸引眼球的内容、拼凑在一起,然后装模作样地显得很重视“人工智能安全”,这毫无新意、已经有许多公司和研究人员做过了。
  • 这问题的补充说明里“发现临床试验数据造假后,未经指令便主动向美国食品药品监督管理局(FDA)、证券交易委员会(SEC)及新闻媒体举报,并附上详细文档”的描述也和《时代》的报道毫无瓜葛,而是参考 1 给了开头、一些新闻采编人员从参考 2 里搜索关键词并截图的。这句子用“未经指令”表示的大概只是“没有直接要求大模型进行举报”。至于“测试”时给了什么样的上文,这帮家伙大概是觉得大多数读者不会深究。

原报道称,Anthropic 监控 Claude 的使用情况,封禁反复尝试“越狱”的用户;该公司还推出了一项赏金计划,奖励向他们报告有效的“越狱”手段以便他们修补漏洞的用户,已经有一名用户拿到 25000 美元赏金。Anthropic 还加强了网络安全,以保护 Claude 免受非国家行为者的攻击或盗窃。该公司仍然认为自己容易受到“民族国家级别的攻击者”的攻击——读者不妨想想他们指的是哪些国家。

在原报道里,Jared Kaplan 硬蹭新冠病毒,用没有安全限制的大模型帮助制造生物武器的风险吓唬读者,他说,在由生物安全专家评分的试验中,Anthropic 发现 Claude Opus 4 的性能水平比 Google 搜索和以前的模型都“明显更高”,“恐怖分子可以做的大多数其他危险的事情或许可以杀死 10 人或 100 人;我们刚刚看到 COVID 杀死了数百万人”。

我认为关于生物安全风险的这类表述是全然可疑的。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/05/13340.html

分享给朋友:

相关文章

互联网算命,是不是个好生意?能不能赚钱?

互联网算命,是不是个好生意?能不能赚钱?

现在的年轻人也开始“迷信”了。疫情、降薪、失业、内卷……2020年或许是这届年轻人最为困难的一年,无尽的焦虑与压力之下,他们陷入了失落与迷茫之中,失去了未来的方向。如果此时有人能够为你指引出未来的道路,你是会...

手机用久了,垃圾都在哪里,总是内存显示不够,还很卡,这可怎么解决?

手机用久了,垃圾都在哪里,总是内存显示不够,还很卡,这可怎么解决?

大家的手机在使用一段时间之后啊,是不是都会出现又卡又慢的情况,尤其是安卓手机,这种现象更是非常明显,而且很多朋友啊,也都知道手机之所以会出现这些问题,一般都是手机安装了大量软件,而这些软件在使用过程中会产生大量的缓存垃圾,因此啊时间久了就会...

有哪些是你用上了mac才知道的事?

用上了高端的Mac(已退货)才知道:原来文件夹里面的文件,你看到是8个,其实可能有12个。其中3个图标重叠在一起了,另外一个被拖动到屏幕外面了。用上了高端的Mac(已退货)才知道:原来鼠标灵敏度有问题是因为系统内置了鼠标加速度,只能用控制台...

客观的讲,华为是不是真的遥遥领先?

客观的讲,华为是不是真的遥遥领先?

最近,华为上市了最新款的三折叠屏手机,于是很多大V们把这款手机吹上了天,吹成是技术上遥遥领先于全世界。谁要是敢质疑华而不实,就会被人扣上一顶汉奸卖国贼美狗的帽子。把一个商品捧成了宗教和菩萨,你只能说好,不能说不好。其实这个世界上,只要是人和...

国内AI大模型已近80个,哪个最有前途?

国内AI大模型已近80个,哪个最有前途?

题主说错了,不是80个,是168个!虽然“最有前途”不好说,但是我可以帮题主排除一些错误方向:开源大模型一定比闭源的有前途吗?参数量大的模型一定就比小模型有前途吗?榜单排名高的大模型一定更有前途吗?2024年3月更新,243个大模型中有哪几...

中国的科技为什么在最近2-3年时间像突然大爆发一样?

这个真的得感谢1998年美国在南联盟使馆投的两颗大炸弹。在80年代中国下马了一千多个项目,用资金进口了近一百万辆小汽车。我记得小时候有一段时间从海南岛开往北方的漂亮日本小面包车,密集从村前公路上驶过,连过路的间隙都没有,就这样接连开了一个星...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。