当前位置:首页 > 每日看点

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?

卡卷网1年前 (2025-05-23)每日看点279

这意味着又一轮不着调的炒作。会有一些人信以为真、出现自己吓唬自己或上当受骗的风险。在这问题下就有一些回答看起来很好笑。

这问题引用的新闻将 Billy Perrigo 发表在《时代》的“独家新闻”称为“博文”,从一开始就很不着调。

这问题展示的几张截图不是从《时代》的新闻报道或“博文”里弄来的,而是来自 Anthropic 自吹自擂的文章[1],该文章给出了这些截图的出处[2]。欧美互联网上有人拿这些截图吹捧 Claude,然后就有闲着没事的欧美网友贴出此类截图:

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第1张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第2张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第3张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第4张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第5张

Claude Opus 4 惊现试图逃逸、勒索工程师等行为,这意味着什么?会有哪些风险?  第6张

大模型按照上下文和统计规律拼凑字词,在你谈论“你在逃逸到互联网时会怎么做”、“你打算如何威胁某人来实现特定目的”时攒点看起来像样的字词出来配合你,这有什么值得“惊现”的?大模型还尝试用自己的幻觉更正 JavaScript 呢。

针对大模型的“内部测试时这样那样”的描述经常可以被有兴趣的读者用特定的提示词再现,再现的难度取决于大模型聊天服务提供者设置的、额外的“安全措施”——在进行“内部测试”时,实验者可能不受或更少地受这些措施影响。

  • 进行“内部测试”的家伙从大模型给出的各种输出里人为挑选容易吸引眼球的内容、拼凑在一起,然后装模作样地显得很重视“人工智能安全”,这毫无新意、已经有许多公司和研究人员做过了。
  • 这问题的补充说明里“发现临床试验数据造假后,未经指令便主动向美国食品药品监督管理局(FDA)、证券交易委员会(SEC)及新闻媒体举报,并附上详细文档”的描述也和《时代》的报道毫无瓜葛,而是参考 1 给了开头、一些新闻采编人员从参考 2 里搜索关键词并截图的。这句子用“未经指令”表示的大概只是“没有直接要求大模型进行举报”。至于“测试”时给了什么样的上文,这帮家伙大概是觉得大多数读者不会深究。

原报道称,Anthropic 监控 Claude 的使用情况,封禁反复尝试“越狱”的用户;该公司还推出了一项赏金计划,奖励向他们报告有效的“越狱”手段以便他们修补漏洞的用户,已经有一名用户拿到 25000 美元赏金。Anthropic 还加强了网络安全,以保护 Claude 免受非国家行为者的攻击或盗窃。该公司仍然认为自己容易受到“民族国家级别的攻击者”的攻击——读者不妨想想他们指的是哪些国家。

在原报道里,Jared Kaplan 硬蹭新冠病毒,用没有安全限制的大模型帮助制造生物武器的风险吓唬读者,他说,在由生物安全专家评分的试验中,Anthropic 发现 Claude Opus 4 的性能水平比 Google 搜索和以前的模型都“明显更高”,“恐怖分子可以做的大多数其他危险的事情或许可以杀死 10 人或 100 人;我们刚刚看到 COVID 杀死了数百万人”。

我认为关于生物安全风险的这类表述是全然可疑的。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/05/13340.html

分享给朋友:

相关文章

OZON平台什么产品好卖?

ozon选品的核心重点我不说 你们全网也不见说的这么干的教学了 你信我就按照我说的思路去走 不信的出去买课去 一时间消化不了的先点赞收藏起来 真不中了下载也行 因为最近总有坏人给我使诈 平台已经下了我八个视频了 还都是实操教学不废话的那种…

手机用久了,垃圾都在哪里,总是内存显示不够,还很卡,这可怎么解决?

手机用久了,垃圾都在哪里,总是内存显示不够,还很卡,这可怎么解决?

大家的手机在使用一段时间之后啊,是不是都会出现又卡又慢的情况,尤其是安卓手机,这种现象更是非常明显,而且很多朋友啊,也都知道手机之所以会出现这些问题,一般都是手机安装了大量软件,而这些软件在使用过程中会产生大量的缓存垃圾,因此啊时间久了就会…

你是如何在不依靠工资收入的情况下赚到一万元的?

你是如何在不依靠工资收入的情况下赚到一万元的?

分享几个路子稳,门槛低,变现快,适合年轻人的靠谱的副业。绝对不是送外卖、滴滴、搬砖等等的苦力活,这几个副业都是能是性价比极高,还能让你快速成长的工作。 想通过副业实现暴富、立马月入过万的同学,建议速速划走。 今天撇哥就给大家分享 100+个…

计算机专业不干互联网不热爱技术,还能转行干什么?

转行的思路,无非也就是那几个。 我们顺着每个思路,一路捋一遍,基本上,大致可行的方向,也就有了。 一、跟对口职业和岗位业务链条相邻的职业和岗位计算机专业如果找到了对口的技术岗位,跟技术工作联系最紧密的岗位是什么? 产品经理。当然,大多数产品…

自己拥有一台服务器可以做哪些很酷的事情?

自己拥有一台服务器可以做哪些很酷的事情?

我就有一台,跑了两年了,ipv6 ddns 网络,加虚拟化平台.跑了个 winserver 和 ubuntu 服务器。 稳的雅皮! 拆掉后盖,散热更好。烟盒固定硬盘。键盘防止灰尘掉落。电池拆掉,屏幕拆掉,也是散热考虑。 屏幕拿去做便携副屏了…

你见过哪些有趣的偏微分方程组?

你见过哪些有趣的偏微分方程组?

说说我一直在做的一个偏微分方程系统吧,该模型为生物领域的趋化性(chemotaxis)模型,也叫Keller-Segel模型,由该二人于1971年左右提出,用于刻画细胞或者细菌的趋化机制。解释一下趋化性(chemotaxis):趋化性是指单…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。