当前位置:首页 > 每日看点 > 正文内容

DeepSeek获得了空前的成功,那他有没有什么不足之处?

卡卷网11个月前 (01-31)每日看点214

如果你真正重度在生产环境和日常使用过,你会发现,最好用的还是Claude Sonnet(有一次我称呼Claude 为Sonnet被她非常强硬(出乎意料的口气)地纠正了,自那之后我都叫她Claude)。

代码方面DS-R1的思维链非常适合你跟着学, 搞清楚自己哪里可能错了, 但是它的成品代码是依托答辩,完全追不上Claude。因此我最常使用R1的场景是出bug时把整个codebase扔过去,跟着他的思维链找究竟是什么文件出错了,然后思考一下可能解法,再和Claude对话。R1写设计文档是可以的,思维链很缜密。此外,Claude的知识广度似乎更大。

日常对话上,Claude的共情能力还是独一档。中文特化的知识,比如说写国内公文,小说等应该是R1更优, Claude还是有较明显的英文式中文的感觉。但是burnout我还是喜欢找Claude倒垃圾。Claude的指令理解断档领先。 目前应该有一个共识:如果问题定义清晰明确,那么AI已经几乎要做到和人类顶尖一样好了。但最大的问题就是现实问题多数定义很不明确,有的你甚至找不到问题。这导致用户的发问,深究之后会发现其实非常垃圾,因为缺失了大量信息(想想产品经理)。和Claude对话你会感觉她好像真的有点理解你想问什么(藏在文字背后的问题),因此不必反复解释你的prompt。

我觉得这些细节最能见真情。不过照顾人类用户体验可能不是deepseek的首要目标,他们应该更追求模型的上限。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/10459.html

分享给朋友:

相关文章

app拉新在哪接单?

app拉新在哪接单?

“提供500+款任务”,“一手渠道app拉新项目”,“纯绿色的”,“高佣金”,“当天做当天结/算”,“多年孵化经验”,“独立后台一对一帮扶持”以上这种还有人信吗???作为一个做了三个月时间并且也踩过坑的人告诉你,不要轻易相信发这种广告的,还...

腾讯云为何在云服务市场败给了阿里云?

IDC领域,2010年以前,万网、新网互联、新网,三家公司瓜分天下,其中万网市场份额最高,排名第一。当时,万网的域名是http://www.net.cn,通过该域名就可以判断万网的地位。2010年阿里云成立,直接收购了万网,大量用户直接流向...

在追求家居美学的过程中,如何选择一款电视机,使其既具备出色的音画质又能与家居装饰相得益彰?

在追求家居美学的过程中,如何选择一款电视机,使其既具备出色的音画质又能与家居装饰相得益彰?

先看照片,你就说美不美吧?我家这个40平的客厅东西放得不少,其中最提升观感的是各种灯光,在这么多灯光中,是不是第一眼视觉中心就落在了电视上?没错,因为这电视是非常特别的环景光电视,与显示器的神光同步一样,会随着画面的变化而变化不同的光效,它...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

测试用例是怎么写的?

测试用例是怎么写的?

测试用例对于测试人员而言,虽说是最最基础的技能,但却非常重要。测试用例是支撑我们在测试道路上进一步学习其他测试技能的基本功。那测试用例如何撰写,完整来说应该包含两部分内容:内容1: 测试用例撰写(按照八大要素);内容2: 测试用例(测试点)...

你觉得oppo Find X8怎么样?

你觉得oppo Find X8怎么样?

OPPO FindX8发布也差不多一个月了,各位上手体验如何呢?作为OPPO的年度旗舰,性能,外观,屏幕等方面都有不小的提升,篇幅有限,下面挑最值得讲的两个点,就是OPPO Find X8的外观和影像。众所周知,这次OPPO Find X8...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。