当前位置:首页 > 每日看点

DeepSeekR2什么时候发布?

卡卷网1年前 (2025-04-17)每日看点767

大约在夏季。

目前我的预计,是Claude 4 发布后一个月。

(Claude 4 予想是在5月22日发布。)


名字是不是DeepSeek R2,还要推敲。

可能是V4/V4 thinking。

如果他们的窗口做的比较大的话,可能直接就去掉非Thinking版本了,就像Google一样。

过多的版本,可能会降低品牌的被感知。

——

目前,他们还可以出一个大牌——就是基于V3324,做一个R1.5 推理模型。

这个模型,我觉得应该会来狙击Qwen,

让Qwen继续成为WF? (这里,要插一段BGM《普通Disco》,绝对既洗脑又魔性。)

【洛天依演唱会 2017 普通DISCO-哔哩哔哩】 https://b23.tv/oKSnHn3

————

目前我对DeepSeek还是比较担忧的。

他们从R1洗下来数据集,来微调了V3324,然后称之为"中文创作能力提升"。

我对他们的审美能力,vibe感受能力,表示非常的担忧。

这已经不是技术问题了,这是一个方向问题。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12628.html

分享给朋友:

相关文章

创业容易吗?

创业容易吗?创建企业不一定是困难或令人生畏的。它可以从一个简单但有力的想法开始,比如小强意识到,如果洗手液能杀死真菌,尤其是拳击台上的真菌,就会更加有用。创业确实需要奉献精神、努力工作和仔细规划——这是没有办法的。虽然这本身可能并不容易,但…

Redmi 为什么可以把性价比做得那么高?

一位修手机的老大哥曾经跟我说过,红米1那个手机,除了处理器还凑活,其余零部件,就是市面上山寨机那种。 其实红米性价比并不算极致,而且一直都有竞争者,从原来的群魔乱舞,到后来的荣耀,魅蓝,一加,再到现在的IQOO和realme。 红米的方法也…

无意中发现技术主管写的代码,大家帮忙看看什么水平?

无意中发现技术主管写的代码,大家帮忙看看什么水平?

虽然很多答主用了诸如“典范级”、“心旷神怡” 的形容, 赞美这段代码, 但这里, 出于技术讨论的动机, 我说说不同看法. 栈, 如果善于利用栈来处理树结构, 那么可以写出更简洁的代码, 根本不需要 recuresiveFn 这种方法. 泛型…

什么样的网站能快速捕获你的心?

什么样的网站能快速捕获你的心?

大家好,我是程序员鱼皮。 大家如果平时使用网站或产品时出现了问题,一般都会去寻找 “联系客服” 的位置,从而获得人工的帮助。我们团队的面试刷题产品 - 面试鸭最近就遇到了这样一个难题:明明我们网站右下角就有联系客服按钮、而且我们每道面试题目…

你见过哪些有趣的偏微分方程组?

你见过哪些有趣的偏微分方程组?

说说我一直在做的一个偏微分方程系统吧,该模型为生物领域的趋化性(chemotaxis)模型,也叫Keller-Segel模型,由该二人于1971年左右提出,用于刻画细胞或者细菌的趋化机制。解释一下趋化性(chemotaxis):趋化性是指单…

你们发文章的插图都是从哪来的?在网上搜出来的图能用吗?

你们发文章的插图都是从哪来的?在网上搜出来的图能用吗?

写文章发帖子,里面的插图尽量自己画,自己编辑,避免引起版权或者所有权纠纷。 我写过6本书,在知乎上也写了4000篇帖子和文章,其中的插图都是自己绘制的,照片绝大多数是自己拍摄的,摘自技术样本的图则必须加以说明。 自己制图,看似麻烦,但积少成…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。