当前位置:首页 > 每日看点 > 正文内容

DeepSeekR2什么时候发布?

卡卷网10个月前 (04-17)每日看点309

大约在夏季。

目前我的预计,是Claude 4 发布后一个月。

(Claude 4 予想是在5月22日发布。)


名字是不是DeepSeek R2,还要推敲。

可能是V4/V4 thinking。

如果他们的窗口做的比较大的话,可能直接就去掉非Thinking版本了,就像Google一样。

过多的版本,可能会降低品牌的被感知。

——

目前,他们还可以出一个大牌——就是基于V3324,做一个R1.5 推理模型。

这个模型,我觉得应该会来狙击Qwen,

让Qwen继续成为WF? (这里,要插一段BGM《普通Disco》,绝对既洗脑又魔性。)

【洛天依演唱会 2017 普通DISCO-哔哩哔哩】 https://b23.tv/oKSnHn3

————

目前我对DeepSeek还是比较担忧的。

他们从R1洗下来数据集,来微调了V3324,然后称之为"中文创作能力提升"。

我对他们的审美能力,vibe感受能力,表示非常的担忧。

这已经不是技术问题了,这是一个方向问题。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12628.html

分享给朋友:

相关文章

创业:集思广益并完善您的商业理念

用史蒂夫乔布斯的话来说,“做伟大工作的唯一方法就是热爱你所做的事情。开始自己的事业是迈向自己喜欢的工作的一步。但是,从形成想法到创建商业网站,在您深入研究之前,需要考虑几个基本步骤和问题:您要解决什么问题?您的目标受众是谁?您的产品或服务与...

手机的运行内存真的有必要上16GB吗?

全是国产垃圾APP惯出来的。那些对国产软件没意见的人,建议出国看看,花不了多少钱,出门开 Google Map,订宾馆用 Booking,翻译用 Google translate,聊天用 Telegram,社交活动用 Discord,你会惊...

如何判断 Java 工程师的基础知识是否扎实?

我来给你出几道大题,能答对70%,你就算基础扎实了。第一部分 Java基础(27)1. 程序本质:代码是如何被执行的?CPU、操作系统、虚拟机各司何职?2. 基础语法:从CPU角度看变量、数组、类型、运算、跳转、函数等语法3. 引用类型:同...

PHP承载百万/天 访问量需要用到什么技术?

当年做一个百万PV的商城,也不过是两台2c4g的阿里云虚机罢了(其实一台就够,另外一台主要的逼着大家一定开发的时候一定要有负载均衡和横向扩容的意识)。当时框架还是Thinkphp3.2,框架提高运行效率的开关全打开,标准的lnmp模式,单机...

腾讯云为何在云服务市场败给了阿里云?

IDC领域,2010年以前,万网、新网互联、新网,三家公司瓜分天下,其中万网市场份额最高,排名第一。当时,万网的域名是http://www.net.cn,通过该域名就可以判断万网的地位。2010年阿里云成立,直接收购了万网,大量用户直接流向...

大家都是怎么把自己的粉丝增加到1000的呢?

大家都是怎么把自己的粉丝增加到1000的呢?

截至2024年10月30日,关注者总数1137人,用时80天,增速约14人/天。2024年10月30日数据2024年8月10日开始创作,连续一周,1个关注者都没有。创作第7天,得到第一个关注,7天时间,写了8篇回答。当天得到关注,激动的心情...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。