当前位置:首页 > 每日看点 > 正文内容

DeepSeekR2什么时候发布?

卡卷网9个月前 (04-17)每日看点230

大约在夏季。

目前我的预计,是Claude 4 发布后一个月。

(Claude 4 予想是在5月22日发布。)


名字是不是DeepSeek R2,还要推敲。

可能是V4/V4 thinking。

如果他们的窗口做的比较大的话,可能直接就去掉非Thinking版本了,就像Google一样。

过多的版本,可能会降低品牌的被感知。

——

目前,他们还可以出一个大牌——就是基于V3324,做一个R1.5 推理模型。

这个模型,我觉得应该会来狙击Qwen,

让Qwen继续成为WF? (这里,要插一段BGM《普通Disco》,绝对既洗脑又魔性。)

【洛天依演唱会 2017 普通DISCO-哔哩哔哩】 https://b23.tv/oKSnHn3

————

目前我对DeepSeek还是比较担忧的。

他们从R1洗下来数据集,来微调了V3324,然后称之为"中文创作能力提升"。

我对他们的审美能力,vibe感受能力,表示非常的担忧。

这已经不是技术问题了,这是一个方向问题。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12628.html

分享给朋友:

相关文章

OZON平台什么产品好卖?

ozon选品的核心重点我不说 你们全网也不见说的这么干的教学了你信我就按照我说的思路去走 不信的出去买课去 一时间消化不了的先点赞收藏起来 真不中了下载也行 因为最近总有坏人给我使诈 平台已经下了我八个视频了 还都是实操教学不废话的那种 气...

用红米手机会很丢人吗?

前些日子遇到了一位快递小哥,京东的,签收小哥年纪不算大,目测二十多岁他的手机上全是一道道极严重的划痕,有点卡,他开热点了,热点名就是手机型号,红米9a,我父母的同款现在他那边操作了一会,然后又是我这边操作了一会小哥看着我手机刷刷的,颇有些好...

为什么张雪峰什么专业都懂?

他不懂专业,他懂的是就业。我记得有个老哥,家里条件不好,母亲吸血。想脱离家庭张雪峰眼睛一亮就说这是个学土木的好苗子。作为土木人我可知道他说的太对了,这种人学土木毕业进中建中铁,直接给你拉非洲看大鳄鱼呲牙。工资不低还能脱离家庭,可不是个学土木...

测试用例是怎么写的?

测试用例是怎么写的?

测试用例对于测试人员而言,虽说是最最基础的技能,但却非常重要。测试用例是支撑我们在测试道路上进一步学习其他测试技能的基本功。那测试用例如何撰写,完整来说应该包含两部分内容:内容1: 测试用例撰写(按照八大要素);内容2: 测试用例(测试点)...

为什么 lnx 求导是 1/x?

为什么 lnx 求导是 1/x?

其实,我想对题主说,你提的问题一点都不弱智。恰恰相反,这是个非常有意义的问题。我们学习一门知识,尤其是数学知识,要知其然,更要知其所以然。今天,我尝试从“如何去定义“的角度出发来解释这个问题,不玩公式推导的符号游戏。希望能带来新的启发。为解...

为什么原来说 7 nm 是半导体工艺的极限,但现在又被突破了?

10年前我们觉得65nm工艺是极限,因为到了65nm节点二氧化硅绝缘层漏电已经不可容忍。所以工业界搞出了HKMG,用high-k介质取代了二氧化硅,传统的多晶硅-二氧化硅-单晶硅结构变成了金属-highK-单晶硅结构。5年前我们觉得22nm...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。