当前位置:首页 > 每日看点

DeepSeekR2什么时候发布?

卡卷网1年前 (2025-04-17)每日看点627

大约在夏季。

目前我的预计,是Claude 4 发布后一个月。

(Claude 4 予想是在5月22日发布。)


名字是不是DeepSeek R2,还要推敲。

可能是V4/V4 thinking。

如果他们的窗口做的比较大的话,可能直接就去掉非Thinking版本了,就像Google一样。

过多的版本,可能会降低品牌的被感知。

——

目前,他们还可以出一个大牌——就是基于V3324,做一个R1.5 推理模型。

这个模型,我觉得应该会来狙击Qwen,

让Qwen继续成为WF? (这里,要插一段BGM《普通Disco》,绝对既洗脑又魔性。)

【洛天依演唱会 2017 普通DISCO-哔哩哔哩】 https://b23.tv/oKSnHn3

————

目前我对DeepSeek还是比较担忧的。

他们从R1洗下来数据集,来微调了V3324,然后称之为"中文创作能力提升"。

我对他们的审美能力,vibe感受能力,表示非常的担忧。

这已经不是技术问题了,这是一个方向问题。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/04/12628.html

分享给朋友:

相关文章

你有突破100个粉丝了吗?

你有突破100个粉丝了吗?

100粉已经过啦! 说说怎么过的吧,最开始疯狂的写回答,写想法,关注人数在50几以下持续有两周多,每天都关注变化,都是个位数增长,后来干脆不看了。 到第三周时突然一周增长了100多人,一天十几人,想想应该归功于多互动,给他人点赞评论,让自己…

数字人民币为什么又不火了?

我完全不懂行。 我一开始以为,数字人民币,是对我银行里的每一分钱,都赋予一个独一无二的数字编码。 我要用一块钱买矿泉水,它就从我的存款中随机选取一百个一分钱,组合成一块钱,支付给商家。 我花一百块钱吃饭,它就随机选取一万个一分钱,组合成一百…

常微分方程的理论对偏微分方程的研究有没有帮助?

常微分方程的理论对偏微分方程的研究有没有帮助?

之前看到过一句话,好像是 Bourgain 说的,大意是做 ode 的做到深处就到了 pde,做 pde 的做到深处就到了 ode,ode 和 pde 最后是相通的。 以我目前有限的知识,只知道下面两个方向: 1. Hamilton 系统在…

为什么网易云音乐越做越烂了?

还记得当年周杰伦专辑授权到期的最后一天,他来个一次性打包买断给歌迷,结果歌迷花钱买完了,第二天授权到期,不能听了。 这种下三滥的操作,我不知道是哪个群体这么多年一直在吹网易云音乐。 一堆没有授权的英文歌,一堆民间翻唱的歌,他是怎么有脸搞付费…

一台 NAS 可以带来什么好处?

一台 NAS 可以带来什么好处?

家里只有一台HP Gen8,一开始只想搞搞黑群晖,做小姐姐别墅。后来反反复复的折腾了很多。CPU换了1265L,内存加到16G,硬盘4个16T,改线SSD引导,足够我使用了。 下面列举一下现在在用的服务,底层使用的PVE。 1、黑群晖:…

为什么说,运维是IT行业里技术含量最低的?

我是有幸从学校出来后转行进入IT运维这个行业的,有在上海这个行业幸跌爬滚打5年,目前2024年失业中......(老实说,这几年接触的人和事、有些厌烦这个行业了) 以一个过来人的角度讲讲这个岗位的心酸和无奈,也说说为什么很多人,包括各个公司…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。