当前位置:首页 > 每日看点 > 正文内容

如何看待 Rust 写的 PNG 解码器比 C 实现更快?

卡卷网1年前 (2024-12-15)每日看点252

如何看待?

很简单啊,Rust比C快呗


C不是底层语言

acm有一个很著名的文章:C不是底层语言,你的电脑不是一个更快的PDP11

大体意思是说:C发明出来是老旧计算机PDP11上的一层浅浅抽象。

但是,PDP11出来以后,后世计算机加了十分十分多的科技与狠活。

而C没有跟进这些科技,逐渐落后于时代。

比如 - 随着CPU的pipeline越来越深,branch的代价越来越高,进而CPU引入了conditional move instruction (if (A) B = C;是一条CPU指令)。

C没有跟进。

又比如 - von neumann bottleneck在CPU上越来越严重。为了根治这个问题,CPU使得一条指令可以做很多计算 - simd。

C没有跟进。

又又比如 - CPU时钟周期越来越快,但是相对应的内存latency则几乎没有提升。这导致越来越多的时间花在了内存读取里面,一个指针读取的是L1/L2 cache还是L3 cache/main memory,是底层性能优化最重要的问题。

C没有跟进。

对比下,看看隔壁老黄的CUDA,就知道真正的底层语言是什么样子的了

  • 通过masking执行branch两边,以此避免pipeline stall
  • 默认一切simd
  • 提供scratchpad memory,一种更快但是小小的内存(跟一般的大但慢的分开),而不是指望memory hirearchy自动优化

但问题来了,知不知道那编译器人最多?NVIDIA。老黄一车车拉编译器人去NVIDIA做什么?CUDA编译器。因为GPU的发展越来越复杂,CUDA离GPU越来越远,所以要做的工作越来越多!

所以 - 连CUDA都离真实硬件这么远,又是谁给C勇气自称底层语言的?梁静茹吗?

常规C不如Rust快

如果我们要认为C比Python快,一个不可避免的问题就是 -

为什么我不能整个Python项目就单纯是用Python FFI调一个高度优化的二进制汇编代码?

这样很明显有FFI的语言性能都是一样的(最快的),很明显,这不合理。

问题出在那?问题出在汇编不是Python!

更具体的 - 我们一般写程序都会遵守‘编程守则’。

比如Java:用虚函数不用静态函数,C++:用RAII管理内存,C:用指针传参甚至用指针返回复杂struct,Go:用pair右边来返回错误,没错误是nil。

我们说‘XXX语言怎么怎么样’,一般都是说‘常规(idiomatic)XXX代码’ - 符合这些守则得出的代码,怎么怎么样。道理很明显 - 总不能python说自己又支持OOP又内存安全又快,结果支持OOP又安全的部分很慢,打开快的部分只是内联汇编吧?同理,总不能C说自己又内存安全又快,结果快的部分不内存安全,内存安全的部分内嵌bohm gc拖慢性能吧?这样的宣传策略,太遥遥领先了。

你不能只在你的feature对你有利的时候爱它。

那问题很明显:常规C是一个缓慢的编程语言。

对,libpng没有simd,没有对内存优化存取策略,导致过时了,但这难道不是C的问题吗?

是皮衣黄为了CUDA霸权,强迫C不能有simd不能有scratchpad memory,还是C自己不肯加,落后于时代?

更惨的是,Rust甚至不需要加simd。

When I talked to an LLVM developer about this, they mentioned that it's easier for LLVM to vectorize Rust than C because Rust emitsnoaliasannotations almost everywhere.
LLVM 开发者提到,由于 Rust 几乎到处使用 noalias 属性,相比 C 语言,LLVM 更容易为 Rust 生成自动向量化的代码。

为什么C不能呢?哦,是因为C指针数组模模糊糊分不清,是因为C类型系统更弱,推不出更多的noalias。

所以C更慢。

无限制C不如Rust快

有的人看到这,会说‘不行!我就是要双标,C可以内联汇编Python不可以!’

但那怕如此Rust依然更快。

因为rust的png比C的libpng更快。

唉?我是什么意思?不是说这是因为libpng写得不好吗?

重点正是如此。

libpng是什么?

这可不是路边的任意代码,是png库。而且是被chrome用着的png库。

这种东东,叫做互联网之栋梁不为过吧?

这种库会缺人手维护吗?

如何看待 Rust 写的 PNG 解码器比 C 实现更快?  第1张

很明显,不缺,甚至有一个png仙人写了十多万行代码。第二名也快了,两个加起来平均十万!

如何看待 Rust 写的 PNG 解码器比 C 实现更快?  第2张

另一边呢?哈哈哈,最大奉献着是个头像都没的用户,写了七千五百行搞了个demo就跑路了,渣男!

对比要控制变量。跟博古特赛跑你不能先跑五秒,同理,对比性能要控制工作量,libpng在工作量更多的前提下更慢,不就代表C比rust慢吗?

C自己把libpng维护者时间精力耗完了,还顶着臭脸时不时一套UB segfault组合拳打出去,吓跑其他潜在维护者,导致没有人有时间写simd代码,不怪C怪谁?怪米哈游的原神太好玩,导致png仙人无心写程序?

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2024/12/4530.html

分享给朋友:

相关文章

B 站上有哪些很好的学习资源?

B 站上有哪些很好的学习资源?

前!方!高!能!精选了多位学习Up主,不乏百万粉丝的大V,还有超多珍贵的学习资源推荐。进了小破站,完全不用担心学完了该怎么办?因为根本学不完啊!!!B站的学习干货实在太多了!语言学习葉子先生酱https://space.bilibili.c...

支付宝碰一碰市场如何?

支付宝碰一碰市场如何?

今年,支付宝又整了新的大活,即无须扫码即能完成支付操作的“支付宝碰一碰”正式登场。下面就来给大家分析分析,这是个什么情况,为什么都在说能赚钱。支付宝碰一下怎么赚钱的?都有谁能赚到这份钱?1.支付宝碰一下原理支付宝碰一下的本质依旧是“条码支付...

WordPress建站同时面向B端和C端,有什么好的解决方案?

这个很容易实现呀,只不过需要自己开发,整体用权限管理就可以实现了,B端和C端是不同用户权限,C端能看到的菜单入口和B端不一样就行了。技术层面实现没问题的,只不过就是看你们的技术能力和投入了 ,这样的需求应该没有现成的开源插件。只能找人定制开...

有没有能够兼顾便携并且流畅运行各种AI应用的笔记本?求推荐?

有没有能够兼顾便携并且流畅运行各种AI应用的笔记本?求推荐?

看了下题主的描述,可以考虑「联想YOGA Air 15 Aura AI元启版」,今年9月底出的一款轻薄本,也通过了英特尔Evo严苛认证。处理器用了英特尔最新的「酷睿 Ultra 7 258V」,主要亮点就是AI性能、图形处理能力和能效,很适...

抖音小店三个月了一单没出,也没有流量,一个星期好像都没有一个点击,怎么办?

抖音小店三个月了一单没出,也没有流量,一个星期好像都没有一个点击,怎么办?

好消息,你有毅力上200多个品,还能坚持三个月坏消息,一单没出我感觉你还是别碰抖店了,甚至电商平台都别碰 你没这个缘分我要是这样,我得用一百辆叉车叉死我自己你如果还想坚持,我直接给你这套至少价值19800学来的新思路简单来说就是 你做的好的...

是不是从Java培训班出来的人都被淘汰了?

真实个人经历。我就是从培训班出来的,但没有学完就跑出来了。当我明白什么人不管什么基础都能进培训班进行培训,学到什么程度都能保证他们包就业,我就知道不正常。我自己是大三下的时候去的,考研考到一半感觉无望,想抓紧时间学习技术,利用应届生身份准备...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。