当前位置:首页 > 每日看点 > 正文内容

如何看待 Rust 写的 PNG 解码器比 C 实现更快?

卡卷网1年前 (2024-12-15)每日看点225

如何看待?

很简单啊,Rust比C快呗


C不是底层语言

acm有一个很著名的文章:C不是底层语言,你的电脑不是一个更快的PDP11

大体意思是说:C发明出来是老旧计算机PDP11上的一层浅浅抽象。

但是,PDP11出来以后,后世计算机加了十分十分多的科技与狠活。

而C没有跟进这些科技,逐渐落后于时代。

比如 - 随着CPU的pipeline越来越深,branch的代价越来越高,进而CPU引入了conditional move instruction (if (A) B = C;是一条CPU指令)。

C没有跟进。

又比如 - von neumann bottleneck在CPU上越来越严重。为了根治这个问题,CPU使得一条指令可以做很多计算 - simd。

C没有跟进。

又又比如 - CPU时钟周期越来越快,但是相对应的内存latency则几乎没有提升。这导致越来越多的时间花在了内存读取里面,一个指针读取的是L1/L2 cache还是L3 cache/main memory,是底层性能优化最重要的问题。

C没有跟进。

对比下,看看隔壁老黄的CUDA,就知道真正的底层语言是什么样子的了

  • 通过masking执行branch两边,以此避免pipeline stall
  • 默认一切simd
  • 提供scratchpad memory,一种更快但是小小的内存(跟一般的大但慢的分开),而不是指望memory hirearchy自动优化

但问题来了,知不知道那编译器人最多?NVIDIA。老黄一车车拉编译器人去NVIDIA做什么?CUDA编译器。因为GPU的发展越来越复杂,CUDA离GPU越来越远,所以要做的工作越来越多!

所以 - 连CUDA都离真实硬件这么远,又是谁给C勇气自称底层语言的?梁静茹吗?

常规C不如Rust快

如果我们要认为C比Python快,一个不可避免的问题就是 -

为什么我不能整个Python项目就单纯是用Python FFI调一个高度优化的二进制汇编代码?

这样很明显有FFI的语言性能都是一样的(最快的),很明显,这不合理。

问题出在那?问题出在汇编不是Python!

更具体的 - 我们一般写程序都会遵守‘编程守则’。

比如Java:用虚函数不用静态函数,C++:用RAII管理内存,C:用指针传参甚至用指针返回复杂struct,Go:用pair右边来返回错误,没错误是nil。

我们说‘XXX语言怎么怎么样’,一般都是说‘常规(idiomatic)XXX代码’ - 符合这些守则得出的代码,怎么怎么样。道理很明显 - 总不能python说自己又支持OOP又内存安全又快,结果支持OOP又安全的部分很慢,打开快的部分只是内联汇编吧?同理,总不能C说自己又内存安全又快,结果快的部分不内存安全,内存安全的部分内嵌bohm gc拖慢性能吧?这样的宣传策略,太遥遥领先了。

你不能只在你的feature对你有利的时候爱它。

那问题很明显:常规C是一个缓慢的编程语言。

对,libpng没有simd,没有对内存优化存取策略,导致过时了,但这难道不是C的问题吗?

是皮衣黄为了CUDA霸权,强迫C不能有simd不能有scratchpad memory,还是C自己不肯加,落后于时代?

更惨的是,Rust甚至不需要加simd。

When I talked to an LLVM developer about this, they mentioned that it's easier for LLVM to vectorize Rust than C because Rust emitsnoaliasannotations almost everywhere.
LLVM 开发者提到,由于 Rust 几乎到处使用 noalias 属性,相比 C 语言,LLVM 更容易为 Rust 生成自动向量化的代码。

为什么C不能呢?哦,是因为C指针数组模模糊糊分不清,是因为C类型系统更弱,推不出更多的noalias。

所以C更慢。

无限制C不如Rust快

有的人看到这,会说‘不行!我就是要双标,C可以内联汇编Python不可以!’

但那怕如此Rust依然更快。

因为rust的png比C的libpng更快。

唉?我是什么意思?不是说这是因为libpng写得不好吗?

重点正是如此。

libpng是什么?

这可不是路边的任意代码,是png库。而且是被chrome用着的png库。

这种东东,叫做互联网之栋梁不为过吧?

这种库会缺人手维护吗?

如何看待 Rust 写的 PNG 解码器比 C 实现更快?  第1张

很明显,不缺,甚至有一个png仙人写了十多万行代码。第二名也快了,两个加起来平均十万!

如何看待 Rust 写的 PNG 解码器比 C 实现更快?  第2张

另一边呢?哈哈哈,最大奉献着是个头像都没的用户,写了七千五百行搞了个demo就跑路了,渣男!

对比要控制变量。跟博古特赛跑你不能先跑五秒,同理,对比性能要控制工作量,libpng在工作量更多的前提下更慢,不就代表C比rust慢吗?

C自己把libpng维护者时间精力耗完了,还顶着臭脸时不时一套UB segfault组合拳打出去,吓跑其他潜在维护者,导致没有人有时间写simd代码,不怪C怪谁?怪米哈游的原神太好玩,导致png仙人无心写程序?

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2024/12/4530.html

分享给朋友:

相关文章

b站真的能自学PS吗?

b站真的能自学PS吗?

看你想达到哪一种程度了,如果你只是平常用PS扣图、调整照片大小、尺寸、简单调个色这样,自学真的挺简单的,B站很多免费的教程都可以教会你这些技巧。但是如果说你想成为专业的设计师或者是商业修图师,无师自通真的非常难,首先你会走很多弯路,不知道怎...

你捡过最大的漏是什么?

你捡过最大的漏是什么?

买了套二手房,软磨硬泡便宜了1个w 结果就是一屋子狼藉 原业主说反正你们要重新装修 就不收拾了 等完了你们一起收拾掉吧 落了很多柜子 电器是啥的 今天打开卧室柜子一看…现在是去存钱的路上有朋友知道这样存钱银行会给发大米跟油吗...

为什么工资五千的人会一下花八九千买手机呢?

这其实是一个何不食肉糜的问题,这个问题其实很现实,越是月薪5000越需要高档手机。 前段时间看了一个纪录片,讲外卖小哥都用什么手机,结果发现绝大多数外卖小哥用的手机都是旗舰机型,有的时候宁可买二手也要买旗舰。 因为1外卖小哥对ip6...

有哪些是你用上了mac才知道的事?

用上了高端的Mac(已退货)才知道:原来文件夹里面的文件,你看到是8个,其实可能有12个。其中3个图标重叠在一起了,另外一个被拖动到屏幕外面了。用上了高端的Mac(已退货)才知道:原来鼠标灵敏度有问题是因为系统内置了鼠标加速度,只能用控制台...

无意中发现技术主管写的代码,大家帮忙看看什么水平?

无意中发现技术主管写的代码,大家帮忙看看什么水平?

虽然很多答主用了诸如“典范级”、“心旷神怡” 的形容, 赞美这段代码, 但这里, 出于技术讨论的动机, 我说说不同看法.栈, 如果善于利用栈来处理树结构, 那么可以写出更简洁的代码, 根本不需要 recuresiveFn 这种方法. 泛型,...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。