如何看待 Rust 写的 PNG 解码器比 C 实现更快?
作者:卡卷网发布时间:2024-12-15 00:17浏览数量:118次评论数量:0次
如何看待?
很简单啊,Rust比C快呗。
C不是底层语言
acm有一个很著名的文章:C不是底层语言,你的电脑不是一个更快的PDP11
大体意思是说:C发明出来是老旧计算机PDP11上的一层浅浅抽象。
但是,PDP11出来以后,后世计算机加了十分十分多的科技与狠活。
而C没有跟进这些科技,逐渐落后于时代。
比如 - 随着CPU的pipeline越来越深,branch的代价越来越高,进而CPU引入了conditional move instruction (if (A) B = C;是一条CPU指令)。
C没有跟进。
又比如 - von neumann bottleneck在CPU上越来越严重。为了根治这个问题,CPU使得一条指令可以做很多计算 - simd。
C没有跟进。
又又比如 - CPU时钟周期越来越快,但是相对应的内存latency则几乎没有提升。这导致越来越多的时间花在了内存读取里面,一个指针读取的是L1/L2 cache还是L3 cache/main memory,是底层性能优化最重要的问题。
C没有跟进。
对比下,看看隔壁老黄的CUDA,就知道真正的底层语言是什么样子的了
- 通过masking执行branch两边,以此避免pipeline stall
- 默认一切simd
- 提供scratchpad memory,一种更快但是小小的内存(跟一般的大但慢的分开),而不是指望memory hirearchy自动优化
但问题来了,知不知道那编译器人最多?NVIDIA。老黄一车车拉编译器人去NVIDIA做什么?CUDA编译器。因为GPU的发展越来越复杂,CUDA离GPU越来越远,所以要做的工作越来越多!
所以 - 连CUDA都离真实硬件这么远,又是谁给C勇气自称底层语言的?梁静茹吗?
常规C不如Rust快
如果我们要认为C比Python快,一个不可避免的问题就是 -
为什么我不能整个Python项目就单纯是用Python FFI调一个高度优化的二进制汇编代码?
这样很明显有FFI的语言性能都是一样的(最快的),很明显,这不合理。
问题出在那?问题出在汇编不是Python!
更具体的 - 我们一般写程序都会遵守‘编程守则’。
比如Java:用虚函数不用静态函数,C++:用RAII管理内存,C:用指针传参甚至用指针返回复杂struct,Go:用pair右边来返回错误,没错误是nil。
我们说‘XXX语言怎么怎么样’,一般都是说‘常规(idiomatic)XXX代码’ - 符合这些守则得出的代码,怎么怎么样。道理很明显 - 总不能python说自己又支持OOP又内存安全又快,结果支持OOP又安全的部分很慢,打开快的部分只是内联汇编吧?同理,总不能C说自己又内存安全又快,结果快的部分不内存安全,内存安全的部分内嵌bohm gc拖慢性能吧?这样的宣传策略,太遥遥领先了。
你不能只在你的feature对你有利的时候爱它。
那问题很明显:常规C是一个缓慢的编程语言。
对,libpng没有simd,没有对内存优化存取策略,导致过时了,但这难道不是C的问题吗?
是皮衣黄为了CUDA霸权,强迫C不能有simd不能有scratchpad memory,还是C自己不肯加,落后于时代?
更惨的是,Rust甚至不需要加simd。
When I talked to an LLVM developer about this, they mentioned that it's easier for LLVM to vectorize Rust than C because Rust emitsnoalias
annotations almost everywhere.
LLVM 开发者提到,由于 Rust 几乎到处使用noalias
属性,相比 C 语言,LLVM 更容易为 Rust 生成自动向量化的代码。
为什么C不能呢?哦,是因为C指针数组模模糊糊分不清,是因为C类型系统更弱,推不出更多的noalias。
所以C更慢。
无限制C不如Rust快
有的人看到这,会说‘不行!我就是要双标,C可以内联汇编Python不可以!’
但那怕如此Rust依然更快。
因为rust的png比C的libpng更快。
唉?我是什么意思?不是说这是因为libpng写得不好吗?
重点正是如此。
libpng是什么?
这可不是路边的任意代码,是png库。而且是被chrome用着的png库。
这种东东,叫做互联网之栋梁不为过吧?
这种库会缺人手维护吗?
很明显,不缺,甚至有一个png仙人写了十多万行代码。第二名也快了,两个加起来平均十万!
另一边呢?哈哈哈,最大奉献着是个头像都没的用户,写了七千五百行搞了个demo就跑路了,渣男!
对比要控制变量。跟博古特赛跑你不能先跑五秒,同理,对比性能要控制工作量,libpng在工作量更多的前提下更慢,不就代表C比rust慢吗?
C自己把libpng维护者时间精力耗完了,还顶着臭脸时不时一套UB segfault组合拳打出去,吓跑其他潜在维护者,导致没有人有时间写simd代码,不怪C怪谁?怪米哈游的原神太好玩,导致png仙人无心写程序?
免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。
相关推荐

你 发表评论:
欢迎