评《最容易被人忽略的基本代码优化技术》

这篇文字主要来自我在TopLanguage讨论组里面的发言,仅作总结留记。

首先要介绍一下原文作者Walter Bright,从他主页可见他是一个很牛的程序员,主要工作领域是写编译器。这个背景很重要,这是原文第二条的主要基础。但是也要注意到,一百个程序员里面也许都没有一个知道如何编写编译器,知道如何读写汇编的程序员比例也许会高一些,但不会很高,估计也就是百分之几的样子,比如我只会读一些简单的汇编代码,但是不会写。

这篇文章认为Profiling和看汇编语言如何被运行的是两个基本技术,我在讨论中也没有提到写汇编,因为会读的人要比会写的多出不少。但是看汇编真的不是一种基本的优化代码手段。

首先这个代码就很值得讨论,Javascript算不算代码?Ruby on rails或者Django这些框架算不算?或者Mono、Java、DotNet算不算代码?这些领域的程序员,很少有人会从汇编语言层面来做代码优化。如果你是一个类似项目的Team leader,组员说他最近在读某Rails项目的汇编代码,想找出慢的原因并加以改进,建议你立刻把他开掉,因为要么他是在磨洋工,要么是脑袋坏掉了。

Profiling是优化代码的必要手段,而不是什么可以被忽略的技术。实在无法想象没有做Profiling,如何找出系统瓶颈,如何做代码优化。换句话说,没有Profiling其实也就没有基准数据,怎么保证你修改的代码一定是优化的?!从这一点上说,忽略Profiling来进行优化,很难想象。

关于Windows下的Profiling,我以前写过一篇博客Profiling C++ performance in Windows http://sunxiunan.com/?p=1216 (名字虽然是英文的,但的确是我写的),里面介绍了一些我看到的或者用过的Profiling技术,颇为简陋,但也帮我做了不少代码优化相关的工作。

正常一个通用的代码优化过程应该是这样的:

1)用户提出性能有问题。如果没有人提出,那就尽量不要作修改,因为优化往往会带来更为混乱的代码,或者一些很难理解维护的代码关系。

2)询问用户他们期望达到的运行速度是什么。因为优化往往是在这里做做在那里改改,如果达到了期望值就要立刻停下来,否则过犹不及。

3)对当前系统做Profiling,收集运行数据。要注意Profiling会多少导致系统运行速度变慢,如何获取正确的运行数据,需要做一些编程工作。并不是拿来一个工具就一定会找到问题。另外还要确认Profiling数据本身是正确的,否则优化多半会是徒劳的。

4)取得数据以后对系统做逐步改进。这一步要注意的是每一步改进都要尽可能的独立、可回退,每做一步改进都要做一次新的Profiling,保证修改以后的代码真正有了速度上的提升。如果对性能提升效果不明显,就不要引入这个修改,哪怕你在上面投入了很多精力,要敢于舍弃。另外做代码优化要着眼全局,不能局部优化了,但是整体运行速度下降。另外要注意对于每一次修改,应该有相应的测试手段保证修改不会影响系统运行。基本上这些优化代码都会引入一些新的bug。关于性能优化,有一篇很不错的文章可以参考http://csbabel.wordpress.com/2010/04/29/interviewbible-1-speed-optimization/

5)代码优化达到期望值以后,停止优化过程,记录相关数据以及优化方法,留作以后查询。

我们这里只提代码优化,其实优化还有很多其它手段,比如添加更好的硬件,换一个快的数据库或者做做数据库调优,改改系统参数,换一个更快的webserver,优化本来就是一个系统工程,光看某一个点很难做好优化,应该有全局观点。

至于看汇编代码找问题,主要是针对C程序员或者C++程序员。但是要知道现在的编译器技术发展与8086时代是完全不一样了,编译配置是完全优化的代码,你很难从运行中看出问题,产生的汇编代码也很难读懂。这也是我很不推荐大家用看汇编来做优化的原因,有时间可以找到更多更严重的系统瓶颈。如果要从汇编层看问题,首先要看懂汇编代码,然后还要会改汇编代码,投入产出比例差太大。而且找到问题就看汇编,容易陷入细节,要时刻牢记优化应从大处着眼,抓大放小才是硬道理,我算是一个比较普通的VisualC++程序员,也做过一些简单的性能优化,基本上用不到看汇编就知道问题所在,profiling是最有用的也是唯一的工具。当然对于作者这样写编译器的程序员而言,看汇编写汇编是他们的日常工作,那就另当别论,但不能推而广之。

另外需要强调的是,虽然不建议大家在优化时看汇编,但对于程序员来说,学习时深入到汇编这一层是非常有帮助的。比如一些常见的问题如calling conversions(http://sunxiunan.com/?p=1229),i++和++i有什么区别,const一些研究http://sunxiunan.com/?p=870 都是看到汇编代码以后就比较容易理解。

总而言之,任何一个程序员要知道如何做代码优化,应该了解代码优化的基本步骤,自己相关领域的一些常见性能问题的模式,自己工作领域常见的Profiling方法和优化工具。有的放矢才能更好的工作。

发表评论