分类: tech

  • 一些技术摘选及随想

    code review的目标,1)消除所有W4警告 2)给不能直接理解的代码加注释 3)丑陋代码的修改,主要针对过多for/while/if/switch这类控制的互相嵌套,把它们削平

    https://bugzilla.redhat.com/show_bug.cgi?id=638477 Linus随手写了个memcpy,当然你可以在glib或者dietlibc这些标准库实现中找到工程级强度代码。

    Python web server方案选择比较http://imilky.cn/blog/2010/04/python-wsgi-web-server/ 另外可以考虑http://mongrel2.org/ 现在这个新版本支持Python、Lua、Ruby、C++,uwsgi可以使用Lua开发 http://projects.unbit.it/uwsgi/wiki/Lua

    如何测试webserver性能,这篇可以作为开始阅读的起点:http://en.wikipedia.org/wiki/Web_server_benchmarking 

    另外很多测试提到ab,其实就是apachebench。

    如何让node.js与apache/nginx共用,如何让tornadoweb与apache/nginx共用,用不着那些有的没的复杂步骤,apache用rewrite,nginx考虑proxy_pass就都完事了。

    C语言正则表达式库,可以用libc里面的,也可以用pcre,oniguruma。

    fastcgi可以用C写,自己devkit就有范例 http://www.fastcgi.com/devkit/examples/authorizer.c

    http://hyperpolyglot.org/lisp Lisp: Common Lisp, Scheme, Clojure, Emacs Lisp lisp各式方言对比!

    http://hyperpolyglot.org/scripting Scripting Languages: PHP, Perl, Python, Ruby, Smalltalk 脚本语言特性比较cheatsheet。

    http://hyperpolyglot.org/small Scripting Languages: Bash, Tcl, Lua, JavaScript, Io 特性对比

    http://hyperpolyglot.org/c C, C++, Objective C, Java, C#特性对比cheatsheet

    C语言装逼教程推荐,http://sunxiunan.com/?p=1661 看后面书籍推荐部分,另外只需要加上一本《高效程序的奥秘》

    建议Python相关讲师多使用appengine,uliweb多加入一些相关示例,appengine又易用又免费又容易部署,那些迁移成本、不能完成的任务先不考虑,用appengine做一些力所能及的东西,让其他人能实际用到,这种成就感是对初学者最好的鼓励。

    最后一条推荐的新闻是Lua5.2进入rc alpha阶段,当然距离真正release也许还要不少时间,但是很值得关注!

  • 闲聊-完成的很快却完成度很低

    由于已经是历史了,所以这篇文字可以放出来了。2010年10月31日的草稿。

     

    ===========================================

    这是一个很有意思的问题,算是”软件工程”的一个很好实例。

    听人提到某个项目,开发人员很早就声称feature完成,等待release。可是不幸的是,测试以后发现种种问题,而且与硬件平台配合以后发现很严重的bug,导致这个项目迟迟不能release。

    问题是很多,主要是从当事人那里得来,简单列举一下。

    比如现在这个release已经包含了很多以前release版本commit过来的bug,本身就是很不稳定的产品,只是可以用罢了。

    还有一个很严重的问题是硬件平台firmware的不稳定导致软件平台无法稳定测试,出现问题很难判断,另外firmware的变动也会导致嵌入软件必须随之变动。firmware常常号称已经OK,但是却充斥了bug,动辄还是需要返工。

    再就是需要添加的feature太多,完成也不仔细,测试也不够。甚至在临近code freeze的时候还有新需求提出。

    再比如平台升级到CE6.0系统,对平台不熟悉,也是引入了很多新问题,原来OK的不OK了,甚至产生严重的Memory leak等等。

    还有比如文档不够,软件开发人员水平不够对产品不了解(导致新特性加入新bug),流程不完善,或者某个决定推来推去,谁都不拍板等问题。

    总而言之,貌似开发人员做的很快,但是快将近一年半以后依然没有release。这个问题一定不是第一次发生也不是最后一次发生。

    那么,该如何解决呢?

  • 必看!IT好书101

    http://www.ithome.com.tw/itadm/article.php?c=63952&s=2

    由IThome组织的一次调查。被调查的专家群(这里面很多人的确可称为专家)

    其中1)《人月神话》

    2)Unix环境高级编程

    3)计算机编程艺术

    4)掌握正则表达式

    5)有效用户界面(effective UI)

    6)算法导论(introduction to algorithms)

    7)计算机算法(computer algorithms)

    8)数据结构基础-C语言 ( fundametals of data structures in c)

    9)设计模式

    10)代码大全2

    11)重构

    12)编程技艺(code craft)

    13)applying and patterns

    14)持续集成 – improving software quality and reducing risk

    15)how we test software at microsoft

    16)had first html with css & xhtml

    17)designing web interfaces

    18)javascript:the good parts

    19) jquery in action

    20) jquery cookbook

    21)learning python 4th

    22) complete web monitering

    23) high performance web sites

    24) even faster web sites

    25) web operations: keeping the data on time

    26) web analytics 2.0

    http://sunxiunan.com

    27) website optimization: speed search engine & conversion rate secrets

    28) the art of community: building the new age of partication

    29) building web reputation systems

    30) the c programming language (K&R)

    31) C名题精选百则-使用C语言-技巧篇

    32)C++ primer plus 5th

    33) effective c++

    34) thinking in c++

    35) programming – principles and practice using c++

    36) programming the mobile web

    37) tapworthy – design great iphone apps

    38) building iphone apps with html, css and javascript

    39) WPF4 unleashed

    40) C# 4.0 in a nutshell

    41) C# in depth

    42) CLR via C# 3rd

    43) head first C#

    44) asp.net mvc2 实战开发

    45) asp.net3.5 最佳实务讲座using c#

    46)thinking in java 4th

    47)effective java programming language guide

    48) java puzzlers

    49) head first java 2nd

    50) core j2ee patterns

    51) programming in scala

    后面的书没啥意思,不录了。

  • 评《最容易被人忽略的基本代码优化技术》

    这篇文字主要来自我在TopLanguage讨论组里面的发言,仅作总结留记。

    首先要介绍一下原文作者Walter Bright,从他主页可见他是一个很牛的程序员,主要工作领域是写编译器。这个背景很重要,这是原文第二条的主要基础。但是也要注意到,一百个程序员里面也许都没有一个知道如何编写编译器,知道如何读写汇编的程序员比例也许会高一些,但不会很高,估计也就是百分之几的样子,比如我只会读一些简单的汇编代码,但是不会写。

    这篇文章认为Profiling和看汇编语言如何被运行的是两个基本技术,我在讨论中也没有提到写汇编,因为会读的人要比会写的多出不少。但是看汇编真的不是一种基本的优化代码手段。

    首先这个代码就很值得讨论,Javascript算不算代码?Ruby on rails或者Django这些框架算不算?或者Mono、Java、DotNet算不算代码?这些领域的程序员,很少有人会从汇编语言层面来做代码优化。如果你是一个类似项目的Team leader,组员说他最近在读某Rails项目的汇编代码,想找出慢的原因并加以改进,建议你立刻把他开掉,因为要么他是在磨洋工,要么是脑袋坏掉了。

    Profiling是优化代码的必要手段,而不是什么可以被忽略的技术。实在无法想象没有做Profiling,如何找出系统瓶颈,如何做代码优化。换句话说,没有Profiling其实也就没有基准数据,怎么保证你修改的代码一定是优化的?!从这一点上说,忽略Profiling来进行优化,很难想象。

    关于Windows下的Profiling,我以前写过一篇博客Profiling C++ performance in Windows http://sunxiunan.com/?p=1216 (名字虽然是英文的,但的确是我写的),里面介绍了一些我看到的或者用过的Profiling技术,颇为简陋,但也帮我做了不少代码优化相关的工作。

    正常一个通用的代码优化过程应该是这样的:

    1)用户提出性能有问题。如果没有人提出,那就尽量不要作修改,因为优化往往会带来更为混乱的代码,或者一些很难理解维护的代码关系。

    2)询问用户他们期望达到的运行速度是什么。因为优化往往是在这里做做在那里改改,如果达到了期望值就要立刻停下来,否则过犹不及。

    3)对当前系统做Profiling,收集运行数据。要注意Profiling会多少导致系统运行速度变慢,如何获取正确的运行数据,需要做一些编程工作。并不是拿来一个工具就一定会找到问题。另外还要确认Profiling数据本身是正确的,否则优化多半会是徒劳的。

    4)取得数据以后对系统做逐步改进。这一步要注意的是每一步改进都要尽可能的独立、可回退,每做一步改进都要做一次新的Profiling,保证修改以后的代码真正有了速度上的提升。如果对性能提升效果不明显,就不要引入这个修改,哪怕你在上面投入了很多精力,要敢于舍弃。另外做代码优化要着眼全局,不能局部优化了,但是整体运行速度下降。另外要注意对于每一次修改,应该有相应的测试手段保证修改不会影响系统运行。基本上这些优化代码都会引入一些新的bug。关于性能优化,有一篇很不错的文章可以参考http://csbabel.wordpress.com/2010/04/29/interviewbible-1-speed-optimization/

    5)代码优化达到期望值以后,停止优化过程,记录相关数据以及优化方法,留作以后查询。

    我们这里只提代码优化,其实优化还有很多其它手段,比如添加更好的硬件,换一个快的数据库或者做做数据库调优,改改系统参数,换一个更快的webserver,优化本来就是一个系统工程,光看某一个点很难做好优化,应该有全局观点。

    至于看汇编代码找问题,主要是针对C程序员或者C++程序员。但是要知道现在的编译器技术发展与8086时代是完全不一样了,编译配置是完全优化的代码,你很难从运行中看出问题,产生的汇编代码也很难读懂。这也是我很不推荐大家用看汇编来做优化的原因,有时间可以找到更多更严重的系统瓶颈。如果要从汇编层看问题,首先要看懂汇编代码,然后还要会改汇编代码,投入产出比例差太大。而且找到问题就看汇编,容易陷入细节,要时刻牢记优化应从大处着眼,抓大放小才是硬道理,我算是一个比较普通的VisualC++程序员,也做过一些简单的性能优化,基本上用不到看汇编就知道问题所在,profiling是最有用的也是唯一的工具。当然对于作者这样写编译器的程序员而言,看汇编写汇编是他们的日常工作,那就另当别论,但不能推而广之。

    另外需要强调的是,虽然不建议大家在优化时看汇编,但对于程序员来说,学习时深入到汇编这一层是非常有帮助的。比如一些常见的问题如calling conversions(http://sunxiunan.com/?p=1229),i++和++i有什么区别,const一些研究http://sunxiunan.com/?p=870 都是看到汇编代码以后就比较容易理解。

    总而言之,任何一个程序员要知道如何做代码优化,应该了解代码优化的基本步骤,自己相关领域的一些常见性能问题的模式,自己工作领域常见的Profiling方法和优化工具。有的放矢才能更好的工作。

  • KISS理论乱掰

    KISS理论不是一个感情方面的娱乐节目,而是编程领域里面很重要的设计思想。

    电脑编程与其它方面的科学相比,总差了一些严谨性或者理论不是那么完善,很多理论都是基于猜想说话,而没有数据支持。不过KISS这个理论我是认同的,从某种程度上讲,KISS很像是奥卡姆剃刀原理,越简单越正确。

    KISS是什么意思?这个就众说纷纭,也可见电脑编程之不科学。有人说是Keep it simple, Stupid!翻译过来就是,“简单点,傻瓜!”很有一些Nerd傲视群雄的气派,但是我喜欢翻译成“要简单,要尽量傻!”(也就是stupid翻译为形容词),理由后面会解释。在维基百科上http://en.wikipedia.org/wiki/KISS_principle介绍了KISS理论的一些相关概念,还有一些人名、链接什么的让你可以跑题。

    为何KISS理论很有趣很重要?我个人感觉,KISS理论让人时刻牢记,人是傻的、或者说大部分都是傻的,而编程代码是给人看的,所以复杂代码复杂算法复杂函数都会导致后续维护的困难,从软件工程角度上说,编码阶段与后期维护阶段时间基本上是1:N的关系,越复杂的软件N值越大。

    以前一个编程书籍阅读小组,想用UML来描述一个网页游戏的架构,结果对于一个类应该属于这个还是那个争吵不休,看了让人觉得很好笑。一个类属于A还是属于B是不是很重要的事情?depends on,但是对于五五开的问题来说,真的没必要争论几天时间,还不如选一个简单的方案先实现出来。

    还有常见的简单问题复杂化的例子是代码重用以及接口扩展。有些人觉得自己编程水平高,言必称重用。比如C语言没有类如何重用代码?都是似是而非的一些问题,连重用是什么这样基本概念都不知道,就敢张嘴乱讲,真真是2B了耶哥哥。接口扩展复杂化的例子在windows api里比比皆是,很多函数就在文档里指明,这个参数应该用NULL,这不扯么,都没有用的参数,当初怎么加进去的?!

    程序员为什么喜欢把代码复杂化?当然是有原因的,首先一个就是让人看不懂,而未知的东西都让人有一种神秘感恐惧感,这样程序员就感觉自己对代码有掌控力,你们都不行就我知道怎么改,你敢让我走路么?!另外一个原因是,复杂化的概念让人觉得有价值,比如你看最近《程序员》上关于云计算的文章,国内这些砖家穴者都纷纷出来推崇云计算,但是文章内容毫无价值臭的跟狗屎一般,都是一些大词(big word)的堆砌繁衍。我在twitter上与程序员主编问过,他无奈回答是”商业需要“。另外一说数据库,一定是Oracle最好,开源的不可靠,为何?因为Oracle那多复杂,连调优都能整成一个赚钱的职业。

    一个程序员要时刻牢记“简单化、傻瓜化”编程,代码要一目了然;长的函数要变短,要不怎么称得上简单;复杂的条件判断要分解,要不怎么称得上傻瓜化,太复杂还得用笔算是不是;至于变量名字,就越直白越好,比如bool IsThisGirlBeautiful(),这种函数一看就懂,连文档都不用写。