天天看点

《编程珠玑(续)(修订版)》—第1章1.7节深入阅读

本节书摘来自异步社区《编程珠玑(续)(修订版)》一书中的第1章,第1.7节深入阅读,作者【美】jon bentley,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.7 深入阅读

don knuth的“empirical study of fortran programs”发表在1971年software——practice and experience 第一卷上(第105~133页)。关于“动态统计”的第3节讨论了行计数和过程时间计数,以及用这两种计数搜集的统计数据。第4节调优了17个关键的内循环,获得了从1.5~13.1倍的加速。在过去的十几年中,我每年至少要读一遍这篇经典论文,越读越觉得好,因此我强烈推荐这篇论文。

①brian kernighan(1942—),著名计算机科学家,现为普林斯顿大学教授。他与人合作创造了awk和ampl编程语言,对unix和c语言的设计也有很大贡献。他还与人合写了多部计算机名著,包括与ritchie合著的_the c programming language_。——编者注

②don knuth(1938—),中文名高德纳,著名计算机科学家,斯坦福大学荣休教授。因对算法分析和编程语言设计领域的贡献获1974年图灵奖。他是名著《计算机程序设计艺术》的作者,设计了tex排版系统。——编者注

③这7个过滤程序执行下列任务:(1) 连接所有输入文件;(2) 让每行包含一个单词,办法是把字母表以外的符号(<code>-c</code>)翻译成新行(ascii八进制12),去掉重复的空行(<code>-s</code>);(3) 把大写翻译成小写;(4) 排序,以便把相同的单词归并在一起;(5) 把连续的相同单词换成一个代表单词及其计数(<code>-c</code>);(6) 按照数值(<code>-n</code>)递减(<code>-r</code>)顺序来排序;(7) 经过一个流编辑器,在打印25行后退出(<code>q</code>)。本书10.5节用图片描述了上述第(4)、(5)、(6)步中的<code>sort</code> ¦ <code>uniq –c</code> ¦ <code>sort</code>组合。

④第二次排序花了第一次排序25%的时间,却只处理了输入行数的8%——数值(<code>-n</code>)标记很费时间。当我们在单列输入上监视这个管道的性能时,第二次排序几乎与第一次排序花一样的时间。这个性能监视的结果对输入数据很敏感。

⑤peter weinberger,著名计算机科学家,现在谷歌任职。他是awk语言的设计者之一(awk中的w),曾任贝尔实验室计算机科学研究部主任。——编者注

⑥rob pike(1956—),著名计算机科学家,现任职于谷歌。他参与了unix操作系统的开发,并领导了分布式操作系统plan 9和inferno以及limbo语言的设计。他与kernighan合撰了名著《程序设计实战》。——编者注

本文仅用于学习和交流目的,不代表异步社区观点。非商业转载请注明作译者、出处,并保留本文的原始链接。

继续阅读