作者 | Isaac Lyman
译者 | 崔皓
谁都喜欢可读性强的代码,希望接手的代码容易阅读,容易理解,从而减少交接的工作量,但并不是所有的代码都有好的易读性,接手前辈的“屎山”通常是一件令开发者非常痛苦的事情。
关于代码有一种流行说法:代码被阅读的次数是它被书写次数的十倍,而且产品的寿命越长,这个比例就越高。考虑到这点,我们似乎对“理解代码”的投资明显不足。开发者通常更侧重于编码的能力,而不是阅读和解释已有代码的能力,即便这种场景在日常工作中会频繁出现。
开发任务的前80-95%时间应该用来阅读代码以及文档。在研究现有代码的过程中,你可能会学到很多东西,只有读完代码之后才能说:“这个功能已经存在了,或者是加入这个功能弊大于利”。
本文将为你介绍一些实用的代码阅读策略,你可以根据实际情况使用它们。
有时候,一段代码非常模糊会误导读者甚至让人难以推理出其含义。一个几乎没有风险的方法是重新命名局部变量和私有方法,以更准确地描述它们的作用。这些类型的修改不会影响到当前工作文件之外的功能,只要注意避免命名冲突,就不会导致逻辑错误。如果可能的话,使用IDE的重构工具(而不是文本查找和替换),这样就可以一键重命名所有被使用的东西了。
例如,考虑下面这段JavaScript代码
function ib(a, fn) {
return (a || []).reduce((o, i) => {
o[fn(i)] = i;
return o;
}, {});
}它阅读起来非常困难,方法名ib对理解函数功能毫无用处。不过,这并不妨碍你对它做出推断:
由于reduce是在a上被调用的(并且它返回到一个空数组),a应该是一个数组类型。
回调参数i将是该数组的一个元素。
reduce的第二个参数,一个空的对象{},告诉我们回调参数o是一个字典(对象)。
所以,通过重命名,我们可以得到如下结果:
function ib(array, fn) {
return (array || []).reduce((dict, element) => {
dict[fn(element)] = element;
return dict; }, {});
}通过上面的调整,可以看到fn是把数组元素变成字典的键。这就揭示了函数ib的目的:将数组转化为字典,用一个自定义的回调来确定索引每个元素的键。你可以把fn改名为getKey,而ib应该被命名为indexBy。重新命名一些标识符有助于我们理解代码,而不需要改变它的逻辑,也不需要一下子考虑所有的部分。如果可以的话,强烈推荐修改。毕竟这样可以提高代码的可读性,将使整个团队受益,同时它并没有增加或改变程序的功能。
大多数代码都会被其他代码调用。如果你在纠结一段代码,那么搞清楚它的调用情况对于了解它的功能有非常大的帮助。可以将方法重命名为ThisBreaksOnPurpose。然后进行编译,尽管在通过反射访问的情况下,你在运行时才会看到错误,但编译的错误提示会告诉这个方法在哪里被使用。
如果以上方法不可行,你可以通过文本搜索方法名。如果你很幸运,这个方法的名字在代码库中是唯一的。如果不是这样,你可能会得到一个更大的结果集,并且不得不翻阅大量不相关的代码。
有时,即使所有的标识符都被很好地命名,用例也很清晰,但是代码还是很难理解。不是所有的代码都符合编码习惯。有时某个特定的操作并没有遵循编码习惯。在最坏的情况下,有问题的代码出现在工作的代码库中,同时也没有使用明显的惯用语。
然而真正独特的代码在长期存在的代码库中是很少见的,特别是在单个表达式或代码行上。如果花几分钟时间在项目中搜索类似的代码,你可能会发现一些蛛丝马迹来解开整个谜题。
全文搜索是其中最简单的方法。你可以选择一个突出的代码片段进行搜索,搜索工具通常包括一个 "全词 "搜索选项,这意味着搜索care.exe不会返回scare.exertion这样的结果。如果你想进一步缩小范围,可以用正则表达式而不是文本短语进行搜索。
当然,偶尔即使是正则表达式也不足以缩小范围,没有人愿意花几个小时在搜索结果中寻找可能没有帮助的东西。学习一些高级搜索技术也是值得的。许多程序员喜欢使用Unix的命令行工具,如grep和awk,或者在Windows上使用手写的PowerShell脚本。我的首选是JS Powered Search,这是一个VS Code扩展,可以让你在JavaScript中定义一个逻辑搜索查询。
在一个完美的代码库中,你可以通过使用单元测试了解代码运行的状态。但是大多数代码库并不完美;由于效率的原因,单元测试工作往往显得可有可无,有时单元测试所描述的是过时的行为。尽管如此,检查并执行代码测试仍旧是一个好主意。至少,他们会描述代码的输入和输出。
如果没有单元测试或者单元测试不够全面,你还有第二次挽救的机会。可以编写一两个测试来证明代码是否存在的问题。如果发现问题并修复它然后提交修改,增加代码库的稳定性,让这段代码具有自解释的能力。你永远不必担心增加自动化测试会破坏现有的功能。
测试需要花费时间来编写,但此举可以大大提升代码执行效率。测试是代码正常工作的实际证据,有单元测试在你就会相信代码功能不会被破坏。
一旦有了单元测试,就有了很好的机制帮助你进行逐步的调试。设置一个断点或在这段代码的顶部添加一个断点/调试器语句。然后运行测试。一旦碰到了断点,执行就会暂停,你可以每次前进一行,进入和退出函数,并检查范围内所有变量的值。
如果你知道哪些用户行为触发了相关的代码,你就可以设置断点并正常运行程序,与程序的界面进行交互。如果你这样做,反馈回路会更长,但它也会使用更真实的数据,这可能有助于你发现空引用和边缘案例。
从上到下的逐行调试可能对运行几十或几百次的代码不太有用,比如嵌套的循环。对于这样的代码,可以在每个循环中添加汇总的变量,方便在循环结束的时查看总量。许多集成开发环境还允许你设置条件性断点,可以通过设置条件在循环中暂停并进入断点从而查看对应变量的值。
如果你的团队把编写文档作为开发过程的一部分,你可以快速跳过这一步。文档不应该是唯一的真理来源,你应该依靠代码来了解程序的行为方式。
文档虽然可以解释代码的 "How",但它往往更擅长解释 "Why"。有时你明白一段代码在做什么,但从另一个角度看貌似有些不对。所以在改变它之前,你应该尽一切努力去了解原来的程序员是根据什么信息或约束来编码的。
一篇好的内部文档也能为你指出知道真相的队友。如果你已经走到了这一步,做了足够多的工作,那么可以向外寻求帮助。确保让对方知道你在做什么工作,你想解决什么问题,他们很有可能会注意到你的视野盲区。
看到这里,你已经了解了几种有效的代码阅读策略。但即使如此,也可能会有无法解决的问题:一个奇怪的设计决定,一个打破代码库编码模式的方法,一个没有明显理由的代码特质。
版本控制系统可以显示代码库中任何一行代码的作者和提交。在Git中,就是git blame命令。大多数系统称它为"blue"或"annotate"。你可以在命令行或IDE中运行这个命令。出现的将是一个逐行的提交列表:一个提交哈希值,一个提交信息,以及一个作者。
如果该行代码的最近一次提交没有意义——例如它是一个格式化或空白的变化,就需要通过文件的变更历史来找到引入该行代码的提交。同样,版本控制系统有一些工具可以帮助你做到这一点。
一旦你拿到了PR和Ticket,不仅拥有了代码的背景,还可以找到与之相关的工作人员:代码的作者、PR审核者、任何评论或更新Ticket的人、签署QA的人。如果前几种方法都不奏效,那么是时候该和前辈们聊聊了。
通过对以上步骤的学习,或许对你有所帮助,特别是对代码背景的理解以及功能的实现方面。在你继续前进之前,还需要考虑重构代码以使其清晰,创建新的文档,在这里投入的任何时间都会让你和你的团队在代码的互动中获得回报。
有效阅读代码的能力是一种秘密武器,它可以使你快速通过技术面试,并使你成为任何团队的重要成员。擅长写代码的程序员是有价值的,擅长读代码的程序员就更具价值了。当生产中出现错误或急需开发新功能时,第一步也是最重要的一步就是理解,阅读代码是能让你顺利到达彼岸。
原文链接:https://stackoverflow.blog/2022/08/15/how-to-interrogate-unfamiliar-code/
崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。
如何在buildr项目中使用Ruby?我在很多不同的项目中使用过Ruby、JRuby、Java和Clojure。我目前正在使用我的标准Ruby开发一个模拟应用程序,我想尝试使用Clojure后端(我确实喜欢功能代码)以及JRubygui和测试套件。我还可以看到在未来的不同项目中使用Scala作为后端。我想我要为我的项目尝试一下buildr(http://buildr.apache.org/),但我注意到buildr似乎没有设置为在项目中使用JRuby代码本身!这看起来有点傻,因为该工具旨在统一通用的JVM语言并且是在ruby中构建的。除了将输出的jar包含在一个独特的、仅限ruby
在rails源中:https://github.com/rails/rails/blob/master/activesupport/lib/active_support/lazy_load_hooks.rb可以看到以下内容@load_hooks=Hash.new{|h,k|h[k]=[]}在IRB中,它只是初始化一个空哈希。和做有什么区别@load_hooks=Hash.new 最佳答案 查看rubydocumentationforHashnew→new_hashclicktotogglesourcenew(obj)→new_has
我的主要目标是能够完全理解我正在使用的库/gem。我尝试在Github上从头到尾阅读源代码,但这真的很难。我认为更有趣、更温和的踏脚石就是在使用时阅读每个库/gem方法的源代码。例如,我想知道RubyonRails中的redirect_to方法是如何工作的:如何查找redirect_to方法的源代码?我知道在pry中我可以执行类似show-methodmethod的操作,但我如何才能对Rails框架中的方法执行此操作?您对我如何更好地理解Gem及其API有什么建议吗?仅仅阅读源代码似乎真的很难,尤其是对于框架。谢谢! 最佳答案 Ru
我的假设是moduleAmoduleBendend和moduleA::Bend是一样的。我能够从thisblog找到解决方案,thisSOthread和andthisSOthread.为什么以及什么时候应该更喜欢紧凑语法A::B而不是另一个,因为它显然有一个缺点?我有一种直觉,它可能与性能有关,因为在更多命名空间中查找常量需要更多计算。但是我无法通过对普通类进行基准测试来验证这一点。 最佳答案 这两种写作方法经常被混淆。首先要说的是,据我所知,没有可衡量的性能差异。(在下面的书面示例中不断查找)最明显的区别,可能也是最著名的,是你的
几个月前,我读了一篇关于rubygem的博客文章,它可以通过阅读代码本身来确定编程语言。对于我的生活,我不记得博客或gem的名称。谷歌搜索“ruby编程语言猜测”及其变体也无济于事。有人碰巧知道相关gem的名称吗? 最佳答案 是这个吗:http://github.com/chrislo/sourceclassifier/tree/master 关于ruby-寻找通过阅读代码确定编程语言的rubygem?,我们在StackOverflow上找到一个类似的问题:
我目前正在使用以下方法获取页面的源代码:Net::HTTP.get(URI.parse(page.url))我还想获取HTTP状态,而无需发出第二个请求。有没有办法用另一种方法做到这一点?我一直在查看文档,但似乎找不到我要找的东西。 最佳答案 在我看来,除非您需要一些真正的低级访问或控制,否则最好使用Ruby的内置Open::URI模块:require'open-uri'io=open('http://www.example.org/')#=>#body=io.read[0,50]#=>"["200","OK"]io.base_ur
前言作为一名程序员,自己的本质工作就是做程序开发,那么程序开发的时候最直接的体现就是代码,检验一个程序员技术水平的一个核心环节就是开发时候的代码能力。众所周知,程序开发的水平提升是一个循序渐进的过程,每一位程序员都是从“菜鸟”变成“大神”的,所以程序员在程序开发过程中的代码能力也是根据平时开发中的业务实践来积累和提升的。提高代码能力核心要素程序员要想提高自身代码能力,尤其是新晋程序员的代码能力有很大的提升空间的时候,需要针对性的去提高自己的代码能力。提高代码能力其实有几个比较关键的点,只要把握住这些方面,就能很好的、快速的提高自己的一部分代码能力。1、多去阅读开源项目,如有机会可以亲自参与开源
嗨~大家好,这里是可莉!今天给大家带来的是7个C语言的经典基础代码~那一起往下看下去把【程序一】打印100到200之间的素数#includeintmain(){ inti; for(i=100;i 【程序二】输出乘法口诀表#includeintmain(){inti;for(i=1;i 【程序三】判断1000年---2000年之间的闰年#includeintmain(){intyear;for(year=1000;year 【程序四】给定两个整形变量的值,将两个值的内容进行交换。这里提供两种方法来进行交换,第一种为创建临时变量来进行交换,第二种是不创建临时变量而直接进行交换。1.创建临时变量来
文章目录git常用命令(简介,详细参数往下看)Git提交代码步骤gitpullgitstatusgitaddgitcommitgitpushgit代码冲突合并问题方法一:放弃本地代码方法二:合并代码常用命令以及详细参数gitadd将文件添加到仓库:gitdiff比较文件异同gitlog查看历史记录gitreset代码回滚版本库相关操作远程仓库相关操作分支相关操作创建分支查看分支:gitbranch合并分支:gitmerge删除分支:gitbranch-ddev查看分支合并图:gitlog–graph–pretty=oneline–abbrev-commit撤消某次提交git用户名密码相关配置g
打印1:defsum(i)i=i+[2]end$x=[1]sum($x)print$x打印12:defsum(i)i.push(2)end$x=[1]sum($x)print$x后者是修改全局变量$x。为什么它在第二个例子中被修改而不是在第一个例子中?类Array的任何方法(不仅是push)都会发生这种情况吗? 最佳答案 变量范围在这里无关紧要。在第一段代码中,您仅使用赋值运算符=为变量i赋值,而在第二段代码中,您正在修改$x(也称为i)使用破坏性方法push。赋值从不修改任何对象。它只是提供一个名称来引用一个对象。方法要么是破坏性