p3c 插件,是怎么检查出你那屎山的代码?
作者:小傅哥
原文:https://mp.weixin.qq.com/s/RwzprbY2AhdgslY8tbVL-A
一、前言
你会对你用到都技术,好奇吗?
虽然我们都被称为码农,也都是写着代码,但因为所处场景需求的不同,所以各类码农也都做着不一样都事情。
有些人统一规范、有些人开发组件、有些人编写业务、有些人倒腾验证,但越是工作内容简单如 CRUD 一样的码农,用到别人提供好的东西却是越多。一会安装个插件、一会引入个 Jar 包、一会调别人个接口,而自己的工作就像是装配工,东拼拼西凑凑,就把产品需求写完了。
坏了,这么干可能几年下来,也不会有什么技术上都突破。因为你对那些使用都技术不好奇,不想知道它们是怎么实现的。就像阿里的 P3C 插件,是怎么检查代码分析出来我写的拉胯的呢?
二、P3C 插件是什么
P3C 是阿里开源代码库的插件工程名称,它以阿里巴巴Java开发手册为标准,用于监测代码质量的 IDEA/Eclipse 插件。
插件安装完成后,就可以按照编程规约,静态分析代码中出现的代码:命名风格、常量定义、集合处理、并发处理、OOP、控制语句、注释、异常等各项潜在风险,同时会给出一些优化操作和实例。
在遵守开发手册标准并按照插件检查都情况下,还是可以非常好的统一编码标准和风格都,也能剔除掉一些潜在都风险。
如果你是新手编程用户或者想写出标准都代码,那么非常建议你按照这样都插件来辅助自己做代码开发。当然如果你所在的公司也有相应都标准手册和插件,也可以按照后遵守它都约定的。
三、P3C 插件源码
在最开始使用这类代码检查都插件的时候,就非常好奇它是怎么发现我的屎山代码的,用了什么样都技术原理呢,如果我能分析下是不是也可以把这样都技术手段用到其他地方。
在分析这样一个代码检查插件前,先思考要从 IDEA 插件都源码查起,看看它是什么个逻辑,之后分析具体是如何使用都。其实这与一些其他的框架性源码学习都是类似的,拿到官网都文档、GitHub 对应的源码,按照步骤进行构建、部署、测试、调试、分析,进而找到核心原理。
P3C 以 IDEA 插件开发为例,主要涉及到插件部分和规约部分,因为是把规约检查的能力与插件技术结合,所以会涉及到一些 IDEA 开发的技术。另外 P3C 插件涉及到都技术语言不只是 Java 还有一部分 kotlin 它是一种在 Java 虚拟机上运行的静态类型编程语言。
1. 插件配置 p3c.xml
翻看源码最重要是要找到入口,这个入口通常也是你在使用插件、程序、接口等时候,最直接进入都那部分。
那么我们在使用 P3C 插件的时候,最明显的就是
编码规约扫描
通过源码中找到这个关键字,看它都涉及了哪个类都配置。action 是 IDEA 插件中用于配置窗体事件入口都地方,以及把这个操作配置到哪个按钮下和对应都快捷键。
2. 编码规约扫描( AliInspectionAction)
这是一个基于 kotlin 语言开发的插件代码逻辑,它通过 actionPerformed 方法获取到工程信息、类信息等,接下来就可以执行代码检查了 doInspections
3. 规约 p3c-pmd
当我们再往下翻看阅读的时候,就看到了一个关于 pmd 的东西。PMD 是一款采用 BSD 协议发布的 Java 程序静态代码检查工具,当使用 PMD 规则分析 Java 源码时,PMD 首先利用 JavaCC 和 EBNF 文法产生了一个语法分析器,用来分析普通文本形式的 Java 代码,产生符合特定语法结构的语法,同时又在 JavaCC 的基础上添加了语义的概念即 JJTree,通过 JJTree 的一次转换,这样就将 Java 代码转换成了一个 AST,AST 是 Java 符号流之上的语义层,PMD 把 AST 处理成一个符号表。然后编写 PMD 规则,一个 PMD 规则可以看成是一个 Visitor,通过遍历 AST 找出多个对象之间的一种特定模式,即代码所存在的问题。该软件功能强大,扫描效率高,是 Java 程序员 debug 的好帮手。
那么 p3c-pmd 是什么呢?
p3c-pmd 插件是基于 PMD 实现的,更具体的来说是基于 pmd-java 的,因为 PMD 不仅支持 Java 代码分析,还支持其他多种语言。
具体自定义规则的方式,通过自定义 Java 类和 XPATH 规则实现。
四、规约监测案例
讲道理,说一千道一万,还得是拿出代码跑一下,才知道 PMD 具体是什么个样子。
1. 测试工程
这是一个类似 p3c-pmd 的测试工程,通过自行扩展重写代码监测规约的方式,来处理自己关于代码的审核标准处理。
naming 下的类是用于处理一些和名称相关的规则,类名、属性名、方法名等
resources 下 ali-naming.xml 是规约的配置文件
2. 驼峰命名规约
通过继承 PMD 提供的 AbstractJavaRule 抽象类,重写 visit 方法,使用正则的方式进行验证。
visit 方法都入参类型非常多,分别用于处理类、接口、方法、代码等各项内容的监测处理,只要重写需要的方法,在里面进行自己都处理就可以。
ClassNamingShouldBeCamelRule、ConstantFieldShouldBeUpperCaseRule、LowerCamelCaseVariableNamingRule 三个类都功能类似,这里就不一一展示了,可以直接参考源码。
3. ali-naming.xml 配置
在 ali-naming.xml 用于配置规约处理类、priority 级别、message 提醒文字。
同时还可以配置代码示例,使用
<example>
标签,在里面写好标准代码即可。
4. 测试验证规约
问题类示例
单元测试
规约的测试验证可以直接使用 PMD.main 方法,在方法中提供字符串数组入参,这里的代码监测地址和规约配置需要是绝对路径。
测试结果
从测试结果可以看到,我们写的三个代码规约分别监测出了代码的命名风格、常量大写、方法名不符合驼峰标识。
同时你还可以测试
category/java/codestyle.xml
这个是 PMD 自身提供好的规约监测。
五、扩展了解 Sonar
其实有了 PMD 静态代码检查规约,能做都事情就很多,不是只对正在写的代码进行检查,还可以对不同阶段的代码进行分析和风险提醒,比如:准备提测阶段、已经上线完成,都可以做相应的监测处理。
而 Sonar 就是一个这样都工具,它是一个 Web 系统,可以展现静态代码扫描的结果,结果是可以自定义的,支持多种语言的原理是它的扩展性。https://www.sonarqube.org/
不遵循代码标准:sonar 可以通过 PMD,CheckStyle,Findbugs 等等代码规则检测工具规范代码编写。
潜在的缺陷:sonar 可以通过 PMD,CheckStyle,Findbugs 等等代码规则检测工具检 测出潜在的缺陷。
糟糕的复杂度分布:文件、类、方法等,如果复杂度过高将难以改变,这会使得开发人员 难以理解它们, 且如果没有自动化的单元测试,对于程序中的任何组件的改变都将可能导致需要全面的回归测试。
重复:显然程序中包含大量复制粘贴的代码是质量低下的,sonar 可以展示 源码中重复严重的地方。
注释不足或者过多:没有注释将使代码可读性变差,特别是当不可避免地出现人员变动 时,程序的可读性将大幅下降 而过多的注释又会使得开发人员将精力过多地花费在阅读注释上,亦违背初衷。
缺乏单元测试:sonar 可以很方便地统计并展示单元测试覆盖率。
糟糕的设计:通过 sonar 可以找出循环,展示包与包、类与类之间的相互依赖关系,可以检测自定义的架构规则 通过 sonar 可以管理第三方的 jar 包,可以利用 LCOM4 检测单个任务规则的应用情况, 检测耦合。
提高代码质量:了解自己在编码过程中犯过的错误,让自己的代码更具有可读性和维护性。
六、总结
PMD 是一款采用 BSD 协议的代码检查工具,你可以扩展实现为自己的标准和规范以及完善个性的提醒和修复操作。
另外基于 IDEA 插件实现的代码检查或者有审计要求的处理,也可以基于 IDEA 插件做更多的扩展,比如提醒修复、提供修复操作、自身业务逻辑的检查。例如 momo 开源库下的一款 IDEA 静态代码安全审计及漏洞一键修复插件 https://github.com/momosecurity/momo-code-sec-inspector-java
这里补充一点,kotlin 语言可以在 IDEA 中转换为 Java 语言,这样你在阅读类似这样的代码时候,如果不好看懂也可以转换一下在阅读。此外 IDEA 插件开发需要基于 Gradle 或者本身提供都模版进行创建,如果感兴趣也可以阅读我写的 IDEA 插件开发文章。
七、系列推荐
版权声明: 本文为 InfoQ 作者【小傅哥】的原创文章。
原文链接:【http://xie.infoq.cn/article/ac7758931c48b4735f9535ac6】。文章转载请联系作者。
评论