使用 Python 制作酷炫多彩的 Jenkins 插件词云图
Jenkins 插件名称高频关键词有哪些?一切尽在酷炫多彩的词云图
作为最流行的 CI/CD 工具,Jenkins 的优势之一是其生态强大,而这与其插件体系分不开的。 目前 Jenkins 插件 1500+ (截止2020年06月17日,插件数量为1749)。
近日发现词云比较好玩,于是想着以 Jenkins 插件名称为数据源,形成的词云会是什么样的呢,什么关键字会比较突出呢? 想到就去做,带着问题,带着好奇心,开始了实践之旅~
插件基本字段说明
以 Jenkins 中文本地化插件为例,在 Jenkins 官网插件详情页面可以看出: 其 ID 为 localization-zh-cn,Name 为 Localization: Chinese (Simplified)。
获取所有 Jenkins 插件的名称
如何获取所有 Jenkins 插件的名称呢?这里我想到3种方式,或许还有更多方式:
对比上面的三种方式,插件权限文件中并没有 Name 字段,插件更新中心配置文件相对从插件官网抓取比较简单。 所以计划从 update-center.json 进行解析,其中插件名称在 json 中对应字段为 title。
生成 Jenkins 插件名称文件
读取 update-center.json 中 plugin 的 title 字段,按行写入到 jenkins-plugins.txt 文件,代码如下:
jenkins-plugins.txt 文件共有 1749 行(与 Jenkins 1749个插件对应),其内容截图如下:
生成词云图
这里使用 Python 代码生成词云图,词的来源为 jenkins-plugins.txt,代码如下:
生成的词云图各个关键字以不同大小和比例,绘制出一幅多彩的画卷,感觉很美观、很酷炫!
以 Jenkins logo 为背景图片,生成的词云图如下:
以 Jenkins 中文社区的 kongfu 为背景图片,生成的词云图如下:
从词云图中可以看出,Pipeline 词频最高,Build、API、Job 次之,紧接着还有 Publisher、Notifier、Trigger、Step、GitHub 等等。
资源说明
所有代码及文件可以在 GitHub 仓库找到,如果你也觉得好玩有趣,顺便点个 star 吧,谢谢~
版权声明: 本文为 InfoQ 作者【donghui2020】的原创文章。
原文链接:【http://xie.infoq.cn/article/831228b70430c334b43dd4627】。文章转载请联系作者。
评论 (1 条评论)