Chrome 插件特性及实战场景案例分析
一、前言
提起 Chrome 扩展插件(Chrome Extension),每个人的浏览器中或多或少都安装了几个插件,像一键翻译、广告屏蔽、录屏等等,通过使用这些插件,可以有效的提高我们的工作效率;但有时候,我们想要的某个功能市面上没有现成的插件,作为开发者自然而然想到,自己是否可以动手开发一个定制化的插件?网上目前很多不错的关于 Chrome 插件的开发教程,可以帮助我们快速上手开发一个插件, 本文换个思路,从应用着手,通过讲解插件的特性来启发读者在工作中哪些场景可以通过插件来解决。
本文侧重点不是 Chrome 插件的基础开发,而是聚焦于原理及应用,会从插件的一些重要特性讲起,结合实际的插件案例,来分析这些特性的作用,从而能够启发读者利用这些特性开发出自己的效率工具,打造自己的趁手利器。
二、什么是 Chrome 扩展插件
什么是 Chrome 扩展插件?在我们印象中,它就像跑在浏览器中的应用,可以把浏览器想象成手机,那么插件就像是应用,我们从 Chrome 应用商店中下载,然后安装到 Chrome 浏览器中,就可以在浏览器中进行运行了。
我们看看官方解释:
Chrome Extension 是一个小的软件程序,它可以用来定义浏览器的浏览体验,让用户可以根据个人需求或者偏好定制 Chrome 浏览器的功能和行为,主要使用的技术栈是 HTML、Javascript 和 CSS。
一句话总结:Chrome 扩展插件是用前端的技术栈,来定制浏览器的功能,改善用户体验。
可能大家还听过一个词:Chrome Plugin。翻译过来是 Chrome 插件,和 Chrome 扩展插件很相近,特别容易搞混,那么他们之间有什么区别呢?
Chrome Extension 仅仅是用来增强浏览器网页的功能,它是利用浏览器提供的已有功能和和各种 API,进行功能组合,从而改善浏览器体验,停留在浏览器层面;
Chrome Plugin 不仅能增强网页的功能,同时能够扩展浏览器本身的功能;当浏览器提供的功能已经无法满足你的需求,就需要你通过 C/C++这样的编译语言来扩展浏览器的功能,例如我们常用的 Flash 插件,Chrome Plugin 工作在内核层面。
三、Chrome 扩展插件组成及核心机制
3.1 Chrome 扩展插件的组成
一个 Chrome 扩展插件通常由 3 类文件组成:
1) 配置文件 manifest.json,用于配置扩展的名称、版本号、作者、图标 icon、弹出界面、权限、脚本路径等信息;
2) 图片、css 等资源文件;
3)js 脚本文件,其中包含:
popup.js:用于搭配 popup.html 使用,点击插件图标的时候展示页面及页面逻辑控制;
background.js:用于定义一个后台页面,相当于一个常驻页面,生命周期和浏览器一致;
content_scripts.js:用于向页面中注入 JS 脚本,它可以操作页面 dom,但不会和页面中的脚本产生冲突。
3.2 Chrome 扩展插件的核心机制
Chrome 扩展插件中比较核心的几个概念:Extension Page、background.js、Content_script.js ,它们在什么时机触发,扮演着什么角色,彼此之间如何进行通信?可以看一下下面的关系图:
从图中可以看出,存在三个进程:扩展进程(Extension Process)、页面渲染进程(Render Process)、浏览器进程(Browser Process)。
1)扩展进程中运行 Extension Page,Extension Page 主要包括 backgrount.html 和 popup.html:
backgrount.html 中没有任何内容,是通过 background.js 创建生成,当浏览器打开时,会自动加载插件的 background.js 文件,它独立于网页并且一直运行在后台,它主要通过调用浏览器提供的 API 和浏览器进行交互;
popup.html 则不同,它有内容,是一个实实在在的页面,和我们普通的 web 页面一样,由 html、css、Javascript 组成,它是按需加载的,需要用户去点击地址栏的按钮去触发,才能弹出页面。
2)渲染进程主要运行 Web Page,当打开页面时,会将 content_script.js 加载并注入到该网页的环境中,它和网页中引入的 Javascript 一样,可以操作该网页的 DOM Tree,改变页面的展示效果;
3)浏览器进程在这里更多起到桥梁作用,作为中转可以实现 Extension Page 和 Content_script.js 之间的消息通信。
四、Chrome 扩展插件能做什么
Chrome 扩展插件的使用方向主要包含两个部分:
改变浏览器的外观:
brower Actions
page Actions
content menus
桌面通知
Omnibox
override 替代页
和浏览器进行交互:
Cookie 控制
标签控制
书签控制
下载控制
事件监听
网络请求
代理...
下面我们通过实例来分析这些功能的使用案例:
实例 1:替换页面
使用替代页,可以将 Chrome 默认的一些特定页面替换掉,改为使用扩展提供的页面。这让开发者可以开发更多有趣或者实用的基本功能页面。
下面是一个替换新标签页的效果图:
实例 2:Cookie 控制
通过 Cookie 的 API,可以对浏览器的 Cookie 进行增删改查工作。例如我们在开发工作中,经常需要频繁的清除浏览器缓存,每次都需要先找到清除按钮,弹出对话框,进行确认,操作很繁琐,如果开发一个 chrome 扩展插件,就可以轻松实现一键快捷清除浏览器 Cookie 等缓存,可以参考 Clear Store 插件。
实例 3:标签控制
使用 chrome.tabs API 与浏览器的标签系统进行交互,可以查询,创建、修改和重新排列浏览器中的标签页;我们在使用浏览器时,经常会打开很多标签页,显得很混乱,中途想要找打开的某个页面时,效率低且痛苦,如果能将这些标签页进行整理并有序的展示该多好,这里给大家推荐一个 Chrome 扩展插件:OneTab,该插件将所有打开的标签页在新的页面中有序的排列出来,如下图,一目了然。
我们甚至可以通过 tabs 实现页签之间的交互,出于安全考虑,tab 的属性中没有 document, 因此无法在扩展中直接获取某个标签页面中的 dom 元素,但是可以通过发送事件请求来实现:
实例 4:拦截请求或者反向代理
在在页面性能点检时,我们经常会检查页面图片资源是否存在尺寸过大,例如 200K,获取一个过大的图片列表页面。
chrome.webRequest API 只能在 background.js 中使用,所以可以通过图片拦截,将链接通过消息传给当前页面的 content_script.js,然后在 content_script.js 中进行图片下载和大小检查。
实例 5:页面元素操作
利用 Content_script.js 可操作 dom 元素,进行对页面元素进行操作,实现自动化登录,解放双手。
五、业务实践
痛点:我目前主要负责 vivo 全球商城的业务,全球化的业务都会面临国际化语言的问题,我们自主开发了一个多语言管理后台,配置 key-value,前端通过接口获取多语言在页面展示;如果运营查看页面,觉得某个文案不太合适,想要修改,需要进行如下图的一系列操作:
可以看到当运营想要修改文案时,他先要知道该文案对应的 key 值,而页面上面无法获取到 key 值,需要让开发提供,然后需要到多语言管理平台去更新对应 key 的值。
这样遇到两个问题:
不能所见即所得,看到页面不能知道 key 值;
所见无法直接修改,需要到另一个管理平台去修改 ;
目前这个在修改内容少的情况下,还是可以操作的,当修改内容很多时,这样操作起来很繁琐,效率很低。
思考:
1)运营是否可以直接在页面上修改并生效?
2)如果可以修改,怎么去实现跨域请求?
3)怎么实现登录授权?
如果对 Chrome 扩展插件熟悉,会发现 Chrome 就是为这量身定制,可以完美解决这些问题。
实现方案:
1)对页面中涉及文案 dom 进行修改,绑定多语言 key 值。
2)利用 Content_script,js 可以操作页面 dom 元素,当启动插件时,将页面所有可修改的文案的 dom 增加 contenteditable 属性,支持可编辑,如图;
3)创建一个修改面板,获取当前选中的 key 值和 value 值,和修改后的值,如上图,右上角面板。
4)利用 Chrome 插件支持跨站请求的特性,向多语言平台直接发送修改请求。
5)利用 Chrome 插件可以获取浏览器中 Cookie 特性,新开一个标签页打开多语言后台,进行登录,登录成功后就可以实现请求的授权修改了。
六、总结
最后总结一下,生活中经常会感叹:看过好多人生道理,依然过不好这一生。同样,使用过很多 Chrome 插件,依然码不好自己的一个插件,所以最后再送给你一个阅读 Chrome 插件源码的插件,堪称插件中的插件,插件中的王者——Chrome extension source viewer。通过它可以很方便的查看其它插件的源码,让我们能够站在巨人的肩膀上往前走~~
作者:vivo 互联网前端团队-Zhang hao
版权声明: 本文为 InfoQ 作者【vivo互联网技术】的原创文章。
原文链接:【http://xie.infoq.cn/article/aa3ce21439f787c259ae59ce9】。文章转载请联系作者。
评论