尽管 HTTP/3 已经来了,HTTP/2 也得了解啊

用户头像
清远
关注
发布于: 2020 年 05 月 17 日
尽管HTTP/3已经来了,HTTP/2也得了解啊

因为HTTP/1.1性能以及速度方面的问题,人们想了一系列的优化措施。当优化措施依然不能满足要求时,就需要对协议进行升级。于是,有了HTTP/2。



源起



HTTP/2基于SPDY。SPDY 音同SPEEDY,也就是快,如果你看过手把手带你体验 HTTP/3 或者 【技术】QUIC的那些事 | QUIC为什么那么快,那么也就知道这个套路了。



2009 年,Google 的工程师Mike Belshe 和Roberto Peon 提出了一种HTTP 的替代方案:SPDY。



SPDY 不是第一个希望替代HTTP 的方案,但它是其中最重要的一个,因为它带来了显而易见的性能提升。



SPDY为HTTP/2 奠定了基础,并证明了其中一些关键特性的合理性,如多路复用、帧和首部压缩等。SPDY很快被整合进了Chrome 和Firefox,并最终几乎被所有主流浏览器所采有。而且几乎在同一时间,服务器和网络代理也对SPDY 提供了必要的支持。



2012 年初,HTTP 工作组启动了开发下一个HTTP 版本的工作,其纲领的关键部分阐述了工作组对新协议的一些期望,HTTP/2 的主要目标是改进传输性能,实现低延迟和高吞吐量。



HTTP/2 被寄予了如下期望:

  1. 相比于使用TCP 的HTTP/1.1,最终用户可感知的多数延迟都有能够量化的显著改善;

  2. 解决HTTP 中的队头阻塞问题;

  3. 并行的实现机制不依赖与服务器建立多个连接,从而提升TCP 连接的利用率,特别是在拥塞控制方面;

  4. 保留HTTP/1.1 的语义,可以利用已有的文档资源(如上所述),包括(但不限于)HTTP 方法、状态码、URI 和首部字段;

  5. 明确定义HTTP/2 和HTTP/1.x 交互的方法,特别是通过中介时的方法(双向);明确指出它们可以被合理使用的新的扩展点和策略。



工作组发出了征求建议书的通知,并最终决定使用SPDY 作为HTTP/2 的起点。RFC 7540 在2015 年5 月14 日发布了,HTTP/2 成为正式协议。



HTTP/2浏览器支持情况:



协议格式



分帧层



HTTP /2 性能增强的核心,全在于新增的二进制分帧层,它定义了如何封装HTTP 消息并在客户端与服务器之间传输。

HTTP2二进制分帧层



这里所谓的“层”,指的是位于套接字接口与应用可见的高层HTTP API 之间的一个新机制。HTTP 的语义,包括各种动词、方法、首部,都不受影响,不同的是传输期间对它们的编码方式变了。HTTP/1 以换行符作为纯文本的分隔符,而HTTP2 将所有传输的信息分割为更小的消息和帧,并对它们采用二进制格式的编码(HTTP为ASCII)。



所有HTTP/2 通信都在一个连接上完成,这个连接可以承载任意数量的双向数据流。相应地,每个数据流以消息的形式发送,而消息由一或多个帧组成,这些帧可以乱序发送,然后再根据每个帧首部的流标识符重新组装。



要理解HTTP/2,就必须理解流、消息和帧这几个基本概念。

  1. 所有通信都在一个 TCP 连接上完成(HTTP1,对单个域名,可能打开4~6个TCP连接)。

  2. 流是连接中的一个虚拟信道,可以承载双向的消息;每个流都有一个唯一的整数标识符(1、2…N)。

  3. 消息是指逻辑上的 HTTP 消息,比如请求、响应等,由一或多个帧组成。

  4. 帧是最小的通信单位,承载着特定类型的数据,如 HTTP 首部、负荷,等等



帧由帧首部和负载组成,帧首部长度相同,都是9个字节:



具体字段含义如下:



帧类型



帧类型如下:



1. DATA帧



2. HEADERS帧



3. PRIORITY帧



4. RST_STREAM帧



5. SETTINGS帧



6. PUSH_PROMISE帧







7. PING帧

作用类似于 ping 。



8. GOAWAY帧



9. WINDOW_UPDATE帧





10. CONTINUATION帧





首部压缩



HTTP 的每一次通信都会携带一组首部,用于描述传输的资源及其属性。在HTTP1 中,这些元数据都是以纯文本形式发送的,通常会给每个请求增加500~800 字节的负荷。如果算上HTTP cookie,增加的负荷通常会达到上千字节。为减少这些开销并提升性能,HTTP/2 会压缩首部元数据:

HTTP/2 在客户端和服务器端使用“首部表”来跟踪和存储之前发送的键-值对

首部表在HTTP/2的连接存续期内始终存在,由客户端和服务器共同渐进地更新





交互流程



HTTP2的交互流程:

HTTP2流、消息和帧

HTTP2:多向请求和响应



HTTP2推送



Curl 查看 HTTP/2



通过curl查看HTTP2的交互流程:curl -v --http2 https://cn.bing.com

备注:H2即为HTTP/2



对应抓包如下:



在抓包中,我们也能看出当前走的是HTTP/2协议,任选TLSv1.2的Application Data行,并点开:



抓包显示,也确实是HTTP/2协议。



HTTP/2默认支持HTTPS,端口为443。



如果不指定HTTP/2,输入命令:curl -v https://cn.bing.com,输出如下:



对应抓包为:



实际上,到这步,抓包中并没有显示到底是HTTP/2还是HTTP/1,任选TLSv1.2的Application Data行,并点开,看具体传输报文:



备注:

  1. 在测试过程中,发现cn.bing.com有测不准原理,有些时候返回支持HTTP/2和HTTP1.1、有些时候只返回HTTP1.1(通过ALPN),因此即使指定了HTTP/2,也不一定走HTTP2流程。

  2. 在Windows下测试时,有些时候虽然不指定HTTP/2,当cn.bing.com返回HTTP/2时,也会走HTTP/2,不确定这个是curl默认选的,还是curl缓存了之前的设置。



浏览器查看HTTP/2



使用Firefox浏览器,默认方式访问并抓包:



抓包显示是HTTP/2,那么,Firefox是怎么知道要用HTTP/2呢?



在TLSv1.2的Client Hello报文中,有如下信息:



报文显示,客户端向服务端发送的Client Hello报文中的ALPN部分表明了支持的协议为HTTP/2及HTTP1.1。



那么,看下服务端的Server Hello,信息如下:



报文显示,服务端选择了HTTP/2的交互方式,Application Data也确实显示是HTTP/2方式。



由于前面我们讲述了HTTP2的报文格式,抓包中Application Data报文是加密的,直接看不出来,为了看具体HTTP2报文格式,可以通过如下方式(Chrome 浏览器和FireFox浏览器):

  1. 设置用户变量:SSLKEYLOGFILE,值为会话密钥的存储文件(设置用户变量后,需要重启浏览器







在浏览器中打开bing网站,并抓包:



可以看到,此时Wireshark已经能解密出具体报文了,并且显示出了具体的报文类型,譬如WINDOW_UPDATA报文。



进一步,过滤HTTP/2的报文:



以HEADERS报文为例,具体看一下抓包中的信息。



长度信息:

前三字节为报文长度,值为0x027f,十进制为639



类型信息:



第4字节值类型为TYPE,值为0x01,为HEADERS报文



FireFox的HTTP/2是默认打开的,如果要使用HTTP1.1,得关闭这个使能:

  1. 浏览器中输入:about:config

  2. 输入:



其他



优化

为了加快访问速度,HTTP/1进行了一系列的优化,但是由于HTTP/2、采取了一些设计上的优势,因此HTTP/1的优化,有些HTTP/2抛弃了;有些依然保留,具体如下:



使用率





参考资料

1. 《HTTP权威指南》

2. 《HTTP/2基础教程》

3.《Web性能权威指南》

4. https://http2-explained.haxx.se/en

https://joji.me/zh-cn/blog/walkthrough-decrypt-ssl-tls-traffic-https-and-http2-in-wireshark/



发布于: 2020 年 05 月 17 日 阅读数: 72
用户头像

清远

关注

好好吃饭,好好上班 2018.03.21 加入

万一哪天不做程序员了,那就开个小饭馆吧

评论

发布
暂无评论
尽管HTTP/3已经来了,HTTP/2也得了解啊