写点什么

React-diff 原理及应用

作者:xiaofeng
  • 2022-11-07
    浙江
  • 本文字数:7992 字

    阅读完需:约 26 分钟

抛砖引玉

React 通过引入 Virtual DOM 的概念,极大地避免无效的 Dom 操作,已使我们的页面的构建效率提到了极大的提升。但是如何高效地通过对比新旧 Virtual DOM 来找出真正的 Dom 变化之处同样也决定着页面的性能,React 用其特殊的 diff 算法解决这个问题。Virtual DOM+React diff 的组合极大地保障了 React 的性能,使其在业界有着不错的性能口碑。diff 算法并非 React 首创,React 只是对 diff 算法做了一个优化,但却是因为这个优化,给 React 带来了极大的性能提升,不禁让人感叹 React 创造者们的智慧!接下来我们就探究一下 React 的 diff 算法。

传统 diff 算法

在文章开头我们提到 React 的 diff 算法给 React 带来了极大的性能提升,而之前的 React diff 算法是在传统 diff 算法上的优化。下面我们先看一下传统的 diff 算法是什么样子的。


传统 diff 算法通过循环递归对节点进行依次对比,效率低下,算法复杂度达到 O(n^3),其中 n 是树中节点的总数。


O(n^3) 到底有多可怕呢?这意味着如果要展示 1000 个节点,就要依次执行上十亿次 的比较,这种指数型的性能消耗对于前端渲染场景来说代价太高了。而 React 却这个 diff 算法时间复杂度从 O(n^3)降到 O(n)。O(n^3)到 O(n)的提升有多大,我们通过一张图来看一下。



从上面这张图来看,React 的 diff 算法所带来的提升无疑是巨大无比的。接下来我们再看一张图:



从 1979 到 2011,30 多年的时间,才将时间复杂度搞到 O(n^3),而 React 从开源到现在不过区区几年的时间,却一下子干到 O(n),到这里不禁再次膜拜一下 React 的创造者们。那么 React 这个牛逼的 diff 算法是如何做到的呢?

React diff 原理

前面我们讲到传统 diff 算法的时间复杂度为 O(n^3),其中 n 为树中节点的总数,随着 n 的增加,diff 所耗费的时间将呈现爆炸性的增长。react 却利用其特殊的 diff 算法做到了 O(n^3)到 O(n)的飞跃性的提升,而完成这一壮举的法宝就是下面这三条看似简单的 diff 策略:


  • Web UI 中 DOM 节点跨层级的移动操作特别少,可以忽略不计

  • 拥有相同类的两个组件将会生成相似的树形结构,拥有不同类的两个组件将会生成不同的树形结构

  • 对于同一层级的一组子节点,它们可以通过唯一 id 进行区分


在上面三个策略的基础上,React 分别将对应的 tree diff、component diff 以及 element diff 进行算法优化,极大地提升了 diff 效率。

tree diff

基于策略一,React 对树的算法进行了简洁明了的优化,即对树进行分层比较,两棵树只会对同一层次的节点进行比较。


既然 DOM 节点跨层级的移动操作少到可以忽略不计,针对这一现象,React 只会对相同层级的 DOM 节点进行比较,即同一个父节点下的所有子节点。当发现节点已经不存在时,则该节点及其子节点会被完全删除掉,不会用于进一步的比较。这样只需要对树进行一次遍历,便能完成整个 DOM 树的比较。



策略一的前提是 Web UI 中 DOM 节点跨层级的移动操作特别少,但并没有否定 DOM 节点跨层级的操作的存在,那么当遇到这种操作时,React 是如何处理的呢?



接下来我们通过一张图来展示整个处理过程:



A 节点(包括其子节点)整个被移动到 D 节点下,由于 React 只会简单地考虑同层级节点的位置变换,而对于不 同层级的节点,只有创建和删除操作。当根节点发现子节点中 A 消失了,就会直接销毁 A;当 D 发现多了一个子节点 A,则会创 建新的 A(包括子节点)作为其子节点。此时,diff 的执行情况:create A → create B → create C → delete A。


由此可以发现,当出现节点跨层级移动时,并不会出现想象中的移动操作,而是以 A 为根节点的整个树被重新创建。这是一种影响 React 性能的操作,因此官方建议不要进行 DOM 节点跨层级的操作。


在开发组件时,保持稳定的 DOM 结构会有助于性能的提升。例如,可以通过 CSS 隐藏或显示节点,而不是真正地移除或添加 DOM 节点。

component diff

React 是基于组件构建应用的,对于组件间的比较所采取的策略也是非常简洁、高效的。


  • 如果是同一类型的组件,按照原策略继续比较 Virtual DOM 树即可。

  • 如果不是,则将该组件判断为 dirty component,从而替换整个组件下的所有子节点。

  • 对于同一类型的组件,有可能其 Virtual DOM 没有任何变化,如果能够确切知道这点,那么就可以节省大量的 diff 运算时间。因此,React 允许用户通过 shouldComponentUpdate()来判断该组件是否需进行 diff 算法分析,但是如果调用了 forceUpdate 方法,shouldComponentUpdate 则失效。


参考 React 实战视频讲解:进入学习


接下来我们看下面这个例子是如何实现转换的:



转换流程如下:



当组件 D 变为组件 G 时,即使这两个组件结构相似,一旦 React 判断 D 和 G 是不同类型的组件,就不会比较二 者的结构,而是直接删除组件 D,重新创建组件 G 及其子节点。虽然当两个组件是不同类型但结构相似时,diff 会影响性能,但正如 React 官方博客所言:不同类型的组件很少存在相似 DOM 树的情况,因此这种极端因素很难在实际开发过程中造成重大的影响。

element diff

当节点处于同一层级时,diff 提供了 3 种节点操作,分别为 INSERT_MARKUP (插入)、MOVE_EXISTING (移动)和 REMOVE_NODE (删除)。


  • INSERT_MARKUP :新的组件类型不在旧集合里,即全新的节点,需要对新节点执行插入操作。

  • MOVE_EXISTING :旧集合中有新组件类型,且 element 是可更新的类型,generateComponentChildren 已调用 receiveComponent ,这种情况下 prevChild=nextChild ,就需要做移动操作,可以复用以前的 DOM 节点。

  • REMOVE_NODE :旧组件类型,在新集合里也有,但对应的 element 不同则不能直接复用和更新,需要执行删除操作,或者旧组件不在新集合里的,也需要执行删除操作。



旧集合中包含节点 A、B、C 和 D,更新后的新集合中包含节点 B、A、D 和 C,此时新旧集合进行 diff 差异化对比,发现 B!=A,则创建并插入 B 至新集合,删除旧集合 A;以此类推,创建并插入 A、D 和 C,删除 B、C 和 D。




我们发现这些都是相同的节点,仅仅是位置发生了变化,但却需要进行繁杂低效的删除、创建操作,其实只要对这些节点进行位置移动即可。React 针对这一现象提出了一种优化策略:允许开发者对同一层级的同组子节点,添加唯一 key 进行区分。 虽然只是小小的改动,性能上却发生了翻天覆地的变化!我们再来看一下应用了这个策略之后,react diff 是如何操作的。



通过 key 可以准确地发现新旧集合中的节点都是相同的节点,因此无需进行节点删除和创建,只需要将旧集合中节点的位置进行移动,更新为新集合中节点的位置,此时 React 给出的 diff 结果为:B、D 不做任何操作,A、C 进行移动操作即可。


具体的流程我们用一张表格来展现一下:



  • index: 新集合的遍历下标。

  • oldIndex:当前节点在老集合中的下标。

  • maxIndex:在新集合访问过的节点中,其在老集合的最大下标值。


操作一栏中只比较 oldIndex 和 maxIndex:


  • 当 oldIndex>maxIndex 时,将 oldIndex 的值赋值给 maxIndex

  • 当 oldIndex=maxIndex 时,不操作

  • 当 oldIndex<maxIndex 时,将当前节点移动到 index 的位置




上面的例子仅仅是在新旧集合中的节点都是相同的节点的情况下,那如果新集合中有新加入的节点且旧集合存在 需要删除的节点,那么 diff 又是如何对比运作的呢?



注:最后还需要对旧集合进行循环遍历,找出新集合中没有的节点,此时发现存在这样的节点 D,因此删除节点 D,到此 diff 操作全部完成。


同样操作一栏中只比较 oldIndex 和 maxIndex,但是 oldIndex 可能有不存在的情况:


  • oldIndex 存在

  • 当 oldIndex>maxIndex 时,将 oldIndex 的值赋值给 maxIndex

  • 当 oldIndex=maxIndex 时,不操作

  • 当 oldIndex<maxIndex 时,将当前节点移动到 index 的位置

  • oldIndex 不存在

  • 新增当前节点至 index 的位置





当然这种 diff 并非完美无缺的,我们来看这么一种情况:



实际我们只需对 D 执行移动操作,然而由于 D 在旧集合中的位置是最大的,导致其他节点的 oldIndex < maxIndex,造成 D 没有执行移动操作,而是 A、B、C 全部移动到 D 节点后面的现象。针对这种情况,官方建议:


在开发过程中,尽量减少类似将最后一个节点移动到列表首部的操作。当节点数量过大或更新操作过于频繁时,这在一定程度上会影响 React 的渲染性能。




由于 key 的存在,react 可以准确地判断出该节点在新集合中是否存在,这极大地提高了 diff 效率。我们在开发过中进行列表渲染的时候,若没有加 key,react 会抛出警告要求开发者加上 key,就是为了提高 diff 效率。但是加了 key 一定要比没加 key 的性能更高吗?我们再来看一个例子:


现在有一集合[1,2,3,4,5],渲染成如下的样子:<div>1</div><div>2</div><div>3</div><div>4</div><div>5</div>---------------现在我们将这个集合的顺序打乱变成[1,3,2,5,4]。1.加key<div key='1'>1</div>             <div key='1'>1</div>     <div key='2'>2</div>             <div key='3'>3</div>  <div key='3'>3</div>  ========>  <div key='2'>2</div>  <div key='4'>4</div>             <div key='5'>5</div>  <div key='5'>5</div>             <div key='4'>4</div>  操作:节点2移动至下标为2的位置,节点4移动至下标为4的位置。
2.不加key<div>1</div> <div>1</div> <div>2</div> <div>3</div> <div>3</div> ========> <div>2</div> <div>4</div> <div>5</div> <div>5</div> <div>4</div> 操作:修改第1个到第5个节点的innerText---------------如果我们对这个集合进行增删的操作改成[1,3,2,5,6]。1.加key<div key='1'>1</div> <div key='1'>1</div> <div key='2'>2</div> <div key='3'>3</div> <div key='3'>3</div> ========> <div key='2'>2</div> <div key='4'>4</div> <div key='5'>5</div> <div key='5'>5</div> <div key='6'>6</div> 操作:节点2移动至下标为2的位置,新增节点6至下标为4的位置,删除节点4。
2.不加key<div>1</div> <div>1</div> <div>2</div> <div>3</div> <div>3</div> ========> <div>2</div> <div>4</div> <div>5</div> <div>5</div> <div>6</div> 操作:修改第1个到第5个节点的innerText---------------通过上面这两个例子我们发现:由于dom节点的移动操作开销是比较昂贵的,没有key的情况下要比有key的性能更好。
复制代码


通过上面的例子我们发现,虽然加了 key 提高了 diff 效率,但是未必一定提升了页面的性能。因此我们要注意这么一点:


对于简单列表页渲染来说,不加 key 要比加了 key 的性能更好


根据上面的情况,最后我们总结一下 key 的作用:


  • 准确判断出当前节点是否在旧集合中

  • 极大地减少遍历次数

应用实践

页面指定区域刷新

现在有这么一个需求,当用户身份变化时,当前页面重新加载数据。猛一看过去觉得非常简单,没啥难度的,只要在 componentDidUpdate 这个生命周期里去判断用户身份是否发生改变,如果发生改变就重新请求数据,于是就有了以下这一段代码:


import React from 'react';import {connect} from 'react-redux';let oldAuthType = '';//用来存储旧的用户身份@connect(  state=>state.user)class Page1 extends React.PureComponent{  state={    loading:true  }  loadMainData(){    //这里采用了定时器去模拟数据请求    this.setState({      loading:true    });    const timer = setTimeout(()=>{      this.setState({        loading:false      });      clearTimeout(timer);    },2000);  }  componentDidUpdate(){    const {authType} = this.props;    //判断当前用户身份是否发生了改变    if(authType!==oldAuthType){      //存储新的用户身份      oldAuthType=authType;      //重新加载数据      this.loadMainData();    }  }  componentDidMount(){    oldAuthType=this.props.authType;    this.loadMainData();  }  render(){    const {loading} = this.state;    return (      <h2>{`页面1${loading?'加载中...':'加载完成'}`}</h2>    )  }}export default Page1;
复制代码


看上去我们仅仅通过加上一段代码就完成了这一需求,但是当我们页面是几十个的时候,那这种方法就显得捉襟见肘了。哪有没有一个很好的方法来实现这个需求呢?其实很简单,利用 react diff 的特性就可以实现它。对于这个需求,实际上就是希望当前组件可以销毁在重新生成,那怎么才能让其销毁并重新生成呢?通过上面的总结我发现两种情况,可以实现组件的销毁并重新生成。


  • 当组件类型发生改变

  • 当 key 值发生变化接下来我们就结合这两个特点,用两种方法去实现。


第一种:引入一个 loading 组件。切换身份时设置 loading 为 true,此时 loading 组件显示;切换身份完成,loading 变为 false,其子节点 children 显示。


<div className="g-main">{loading?<Loading/>:children}</div> 
复制代码


第二种:在刷新区域加上一个 key 值就可以了,用户身份一改变,key 值就发生改变。


<div className="g-main" key={authType}>{children}</div>
复制代码


第一种和第二种取舍上,个人建议的是这样子的:


如果需要请求服务器的,用第一种,因为请求服务器会有一定等待时间,加入 loading 组件可以让用户有感知,体验更好。如果是不需要请求服务器的情况下,选用第二种,因为第二种更简单实用。

更加方便地监听 props 改变

针对这个需求,我们喜欢将搜索条件封装成一个组件,查询列表封装成一个组件。其中查询列表会接收一个查询参数的属性,如下所示:


import React from 'react';import {Card} from 'antd';import Filter from './components/filter';import Teacher from './components/teacher';export default class Demo2 extends React.PureComponent{  state={    filters:{      name:undefined,      height:undefined,      age:undefined    }  }  handleFilterChange=(filters)=>{    this.setState({      filters    });  }  render(){    const {filters} = this.state;    return <Card>      {/* 过滤器 */}      <Filter onChange={this.handleFilterChange}/>       {/* 查询列表 */}      <Teacher filters={filters}/>    </Card>  }}
复制代码


现在我们面临一个问题,如何在组件 Teacher 中监听 filters 的变化,由于 filters 是一个引用类型,想监听其变化变得有些复杂,好在 lodash 提供了比较两个对象的工具方法,使其简单了。但是如果后期给 Teacher 加了额外的 props,此时你要监听多个 props 的变化时,你的代码将变得比较难以维护。针对这个问题,我们依旧可以通过 key 值去实现,当每次搜索时,重新生成一个 key,那么 Teacher 组件就会重新加载了。代码如下:


import React from 'react';import {Card} from 'antd';import Filter from './components/filter';import Teacher from './components/teacher';export default class Demo2 extends React.PureComponent{  state={    filters:{      name:undefined,      height:undefined,      age:undefined    },    tableKey:this.createTableKey()  }  createTableKey(){    return Math.random().toString(36).substring(7);  }  handleFilterChange=(filters)=>{    this.setState({      filters,      //重新生成tableKey      tableKey:this.createTableKey()    });  }  render(){    const {filters,tableKey} = this.state;    return <Card>      {/* 过滤器 */}      <Filter onChange={this.handleFilterChange}/>       {/* 查询列表 */}      <Teacher key={tableKey} filters={filters}/>    </Card>  }}
复制代码


即使后期给 Teacher 加入新的 props,也没有问题,只需拼接一下 key 即可:


 <Teacher key={`${tableKey}-${prop1}-${prop2}`} filters={filters} prop1={prop1} prop2={prop2}/>
复制代码

react-router 中 Link 问题

先看一下 demo 代码:


import React from 'react';import {Card,Spin,Divider,Row,Col} from 'antd';import {Link} from 'react-router-dom';
const bookList = [{ bookId:'1', bookName:'三国演义', author:'罗贯中'},{ bookId:'2', bookName:'水浒传', author:'施耐庵'}]export default class Demo3 extends React.PureComponent{ state={ bookList:[], bookId:'', loading:true } loadBookList(bookId){ this.setState({ loading:true }); const timer = setTimeout(()=>{ this.setState({ loading:false, bookId, bookList }); clearTimeout(timer); },2000); } componentDidMount(){ const {match} = this.props; const {params} = match; const {bookId} = params; this.loadBookList(bookId); } render(){ const {bookList,bookId,loading} = this.state; const selectedBook = bookList.find((book)=>book.bookId===bookId); return <Card> <Spin spinning={loading}> { selectedBook&&(<div> <img width="120" src={`/static/images/book_cover_${bookId}.jpeg`}/> <h4>书名:{selectedBook?selectedBook.bookName:'--'}</h4> <div>作者:{selectedBook?selectedBook.author:'--'}</div> </div>) } <Divider orientation="left">关联图书</Divider> <Row> { bookList.filter((book)=>book.bookId!==bookId).map((book)=>{ const {bookId,bookName} = book; return <Col span={6}> <img width="120" src={`/static/images/book_cover_${bookId}.jpeg`}/> <h4><Link to={`/demo3/${bookId}`}>{bookName}</Link></h4> </Col> }) } </Row> </Spin> </Card> }}
复制代码


通过演示 gif,我们看到了地址栏的地址已经发生改变,但是并没有我们想象中那样从新走一遍 componentDidMount 去请求数据,这说明我们的组件并没有实现销毁并重新生成这么一个过程。解决这个问题你可以在 componentDidUpdate 去监听其改变:


  componentDidUpdate(){    const {match} = this.props;    const {params} = match;    const {bookId} = params;    if(bookId!==this.state.bookId){      this.loadBookList(bookId);    }  }
复制代码


前面我们说过如果是后期需要监听多个 props 的话,这样子后期维护比较麻烦.同样我们还是利用 key 去解决这个问题,首页我们可以将页面封装成一个组件 BookDetail,并且在其外层再包裹一层,再去给 BookDetail 加 key,代码如下:


import React from 'react';import BookDetail from './bookDetail';export default class Demo3 extends React.PureComponent{  render(){    const {match} = this.props;    const {params} = match;    const {bookId} = params;    return <BookDetail key={bookId} bookId={bookId}/>  }}
复制代码


这样的好处是我们代码结构更加清晰,后续拓展新功能比较简单。

结语:

  • React 的高效得益于其 Virtual DOM+React diff 的体系。diff 算法并非 react 独创,react 只是在传统 diff 算法做了优化。但因为其优化,将 diff 算法的时间复杂度一下子从 O(n^3)降到 O(n)。

  • React diff 的三大策略:

  • Web UI 中 DOM 节点跨层级的移动操作特别少,可以忽略不计。

  • 拥有相同类的两个组件将会生成相似的树形结构,拥有不同类的两个组件将会生成不同的树形结构。

  • 对于同一层级的一组子节点,它们可以通过唯一 id 进行区分。

  • 在开发组件时,保持稳定的 DOM 结构会有助于性能的提升。

  • 在开发过程中,尽量减少类似将最后一个节点移动到列表首部的操作。

  • key 的存在是为了提升 diff 效率,但未必一定就可以提升性能,记住简单列表渲染情况下,不加 key 要比加 key 的性能更好。

  • 懂得借助 react diff 的特性去解决我们实际开发中的一系列问题。


用户头像

xiaofeng

关注

努力写代码中 2022-08-18 加入

努力写代码中

评论

发布
暂无评论
React-diff原理及应用_React_xiaofeng_InfoQ写作社区