数据结构进阶 (一) 稀疏矩阵
一、稀疏矩阵的定义
对于那些零元素数目远远多于非零元素数目,并且非零元素的分布没有规律的矩阵称为稀疏矩阵(sparse)。
人们无法给出稀疏矩阵的确切定义,一般都只是凭个人的直觉来理解这个概念,即矩阵中非零元素的个数远远小于矩阵元素的总数,并且非零元素没有分布规律。
二、稀疏矩阵的压缩存储
由于稀疏矩阵中非零元素较少,零元素较多,因此可以采用只存储非零元素的方法来进行压缩存储。
由于非零元素分布没有任何规律,所以在进行压缩存储的时侯需要存储非零元素值的同时还要存储非零元素在矩阵中的位置,即非零元素所在的行号和列号,也就是在存储某个元素比如 aij 值的同时,还需要存储该元素所在的行号 i 和它的列号 j,这样就构成了一个三元组(i,j,aij)
的线性表。
三元组可以采用顺序表示方法,也可以采用链式表示方法,这样就产生了对稀疏矩阵的不同压缩存储方式。
2.1 稀疏矩阵的顺序实现
若把稀疏矩阵的三元组线性表按顺序存储结构存储,则称为稀疏矩阵的三元组顺序表。
顺序表中除了存储三元组外,还应该存储矩阵行数、列数和总的非零元素数目,这样才能唯一的确定一个矩阵。
顺序存储结构存储三元组线性表的C#
代码如下:
2.2 稀疏矩阵的十字链表实现
十字链表结点分为三类 :
表结点,它由五个域组成,其中 i 和 j 存储的是结点所在的行和列,right 和 down 存储的是指向十字链表中该结点所有行和列的下一个结点的指针,v 用于存放元素值。
行头和列头结点,这类结点也有域组成,其中行和列的值均为零,没有实际意义,right 和 down 的域用于在行方向和列方向上指向表结点,next 用于指向下一个行或列的表头结点。
总表头结点,这类结点与表头结点的结构和形式一样,只是它的 i 和 j 存放的是矩阵的行和列数。
十字链表可以看作是由各个行链表和列链表共同搭建起来的一个综合链表,每个结点 aij 既是处在第 i 行链表的一个结点,同时也是处在第 j 列链表上的一个结点,就你是处在十字交叉路口上的一个结点一样,这就是十字链表的由来。
十字链表中的每一行和每一列链表都是一个循环链表,都有一个表头结点。
三、稀疏矩阵的实现
矩阵运算通常包括矩阵转置、矩阵加、矩阵乘、矩阵求逆等。这里仅讨论最简单的矩阵转置运算算法。
矩阵转置运算是矩阵运算中最重要的一项,它是将m×n
的矩阵变成另外一个n×m
的矩阵,使原来矩阵中元素的行和列的位置互换而值保持不变,即若矩阵 N 是矩阵 M 的转置矩阵,则有:M[i][j]=N[j][i] (0≤i≤m-1,0≤j≤n-1)
。
三元组表表示转置矩阵的具体方法是:
第一步:根据 M 矩阵的行数、列数和非零元总数确定 N 矩阵的列数、行数和非零元总数。
第二步:当三元组表非空(M 矩阵的非零元不为 0)时,对 M 中的每一列 col(0≤col≤n-1),通过从头至尾扫描三元组表 data,找出所有列号等于 col 的那些三元组,将它们的行号和列号互换后依次放人 N 的 data 中,即可得到 N 的按行优先的压缩存贮表示。
版权声明: 本文为 InfoQ 作者【No Silver Bullet】的原创文章。
原文链接:【http://xie.infoq.cn/article/d2194adc8241ea795bcb3d99d】。文章转载请联系作者。
评论