写点什么

linux 学习零基础教学课程:Linux 文件系统结构

作者:侠盗安全
  • 2022 年 1 月 05 日
  • 本文字数:7428 字

    阅读完需:约 24 分钟

linux学习零基础教学课程:Linux文件系统结构

全套学习资料移步至公众号【学神来啦】更多学习资料添加扣扣资源群:661308959

本节所讲内容:

  13.1  硬盘结构

  13.2  文件系统结构

  13.2  硬链接和软链接

  13.4  实战:解决磁盘有空间但创建不了文件-修复服务器文件系统

 

13.1  硬盘结构

文件系统结构,理解文件系统,要从文件储存说起。

硬盘结构:



互动:磁盘内部是真空的吗?   是:1  ,不是:2

 

磁盘内部不是真空,只不过里面的空气很干净。如果是真空,还不利于散热,会造成内部气体膨胀影响磁头的稳定性。

还有一些硬盘里面不是普通空气,而是惰性气体:氦(hai 害)气。它的好处是密度比空气小,可以减小磁盘转动阻力。但是充满氦气磁盘如果漏气会就损坏(常见于企业级)。

 

磁盘相关专业术语:

硬盘的内部是金属盘片,将圆形的盘片划分成若干个扇形区域,这就是扇区。若干个扇区就组成整个盘片。为什么要分扇区?是逻辑化数据的需要,能更好的管理硬盘空间。 以盘片中心为圆心,把盘片分成若干个同心圆,那每一个划分圆的“线条”,就称为磁道

硬盘内的盘片有两个面,都可以储存数据,而硬盘内的盘片往往不止一张,常见的有两张,那么,两张盘片中相同位置的磁道,就组成一个“柱面”,盘片中有多少个磁道,就有多少个柱面。盘片两面都能存数据,要读取它,必须有磁头,所以,每一个面,都有一个磁头,一张盘片就有两个磁头。

硬盘的存储容量=磁头数×磁道(柱面)数×每道扇区数×每道扇区字节数。

磁道从外向内自 0 开始顺序进行编号,各个磁道上的扇区数是在硬盘格式化时确定的。 

 

文件储存在硬盘上,硬盘的最小存储单位叫做"扇区"(Sector)。每个扇区储存 512 字节(相当于 0.5KB)。 

比较古老的 CHS (Cylinder/Head/Sector :磁头(Heads)、柱面(Cylinder)、扇区(Sector))结构体系. 因为很久以前,在硬盘的容量还非常小的时候,人们采用与软盘类似的结构生产硬盘。也就是硬盘盘片的每一条磁道都具有相同的扇区数,由此产生了所谓的 3D 参数,即是磁头数(Heads)、柱面数(Cylinders)、扇区数(Sectors)以及相应的 3D 寻址方式。 



互动 : 如上的磁盘结构有没有问题???

这种结构有问题:

以前老式的磁盘,每个磁道的扇区都一样,这样外磁道整个弧长要大于内部的扇区弧长,因而其磁记录密度就要比内部磁道的密度要小。最终,导致了外部磁道的空间浪费。

 

如查你磁盘设计工程师,你打算怎么解决?  你选择下面哪种方法?

方法 1:每个磁道的宽度不一样,从而让每个扇区面积尽量一样

方法 2:不再一刀切,让磁道中的扇区数量可以不一样



现在硬盘都采用这种技术:ZBR(Zoned Bit Recording)区位记录        (Zoned  zōnd )

Zoned-bit recording(ZBR 区位记录)是一种物理优化硬盘存储空间的方法,此方法通过将更多的扇区放到磁盘的外部磁道而获取更多存储空间。

ZBR 磁盘扇区结构示意图



互动: 从外面读数据快? 还是从里面快?  里:1  外:2



使用 ZBR 区位记录法做的磁盘有以下特点:读外圈的数据快,读内圈的数据慢,所以测试硬盘经常看到读取速度越来越慢的曲线图就很正常了。



 

互动:windows 安装系统的 C 盘或 Linux boot 分区一般安装在磁盘最外面还是最里面?

windows : C 盘安装最外,速度也是最快

Linux : boot 分区和 swap 分区,装最外面

磁盘写数据时,先从外面往里。

操作系统读取硬盘的时候,不会一个个扇区的读取,这样效率太低,而是一次性连续读取多个扇区,一次性读取一个“块”(block)。这种由多个扇区组成的“块”,是文件存取的最小单位。“块”的大小,最常见的是 1kb(连续 2 个“sector 扇区”组成一个“block 块”),(4kb 块 4096 字节 就是 8 个“sector 扇区”组成),一个扇区是 512 字节。

[root@xuegod63 ~]# stat /etc/passwd  #查看 Linux 系统的“块 block” 大小

  文件:"/etc/passwd"

  大小:2053       块:8          IO 块:4096 字节 =4KB  普通文件





Windows 文件右击属性查看大小:  说明我的 windows 的 NTFS 文件系统中默认的簇大小为 4KB

Windows 里的簇相当于 linux 中的 block 块,都是文件的最小存取单位,由多个扇区组成。

 

13.2  文件系统结构

Linux 文件系统由三部分组成 : 文件名,inode,block

Linux 文件系统: ext3,ext4,xfs

windows 文件系统: FAT32,NTFS

 

13.2.1  文件名

[root@xuegod63 ~]# cp /etc/passwd a.txt

[root@xuegod63 ~]# ls a.txt  # a.txt 就是文件名

 

13.2.2  inode 的内容

inode 包含文件的元信息,具体来说有以下内容:

* 文件的字节数

* 文件拥有者的 User ID

* 文件的 Group ID

* 文件的读、写、执行权限

* 文件的时间戳,共有三个:ctime 指 inode 上一次变动的时间,mtime 指文件内容上一次变动的时间,atime 指文件上一次打开的时间。

* 链接数,即有多少文件名指向这个 inode

* 文件数据 block 的位置

 

可以用 stat 命令,查看某个文件的 inode 信息:

[root@centos60 ~]# echo $LANG                  #查看语言环境变量

[root@centos60 ~]# LANG=en_US.UTF-8          #语言环境变量改为英文

[root@centos60 ~]# LANG=zh_CN.UTF-8          #语言环境变量改为中文

 

[root@xuegod63 ~]# stat a.txt

  File: ‘a.txt’

  Size: 2053       Blocks: 8          IO Block: 4096   regular file

Device: 803h/2051d Inode: 18521833    Links: 1

Access: (0644/-rw-r--r--)  Uid: (    0/    root)   Gid: (    0/    root)

Access 最近访问时间: 2018-05-16 14:55:36.061095050 +0800

Modify 最近更改时间: 2018-05-16 14:55:36.062095050 +0800

Change 最近改动时间: 2018-05-16 14:55:36.062095050 +0800

 Birth 创建时间: -

[root@xuegod63 ~]#  ll /etc/passwd #ll 其实就是查看 passwd 的 inode 信息

-rw-r--r--. 1 root root 2053 Sep 19  2017 /etc/passwd #ll 查看到时间是 mtime 时间(文件内容修改时间)

 

互动:

ctime 是什么?  是创建时间吗? 不会:1

mtime : modify time  修改文件内容的时间

atime  : access time   访问文件内容的时间

ctime 指 inode 上一次文件属性变动的时间,change time 。 比如: chmod +x  a.sh

mtime 指文件内容上一次变动的时间,modify time  。

如:echo aa >> a.sh 或 vim  a.sh 修改内容

atime 指文件上一次查看文件的时间,access time 。 如:  cat  a.sh

 

例 2:测试 mtime 时间,黑客先修改时间,再植入木马程序,防止 find / -mtime 查看木马文件

[root@xuegod63 ~]# stat a.txt #查看时间

[root@xuegod63 ~]# date -s '13:42'   #修改时间  

[root@xuegod63 ~]# vim a.txt #写入 aaaa 

[root@xuegod63 ~]# stat a.txt #查看时间

[root@xuegod63 ~]# chmod +x a.txt

注意:这里的思路是先改时间,然后修改文件,最后恢复时间,这样你按时间查找文件,就找不到

[root@xuegod63 ~]# hwclock -s       #以硬件时间为准,同步到系统时间

 

[root@xuegod63 ~]# yum -y install ntpdate

[root@xuegod63 ~]# ntpdate ntp1.aliyun.com #通过轮询指定正确时间的 NTP 服务器来校正本地系统时间

 

13.2.3  inode 的大小

inode 也会消耗硬盘空间,所以硬盘格式化的时候,操作系统自动将硬盘分成两个区域。一个是数据区,存放文件数据;另一个是 inode 区(inode table),存放 inode 所包含的信息。

每个 inode 节点的大小,一般是 128 字节或 256 字节。inode 节点的总数,在格式化时就给定,假定在一块 1GB 的硬盘中,每个 inode 节点的大小为 128 字节,每 1KB 就设置一个 inode,那么 inode table 的大小就会达到 128MB,占整块硬盘的 12.8%。

inode 号码

每个 inode 都有一个号码,操作系统用 inode 号码来识别不同的文件。

 Unix/Linux 系统内部不使用文件名,而使用 inode 号码来识别文件。对于系统来说,文件名只是 inode 号码便于识别的别称或者绰号。表面上,用户通过文件名,打开文件。实际上,系统内部这个过程分成三步:首先,系统找到这个文件名对应的 inode 号码;其次,通过 inode 号码,获取 inode 信息;最后,根据 inode 信息,找到文件数据所在的 block,读出数据。

 

例 1: 使用 ls -i 命令,可以看到文件名对应的 inode 号码

[root@xuegod63 ~]# ls -i a.txt

440269 a.txt

 

例 2:查看每个硬盘分区的 inode 总数和已经使用的数量,可以使用 df 命令。

[root@localhost ~]# df -i

Filesystem            Inodes   IUsed   IFree IUse% Mounted on

/dev/sda2             640848  151010  489838   24% /

tmpfs                 145579       1  145578    1% /dev/shm

/dev/sda1              51200      38   51162    1% /boot

注:由于每个文件都必须有一个 inode,因此有可能发生 inode 已经用光,但是硬盘还未存满的情况。这时,就无法在硬盘上创建新文件。

 

13.2.4  目录文件

Unix/Linux 系统中,目录(directory)也是一种文件。打开目录,实际上就是打开目录文件。 

目录文件的结构非常简单,就是一系列目录项的列表。每个目录项,由两部分组成:所包含文件的文件名,以及该文件名对应的 inode 号码。

[root@xuegod63 ~]# ls -id /etc

8388673 /etc

 例:ls -i 命令列出整个目录文件,即文件名和 inode 号码:

[root@xuegod63 ~]# ls -i /etc

 

13.2.5  block 块大小

block 是真正存储数据的地方。  

block 是 文件系统 中最小的存储单位

扇区 是  磁盘    中最小的存储单位



在 linux 下中叫:block,在 windows 中叫:簇

 

互动:为什么要有 block,直接使用扇区可以吗?直接往扇区上写数据就好了,为什么要搞 block?

 

操作系统读取硬盘的时候,不会一个个扇区(512 字节)地读取,这样效率太低,而是一次性连续读取多个扇区,即一次性读取一个"块"(block)。这种由多个扇区组成的"块",是文件存取的最小单位。"块"的大小,最常见的是 1KB,即连 2 个 sector 扇区组成一个 block。或 4K。

 

情景: 如果没有 block? 会怎么样?

夜深人静,下了 3.6G  cang.avi 的电影,一次读 512B , 寻址次数太多,太慢了。。。  

结果。。。你懂得 。。。?



block 调大:

优点: 速度快,节约寻址时间,缺点:空间浪费

比如: 2T 硬盘, 前 1.5T,使用 4K, 把剩下的 500G 格式化成 64K 簇。用空间换时间

 

例:查看 Linux 系统块大小

[root@xuegod63 ~]# stat /etc/passwd | grep IO

  大小:2053       块:8          IO 块:4096   普通文件

#block 到是 4K

总结:

硬盘的结构:ZBR 区位记录

inode(inode 表中主要看 inode 号)

inode 号唯一标识一个文件(一个文件系统里面)

inode 用完了,文件就不能创建了。

inode 数据量设置大一些:可以创建多个文件。占用空间比较大

inode 数据量设置小一些:可以创建很少文件。占用空间比较小

 

block

block 设置大:效率高,利用率低。(用空间换时间)

block 设置小:效率低,利用率高。(用时间换空间)

 

13.3  文件的硬链接和软链接

13.3.1  Linux 链接概念

Linux 链接分两种,一种被称为硬链接(Hard Link),另一种被称为软链接,即符号链接(Symbolic Link)。默认情况下,ln 命令产生硬链接。

【硬连接】:硬连接指通过索引节点号来进行连接。inode 是可以对应多个文件名的

在 Linux 的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号,称为索引节点号(Inode Index)。

在 Linux 中,多个文件名可以指向同一索引节点。一般这种连接就是硬连接。

硬连接的作用是允许一个文件拥有多个有效路径名,这样用户就可以建立硬连接到重要文件,以防止“误删”的功能。

只删除一个连接并不影响索引节点本身和其它的连接,只有当最后一个连接被删除后,文件的数据块及目录的连接才会被释放。也就是说,文件真正删除的条件是与之相关的所有硬连接文件均被删除。

【软连接】:另外一种连接称之为符号连接(Symbolic Link),也叫软连接。软链接文件有类似于 Windows 的快捷方式。它实际上是一个特殊的文件。在符号连接中,文件实际上是一个文本文件,其中包含的有另一文件的位置信息。

 

13.3.2  实战-1: ln 命令创建硬链接

语法格式:ln 源文件 目标文件

[root@xuegod63 ~]# echo 1111 > a.txt



硬链接的原理就是多个文件名指向同一个 inode,因此多个文件名共用一个 inode 号,达到共享与备份的目的,也可以理解为硬链接就是指向 inode 号的引用,删除一个硬链接并没有删除数据,只是删除了对这个 inode 的引用 

注意:源文件被删除,不影响链接文件的正常使用,因为 2 个文件都只是对 inode 的引用



硬链接不能针对目录创建



硬链接不能跨分区进行创建



硬链接的特点: 无法针对目录,跨分区无法实现。因为每个分区都有自己独立的 INDOE 编号

每个分区在格式化之前就指定 inode 数据元信息存放区和文件数据存放区,所以 inode 和数据的对应关系就会在一个分区里面关联,而硬链接的文件是同分区下指向同一个 inode 的两个文件,故硬链接不能夸分区.那当我在 A 分区下为文件 aa 建立硬链接 bb 的时候,我编辑 bb 文件,aa 文件内容也会跟着改变,那么当我把 bb 移动到另一个分区的时候 bb 的 inode 号发生了变化. bb 文件的变化已经不会对 aa 文件造成影响了,说明跨分区生成了 bb 新的 inode 元数据库,跟之前分区的 inode 元数据没有关系了

2《《

互动:为什么刚创建的一个目录,链接数就是 2?

[root@xuegod63 ~]# mkdir test

[root@xuegod63 ~]# ll -d test/

drwxr-xr-x 2 root root 6 5 月  16 15:55 test/

默认新一个空目录,此目录的第二字段就是 2(包含两个隐藏目录,因为每一个目录都有一个指向它本身的子目录"." 和指向它上级目录的子目录".."),所以 test 是一个链接, 隐藏目录. 是第二个链接

[root@xuegod63 ~]# ll -a test        #显示隐藏文件

[root@xuegod63 ~]# ll -id test/    #两个 inode 号是一样的

2453723 drwxr-xr-x 2 root root 6 5 月  16 15:55 test/

[root@xuegod63 ~]# ll -id test/.

2453723 drwxr-xr-x 2 root root 6 5 月  16 15:55 test/.

[root@xuegod63 ~]# ll -id test/..

16797761 dr-xr-x---. 5 root root 282 12 月 12 14:31 test/..

[root@xuegod63 ~]# ll -id /root

16797761 dr-xr-x---. 5 root root 282 12 月 12 14:31 /root

 

13.3.3  ln -s 创建软连接

软链接:相当于 windows 中的快捷方式

语法:ln  -s  源文件  软链接的名字

例:

[root@xuegod63 ~]# cp /etc/passwd a.txt

[root@xuegod63 ~]# ln -s a.txt a-link.txt

[root@xuegod63 ~]# ll a-link.txt

lrwxrwxrwx 1 root root 5 5 月  16 16:10 a-link.txt -> a.txt

[root@xuegod63 ~]# rm -rf a.txt

[root@xuegod63 ~]# ll a-link.txt

lrwxrwxrwx 1 root root 5 5 月  16 16:10 a-link.txt -> a.txt



注:源文件被删除,链接文件失效

例 2:能针对目录和跨分区创建软链接

[root@xuegod63 ~]# ln -s /boot/grub grub-link


 

能跨分区创建(源文件必须写绝对路径)

[root@xuegod63 ~]# cd /boot/

[root@xuegod63 boot]# ln -s ./grub /root/aaa

[root@xuegod63 boot]# ll /root/aaa

lrwxrwxrwx 1 root root 6 5 月  16 16:21 /root/aaa -> ./grub  #报错了

 

13.3.4  inode 的特殊作用

由于 inode 号码与文件名分离,这种机制导致了一些 Unix/Linux 系统特有的现象。

1. 有时,文件名包含特殊字符,无法正常删除。这时,直接删除 inode 节点,就能起到删除文件的作用。

2. 移动文件或重命名文件,只是改变文件名,不影响 inode 号码。

3. 打开一个文件以后,系统就以 inode 号码来识别这个文件,不再考虑文件名。因此,通常来说,系统无法从 inode 号码得知文件名。

互动:为什么每次修改完服务器配置文件后,都需要重新加载一下配置文件?

因为 vim 每次修改完后,Inode 号都会变。

[root@xuegod63 ~]# cp /etc/passwd passwd

[root@localhost ~]# ls -i passwd

393418 passwd

[root@localhost ~]# vim passwd     #添加一些内容

[root@localhost ~]# ll -i passwd

440252 -rw-r--r-- 1 root root 1813 Dec 29 12:04 passwd

就是为什么每次修改完服务器的配置文件,都要重启服务,重新读一下配置文件。

(vim 打开文件时会有 swp 缓存文件,关闭时会用 swp 重命名,所以 inode 会变)

 

13.4  实战:解决磁盘有空间但创建不了文件-修复服务器文件系统

13.4.1  解决磁盘有空间但创建不了文件

实战场景:在一台配置较低的 Linux 服务器(内存、硬盘比较小)的/data 分区内创建文件时,系统提示磁盘空间不足,用 df -h 命令查看了一下磁盘使用情况,发现/data 分区只使用了 80%,还有 1.9G 的剩余空间,但是无法创建新的文件。当时使用的是 root 用户。服务器没有被黑。

df -h

文件系统          容量    已用  可用   已用 %  挂载点

/dev/sda3        10G   8.0G  1.9G   80%    /

 

常识: 只要权限够,磁盘上有空间一定可以创建文件。 这个是错的。

排查:

df -i  

文件系统         Inode     已用(I)     可用(I)         已用(I)%   挂载点

/dev/sda3      5242880   5242880    0              100%        /

#后来用 df -i 查看了一下/data 所在的分区的索引节点(inode),发现已经用满(IUsed=100%),导致系统无法创建新目录和文件。

查找原因:

/data/cache 目录中存在数量非常多的小字节缓存文件,占用的 Block 不多,但是占用了大量的 inode。

 

解决方案 1:删除/data/cache 目录中的部分文件,释放出/data 分区的一部分 inode。

解决方案 2 : 在/data 备份好一些文件,然后删除这些文件,释放一些 inode,然后创建一个文件夹/data/cache2。在 cache2 下挂载一个新分区: sda4  ,下次写数据需要写到新分区 cache2 目录下。

 

inode 分区完后,可以增加吗? 不可以。  inode 总数是在格式化时定下来。有兴趣的可以自行扩展

13.4.2  实战:修复服务器文件系统

实战场景:公司服务器突然断电后,再次启动后,报如下错误。



解决方法:

fsck(英文全拼:file system check)

命令用于检查与修复 Linux 档案系统,可以同时检查一个或多个 Linux 档案系统。

输入 root 密码

输入密码后,报错是哪个分区坏了,就修复哪个分区,修复的时候,可能会丢失数据,如果有重要数据的话,一定要和领导说一声。

fsck -f -y  /dev/sda1   #把引导分区文件系统修复一下  # 慎用,给领导说一声

fsck -f -y  /dev/sda3   #把根分区文件系统修复一下    # 慎用,给领导说一声

reboot  重启

fsck 参数:

-y 对所有问题都回答 "yes"

-f 即使文件系统标记为 clean 也强制进行检查

更多学习资料请移步至公众号【学神来啦】

用户头像

侠盗安全

关注

还未添加个人签名 2021.11.04 加入

还未添加个人简介

评论

发布
暂无评论
linux学习零基础教学课程:Linux文件系统结构