写点什么

Python 基础(七) | 文件、异常以及模块详解

作者:timerring
  • 2022 年 10 月 02 日
    山东
  • 本文字数:9459 字

    阅读完需:约 31 分钟

⭐本专栏旨在对 Python 的基础语法进行详解,精炼地总结语法中的重点,详解难点,面向零基础及入门的学习者,通过专栏的学习可以熟练掌握 python 编程,同时为后续的数据分析,机器学习及深度学习的代码能力打下坚实的基础。

🔥本文已收录于 Python 基础系列专栏: Python基础系列教程 欢迎订阅,持续更新。



实际应用中,我们绝大多数的数据都是通过文件的交互完成的

7.1 文件的读写

7.1.1 文件的打开

  • 文件的打开通用格式,推荐使用 with,因为如果不用 with 的话就需要考虑 close 的操作


with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:    "对文件进行相应的读写操作"# 使用with 块的好处:执行完毕后,自动对文件进行close操作。
复制代码


【例 1】一个简单的文件读取


with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f:     # 第一步:打开文件    text = f.read()                                                   # 第二步:读取文件    print(text)
复制代码


我是一个测试文件
复制代码


1、文件路径


  • 完整路径,如上例所示

  • 程序与文件在同一文件夹,可简化成文件名


with open("测试文件.txt", "r", encoding = "gbk") as f:     # 第一步:打开文件    text = f.read()                                        # 第二步:读取文件    print(text)
复制代码


我是一个测试文件
复制代码


2、打开模式


  • "r"  只读模式,如文件不存在,报错

  • "w" 覆盖写模式,如文件不存在,则创建;如文件存在,则完全覆盖原文件

  • "x" 创建写模式,如文件不存在,则创建;如文件存在,报错

  • "a"  追加写模式,如文件不存在,则创建;如文件存在,则在原文件后追加内容

  • "b" 二进制文件模式,不能单独使用,需要配合使用如"rb","wb","ab",该模式不需指定 encoding

  • "t" 文本文件模式,默认值,需配合使用 如"rt","wt","at",一般省略,简写成如"r","w","a"

  • "+",与"r","w","x","a"配合使用,在原功能基础上,增加读写功能

  • 打开模式缺省,默认为只读模式


3、字符编码


  • 万国码 utf-8


包含全世界所有国家需要用到的字符


  • 中文编码 gbk


专门解决中文编码问题


  • windows 系统下,如果缺省,则默认为 gbk(所在区域的编码)

  • 为清楚起见,除了处理二进制文件,建议不要缺省 encoding

7.1.2 文件的读取

1、读取整个内容——f.read()


with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f:       # 第一步:打开文件    text = f.read()                                                    # 第二步:读取文件    print(text)
复制代码


临江仙·滚滚长江东逝水滚滚长江东逝水,浪花淘尽英雄。是非成败转头空。青山依旧在,几度夕阳红。白发渔樵江渚上,惯看秋月春风。一壶浊酒喜相逢。古今多少事,都付笑谈中。
复制代码



with open("三国演义片头曲_utf.txt", encoding="utf-8") as f:     # "r",可缺省,为清晰起见,最好写上    text = f.read()                                                       print(text)
复制代码


临江仙·滚滚长江东逝水滚滚长江东逝水,浪花淘尽英雄。是非成败转头空。青山依旧在,几度夕阳红。白发渔樵江渚上,惯看秋月春风。一壶浊酒喜相逢。古今多少事,都付笑谈中。
复制代码



  • 解码模式不匹配


with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:         text = f.read()                                                        print(text)
复制代码


---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-6-8e9ea685585d> in <module> 1 with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:----> 2 text = f.read() 3 print(text)

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence
复制代码


with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省,windows系统默认为"gbk"    text = f.read()                                                        print(text)
复制代码


---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-7-480622bc01aa> in <module> 1 with open("三国演义片头曲_utf.txt", "r") as f: # encoding缺省,windows系统默认为"gbk"----> 2 text = f.read() 3 print(text)

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence
复制代码


2、逐行进行读取——f.readline()


with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:         for i in range(3):        text = f.readline()                                                   # 每次只读取一行        print(text)
复制代码


临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
复制代码



with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:         while True:        text = f.readline()        if not text:            # print(text is "")            break        else:            # print(text == "\n") # 换行符不会被判定为空            print(text, end="")      # 保留原文的换行,使print()的换行不起作用,因为print本身也是带有一个换行作用的
复制代码


临江仙·滚滚长江东逝水滚滚长江东逝水,浪花淘尽英雄。是非成败转头空。
青山依旧在,几度夕阳红。白发渔樵江渚上,惯看秋月春风。一壶浊酒喜相逢。古今多少事,都付笑谈中。
复制代码


3、读入所有行,以每行为元素形成一个列表——f.readlines()


with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:    text = f.readlines()              # 注意每行末尾有换行符    print(text)               
复制代码


['临江仙·滚滚长江东逝水\n', '滚滚长江东逝水,浪花淘尽英雄。\n', '是非成败转头空。\n', '\n', '青山依旧在,几度夕阳红。\n', '白发渔樵江渚上,惯看秋月春风。\n', '一壶浊酒喜相逢。\n', '古今多少事,都付笑谈中。\n']
复制代码


with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:         for text in f.readlines():                                                           print(text)                # 不想换行则用print(text, end="")         
复制代码


临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
复制代码




​ 青山依旧在,几度夕阳红。​


​ 白发渔樵江渚上,惯看秋月春风。​


一壶浊酒喜相逢。
古今多少事,都付笑谈中。
复制代码



4、文本文件读取小结


文件比较大时,read()和 readlines()占用内存过大,不建议使用


readline 用起来又不太方便


with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:         for text in f:         # f本身就是一个可迭代对象,每次迭代读取一行内容         print(text)  
复制代码


临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
复制代码




​ 青山依旧在,几度夕阳红。​


​ 白发渔樵江渚上,惯看秋月春风。​


一壶浊酒喜相逢。
古今多少事,都付笑谈中。
复制代码



5、二进制文件


图片:二进制文件


with open("test.jpg", "rb") as f:             print(len(f.readlines()))
复制代码


69
复制代码

7.1.3 文件的写入

1、向文件写入一个字符串或字节流(二进制)——f.write()


with open("恋曲1980.txt", "w", encoding="utf-8") as f:                              f.write("你曾经对我说\n")        # 文件不存在则立刻创建一个        f.write("你永远爱着我\n")        # 如需换行,末尾加换行符\n,文件会在第二行进行写入        f.write("爱情这东西我明白\n")        f.write("但永远是什么\n")
复制代码


2、追加模式——"a"


with open("恋曲1980.txt", "a", encoding="utf-8") as f:                              f.write("姑娘你别哭泣\n")        # 如果文件存在,新写入内容会覆盖掉原内容,一定要注意!!!        f.write("我俩还在一起\n")                f.write("今天的欢乐\n")        f.write("将是明天创痛的回忆\n")
复制代码


3、将一个元素为字符串的列表整体写入文件——f.writelines()


ls = ["春天刮着风", "秋天下着雨", "春风秋雨多少海誓山盟随风远去"]with open("恋曲1980.txt", "w", encoding="utf-8") as f:    f.writelines(ls)
复制代码


ls = ["春天刮着风\n", "秋天下着雨\n", "春风秋雨多少海誓山盟随风远去\n"]with open("恋曲1980.txt", "w", encoding="utf-8") as f:    f.writelines(ls)
复制代码

7.1.4 既读又写

1、"r+"


  • 如果文件名不存在,则报错

  • 指针在开始

  • 要把指针移到末尾才能开始写,否则会覆盖前面内容


with open("浪淘沙_北戴河.txt", "r+", encoding="gbk") as f:#     for line in f:#         print(line)   # 全部读一遍后,指针到达结尾    f.seek(0,2)         # 或者可以将指针移到末尾f.seek(偏移字节数,位置(0:开始;1:当前位置;2:结尾))    text = ["萧瑟秋风今又是,\n", "换了人间。\n"]    f.writelines(text)
复制代码


2、"w+"


  • 若文件不存在,则创建

  • 若文件存在,会立刻清空原内容!!!


with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:    pass
复制代码


with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:    text = ["萧瑟秋风今又是,\n", "换了人间。\n"]  # 清空原内容    f.writelines(text)                             # 写入新内容,指针在最后    f.seek(0,0)            # 指针移到开始    print(f.read())        # 读取内容
复制代码



3、"a+"


  • 若文件不存在,则创建

  • 指针在末尾,添加新内容,不会清空原内容


with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:    f.seek(0,0)            # 指针移到开始    print(f.read())        # 读取内容
复制代码


大雨落幽燕,白浪滔天。秦皇岛外打鱼船。一片汪洋都不见,知向谁边?往事越千年,魏武挥鞭,东临碣石有遗篇。萧瑟秋风今又是,换了人间。
复制代码


with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:    text = ["萧瑟秋风今又是,\n", "换了人间。\n"]      f.writelines(text)                             # 指针在最后,追加新内容,     f.seek(0,0)            # 指针移到开始    print(f.read())        # 读取内容
复制代码


大雨落幽燕,白浪滔天。秦皇岛外打鱼船。一片汪洋都不见,知向谁边?往事越千年,魏武挥鞭,东临碣石有遗篇。萧瑟秋风今又是,换了人间。萧瑟秋风今又是,换了人间。
复制代码


7.1.5 数据的存储与读取

通用的数据格式,可以在不同语言中加载和存储


本节简单了解两种数据存储结构 csv 和 json


1、csv 格式


由逗号将数据分开的字符序列,可以由 excel 打开


  • 读取


with open("成绩.csv", "r", encoding="gbk") as f:    ls = []     for line in f:                              # 逐行读取        ls.append(line.strip("\n").split(","))  # 去掉每行的换行符,然后用“,”进行分割for res in ls:    print(res)
复制代码


['编号', '数学成绩', '语文成绩']['1', '100', '98']['2', '96', '99']['3', '97', '95']
复制代码


  • 写入


ls = [['编号', '数学成绩', '语文成绩'], ['1', '100', '98'], ['2', '96', '99'], ['3', '97', '95']]with open("score.csv", "w", encoding="gbk") as f:   # encoding="utf-8"中文出现乱码    for row in ls:                                  # 逐行写入        f.write(",".join(row)+"\n")                 # 用逗号组合成字符串形式,末尾加换行符
复制代码


也可以借助 csv 模块完成上述操作


2、json 格式


常被用来存储字典类型


  • 写入——dump()


import json
scores = {"Petter":{"math":96 , "physics": 98}, "Paul":{"math":92 , "physics": 99}, "Mary":{"math":98 , "physics": 97}}with open("score.json", "w", encoding="utf-8") as f: # 写入整个对象 # indent 表示字符串换行+缩进 ensure_ascii=False 显示中文 json.dump(scores, f, indent=4, ensure_ascii=False)
复制代码


  • 读取——load()


with open("score.json", "r", encoding="utf-8") as f:                                                 scores = json.load(f)           # 加载整个对象        for k,v in scores.items():            print(k,v)
复制代码


Petter {'math': 96, 'physics': 98}Paul {'math': 92, 'physics': 99}Mary {'math': 98, 'physics': 97}
复制代码

7.2 异常处理

7.2.1 常见异常的产生

1、除 0 运算——ZeroDivisionError


1/0
复制代码


---------------------------------------------------------------------------
ZeroDivisionError Traceback (most recent call last)
<ipython-input-1-9e1622b385b6> in <module>----> 1 1/0

ZeroDivisionError: division by zero
复制代码


2、找不到可读文件——FileNotFoundError


with open("nobody.csv") as f:    pass
复制代码


---------------------------------------------------------------------------
FileNotFoundError Traceback (most recent call last)
<ipython-input-2-f2e8c7d0ac60> in <module>----> 1 with open("nobody.csv") as f: 2 pass

FileNotFoundError: [Errno 2] No such file or directory: 'nobody.csv'
复制代码


3、值错误——ValueError


传入一个调用者不期望的值,即使这个值的类型是正确的


s = "1.3"n = int(s)
复制代码


---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-8-69942d9db3c0> in <module> 1 s = "1.3"----> 2 n = int(s)

ValueError: invalid literal for int() with base 10: '1.3'
复制代码


4、索引错误——IndexError


下标超出序列边界


ls = [1, 2, 3]ls[5]
复制代码


---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-9-acf459124b52> in <module> 1 ls = [1, 2, 3]----> 2 ls[5]

IndexError: list index out of range
复制代码


5、类型错误——TypeError


传入对象类型与要求不符


1 + "3"
复制代码


---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-10-ee505dc42f75> in <module>----> 1 1 + "3"

TypeError: unsupported operand type(s) for +: 'int' and 'str'
复制代码


6、其他常见的异常类型


NameError 使用一个未被定义的变量


KeyError 试图访问字典里不存在的键


。。。


print(a)
复制代码


---------------------------------------------------------------------------
NameError Traceback (most recent call last)
<ipython-input-11-bca0e2660b9f> in <module>----> 1 print(a)

NameError: name 'a' is not defined
复制代码


d = {}d["1"]
复制代码


---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-12-e629d551aca0> in <module> 1 d = {}----> 2 d["1"]

KeyError: '1'
复制代码


当异常发生的时候,如果不预先设定处理方法,程序就会中断

7.2.2 异常的处理

提高程序的稳定性和可靠性


1、try_except


  • 如果 try 内代码块顺利执行,except 不被触发

  • 如果 try 内代码块发生错误,触发 except,执行 except 内代码块

  • 单分支


x = 10y = 0try:    z = x/yexcept ZeroDivisionError:                  # 一般来说会预判到出现什么错误    # z = x/(y+1e-7)    # print(z)    print("0不可以被除!")    
复制代码


0不可以被除!
复制代码


x = 10y = 0try:    z = x/yexcept NameError:                  # 一般来说会预判到出现什么错误    # z = x/(y+1e-7)    # print(z)    print("0不可以被除!")   
复制代码


---------------------------------------------------------------------------
ZeroDivisionError Traceback (most recent call last)
<ipython-input-14-aea58863ad72> in <module> 2 y = 0 3 try:----> 4 z = x/y 5 except NameError: # 一般来说会预判到出现什么错误 6 # z = x/(y+1e-7)

ZeroDivisionError: division by zero
复制代码


  • 多分支


ls = []d = {"name": "timerring"}try:    y = m    # ls[3]    # d["age"]except NameError:    print("变量名不存在")except IndexError:    print("索引超出界限")except KeyError:    print("键不存在")
复制代码


变量名不存在
复制代码


  • 万能异常 Exception (所有错误的老祖宗)


ls = []d = {"name": "大杰仔"}try:    # y = m    ls[3]    # d["age"]except Exception:    print("出错啦")
复制代码


出错啦
复制代码


  • 捕获异常的值 as


ls = []d = {"name": "大杰仔"}# y = xtry:    y = m    # ls[3]    # d["age"]except Exception as e:    # 虽不能获得错误具体类型,但可以获得错误的原因    print(e)
复制代码


name 'm' is not defined
复制代码


2、try_except_else


  • 如果 try 模块执行,则 else 模块也执行


可以将 else 看做 try 成功的额外奖赏


try:    with open("浪淘沙_北戴河.txt") as f:        text = f.read()except FileNotFoundError:    print("找不到该文件,ta是不是用了美颜?")else:    for s in ["\n", ",", "。", "?"]:         # 去掉换行符和标点符号        text = text.replace(s, "")    print("毛主席的名作《浪淘沙_北戴河》共由{}个字组成。".format(len(text)))
复制代码


毛主席的名作《浪淘沙_北戴河》共由65个字组成。
复制代码


3、try_except_finally


  • 不论 try 模块是否执行,finally 最后都执行


ls = []d = {"name": "大杰仔"}# y = xtry:    y = m    # ls[3]    # d["age"]except Exception as e:    # 虽不能获得错误具体类型,但可以获得错误的值    print(e)finally:    print("不论触不触发异常,都将执行")
复制代码


name 'm' is not defined不论触不触发异常,都将执行
复制代码

7.3 模块简介


已经被封装好


无需自己再“造轮子”


声明导入后,拿来即用

7.3.1 广义模块分类

1、Python 内置


 时间库 time\  随机库 random\  容器数据类型 collection\  迭代器函数 itertools


2、第三方库


 数据分析 numpy、pandas\  数据可视化 matplotlib\  机器学习 scikit-learn\  深度学习 Tensorflow


3、自定义文件


  • 单独 py 文件

  • 包——它包含多个 py 文件


# 文件夹内多个py文件,再加一个__init__.py文件(内容可为空)
复制代码

7.3.2 模块的导入

1、导入整个模块——import 模块名


  • **调用方式:**模块名.函数名或类名


import time
start = time.time() # 调用time模块中的time()time.sleep(3) # 调用time模块中的sleep() 休息3秒钟end = time.time() print("程序运行用时:{:.2f}秒".format(end-start))
复制代码


程序运行用时:3.00秒
复制代码


import fun1
fun1.f1()
复制代码


导入fun1成功
复制代码


2、从模块中导入类或函数——from 模块 import 类名或函数名


  • **调用方式:**函数名或类名


from itertools import product   # 这种情况可以直接使用函数名进行使用,无需加上前面的模块名了
ls = list(product("AB", "123"))print(ls)
复制代码


[('A', '1'), ('A', '2'), ('A', '3'), ('B', '1'), ('B', '2'), ('B', '3')]
复制代码


from function.fun1 import f1         # 注意这种用法
f1()
复制代码


导入fun1成功
复制代码


一次导入多个


from function import fun1, fun2
fun1.f1()fun2.f2()
复制代码


导入fun1成功导入fun2成功
复制代码


3、导入模块中所有的类和函数——from 模块 import *


  • **调用方式:**函数名或类名


from random import * # 通配符导入所有的文件,这样可以使用不用加模块名前缀
print(randint(1,100)) # 产生一个[1,100]之间的随机整数print(random()) # 产生一个[0,1)之间的随机小数
复制代码


360.6582485822110181
复制代码

7.3.3 模块的查找路径

模块搜索查找顺序:


  • 1、优先内存中已经加载的模块


import fun1
fun1.f1()
复制代码


导入fun1成功
复制代码


# 删除硬盘上的fun1 文件import fun1
fun1.f1()
复制代码


导入fun1成功
复制代码


# 修改硬盘上的fun1 文件import fun1
fun1.f1()# 居然没变,说明是优先从内存中读取的
复制代码


导入fun1成功
复制代码


  • 2、内置模块


# Python 启动时,解释器会默认加载一些 modules 存放在sys.modules中# sys.modules 变量包含一个由当前载入(完整且成功导入)到解释器的模块组成的字典, 模块名作为键, 它们的位置作为值import sys
print(len(sys.modules))print("math" in sys.modules)print("numpy" in sys.modules)for k,v in list(sys.modules.items())[:20]: print(k, ":", v)
复制代码


738TrueFalsesys : <module 'sys' (built-in)>builtins : <module 'builtins' (built-in)>_frozen_importlib : <module 'importlib._bootstrap' (frozen)>_imp : <module '_imp' (built-in)>_thread : <module '_thread' (built-in)>_warnings : <module '_warnings' (built-in)>_weakref : <module '_weakref' (built-in)>zipimport : <module 'zipimport' (built-in)>_frozen_importlib_external : <module 'importlib._bootstrap_external' (frozen)>_io : <module 'io' (built-in)>marshal : <module 'marshal' (built-in)>nt : <module 'nt' (built-in)>winreg : <module 'winreg' (built-in)>encodings : <module 'encodings' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\__init__.py'>codecs : <module 'codecs' from 'C:\\Users\\ibm\\Anaconda3\\lib\\codecs.py'>_codecs : <module '_codecs' (built-in)>encodings.aliases : <module 'encodings.aliases' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\aliases.py'>encodings.utf_8 : <module 'encodings.utf_8' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\utf_8.py'>_signal : <module '_signal' (built-in)>__main__ : <module '__main__'>
复制代码


  • 3、sys.path 路径中包含的模块


import sys
sys.path
复制代码


['E:\\ipython', 'C:\\Users\\ibm\\Anaconda3\\python37.zip', 'C:\\Users\\ibm\\Anaconda3\\DLLs', 'C:\\Users\\ibm\\Anaconda3\\lib', 'C:\\Users\\ibm\\Anaconda3', '', 'C:\\Users\\ibm\\AppData\\Roaming\\Python\\Python37\\site-packages', 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages', 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\win32', 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\win32\\lib', 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\Pythonwin', 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\IPython\\extensions', 'C:\\Users\\ibm\\.ipython']
复制代码


  • sys.path 的第一个路径是当前执行文件所在的文件夹

  • 若需将不在该文件夹内的模块导入,需要将模块的路径添加到 sys.path


# import fun3
复制代码


import sys
sys.path.append("C:\\Users\\ibm\\Desktop") # 注意是双斜杠
import fun3
fun3.f3()
复制代码


导入fun3成功
复制代码


发布于: 2022 年 10 月 02 日阅读数: 3
用户头像

timerring

关注

还未添加个人签名 2022.07.14 加入

还未添加个人简介

评论

发布
暂无评论
Python基础(七) | 文件、异常以及模块详解_异常_timerring_InfoQ写作社区