⭐本专栏旨在对 Python 的基础语法进行详解,精炼地总结语法中的重点,详解难点,面向零基础及入门的学习者,通过专栏的学习可以熟练掌握 python 编程,同时为后续的数据分析,机器学习及深度学习的代码能力打下坚实的基础。
🔥本文已收录于 Python 基础系列专栏: Python基础系列教程 欢迎订阅,持续更新。
8.1 数据类型的底层实现
8.1.1 奇怪的列表
1、错综复杂的复制
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}]
复制代码
# list_3 = list_1 # 错误!!!list_2 = list_1.copy() # 或者list_1[:] \ list(list_1) 均可实习浅拷贝
复制代码
list_2[1].append(55)
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [1, [22, 33, 44, 55], (5, 6, 7), {'name': 'Sarah'}]list_2: [1, [22, 33, 44, 55], (5, 6, 7), {'name': 'Sarah'}]
复制代码
2、列表的底层实现
引用数组的概念
列表内的元素可以分散的存储在内存中
列表存储的,实际上是这些元素的地址!!!——地址的存储在内存中是连续的
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}]list_2 = list(list_1) # 浅拷贝 与list_1.copy()功能一样
复制代码
(1)新增元素
list_1.append(100)list_2.append("n")
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [1, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 100]list_2: [1, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 'n']
复制代码
(2)修改元素
list_1[0] = 10list_2[0] = 20
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [10, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 100]list_2: [20, [22, 33, 44], (5, 6, 7), {'name': 'Sarah'}, 'n']
复制代码
(3)对列表型元素进行操作
list_1[1].remove(44)list_2[1] += [55, 66]
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [10, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah'}, 100]list_2: [20, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah'}, 'n']
复制代码
因为操作的是列表,而原列表映射的是地址,修改元素后对地址进行映射,因此 list1 和 2 的修改相同
(4)对元组型元素进行操作
list_2[2] += (8,9)
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [10, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah'}, 100]list_2: [20, [22, 33, 55, 66], (5, 6, 7, 8, 9), {'name': 'Sarah'}, 'n']
复制代码
元组是不可变的!!!相当于新加了一个元组(5, 6, 7, 8, 9),而 list2 指向该元组。
(5)对字典型元素进行操作
list_1[-2]["age"] = 18
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [10, [22, 33, 55, 66], (5, 6, 7), {'name': 'Sarah', 'age': 18}, 100]list_2: [20, [22, 33, 55, 66], (5, 6, 7, 8, 9), {'name': 'Sarah', 'age': 18}, 'n']
复制代码
3、引入深拷贝
浅拷贝之后
引入深拷贝
import copy
list_1 = [1, [22, 33, 44], (5, 6, 7), {"name": "Sarah"}]list_2 = copy.deepcopy(list_1)list_1[-1]["age"] = 18list_2[1].append(55)
print("list_1: ", list_1)print("list_2: ", list_2)
复制代码
list_1: [1, [22, 33, 44], (5, 6, 7), {'name': 'Sarah', 'age': 18}]list_2: [1, [22, 33, 44, 55], (5, 6, 7), {'name': 'Sarah'}]
复制代码
8.1.2 神秘的字典
1、快速的查找
import time
ls_1 = list(range(1000000))ls_2 = list(range(500))+[-10]*500
start = time.time()count = 0for n in ls_2: if n in ls_1: count += 1end = time.time()print("查找{}个元素,在ls_1列表中的有{}个,共用时{}秒".format(len(ls_2), count,round((end-start),2)))
复制代码
查找1000个元素,在ls_1列表中的有500个,共用时6.19秒
复制代码
import time
d = {i:i for i in range(100000)}ls_2 = list(range(500))+[-10]*500
start = time.time()count = 0for n in ls_2: try: d[n] except: pass else: count += 1end = time.time()print("查找{}个元素,在ls_1列表中的有{}个,共用时{}秒".format(len(ls_2), count,round(end-start)))
复制代码
查找1000个元素,在ls_1列表中的有500个,共用时0秒
复制代码
2、字典的底层实现
通过稀疏数组来实现值的存储与访问
字典的创建过程
print(hash("python"))print(hash(1024))print(hash((1,2)))
复制代码
-477104656446059976410243713081631934410656
复制代码
d["age"] = 18 # 增加键值对的操作,首先会计算键的散列值hash("age")print(hash("age"))
复制代码
极个别时候,散列值会发生冲突,则内部有相应的解决冲突的办法
for i in range(2, 2): print(i)
复制代码
键值对的访问过程
3、小结
(1)字典数据类型,通过空间换时间,实现了快速的数据查找
(2)因为散列值对应位置的顺序与键在字典中显示的顺序可能不同,因此表现出来字典是无序的
8.1.3 紧凑的字符串
通过紧凑数组实现字符串的存储
列表可以变化,不方便预留空间
8.1.4 是否可变
1、不可变类型:数字、字符串、元组
在生命周期中保持内容不变
x = 1y = "Python"
print("x id:", id(x))print("y id:", id(y))
复制代码
x id: 140718440616768y id: 2040939892664
复制代码
x += 2y += "3.7"
print("x id:", id(x))print("y id:", id(y))
复制代码
x id: 140718440616832y id: 2040992707056
复制代码
元组并不是总是不可变的
t = (1,[2])t[1].append(3)
print(t)
复制代码
2、可变类型:列表、字典、集合
ls = [1, 2, 3]d = {"Name": "Sarah", "Age": 18}
print("ls id:", id(ls))print("d id:", id(d))
复制代码
ls id: 2040991750856d id: 2040992761608
复制代码
ls += [4, 5]d_2 = {"Sex": "female"}d.update(d_2) # 把d_2 中的元素更新到d中
print("ls id:", id(ls))print("d id:", id(d))
复制代码
ls id: 2040991750856d id: 2040992761608
复制代码
8.1.5 列表操作的几个小例子
【例 1】 删除列表内的特定元素
缺点:每次存在运算,都要从头对列表进行遍历、查找、效率低
alist = ["d", "d", "d", "2", "2", "d" ,"d", "4"]s = "d"while True: if s in alist: alist.remove(s) else: breakprint(alist)
复制代码
首先 alist 被删除元素时不断在变,但是索引 s 是按照顺序来的,因此会造成可能跨过某一元素的现象,但是删除仍是按照从列表头开始扫描的顺序进行的。
alist = ["d", "d", "d", "2", "2", "d" ,"d", "4"]for s in alist: if s == "d": alist.remove(s) # remove(s) 删除列表中第一次出现的该元素print(alist)
复制代码
['2', '2', 'd', 'd', '4']
复制代码
解决方法:使用负向索引
负向索引相当于倒序扫描,确保每次遍历的是列表头,同时删除的也是列表头。
alist = ["d", "d", "d", "2", "2", "d" ,"d", "4"]for i in range(-len(alist), 0): if alist[i] == "d": alist.remove(alist[i]) # remove(s) 删除列表中第一次出现的该元素print(alist)
复制代码
【例 2】 多维列表的创建
[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]
复制代码
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0], [1, 0, 0, 0, 0, 0, 0, 0, 0, 0], [1, 0, 0, 0, 0, 0, 0, 0, 0, 0], [1, 0, 0, 0, 0, 0, 0, 0, 0, 0], [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]]
复制代码
因为下面的四个列表都是第一个列表的复制,因此第一个列表变了,下面的几个都会发生变化。
8.2 简洁的语法
8.2.1 解析语法
ls = [[0]*10 for i in range(5)]ls
复制代码
[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]
复制代码
[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]
复制代码
这里都是独立创建的,因此互不影响。
1、解析语法的基本结构——以列表解析为例(也称为列表推导)
[expression for value in iterable if conditihon]
执行过程
(1)从可迭代对象中拿出一个元素
(2)通过 if 条件(如果有的话),对元素进行筛选
若通过筛选:则把元素传递给表达式 若未通过: 则进入(1)步骤,进入下一次迭代
复制代码
(3)将传递给表达式的元素,代入表达式进行处理,产生一个结果
(4)将(3)步产生的结果作为列表的一个元素进行存储
(5)重复(1)~(4)步,直至迭代对象迭代结束,返回新创建的列表
# 等价于如下代码result = []for value in iterale: if condition: result.append(expression)
复制代码
【例】求 20 以内奇数的平方
squares = []for i in range(1,21): if i%2 == 1: squares.append(i**2)print(squares)
复制代码
[1, 9, 25, 49, 81, 121, 169, 225, 289, 361]
复制代码
squares = [i**2 for i in range(1,21) if i%2 == 1]print(squares)
复制代码
[1, 9, 25, 49, 81, 121, 169, 225, 289, 361]
复制代码
支持多变量
x = [1, 2, 3]y = [1, 2, 3]
results = [i*j for i,j in zip(x, y)]results
复制代码
支持循环嵌套
colors = ["black", "white"]sizes = ["S", "M", "L"]tshirts = ["{} {}".format(color, size) for color in colors for size in sizes]tshirts
复制代码
['black S', 'black M', 'black L', 'white S', 'white M', 'white L']
复制代码
2、其他解析语法的例子
squares = {i: i**2 for i in range(10)}for k, v in squares.items(): print(k, ": ", v)
复制代码
0 : 01 : 12 : 43 : 94 : 165 : 256 : 367 : 498 : 649 : 81
复制代码
squares = {i**2 for i in range(10)}squares
复制代码
{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}
复制代码
squares = (i**2 for i in range(10))squares
复制代码
<generator object <genexpr> at 0x000001DB37A58390>
复制代码
colors = ["black", "white"]sizes = ["S", "M", "L"]tshirts = ("{} {}".format(color, size) for color in colors for size in sizes)for tshirt in tshirts: print(tshirt)
复制代码
black Sblack Mblack Lwhite Swhite Mwhite L
复制代码
8.2.2 条件表达式
expr1 if condition else expr2
【例】将变量 n 的绝对值赋值给变量 x
n = -10if n >= 0: x = nelse: x = -nx
复制代码
n = -10x = n if n>= 0 else -nx
复制代码
条件表达式和解析语法简单实用、运行速度相对更快一些,相信大家会慢慢的爱上它们
8.3 三大神器
8.3.1 生成器
ls = [i**2 for i in range(1, 1000001)]
复制代码
缺点:占用大量内存
生成器
(1)采用惰性计算的方式
(2)无需一次性存储海量数据
(3)一边执行一边计算,只计算每次需要的值
(4)实际上一直在执行 next()操作,直到无值可取
1、生成器表达式
squares = (i**2 for i in range(1000000))
复制代码
无需显示存储全部数据,节省内存
sum((i for i in range(101))) # 求和,里面是一个生成器
复制代码
2、生成器函数——yield
数列前两个元素为 1,1 之后的元素为其前两个元素之和
def fib(max): ls = [] n, a, b = 0, 1, 1 while n < max: ls.append(a) a, b = b, a + b n = n + 1 return ls
fib(10)
复制代码
[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]
复制代码
中间尝试
def fib(max): n, a, b = 0, 1, 1 while n < max: print(a) a, b = b, a + b n = n + 1
fib(10)
复制代码
构造生成器函数
在每次调用 next()的时候执行,遇到 yield 语句返回,再次执行时从上次返回的 yield 语句处继续执行
def fib(max): n, a, b = 0, 1, 1 while n < max: yield a a, b = b, a + b n = n + 1
fib(10)
复制代码
<generator object fib at 0x000001BE11B19048>
复制代码
for i in fib(10): print(i)
复制代码
8.3.2 迭代器
1、可迭代对象
可直接作用于 for 循环的对象统称为可迭代对象:Iterable
(1)列表、元组、字符串、字典、集合、文件
可以使用 isinstance()判断一个对象是否是 Iterable 对象
from collections import Iterable
isinstance([1, 2, 3], Iterable)
复制代码
isinstance({"name": "Sarah"}, Iterable)
复制代码
isinstance('Python', Iterable)
复制代码
(2)生成器
squares = (i**2 for i in range(5))isinstance(squares, Iterable)
复制代码
生成器不但可以用于 for 循环,还可以被 next()函数调用
print(next(squares))print(next(squares))print(next(squares))print(next(squares))print(next(squares))
复制代码
直到没有数据可取,抛出 StopIteration
---------------------------------------------------------------------------
StopIteration Traceback (most recent call last)
<ipython-input-66-f5163ac9e49b> in <module>----> 1 print(next(squares))
StopIteration:
复制代码
可以被 next()函数调用并不断返回下一个值,直至没有数据可取的对象称为迭代器:Iterator
2、迭代器
可以使用 isinstance()判断一个对象是否是 Iterator 对象
(1) 生成器都是迭代器
from collections import Iterator
squares = (i**2 for i in range(5))isinstance(squares, Iterator)
复制代码
(2) 列表、元组、字符串、字典、集合不是迭代器
isinstance([1, 2, 3], Iterator)
复制代码
可以通过 iter(Iterable)创建迭代器
isinstance(iter([1, 2, 3]), Iterator)
复制代码
for item in Iterable 等价于:
先通过iter()函数获取可迭代对象Iterable的迭代器 然后对获取到的迭代器不断调用next()方法来获取下一个值并将其赋值给item 当遇到StopIteration的异常后循环结束
复制代码
(3)zip enumerate 等 itertools 里的函数是迭代器
x = [1, 2]y = ["a", "b"]zip(x, y)
复制代码
for i in zip(x, y): print(i) isinstance(zip(x, y), Iterator)
复制代码
numbers = [1, 2, 3, 4, 5]enumerate(numbers)
复制代码
<enumerate at 0x1be11b39990>
复制代码
for i in enumerate(numbers): print(i) isinstance(enumerate(numbers), Iterator)
复制代码
(0, 1)(1, 2)(2, 3)(3, 4)(4, 5)
True
复制代码
(4) 文件是迭代器
with open("测试文件.txt", "r", encoding = "utf-8") as f: print(isinstance(f, Iterator))
复制代码
(5)迭代器是可耗尽的
squares = (i**2 for i in range(5))for square in squares: print(square)
复制代码
for square in squares: print(square)
复制代码
再迭代不出来了,因为已经耗尽了
(6)range()不是迭代器
numbers = range(10)isinstance(numbers, Iterator)
复制代码
print(len(numbers)) # 有长度print(numbers[0]) # 可索引print(9 in numbers) # 可存在计算next(numbers) # 不可被next()调用
复制代码
100True
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-76-7c59bf859258> in <module> 2 print(numbers[0]) # 可索引 3 print(9 in numbers) # 可存在计算----> 4 next(numbers) # 不可被next()调用
TypeError: 'range' object is not an iterator
复制代码
for number in numbers: print(number)
复制代码
不会被耗尽。
for number in numbers: print(number)
复制代码
可以称 range()为懒序列
它是一种序列 但并不包含任何内存中的内容 而是通过计算来回答问题
复制代码
8.3.3 装饰器
1、需求的提出
(1)需要对已开发上线的程序添加某些功能
(2)不能对程序中函数的源代码进行修改
(3)不能改变程序中函数的调用方式
比如说,要统计每个函数的运行时间
def f1(): pass
def f2(): pass
def f3(): pass
f1()f2()f3()
复制代码
没问题,我们有装饰器!!!
2、函数对象
函数是 Python 中的第一类对象
(1)可以把函数赋值给变量
(2)对该变量进行调用,可实现原函数的功能
def square(x): return x**2
print(type(square)) # square 是function类的一个实例
复制代码
pow_2 = square # 可以理解成给这个函数起了个别名pow_2print(pow_2(5))print(square(5))
复制代码
可以将函数作为参数进行传递
3、高阶函数
(1)接收函数作为参数
(2)或者返回一个函数
满足上述条件之一的函数称之为高阶函数
def square(x): return x**2
def pow_2(fun): return fun
f = pow_2(square)f(8)
复制代码
4、 嵌套函数
在函数内部定义一个函数
def outer(): print("outer is running") def inner(): print("inner is running") inner()
outer()
复制代码
outer is runninginner is running
复制代码
5、闭包
def outer(): x = 1 z = 10 def inner(): y = x+100 return y, z return inner
f = outer() # 实际上f包含了inner函数本身+outer函数的环境print(f)
复制代码
<function outer.<locals>.inner at 0x000001BE11B1D730>
复制代码
print(f.__closure__) # __closure__属性中包含了来自外部函数的信息for i in f.__closure__: print(i.cell_contents)
复制代码
(<cell at 0x000001BE0FDE06D8: int object at 0x00007FF910D59340>, <cell at 0x000001BE0FDE0A98: int object at 0x00007FF910D59460>)110
复制代码
闭包:延伸了作用域的函数
如果一个函数定义在另一个函数的作用域内,并且引用了外层函数的变量,则该函数称为闭包
闭包是由函数及其相关的引用环境组合而成的实体(即:闭包=函数+引用环境)
def outer(): x = 1 def inner(): x = x+100 return x return inner
f = outer() f()
复制代码
---------------------------------------------------------------------------
UnboundLocalError Traceback (most recent call last)
<ipython-input-87-d2da1048af8b> in <module> 10 11 f = outer()---> 12 f()
<ipython-input-87-d2da1048af8b> in inner() 3 4 def inner():----> 5 x = x+100 6 return x 7
UnboundLocalError: local variable 'x' referenced before assignment
复制代码
nonlocal 允许内嵌的函数来修改闭包变量,表明它不是一个内部变量,采用外部函数的变量。
def outer(): x = 1 def inner(): nonlocal x x = x+100 return x return inner
f = outer() f()
复制代码
6、一个简单的装饰器
嵌套函数实现
import time
def timer(func): def inner(): print("inner run") start = time.time() func() end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) return inner
def f1(): print("f1 run") time.sleep(1)
f1 = timer(f1) # 包含inner()和timer的环境,如传递过来的参数funcf1()
复制代码
inner runf1 runf1 函数运行用时1.00秒
复制代码
语法糖
import time
def timer(func): def inner(): print("inner run") start = time.time() func() end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) return inner
@timer # 相当于实现了f1 = timer(f1)def f1(): print("f1 run") time.sleep(1) f1()
复制代码
inner runf1 runf1 函数运行用时1.00秒
复制代码
7、装饰有参函数
import time
def timer(func): def inner(*args, **kwargs): print("inner run") start = time.time() func(*args, **kwargs) end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) return inner
@timer # 相当于实现了f1 = timer(f1)def f1(n): print("f1 run") time.sleep(n)
f1(2)
复制代码
inner runf1 runf1 函数运行用时2.00秒
复制代码
被装饰函数有返回值的情况
import time
def timer(func): def inner(*args, **kwargs): print("inner run") start = time.time() res = func(*args, **kwargs) end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) return res return inner
@timer # 相当于实现了f1 = timer(f1)def f1(n): print("f1 run") time.sleep(n) return "wake up" res = f1(2)print(res)
复制代码
inner runf1 runf1 函数运行用时2.00秒wake up
复制代码
8、带参数的装饰器
装饰器本身要传递一些额外参数
def timer(method): def outer(func): def inner(*args, **kwargs): print("inner run") if method == "origin": print("origin_inner run") start = time.time() res = func(*args, **kwargs) end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) elif method == "double": print("double_inner run") start = time.time() res = func(*args, **kwargs) end = time.time() print("{} 函数运行双倍用时{:.2f}秒".format(func.__name__, 2*(end-start))) return res return inner return outer
@timer(method="origin") # 相当于timer = timer(method = "origin") f1 = timer(f1)def f1(): print("f1 run") time.sleep(1) @timer(method="double")def f2(): print("f2 run") time.sleep(1)
f1()print()f2()
复制代码
inner runorigin_inner runf1 runf1 函数运行用时1.00秒
inner rundouble_inner runf2 runf2 函数运行双倍用时2.00秒
复制代码
理解闭包是关键!!!
9、何时执行装饰器
func_names=[]def find_function(func): print("run") func_names.append(func) return func
@find_functiondef f1(): print("f1 run")
@find_functiondef f2(): print("f2 run")
@find_functiondef f3(): print("f3 run")
复制代码
for func in func_names: print(func.__name__) func() print()
复制代码
10、回归本源
import time
def timer(func): def inner(): print("inner run") start = time.time() func() end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) return inner
@timer # 相当于实现了f1 = timer(f1)def f1(): time.sleep(1) print("f1 run")
print(f1.__name__)
复制代码
import timefrom functools import wraps
def timer(func): @wraps(func) def inner(): print("inner run") start = time.time() func() end = time.time() print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start))) return inner
@timer # 相当于实现了f1 = timer(f1)def f1(): time.sleep(1) print("f1 run")
print(f1.__name__) f1()
复制代码
f1inner runf1 runf1 函数运行用时1.00秒
复制代码
评论