Python 变量作用域与 LEGB 规则
Python 中的 name 有多种:变量、函数名、类名、对象名等。一般每个对象都有一个变量名指向,更准确说是 绑定。那么这些 name 是如何赋值、初始化、查找及修改的呢?各自的作用细则又是什么样的呢?本篇尝试解答这个问题。
作用域
我们经常听说 Python 函数访问局部变量、或者全局变量;在定义装饰器的时候,还会使用自由变量。这里的局部、全局及自由变量,就是变量的作用域。
语言区分作用域,是为了复用变量名。BASIC 语言只有全局变量,这就会导致很多修改、检索问题,维护很困难。引入作用域,相当于给变量划分了各自的“隔离区”,在不同”隔离区“里,查找变量变得很容易。
正是因为有了作用域,我们在函数内才可以随意使用变量名,而不担心其与全局变量、其他函数中的变量冲突——因为这两个作用域是分割的。
Python 中的命名和作用域
Python 是动态类型语言,变量是在定义的时候赋值的。这句话的意思我们分以下几个方面来理解:
a = 1 赋值时定义变量
from tools import cubie 导入时定义变量 cubie
def fun():pass 定义函数,绑定变量 fun
def fun(name=None):pass 定义变量 name 为函数 fun 的形式变量(也是局部变量)
class Car:pass 定义类,绑定类名 Car
以上,都实现了变量的定义。
而变量具体作用域取决于定义位置。
定义在函数内部的变量、定义在函数声明中的参数,视为局部变量。
定义在.py 文件内的,且函数、类之外的变量,视为全局变量。
定义在嵌套函数外层中的变量,视为自由变量。
定义在 builtin 中的变量,视为内置变量。
看起来如此复杂的四种变量作用域,让我们用一个例子来说明它们的访问规则。
LEGB 规则
让我们用一个例子说明 LEGB 仿问规则。
其输出为
可见,在 outer 函数的嵌套函数 inner 中的输出语句print(i1,i2,o1,o2,e,g,b)
是本程序重点。其具体执行情况如下:
print i1 和 i2,毫无疑问的局部变量。
print o1 和 o2,本地作用域没有,向上查找到 outer 函数内部变量,视为自由变量引用。
print e,本地作用域没有,类似上例,视为自由变量。
print g,本地作用域没有,自由变量作用域(闭包)没有,一直上溯到全局作用局找到。
print b,本地作用域没有,自由变量作用域(闭包)没有,全局作用局没有,一致上溯到内置变量空间找到。
至此,LEGB 规则呼之欲出:在本地空间寻找不到的变量,逐级向上级寻找。这里的 LEGB 分别指代 Local,Enclose,Global 和 Builtin。
nonlocal 和 global
对函数的赋值和索引,是两种不同的情况:
赋值:创建一个变量或者修改。
索引:检索其值。
以上两者的差别,会导致我们在局部作用域中:
赋值一个
全局变量:等于创建一个局部变量。
自由变量:等于创建一个局部变量。
索引:正常检索其值。
我们修改上例中的 inner 函数为如下形式:
在嵌套函数内,重新定义了 g 变量,一般理解这是重新赋值全局变量。但是我们看上条规则:在局部作用域中,赋值一个全局变量时,等于创建一个局部变量。也就是说此时的 g 已经是局部变量了——在程序最后的 print(g)语句输出global
而不是修改后的inner global
也验证了以上规则。
不重新赋值,只是使用全局变量和自由变量,则没有问题。
自由变量也是类似的情况。
为了解决局部作用域中赋值全局变量和自由变量导致的变成局部变量问题,Python 引入关键字 glbal 和 nolocal。
此时的赋值,则分别是对全局变量和自由变量的操作,而非新建局部变量。
四种变量除了作用域和使用上的不同,在具体存储方式上肯定也有不同。
存储在哪里
每个函数都有代码对象(code object):__code__,这个对象中存储了函数的代码和参数信息。
其中,以 co_开头的属性,是本文我们需要关注的。
co_argcount 函数形式参数个数。
co_cellvars 被内部包含函数引用的变量组成的元组。也就是所谓自由变量。
co_freevars 当前函数引用的外部变量组成的元组,和上个 co_cellvars 是相对的概念。
co_consts 常量,包括如下:
None 函数返回值,系统自带。
从前往后数所有字面常量
内嵌函数代码对象 code object
内嵌函数的 qual_name 常量,如:outer.<locals>.inner
co_name 本函数的名字
co_names 本函数用到的全局变量、系统内置变量。
co_nlocals 本函数的局部变量个数。
co_varnames 本函数局部变量,不含被引用自由变量,包含形式参数和内嵌函数绑定变量。
总结
Python 的作用域分为四种,分别是局部、全局、自由和内置;
定义变量的位置决定了变量的作用域;
作用域的查找遵守 LEGB 规则;
为了在局部作用域中修改全局变量和自由变量,引入了 global 关键字和 nonlocal 关键字。
函数的代码对象,有助于我们分析函数变量作用域,更好理解诸如装饰器和函数式编程。
版权声明: 本文为 InfoQ 作者【大奎】的原创文章。
原文链接:【http://xie.infoq.cn/article/dcc8132c5ff9dbf0a237ad4a1】。文章转载请联系作者。
评论