爬虫(108)Python 3.8 的超酷新功能(接近一万字,请耐心享用,而且建议收藏)
在Python中的最新版本发布!自夏季以来,Python 3.8已在beta版本中可用,但在2019年10月14日,第一个正式版本已准备就绪。现在,我们所有人都可以开始使用新功能并从最新改进中受益。
Python 3.8带来了什么?该文档很好地概述了新功能。但是,本文将更深入地介绍一些最大的变化,并向您展示如何利用Python 3.8。
在本文中,您将了解:
使用赋值表达式简化一些代码结构
在自己的函数中强制仅位置参数
指定更精确的类型提示
使用f字符串进行更简单的调试
除了少数例外,Python 3.8对早期版本进行了许多小的改进。在本文结尾处,您将看到许多不那么引人注意的更改,并讨论了一些使Python 3.8比其先前版本更快的优化。最后,您将获得有关升级到新版本的一些建议。
房间里的海象:赋值表达
Python 3.8中最大的变化是赋值表达式的引入。它们使用新的符号(:=
)编写。该运算符通常被称为海象运算符,因为它类似于海象的侧面的象牙和海象牙。
赋值表达式使您可以在同一表达式中赋值并返回一个值。例如,如果要分配给变量并打印其值,则通常需要执行以下操作:
在Python 3.8中,可以使用walrus运算符将这两个语句合并为一个:
分配表达式使您可以分配True
给walrus
,并立即打印该值。但是请记住,如果没有它,海象运算符不会做任何不可能的事情。它只会使某些构造更加方便,并且有时可以更清楚地传达代码的意图。
一种显示海象运算符优势的模式是while
循环,您需要在循环中初始化和更新变量。例如,以下代码要求用户输入直到输入quit
:
此代码不理想。您正在重复该input()
语句,并且需要以某种方式将其添加current
到列表中,然后再询问用户。更好的解决方案是设置一个无限while
循环,然后使用它break
来停止循环:
这会将测试移回应有的while
行。但是,该行现在发生了几件事,因此需要花费更多的精力才能正确地阅读它。对于海象运算符何时有助于使您的代码更具可读性,请做出最佳判断。
PEP 572描述了赋值表达式的所有细节,包括将其引入语言的一些原理,以及如何使用海象运算符的几个示例。
仅位置参数
内置函数float()
可用于将文本字符串和数字转换为float
对象。考虑以下示例:
仔细看看的签名float()
。注意/
参数后的斜杠()。这是什么意思?
注意:有关该/
符号的深入讨论,请参阅PEP 457-仅位置参数的符号。
事实证明,虽然float()
调用了一个参数,x
但不允许使用其名称:
使用时float()
,只允许按位置而不是关键字指定参数。在Python 3.8之前,此类仅位置参数仅适用于内置函数。没有简单的方法来指定参数在您自己的函数中应该仅位置:
这是可能的模拟位置-only参数使用*args
,但是这是不够灵活,不易阅读,并迫使你实现自己的参数解析。在Python 3.8中,您可以/
用来表示必须由位置指定之前的所有参数。您可以重写incr()
为仅接受位置参数:
通过/
在之后添加x
,您可以将其指定x
为仅位置参数。您可以将常规参数与仅位置参数结合使用,方法是将常规参数放在斜杠之后:
在中greet()
,斜线放在name
和之间greeting
。这意味着它name
是仅位置参数,greeting
而是可以通过位置或关键字传递的常规参数。
乍一看,仅位置参数似乎有点局限性,与Python关于可读性重要性的口号背道而驰。您可能会发现在很多情况下仅位置参数可以改善您的代码。
但是,在正确的情况下,仅位置参数可以在设计函数时提供一定的灵活性。首先,当您的参数具有自然顺序但很难给其提供良好的描述性名称时,仅位置参数才有意义。
使用仅位置参数的另一个可能的好处是,您可以更轻松地重构函数。特别是,您可以更改参数的名称,而不必担心其他代码取决于这些名称。
仅位置参数很好地补充了仅关键字参数。在任何版本的Python 3中,都可以使用星号(*
)指定仅关键字的参数。任何参数后 *
,必须使用关键字来指定:
celsius
是仅关键字的参数,因此,如果您尝试根据不含关键字的位置进行指定,Python会引发错误。
您可以通过按/
和分隔此顺序的顺序来组合仅位置,常规和仅关键字的参数*
。在以下示例中,text
是仅位置参数,border
是具有默认值的常规参数,并且width
是具有默认值的仅关键字参数:
由于text
仅位置定位,因此您不能使用关键字text
:
border
另一方面,既可以指定关键字,也可以不指定关键字:
最后,width
必须使用关键字指定:
您可以在PEP 570中阅读有关仅位置参数的更多信息。
更多精确类型
此时,Python的键入系统已经相当成熟。但是,在Python 3.8中,添加了一些新功能typing
以允许更精确的键入:
文字类型
打字字典
最终对象
通讯协定
Python支持可选的类型提示,通常作为代码上的注释:
在此示例中,您说number
应为a float
,并且double()
函数也应返回a float
。但是,Python将这些注释视为hints。它们不会在运行时强制执行:
double()
"I'm not a float"
即使不是,也愉快地接受作为参数float
。有些库可以在运行时使用类型,但这不是Python的类型系统的主要用例。
相反,类型提示允许静态类型检查器对Python代码进行类型检查,而无需实际运行脚本。这让人想起编译器捕获其他语言(如Java,Rust和Crystal)的类型错误。此外,类型提示可作为代码的文档,使其更易于阅读,并改善IDE中的自动完成功能。
注意:有几种可用的静态类型检查器,包括Pyright,Pytype和Pyre。在本文中,您将使用Mypy。您可以使用以下方法从PyPI安装Mypy pip
:
从某种意义上说,Mypy是Python类型检查器的参考实现,并在 Jukka Lehtasalo的领导下由Dropbox开发。Python的创建者Guido van Rossum是Mypy团队的成员。
您可以在原始PEP 484和Python类型检查(指南)中找到有关类型提示的更多信息。
Python 3.8已接受并包含了四个有关类型检查的新PEP。您将看到其中每个的简短示例。
PEP 586介绍了该Literal
类型。Literal
它有点特殊,因为它代表一个或多个特定值。一种使用情况Literal
是,当使用字符串参数描述特定行为时,能够精确地添加类型。考虑以下示例:
该程序将通过静态类型检查器,即使"up"
方向无效。类型检查器仅检查"up"
是字符串。在这种情况下,更精确地说direction
必须是文字字符串"horizontal"
或文字字符串"vertical"
。使用Literal
,您可以精确地做到这一点:
通过将允许的值暴露direction
给类型检查器,现在可以警告该错误:
基本语法为Literal[<literal>]
。例如,Literal[38]
表示文字值38。您可以使用来表示多个文字值之一Union
:
由于这是一个相当普遍的用例,因此您可以(并且应该应该)使用更简单的表示法Literal["horizontal", "vertical"]
。在向中添加类型时,您已经使用了后者draw_line()
。如果您仔细查看上面Mypy的输出,您会发现它在Union
内部将较简单的表示法转换为表示法。
在某些情况下,函数的返回值的类型取决于输入参数。一个示例open()
可能根据的值返回文本字符串或字节数组mode
。这可以通过重载来处理。
以下示例显示了计算器的骨架,该计算器可以将答案返回为正数(38
)或罗马数字(XXXVIII
):
该代码具有正确的类型提示:的结果add()
将为str
或int
。然而,通常此代码将用文字称为True
或False
作为价值to_roman
在这种情况下,你会喜欢的类型检查来推断是否准确str
或int
返回。可以和以下命令Literal
一起使用@overload
:
添加的@overload
签名将帮助您的类型检查器进行推断str
或int
根据的字面值to_roman
。注意,省略号(...
)是代码的文字部分。它们在重载签名中代表功能主体。
作为补充Literal
,PEP 591引入了Final
。该限定符指定不应重新分配,重新定义或覆盖变量或属性。以下是输入错误:
Mypy将突出显示该行ID += 1
,并注意您Cannot assign to final name "ID"
。这为您提供了一种确保代码中的常量永远不会更改其值的方法。
另外,还有一个@final
装饰器可以应用于类和方法。装饰了的类@final
不能被子类化,而@final
方法不能被子类覆盖:
Mypy将使用错误消息标记此示例Cannot inherit from final class "Base"
。要了解有关Final
和的更多信息@final
,请参阅PEP 591。
第三PEP允许更多的特定类型的提示是PEP 589,其引入TypedDict
。可以使用类似于typed的符号来指定字典中键和值的类型NamedTuple
。
传统上,字典使用注释Dict
。问题在于,这仅允许键的一种类型和值的一种类型,通常导致诸如的注释Dict[str, Any]
。例如,考虑一个字典,该字典注册有关Python版本的信息:
对应的值为version
字符串,而release_year
为整数。无法使用精确表示Dict
。使用new TypedDict
,您可以执行以下操作:
然后,类型检查器将能够推断出py38["version"]
类型为str
,而类型py38["release_year"]
为int
。在运行时,a TypedDict
是常规的dict
,照常忽略类型提示。您也可以TypedDict
纯粹用作注释:
Mypy会告知您任何值的类型错误,还是使用了未声明的键。有关更多示例,请参见PEP 589。
Mypy已经支持协议已有一段时间了。但是,官方验收仅在2019年5月发生。
协议是形式化Python对鸭子输入的支持的一种方式:
当我看到一只鸟走路像鸭子,游泳像鸭子,嘎嘎像鸭子一样时,我称那只鸟为鸭子。(来源)
鸭式打字允许您例如阅读.name
具有.name
属性的任何对象,而无需真正关心对象的类型。支持打字系统似乎违反直觉。通过结构子类型化,仍然有可能了解鸭子的类型。
例如,您可以定义一个协议Named
,该协议可以识别具有.name
属性的所有对象:
在这里,greet()
只要定义了.name
属性,就可以使用任何对象。有关协议的更多信息,请参见PEP 544和Mypy文档。
使用f字符串进行更简单的调试
f字符串是在Python 3.6中引入的,已经非常流行。它们可能是仅在3.6版及更高版本上支持Python库的最常见原因。f字符串是格式化的字符串文字。您可以通过以下方式识别它f
:
使用f字符串时,可以将变量甚至表达式括在花括号内。然后将在运行时对它们进行评估,并将其包含在字符串中。一个f字符串中可以包含多个表达式:
在最后一个表达式中{math.pi * r * r:.2f}
,您还使用了格式说明符。格式说明符与表达式之间用冒号分隔。
.2f
表示该区域的格式为带有2个小数的浮点数。格式说明符与相同.format()
。有关允许的格式说明符的完整列表,请参见官方文档。
在Python 3.8中,可以在f字符串中使用赋值表达式。只需确保用括号将赋值表达式括起来即可:
但是,Python 3.8中真正的f-news是新的调试说明符。现在=
,您可以在表达式的末尾添加,它将同时打印该表达式及其值:
这是个捷径,通常在交互式工作或添加打印语句来调试脚本时最有用。在早期版本的Python中,您需要对变量或表达式进行两次拼写才能获得相同的信息:
您可以在周围添加空格=
,并照常使用格式说明符:
:
>10
格式说明称,name
10字符串中应右对齐。=
同样适用于更复杂的表达式:
有关f字符串的更多信息,请参见Python 3的f字符串:改进的字符串格式语法(指南)。
Python指导委员会
从技术上讲,Python的治理不是语言功能。然而,Python的3.8是Python的第一个版本下没有发展仁慈的独裁的吉多·范罗苏姆。Python语言现在由一个由五个核心开发人员组成的指导委员会管理:
巴里华沙
布雷特·坎农
卡罗尔·威林
吉多·范·罗苏姆(Guido van Rossum)
尼克·科格兰
通往Python新治理模型的道路是自组织方面的有趣研究。吉多·范·罗苏姆(Guido van Rossum)在1990年代初期创立了Python,并被亲切地称为Python的仁慈生命独裁者(BDFL)。多年来,通过Python增强提案(PEP)做出了关于Python语言的越来越多的决定。尽管如此,Guido仍在所有新语言功能上都拥有最终决定权。
在对赋值表达式进行了漫长而漫长的讨论之后,Guido 在2018年7月宣布他将退出BDFL职位(这次是真实的)。他故意没有指定继任者。相反,他要求核心开发人员团队弄清楚今后应该如何管理Python。
幸运的是,PEP流程已经很完善,因此使用PEP讨论并决定新的治理模型是很自然的。到2018年秋季,人们提出了几种模式,包括选举新的BDFL(更名为审判官重大影响决策官:GUIDO),或在没有集中领导的情况下转向基于共识和投票的社区模式。2018年12月,在核心开发人员投票后选择了指导委员会模型。
指导委员会由上面列出的Python社区的五个成员组成。在每个主要的Python版本发布之后,将选举一个新的指导委员会。换句话说,Python 3.8发行后将进行选举。
尽管这是一次公开选举,但可以预计,即使不是全部,大多数首届指导委员会也将连任。指导委员会具有决定Python语言的广泛权力,但应努力尽可能少地行使这些权力。
您可以在PEP 13中阅读有关新治理模型的所有信息,而PEP 8000中介绍了决定新模型的过程。有关更多信息,请参阅PyCon 2019主题演讲,并在Talk Python To Me和Changelog播客上收听Brett Cannon 。您可以在GitHub上关注指导委员会的更新。
其他很酷的功能
到目前为止,您已经看到有关Python 3.8新增功能的头条新闻。但是,还有许多其他变化也很酷。在本节中,您将快速了解其中的一些。
importlib.metadata
Python 3.8的标准库中提供了一个新模块:importlib.metadata
。通过此模块,您可以访问有关Python安装中已安装软件包的信息。连同其配套模块一起importlib.resources
,importlib.metadata
改进了旧版的功能pkg_resources
。
例如,您可以获得有关pip
以下信息:
当前安装的版本pip
是19.2.3。metadata()
可以访问您可以在PyPI上看到的大多数信息。例如,您可以看到此版本的pip
需要Python 2.7或Python 3.5或更高版本。使用files()
,您将获得构成pip
程序包的所有文件的清单。在这种情况下,几乎有700个文件。
files()
返回Path
对象列表。这些使您可以使用方便的方式查看软件包的源代码read_text()
。以下示例__init__.py
从realpython-reader
包装中打印出:
您还可以访问包依赖关系:
requires()
列出软件包的依赖关系。您可以看到,realpython-reader
例如,它feedparser
在后台用于阅读和解析文章提要。
importlib.metadata
PyPI上有一个可用的反向端口,可在早期版本的Python上运行。您可以使用安装它pip
:
有关更多信息,请参阅文档importlib.metadata
新的和改进的math
和statistics
函数
Python 3.8对现有的标准库软件包和模块进行了许多改进。math
在标准库中有一些新功能。math.prod()
与内置相似sum()
,但对于乘法:
这两个语句是等效的。prod()
当您已经将因子存储在迭代器中时,将更易于使用。
另一个新功能是math.isqrt()
。您可以isqrt()
用来查找平方根的整数部分:
9的平方根是3。您可以看到它isqrt()
返回整数结果,而math.sqrt()
始终返回a float
。15的平方根几乎是3.9。请注意,将答案isqrt()
截断为下一个整数,在这种情况下为3。
最后,您现在可以更轻松地使用标准库中的n维点和向量。您可以使用来找到两点之间的距离math.dist()
,以及使用来找到向量的长度math.hypot()
:
这使得使用标准库更容易处理点和向量。但是,如果要对点或向量进行许多计算,则应签出NumPy。
该statistics
模块还具有几个新功能:
statistics.fmean()
计算float
数字的平均值。
statistics.geometric_mean()
计算float
数字的几何平均值。
statistics.multimode()
查找序列中最频繁出现的值。
statistics.quantiles()
计算将数据以等概率分为n个连续区间的切点。
以下示例显示了正在使用的功能:
在Python 3.8中,有了一个新statistics.NormalDist
类,可以更轻松地处理高斯正态分布。
若要查看使用的例子NormalDist
,你可以尝试比较新的速度statistics.fmean()
和传统statistics.mean()
:
在这个例子中,你使用timeit
来衡量的执行时间mean()
和fmean()
。为了获得可靠的结果,您可以让timeit
每个功能执行100次,并为每个功能收集30个这样的时间样本。基于这些示例,您将创建两个NormalDist
对象。请注意,如果您自己运行代码,则可能需要一分钟的时间来收集不同的时间样本。
NormalDist
具有许多方便的属性和方法。请参阅文档以获取完整列表。检查.mean
和.stdev
,您会看到旧版本的statistics.mean()
运行时间为0.826±0.078秒,而新版本的运行statistics.fmean()
时间为0.0105±0.0009秒。换句话说,fmean()
这些数据的速度要快80倍左右。
如果您需要使用Python而不是标准库提供的高级统计信息,请查看statsmodels
和scipy.stats
。
关于危险语法的警告
Python的SyntaxWarning
可以警告可疑的语法,通常不是SyntaxError
。Python 3.8添加了一些新功能,可以在编码和调试过程中为您提供帮助。
is
和之间的区别==
可能会造成混淆。为相等的值,后者检查,而is
是True
仅当对象是相同的。Python 3.8会警告您有关应使用==
而不是的情况is
:
写长列表时,尤其是垂直格式化时,很容易错过逗号。忘记元组列表中的逗号将给出有关元组不可调用的混乱错误消息。Python 3.8还会发出警告,指出实际问题:
该警告正确地将丢失的逗号标识为真正的罪魁祸首。
最佳化
Python 3.8进行了一些优化。一些使代码运行更快。其他减少了内存占用。例如,namedtuple
与Python 3.7相比,在Python 3.8中查找a中的字段要快得多:
你可以看到,查找.twitter
在namedtuple
30-40%,在Python 3.8快。从具有已知长度的可迭代对象初始化列表时,可以节省一些空间。这样可以节省内存:
在这种情况下,与3.7相比,该列表在Python 3.8中使用的内存减少了约11%。
其他优化包括的更高性能subprocess
,更快的文件复制shutil
,更高的默认性能pickle
以及更快的operator.itemgetter
操作。有关优化的完整列表,请参见官方文档。
那么,您是否应该升级到Python 3.8?
让我们从简单的答案开始。如果您想尝试这里看到的任何新功能,那么您确实需要能够使用Python 3.8。像pyenv
和Anaconda这样的工具可以很容易地并排安装多个版本的Python。或者,您可以运行官方的Python 3.8 Docker容器。自己尝试使用Python 3.8没有任何弊端。
现在,对于更复杂的问题。您是否应该将生产环境升级到Python 3.8?您是否应该使自己的项目依赖于Python 3.8来利用这些新功能?
在Python 3.8中运行Python 3.7代码的问题应该很少。因此,升级环境以运行Python 3.8是非常安全的,并且您将能够利用新版本中进行的优化。Python 3.8的不同beta版本已经可用了几个月,因此希望可以解决大多数错误。但是,如果您想保守一点,可以坚持到第一个维护版本(Python 3.8.1)可用。
升级环境后,就可以开始尝试仅在Python 3.8中使用的功能,例如赋值表达式和仅位置参数。但是,您应该注意其他人是否依赖您的代码,因为这也会迫使他们也升级他们的环境。流行的库可能至少会在更长的一段时间内至少支持Python 3.6。
有关为Python 3.8准备代码的更多信息,请参见移植到 Python 3.8。
引用自
https://realpython.com/python38-new-features
版权声明: 本文为 InfoQ 作者【志学Python】的原创文章。
原文链接:【http://xie.infoq.cn/article/d487e1b923dd3599bbc0a71b2】。文章转载请联系作者。
评论