写点什么

NumPy 与 Python 内置列表的区别

作者:宇宙之一粟
  • 2022 年 7 月 08 日
  • 本文字数:950 字

    阅读完需:约 3 分钟

NumPy 与 Python 内置列表的区别

什么是 Numpy

NumPy,是 Numerical Python 的简称,用于高性能科学计算和数据分析的基础包,像数学科学工具(pandas)和框架(Scikit-learn)中都使用到了 NumPy 这个包。


NumPy 中的基本数据结构是 ndarray 或者 N 维数值数组,在形式上来说,它的结构有点像 Python 的基础类型——Python 列表。


但本质上,这两者并不同,可以看到一个简单的对比。


我们创建两个列表,当我们创建好了之后,可以使用 + 运算符进行连接:


list1 = [i for i in range(1,11)]list2 = [i**2 for i in range(1,11)]print(list1+list2)# [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
复制代码


列表中元素的处理感觉像对象,不是很数字,不是吗? 如果这些是数字向量而不是简单的数字列表,您会期望 + 运算符的行为略有不同,并将第一个列表中的数字按元素添加到第二个列表中的相应数字中。


接下来看一下 Nympy 的数组版本:


import numpy as nparr1 = np.array(list1)arr2 = np.array(list2)arr1 + arr2# array([  2,   6,  12,  20,  30,  42,  56,  72,  90, 110])
复制代码


通过 numpy 的 np.array 数组方法实现了两个列表内的逐个值进行相加。


我们通过 dir 函数来看两者的区别,先看 Python 内置列表 list1 的内置方法:



再用同样的方法看一下 arr1 中的方法:

NumPy 数组对象还有更多可用的函数和属性。 特别要注意诸如 meanstdsum 之类的方法,因为它们清楚地表明重点关注使用这种数组对象的数值/统计计算。 而且这些操作也很快。


NumPy 数组和 Python 内置计算对比


NumPy 的速度要快得多,因为它的矢量化实现以及它的许多核心例程最初是用 C 语言(基于 CPython 框架)编写的。 NumPy 数组是同构类型的密集排列的数组。 相比之下,Python 列表是指向对象的指针数组,即使它们都属于同一类型。 因此,我们得到了参考局部性的好处。


许多 NumPy 操作是用 C 语言实现的,避免了 Python 中的循环、指针间接和逐元素动态类型检查的一般成本。 特别是,速度的提升取决于您正在执行的操作。 对于数据科学和 ML 任务,这是一个无价的优势,因为它避免了长和多维数组中的循环。


让我们使用 @timing 计时装饰器来说明这一点。 这是一个围绕两个函数 std_devstd_dev_python 包装装饰器的代码,分别使用 NumPy 和本机 Python 代码实现列表/数组的标准差计算。

发布于: 刚刚阅读数: 4
用户头像

宇宙古今无有穷期,一生不过须臾,当思奋争 2020.05.07 加入

🏆InfoQ写作平台-第二季签约作者 🏆 混迹于江湖,江湖却没有我的影子 热爱技术,专注于后端全栈,轻易不换岗 拒绝内卷,工作于软件工程师,弹性不加班 热衷分享,执着于阅读写作,佛系不水文

评论

发布
暂无评论
NumPy 与 Python 内置列表的区别_Numpy_宇宙之一粟_InfoQ写作社区