写点什么

pandas

0 人感兴趣 · 61 次引用

  • 最新
  • 推荐

pandas plot 函数:数据可视化的快捷通道

一般来说,我们先用pandas分析数据,然后用matplotlib之类的可视化库来显示分析结果。而pandas库中有一个强大的工具--plot函数,可以使数据可视化变得简单而高效。

https://static001.geekbang.org/infoq/ff/ff65b3084a8961af77a6bdb88118b4cd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Python 必备:Pandas 中 rolling 方法指南

用户头像
秃头小帅oi
2023-12-06

在数据分析和时间序列数据处理中,经常需要执行滚动计算或滑动窗口操作。Pandas库提供了rolling方法,用于执行这些操作。

https://static001.geekbang.org/infoq/85/85e4ad1e73976e3c9f87408995cefd0c.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Pandas 数据清理

用户头像
3D建模设计
2023-09-13

本分步教程适用于初学者,指导他们使用强大的 Pandas 库完成数据清理和预处理过程

ARTS 打卡 第三周

用户头像
一期一会
2023-09-03

A:62. 不同路径 R: GenAI 十大热门技能 T: Pandas解析Json S:工作强度太大了,我哪里还有时间健身,锻炼?

ARTS 打卡 第二周

用户头像
一期一会
2023-08-27

A:活字印刷 R:用代码替代提问 T:pandas关键数据结构 S:钱给得不够怎么办

https://static001.geekbang.org/infoq/46/46ce8f741de039aa09aa1f6b76dc78e5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

27. Pandas

用户头像
茶桁
2023-08-23

如果你以后从事的是数据治理和分析工作,那么本节课的内容可能会是你在今后工作中用到的最多的内容。我们需要学习行列索引的操作,数据的处理,数据的合并,多层索引,时间序列,数据的分组聚合(重点)。最后,我们会有一个案例的展示。

https://static001.geekbang.org/infoq/d2/d2a8d8eb377158810c5d8d355d2321e4.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Python 案例|Pandas 正则表达式

用户头像
TiAmo
2023-08-17

字符串的处理在数据清洗中占比很大。也就是说,很多不规则的数据处理都是在对字符串进行处理。Excel提供了拆分、提取、查找和替换等对字符串处理的技术。在Pandas中同样提供了这些功能,并且在Pandas中还有正则表达式技术的加持,让其字符串处理能力更加强大。

Python 数据分析库介绍及引入惯例

用户头像
timerring
2023-04-05

NumPy NumPy(Numerical Python的简称)是Python科学计算的基础包。 快速高效的多维数组对象ndarray。 作为在算法和库之间传递数据的容器。对于数值型数据,NumPy数组在存储和处理数据时要比内置的Pyth

快速入门 pandas 进行数据挖掘数据分析 [多维度排序、数据筛选、分组计算、透视表](一)

Python使用缩进(tab或者空格)来组织代码,而不是像其 他语言比如R、C++、Java和Perl那样用大括号。考虑使用for循 环来实现排序算法:

https://static001.geekbang.org/infoq/fe/fe8830b7890440c33aa13137a2a8c6e8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

python 数据分析 -pandas 基础(1)

用户头像
AIWeker
2022-11-17

pandas是处理结构化(表格数据)最常用的工具,是python数据分析和数据处理的最成熟的库。pandas最早是为了处理金融数据而开发的,开放到社区至今,已经广泛应用于各个领域中;pandas以numpy为基础,而pandas是其他应用的数据基础,如Scikit-learn等。

数据的分组与计算

用户头像
攻城狮Wayne
2022-11-01

对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在数据集准备好之后,通常就是计算分组统计或生成透视表。pandas 提供了一个灵活高效的 groupby 功能,使我们可以高效地对数据集进行操作。

Pandas 的介绍及 Series、 DataFrame 的创建

用户头像
攻城狮Wayne
2022-10-31

Pandas 是一个强大的分析结构化数据的工具集;它的使用基础是 Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。Pandas 的主要数据结构是 Series(一维数据)和 DataFrame(二维数据)。

pandas 如何读写源数据

说到pandas,相信每个数据分析师都不陌生。在日常分析工作中,免不了需要读写数据。而数据的来源往往各式各样,有csv文件、excel内容、关系型数据库等等。今天总结一下pandas如何读取不同数据源。

Python 教程之数据分析(4)—— 使用 Python 进行数据分析和可视化 | 第 1 套

Python 是一种用于进行数据分析的出色语言,主要是因为以数据为中心的 Python 包的奇妙生态系统。Pandas就是其中之一,它使导入和分析数据变得更加容易。在本文中,我使用 Pandas 分析了来自流行的“statweb.stanford.edu”网站的联合国公共数据集的 Country

https://static001.geekbang.org/infoq/94/941bb886ba7e4b57d032ce9b197659e2.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

学会 Pandas 这六大函数,数据分析够用了

用户头像
happymove
2022-05-30

数据分析利器pandas,六大不容错过的数据分析函数。

https://static001.geekbang.org/infoq/c1/c1fc35fe550a61029764ec1bc30cb6b6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Pandas 索引的操作

用户头像
Peter
2022-04-22

Pandas索引的操作

https://static001.geekbang.org/infoq/c1/c1fc35fe550a61029764ec1bc30cb6b6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Pandas+Numpy+Sklearn 随机取数

用户头像
Peter
2022-04-22

各种随机取数的方法

https://static001.geekbang.org/infoq/30/3005992cbde9ca23f35e795e7de8320f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析实际案例之:pandas 在餐厅评分数据中的使用

用户头像
程序那些事
2022-02-16

为了更好的熟练掌握pandas在实际数据分析中的应用,今天我们再介绍一下怎么使用pandas做美国餐厅评分数据的分析。

https://static001.geekbang.org/infoq/e9/e94258c3d4ee4f0e9c403c5f0489268d.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析实际案例之:pandas 在泰坦尼特号乘客数据中的使用

用户头像
程序那些事
2022-02-15

1912年4月15日,号称永不沉没的泰坦尼克号因为和冰山相撞沉没了。因为没有足够的救援设备,2224个乘客中有1502个乘客不幸遇难。事故已经发生了,但是我们可以从泰坦尼克号中的历史数据中发现一些数据规律吗?今天本文将会带领大家灵活的使用pandas来进行数据

https://static001.geekbang.org/infoq/b9/b90808f850e648450249eefede1cead8.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析从零开始实战专栏导航 @老表

用户头像
老表
2021-12-09

本系列学习笔记参考书籍:  《数据分析实战》托马兹·卓巴斯,会将自己学习本书的笔记分享给大家,同样开成一个系列『数据分析从零开始实战』。

大数据开发之数据读取—Pandas vs Spark

用户头像
@零度
2021-12-06

​数据读取是所有数据处理分析的第一步,而Pandas和Spark作为常用的计算框架,都对常用的数据源读取内置了相应接口。总体而言,大数据培训数据读取可分为从文件读取和从数据库读取两大类,其中数据库读取包含了主流的数据库,从文件读取又区分为不同的文件

【Pandas 学习笔记 02】- 数据处理高阶用法

Pandas 是一个 Python 软件库,它提供了大量能使我们快速便捷地处理数据的函数和方法。在本文将主要介绍 Pandas 的实用数据处理操作。

https://static001.geekbang.org/infoq/9d/9ddf6b7d4fbca77770518e32e5b4000d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析从零开始实战,Python、Pandas 与各类数据库

用户头像
老表
2021-11-30

前面四篇文章讲了数据分析虚拟环境创建和pandas读写CSV、TSV、JSON、Excel、XML格式的数据,HTML页面读取,今天我们继续探索pPython、Pandas操作各类数据库。

https://static001.geekbang.org/infoq/56/5697137b7daac63d1f50752cb3abe5f1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析从零开始实战,Pandas 读写 Excel/XML 数据

用户头像
老表
2021-11-28

前面两篇文章讲了数据分析虚拟环境创建和pandas读写csv、tsv、json格式的数据,今天我们继续探索pandas读取数据,如何读取Excel和XML数据?

【Pandas 学习笔记 02】处理数据实用操作

Pandas 是一个 Python 软件库,它提供了大量能使我们快速便捷地处理数据的函数和方法。在本文将主要介绍 Pandas 的实用数据处理操作。

https://static001.geekbang.org/infoq/e3/e38c546e1afe23176cb91360a423336a.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析从零开始实战,Pandas 读写 CSV 数据

用户头像
老表
2021-11-25

本系列学习笔记参考书籍: 《数据分析实战》托马兹·卓巴斯,会将自己学习本书的笔记分享给大家,同样开成一个系列『数据分析从零开始实战』。

【Pandas 学习笔记 01】强大的分析结构化数据的工具集

在进行量化分析的过程中,总是需要使用大量的数据基础,对数据之间的关联进行挖掘,最终找到我们需要的数据。今天就介绍下Pandas-一个强大的分析结构化数据的工具集。

https://static001.geekbang.org/infoq/c1/c1fc35fe550a61029764ec1bc30cb6b6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

图解 Pandas 的排名 rank 机制

用户头像
Peter
2021-11-07

在我们的生活经常会遇到各种排名问题:学生成绩排名、销售员业绩排名、各种比赛排名等。在之前一篇关于SQL的文章-《面试必备:SQL排名和窗口函数》中有提到过如何使用SQL来实现3种主要的排名方式:顺序排名、跳跃排名和密集排名。

pandas_pandas技术文章_InfoQ写作社区