写点什么

python DataFrame 常用描述性统计分析方法,熬夜整理华为最新 Python 笔试题

作者:程序媛可鸥
  • 2022 年 3 月 21 日
  • 本文字数:1465 字

    阅读完需:约 5 分钟

print(df)



关于 DataFrame 的 append()方法


DataFrame 增添一行可以使用 append()方法。设置参数,ignore_index=True 可以忽略掉索引。


当在 DataFrame 后边追加的对象为 Series 时,必须把 ignore_index 设为 True,或者除非 Serise 有 name 属性


当追加多列时,设置 ignore_index 为 True 可以避免出现索引值重复的异常事件。


此外 DataFrame 的 append()方法在未来的版本即将被取消。将由 concat 替代。


[](


)max() 最大值 & min() 最小值




import pandas as pd


data = [[110, 105, 99], [105, 88, 115], [109, 120, 130]]


index = [1, 2, 3]


columns = ['语文', '数学', '英语']


pd.set_option('display.unicode.east_asian_width', True)


df = pd.DataFrame(data=data, index=index, columns=columns)


print(df)


print("================================")


df_max = df.max()


print(df_max)


print("================================")


df_min = df.min()


print(df_min)



[](


)median() 中位数




import pandas as pd


data = [[110, 120, 110], [130, 130, 131], [115, 120, 130]]


columns = ['语文', '数学', '英语']


df = pd.DataFrame(data=data, columns=columns)


print(df)


print("================================")


print(df.median())



[](


)


mming.blog.csdn.net/article/details/123238672)mode() 众数




import pandas as pd


data = [[110, 120, 110], [130, 130, 130], [130, 120, 130]]


columns = ['语文', '数学', '英语']


df = pd.DataFrame(data=data, columns=columns)


print(df)

三科成绩的众数

print(df.mode())

每一行的众数

print(df.mode(axis=1))

“数学”的众数

print(df['数学'].mode())



[](


)var() 方差




import pandas as pd


data = [[110, 113, 102, 105, 108], [118, 98, 119, 85, 118]]


index = ['小黑', '小白']


columns = ['物理 1', '物理 2', '物理 3', '物理 4', '物理 5']


df = pd.DataFrame(data=data, index=index, columns=columns)


print(df)


print("========================================")


print(df.var(axis=1))



[](


)std() 标准差




import pandas as pd


data = [[110, 120, 110], [130, 130, 130], [130, 120, 130]]


columns = ['语文', '数学', '英语']


df = pd.DataFrame(data=data, columns=columns)


print(df)


print("=============================")


print(df.std())



[](


)quantile() 分位数




以 35%分位数为例


import pandas as pd

创建 DataFrame 数据(数学成绩)

data = [120, 89, 98, 78, 65, 102, 112, 56, 79, 45]


columns = ['数学']


df = pd.DataFrame(data=data, columns=columns)


print(df)


print("============================")

计算 35%的分位数

x = df['数学'].quantile(0.35)

输出淘汰学生

print(df[df['数学'] <= x])



关于其他数据类型,如 Timestamp,也可以使用分位数 quantile()方法。


(1)Python 所有方向的学习路线(新版)


这是我花了几天的时间去把 Python 所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。


最近我才对这些路线做了一下新的更新,知识体系更全面了。



(2)Python 学习视频


包含了 Python 入门、爬虫、数据分析和 web 开发的学习视频,总共 100 多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。



(3)100 多个练手项目


我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。



用户头像

Python编程资料加Q群免费领取:419829237 2022.03.14 加入

还未添加个人简介

评论

发布
暂无评论
python DataFrame常用描述性统计分析方法,熬夜整理华为最新Python笔试题_Python_程序媛可鸥_InfoQ写作平台