python DataFrame 常用描述性统计分析方法,熬夜整理华为最新 Python 笔试题
print(df)
关于 DataFrame 的 append()方法
DataFrame 增添一行可以使用 append()方法。设置参数,ignore_index=True 可以忽略掉索引。
当在 DataFrame 后边追加的对象为 Series 时,必须把 ignore_index 设为 True,或者除非 Serise 有 name 属性。
当追加多列时,设置 ignore_index 为 True 可以避免出现索引值重复的异常事件。
此外 DataFrame 的 append()方法在未来的版本即将被取消。将由 concat 替代。
[](
)max() 最大值 & min() 最小值
import pandas as pd
data = [[110, 105, 99], [105, 88, 115], [109, 120, 130]]
index = [1, 2, 3]
columns = ['语文', '数学', '英语']
pd.set_option('display.unicode.east_asian_width', True)
df = pd.DataFrame(data=data, index=index, columns=columns)
print(df)
print("================================")
df_max = df.max()
print(df_max)
print("================================")
df_min = df.min()
print(df_min)
[](
)median() 中位数
import pandas as pd
data = [[110, 120, 110], [130, 130, 131], [115, 120, 130]]
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("================================")
print(df.median())
[](
)
mming.blog.csdn.net/article/details/123238672)mode() 众数
import pandas as pd
data = [[110, 120, 110], [130, 130, 130], [130, 120, 130]]
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, columns=columns)
print(df)
三科成绩的众数
print(df.mode())
每一行的众数
print(df.mode(axis=1))
“数学”的众数
print(df['数学'].mode())
[](
)var() 方差
import pandas as pd
data = [[110, 113, 102, 105, 108], [118, 98, 119, 85, 118]]
index = ['小黑', '小白']
columns = ['物理 1', '物理 2', '物理 3', '物理 4', '物理 5']
df = pd.DataFrame(data=data, index=index, columns=columns)
print(df)
print("========================================")
print(df.var(axis=1))
[](
)std() 标准差
import pandas as pd
data = [[110, 120, 110], [130, 130, 130], [130, 120, 130]]
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("=============================")
print(df.std())
[](
)quantile() 分位数
以 35%分位数为例
import pandas as pd
创建 DataFrame 数据(数学成绩)
data = [120, 89, 98, 78, 65, 102, 112, 56, 79, 45]
columns = ['数学']
df = pd.DataFrame(data=data, columns=columns)
print(df)
print("============================")
计算 35%的分位数
x = df['数学'].quantile(0.35)
输出淘汰学生
print(df[df['数学'] <= x])
关于其他数据类型,如 Timestamp,也可以使用分位数 quantile()方法。
(1)Python 所有方向的学习路线(新版)
这是我花了几天的时间去把 Python 所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python 学习视频
包含了 Python 入门、爬虫、数据分析和 web 开发的学习视频,总共 100 多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100 多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。
评论