文章目录
- 常用统计量概念
- 演示
- 封装
常用统计量概念
演示
演示数据如下,保存到磁盘上
复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22身高,体重 172,75 171,62 166,62 160,55 155,57 173,58 166,55 170,63 167,53 173,60 178,60 173,73 163,47 165,66 170,60 163,50 172,57 182,63 171,59 177,64
这里只求了身高的统计量
复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13import pandas as pd df = pd.read_csv('datas/data1.csv') print(df['身高']) print('均值',df['身高'].mean()) print('中位数', df['身高'].median()) print('方差', df['身高'].var()) print('标准差', df['身高'].std()) print('极差', df['身高'].max()-df['身高'].min()) print('偏度', df['身高'].skew()) print('峰度', df['身高'].kurt())
封装
可以把之前的代码简单封装一下,便于以后使用
复制代码
1
2
3
4
5
6
7
8
9
10
11def cal_sta(dataFrameColumn): print('均值', dataFrameColumn.mean()) print('中位数', dataFrameColumn.median()) print('方差', dataFrameColumn.var()) print('标准差', dataFrameColumn.std()) print('极差', dataFrameColumn.max() - dataFrameColumn.min()) print('偏度', dataFrameColumn.skew()) print('峰度', dataFrameColumn.kurt())
这样当自己需要多个统计量时,就不用一行行写,直接将要计算的列给这个工具方法即可
最后附上其他常用统计量的调用方法
复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20count 非 NA 值的数量 describe 针对 Series 或 DF 的列计算汇总统计 min , max 最小值和最大值 argmin , argmax 最小值和最大值的索引位置(整数) idxmin , idxmax 最小值和最大值的索引值 quantile 样本分位数(0 到 1) sum 求和 mean 均值 median 中位数 mad 根据均值计算平均绝对离差 var 方差 std 标准差 skew 样本值的偏度(三阶矩) kurt 样本值的峰度(四阶矩) cumsum 样本值的累计和 cummin , cummax 样本值的累计最大值和累计最小值 cumprod 样本值的累计积 diff 计算一阶差分(对时间序列很有用) pct_change 计算百分数变化
最后
以上就是背后心锁最近收集整理的关于数学建模入门-python计算常用统计量常用统计量概念演示封装的全部内容,更多相关数学建模入门-python计算常用统计量常用统计量概念演示封装内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复