数学建模入门-python计算常用统计量常用统计量概念演示封装

345 阅读 0 评论 228 点赞

我是靠谱客的博主背后心锁，这篇文章主要介绍数学建模入门-python计算常用统计量常用统计量概念演示封装，现在分享给大家，希望可以做个参考。

文章目录

常用统计量概念
演示
封装

常用统计量概念

在这里插入图片描述

演示

演示数据如下，保存到磁盘上

这里只求了身高的统计量

import pandas as pd
df = pd.read_csv('datas/data1.csv')
print(df['身高'])
print('均值',df['身高'].mean())
print('中位数', df['身高'].median())

print('方差', df['身高'].var())
print('标准差', df['身高'].std())
print('极差', df['身高'].max()-df['身高'].min())

print('偏度', df['身高'].skew())
print('峰度', df['身高'].kurt())

在这里插入图片描述

封装

可以把之前的代码简单封装一下，便于以后使用

def cal_sta(dataFrameColumn):
    print('均值', dataFrameColumn.mean())
    print('中位数', dataFrameColumn.median())

    print('方差', dataFrameColumn.var())
    print('标准差', dataFrameColumn.std())
    print('极差', dataFrameColumn.max() - dataFrameColumn.min())

    print('偏度', dataFrameColumn.skew())
    print('峰度', dataFrameColumn.kurt())

这样当自己需要多个统计量时，就不用一行行写，直接将要计算的列给这个工具方法即可

最后附上其他常用统计量的调用方法

count 	非 NA 值的数量
describe 	针对 Series 或 DF 的列计算汇总统计
min , max 	最小值和最大值
argmin , argmax 	最小值和最大值的索引位置（整数）
idxmin , idxmax 	最小值和最大值的索引值
quantile 	样本分位数（0 到 1）
sum 	求和
mean 	均值
median 	中位数
mad 	根据均值计算平均绝对离差
var 	方差
std 	标准差
skew 	样本值的偏度（三阶矩）
kurt 	样本值的峰度（四阶矩）
cumsum 	样本值的累计和
cummin , cummax 	样本值的累计最大值和累计最小值
cumprod 	样本值的累计积
diff 	计算一阶差分（对时间序列很有用）
pct_change 	计算百分数变化