今天小编给大家分享一下怎么用Python和R实现描述性统计的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。
让客户满意是我们工作的目标,不断超越客户的期望值来自于我们对这个行业的热爱。我们立志把好的技术通过有效、简单的方式提供给客户,将通过不懈努力成为客户在信息化领域值得信任、有价值的长期合作伙伴,公司提供的服务项目有:主机域名、网络空间、营销软件、网站建设、普陀网站维护、网站推广。
描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,可以借助描述性统计来描述或总结数据的基本情况。
Python实现
from numpy import mean,median,ptp,var,stdimport numpy as npimport pandas as pd#算术平均值data = [1,2,3,4,5,5,5,6,7,8,8,9]data_mean = mean(data)print("算术平均数 = ")print(data_mean)#中位数data_median = median(data)print("中位数 = ")print (data_median)#众数data_mode = mode(data)print("众数 = ")print (data_mode)#极差data_range = max(data)-min(data)print("极差 = ")print (data_range)#方差和标准差data_var = var (data)print ("方差 = ")print (data_var)#标准差data_sd = std(data)print ("标准差 = " )print (data_sd)#变异系数data_cv = mean(data) / std(data)print ("变异系数 = " )print (data_cv)#四分卫极差dt = pd.Series(np.array([1,2,3,4,5,5,5,6,7,8,8,9]))print('Q1:', dt.quantile(.25))print('Q3:', dt.quantile(.75))print('Q3 - Q1 :', dt.quantile(.75) - dt.quantile(.25) )
R实现
#整理成描述性统计的函数my_describe <- function(x){ options(digits = 3) N = length(x); Min = min(x, na.rm = TRUE); Q1 = quantile(x, probs = 0.25, na.rm = TRUE); Median = median(x, na.rm = TRUE); Q3 = quantile(x, probs = 0.75, na.rm = TRUE); Max = max(x, na.rm = TRUE); Mean = mean(x, na.rm = TRUE); Var = var(x, na.rm = TRUE); Sd = sd(x, na.rm = TRUE); Range = abs(diff(range(x))); #返回结果 return(data.frame(N = N, Min = Min, Q1 = Q1, Median = Median, Q3 = Q3, Max = Max, Mean = Mean, Var = Var, Sd = Sd, Range = Range))}#可对data数据集批量使用sapply(data, my_describe)
以上就是“怎么用Python和R实现描述性统计”这篇文章的所有内容,感谢各位的阅读!相信大家阅读完这篇文章都有很大的收获,小编每天都会为大家更新不同的知识,如果还想学习更多的知识,请关注创新互联行业资讯频道。
售后响应及时
7×24小时客服热线数据备份
更安全、更高效、更稳定价格公道精准
项目经理精准报价不弄虚作假合作无风险
重合同讲信誉,无效全额退款