首页碳资讯 pearson相关系数（spearman相关性分析结果解读）

pearson相关系数（spearman相关性分析结果解读）

网站小编发布于 2022年3月31日评论(0) 阅读(1607)

最早接触pearson相关系数时，是在大学《概率论与数理统计》课本中，后来从事数据分析挖掘相关的工作，经常会用到评价两组数据之间的相关性，于是找到了皮尔森（pearson）相关系数。其实，还有一种相关系数斯皮尔曼（spearman）相关系数，肯德尔（kendall）相关系数。

在这三大相关系数中，spearman和kendall属于等级相关系数亦称为”秩相关系数”，是反映等级相关程度的统计分析指标。今天先不介绍。

今天先聊一下比较常用的pearson相关系数。

用数学公式表示，皮尔森相关系数等于两个变量的协方差除于两个变量的标准差，先看一下公式：

pearson相关系数（spearman相关性分析结果解读）

pearson是一个介于-1和1之间的值，用来描述两组线性的数据一同变化移动的趋势。

当两个变量的线性关系增强时，相关系数趋于1或-1；

当一个变量增大，另一个变量也增大时，表明它们之间是正相关的，相关系数大于0；

如果一个变量增大，另一个变量却减小，表明它们之间是负相关的，相关系数小于0；

如果相关系数等于0，表明它们之间不存在线性相关关系。

pearson相关系数在python中的实现：

pearson相关系数（spearman相关性分析结果解读）

1，numpy库中实现：

pearson相关系数（spearman相关性分析结果解读）

相关系数的对角矩阵

2，在scipy中实现，主要是在stats包中实现

pearson相关系数（spearman相关性分析结果解读）

得到的结果是一个元组，第一个元素是相关系数，第二个是P值，p-value越小，表示相关程度越显著。

3，在pandas中运用，日常处理数据都是用pandas，这个当然少不了喽

pearson相关系数（spearman相关性分析结果解读）

得到的也是一个相关系数数据

皮尔逊相关系数的适用范围：

当两个变量的标准差都不为零时，相关系数才有定义，皮尔逊相关系数适用于：

1. 两个变量之间是线性关系，都是连续数据。

2. 两个变量的总体是正态分布，或接近正态的单峰分布。

3. 两个变量的观测值是成对的，每对观测值之间相互独立。

关于作者: 网站小编

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送至87172970@qq.com邮件举报，一经查实，本站将立刻删除。

发表回复取消回复

要发表评论，您必须先登录。