当前位置:首页 > 上门服务 >

怎么判断线性相关(线性相关判断方法总结)

来源:原点资讯(m.360kss.com)时间:2024-01-25 05:15:50作者:YD166手机阅读>>

从事质量行业的朋友一定经常需要对数据进行分析,这也是一项最基础的技能。那么你知道几种数据相关性分析的方法呢?

做数据分析时,为了提炼观点,相关性分析是必不可少,而且尤为重要的一个环节。但是,对于不同类型的数据,相关性分析的方法都各不相同。本文,主要按照不同的数据类型,来对各种相关性分析方法进行梳理总结。

相关性分析是指对两个或多个具备相关性的变量元素进行分析,相关性不等于因果性。

一、离散与离散变量之间的相关性1、卡方检验

卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。

怎么判断线性相关,线性相关判断方法总结(1)

(1)假设,多个变量之间不相关

(2)根据假设计算得出每种情况的理论值,根据理论值与实际值的差别,计算得到卡方值 及 自由度

df=(C-1)(R-1)

(3)查卡方表,求p值

卡方值越大,P值越小,变量相关的可能性越大,当P<=0.05,否定原假设,认为变量相关。

2、信息增益和信息增益率

在介绍信息增益之前,先来介绍两个基础概念,信息熵和条件熵。

信息熵,就是一个随机变量的不确定性程度。

条件熵,就是在一个条件下,随机变量的不确定性。

(1)信息增益:熵 - 条件熵

在一个条件下,信息不确定性减少的程度。

Gain(Y,X)=H(Y)-H(Y|X)

信息增益越大,表示引入条件X之后,不纯度减少得越多。信息增益越大,则两个变量之间的相关性越大。

(2)信息增益率

假设,某个变量存在大量的不同值,例如ID,引入ID后,每个子节点的不纯度都为0,则信息增益减少程度达到最大。所以,当不同变量的取值数量差别很大时,引入取值多的变量,信息增益更大。因此,使用信息增益率,考虑到分支个数的影响。

Gain_ratio=(H(Y)-H(Y|X))/H(Y|X)

二、连续与连续变量之间的相关性1、协方差

协方差,表达了两个随机变量的协同变化关系。如果两个变量不相关,则协方差为0。

cov(X,Y)=E{[X-E(X)],[Y-E(Y)]}

当 cov(X, Y)>0时,表明 X与Y 正相关;

当 cov(X, Y)<0时,表明X与Y负相关;

当 cov(X, Y)=0时,表明X与Y不相关。

协方差只能对两组数据进行相关性分析,当有两组以上数据时就需要使用协方差矩阵。

协方差通过数字衡量变量间的相关性,正值表示正相关,负值表示负相关。但无法对相关的密切程度进行度量。当我们面对多个变量时,无法通过协方差来说明那两组数据的相关性最高。要衡量和对比相关性的密切程度,就需要使用下一个方法:相关系数。

2、线性相关系数

也叫Pearson相关系数, 主要衡量两个变量线性相关的程度。

r=cov(X,Y)/(D(X)D(Y))

相关系数是用协方差除以两个随机变量的标准差。相关系数的大小在-1和1之间变化。再也不会出现因为计量单位变化,而数值暴涨的情况了。

线性相关系数必须建立在因变量与自变量是线性的关系基础上,否则线性相关系数是无意义的。

三、连续与离散变量之间的相关性1、连续变量离散化

将连续变量离散化,然后,使用离散与离散变量相关性分析的方法来分析相关性。

2、箱形图

使用画箱形图的方法,看离散变量取不同值,连续变量的均值与方差及取值分布情况。

如果,离散变量取不同值,对应的连续变量的箱形图差别不大,则说明,离散变量取不同值对连续变量的影响不大,相关性不高;反之,相关性高。

文章转自网络,如有侵权请联系删除。

欢迎来到盈飞无限质量智能世界。【质量管理系统 QMS/QES】免费试用,注册下载,试用账号和密码是:admin,【下载路径】https://www.infinityqs.cn/quickstart/free-trial 欢迎关注微信公众号【品质人生质量开讲】,收获专属“掌上质量知识库”!

,

栏目热文

怎样才算具有线性相关关系(怎样简单的判断线性相关与无关)

怎样才算具有线性相关关系(怎样简单的判断线性相关与无关)

考纲原文变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想...

2024-01-25 04:57:47查看全文 >>

车辆熄火后大灯开关未关会耗电吗(停车熄火后大灯未关闭会耗电吗)

车辆熄火后大灯开关未关会耗电吗(停车熄火后大灯未关闭会耗电吗)

汽车已经成为了大家离不开的交通工具,不仅能在一家人出游时发挥出比较大的作用,更多的是在日常生活的通勤中为我们带来了便利,...

2024-01-25 05:08:06查看全文 >>

车灯熄火前不关但没亮耗电吗(车已熄火大灯忘记关会耗电吗)

车灯熄火前不关但没亮耗电吗(车已熄火大灯忘记关会耗电吗)

今天看见有人在问,如果打到远光灯了,但是没亮,会不会亏电的问题。这里我就对于灯光打开会不会亏电做个介绍。1.首先,针对于...

2024-01-25 04:59:30查看全文 >>

汽车大灯晚上熄火不关耗电吗(停车熄火后大灯未关闭会耗电吗)

汽车大灯晚上熄火不关耗电吗(停车熄火后大灯未关闭会耗电吗)

首先,汽车正常驾驶时大灯主要耗费的是发电机产生的电量,而当夜晚熄火停车的时候,发电机停止了工作,此时就转成车子的电瓶来给...

2024-01-25 05:19:14查看全文 >>

汽车自动大灯熄火不关会耗电吗(汽车熄火大灯没关灯不亮还耗电吗)

汽车自动大灯熄火不关会耗电吗(汽车熄火大灯没关灯不亮还耗电吗)

自动车灯功能是现代汽车的一项智能辅助功能,它可以根据周围环境光线的变化来自动调节车辆的灯光开关。然而,对于很多车主来说,...

2024-01-25 05:00:28查看全文 >>

口袋妖怪漆黑的魅影开拓地区在哪(口袋妖怪漆黑的魅影魅影之森在哪)

口袋妖怪漆黑的魅影开拓地区在哪(口袋妖怪漆黑的魅影魅影之森在哪)

对战开拓区(日文︰バトルフロンティア,英文︰Battle Frontier)是一个在《白金》和《心金/魂银》中的特殊地点...

2024-01-25 05:01:23查看全文 >>

口袋妖怪漆黑的魅影浅滩在哪里(口袋妖怪漆黑的魅影魅影之森在哪)

口袋妖怪漆黑的魅影浅滩在哪里(口袋妖怪漆黑的魅影魅影之森在哪)

今天(2019.4.22),我们迎来了第50个世界地球日。世界地球日,顾名思义,是一个专为世界环境保护而设立的节日,旨在...

2024-01-25 05:23:18查看全文 >>

win8系统不显示可移动磁盘怎么办(win8系统找不到硬盘)

win8系统不显示可移动磁盘怎么办(win8系统找不到硬盘)

为了保存更多的资料文件,很多用户都会使用移动硬盘来存储。但如果移动硬盘被禁用了,电脑是无法显示出来的,这时候该怎么解决呢...

2024-01-25 04:53:36查看全文 >>

win8怎么恢复磁盘(win8磁盘图标恢复)

win8怎么恢复磁盘(win8磁盘图标恢复)

电脑磁盘分区对于新购买的电脑来说,是整理电脑第一步要做的事情,大家一般都会根据自己的需要把磁盘划分为C盘、D盘、E盘等等...

2024-01-25 04:55:38查看全文 >>

win8磁盘打不开怎么办(win8怎么修复磁盘)

win8磁盘打不开怎么办(win8怎么修复磁盘)

Win8系统磁盘损坏无法读取怎么办?不少用户电脑在重启的时候出现了检查磁盘的字样,并且还提示磁盘已经损坏无法读取,那么遇...

2024-01-25 05:11:46查看全文 >>

文档排行