当前位置:首页 > 影视动漫 >

简单线性回归模型怎么解题(线性回归模型公式怎么算)

来源:原点资讯(m.360kss.com)时间:2023-11-06 03:35:13作者:YD166手机阅读>>

作者丨Pradeep Menon

原文丨https://towardsdatascience.com/data-science-simplified-hypothesis-testing-56e180ef2f71

译者丨TalkingData 张永超

在此系列之前的文章(见文末)中,已经讨论了关于统计学习的关键概念和假设验证相关内容。在本篇内容中,将进入线性回归模型的讨论。

在开始之前,回顾一下之前统计学习中比较重要的几个关键点:

自变量和因变量:

在统计学习的背景下,有两种类型的数据:

  • 自变量:可以直接控制的数据。
  • 因变量:无法直接控制的数据。

无法控制的数据,即因变量需要预测或估计。

模型:

模型本质上就是一个转换引擎,主要的作用就是找到自变量和因变量之间的关系函数。

参数:

参数是添加到模型中用于估计输出的一部分。

基本概念

线性回归模型提供了一个监督学习的简单方法。它们简单而有效。

但是,到底什么是线性?

线性意味着:数据点排列在或者沿着一条直线或者接近直线的线排列。线性表明,因变量和自变量之间的关系可以用直接表示。

回顾高中时的数学课程,一条直线的方程式是什么呢?

y = mx c

线性回归只不过是这个简单方程的表现。

上述公式中:

  • y是因变量,是需要估计或者预测的变量
  • x是自变量,是可控的变量,在这里属于输入变量
  • m是斜率,体现了直线的倾斜程度,一般使用符号β表示
  • c是截距,当x为0时,确定y值的一个常数

线性回归模型并不是完美的,它试图以直接来逼近自变量和因变量之间的关系。而近似总会导致错误,并且一些错误是无法避免的,是问题性质本身所固有的,这些错误无法消除,称之为不可简化的错误,真正的关系中,总是具有一定的噪声项,并且是任何模型无法减少的。

上述直接公式因此可以重写为:

简单线性回归模型怎么解题,线性回归模型公式怎么算(1)

  • β0和β1是代表截距和斜率的两个未知常数。他们是参数。
  • ε是误差项。

简述

下面通过一个例子来说明线性回归模型的术语和工作原理。

费尔南多是一名数据科学家,他想要买一辆车。他想估计或者预测他最终必须支付的汽车价格。正好他有一个朋友在一家汽车经销商上班,费尔南多向这位朋友咨询了各种其他汽车的价格以及汽车的一些特点,他的朋友向他提供了如下的一些信息:

简单线性回归模型怎么解题,线性回归模型公式怎么算(2)

  • make: 车辆品牌
  • fuelType:所使用的动力燃料
  • nDoor:车门数量
  • engineSize:发动机大小(马力)
  • price:最终的价格

首先,费尔南多希望评估他是否可以根据发动机大小预测汽车价格。第一组分析旨在回答以下问题:

  • 汽车价格与发动机大小有关吗?
  • 这种关系有多强?
  • 关系是线性的吗?
  • 我们可以根据发动机大小预测/估算汽车价格吗?

费尔南多进行了相关分析,相关性是衡量两个变量相关的程度。它是通过称为相关系数的度量来衡量的,值在0和1之间。

如果相关系数是一个较大的数,例如 0.7 以上的数,则意味着随着一个变量的增加,另一个变量也会增加。也就说,相关系数体现了变量间“同向变化”情况。

费尔南多做了一些相关性的分析,绘制出了价格与发动机大小之间的关系。

他将数据集分割成了训练和测试两部分,其中75%的数据作为训练使用,剩下的作为测试来用。

他使用了一些统计性软件包构建了一个线性回归模型,该模型本身找到了汽车的价格和发动机大小间的关系,由此创建了一个线性方程。

简单线性回归模型怎么解题,线性回归模型公式怎么算(3)

有了这个模型之后,就可以回答费尔南多想了解的几个问题了:

  • 汽车价格与发动机大小有关吗?
  • 是的,它们之间是有关系的。
  • 这种关系有多强?
  • 它们间的相关系数为0.872。是一种很强的关系。
  • 关系是线性的吗?
  • 存在一条直线可以拟合。一个良好的价格预测可以由发动机大小来决定。
  • 我们可以根据发动机大小预测/估算汽车价格吗?
  • 可以。

对于价格和发动机大小的关系显而易见,其实这个模型的最终表达式也很简单,如下:

price = β0 β1 x engine size

模型构建与解释

模型

在上述内容中,原始数据集按照一定的比例进行了分割,产生训练集和测试集两大部分,训练集被用于学习或者找规律,最终创建模型,测试集被用于评估模型的性能。

费尔南多将数据集分割成了训练和测试两部分,其中75%的数据作为训练使用,剩下的作为测试来用。他使用了一些统计性软件包构建了一个线性回归模型,该模型本身找到了汽车的价格和发动机大小间的关系,由此创建了一个线性方程。

简单线性回归模型怎么解题,线性回归模型公式怎么算(4)

首页 123下一页

栏目热文

线性回归的计算公式(线性回归预测股票)

线性回归的计算公式(线性回归预测股票)

各位同学好,今天我和大家分享一下python机器学习中线性回归算法的实例应用,并介绍正则化、岭回归方法。在上一篇文章中我...

2023-11-06 03:26:54查看全文 >>

奥特曼出大招动作(奥特曼精彩大招场面)

奥特曼出大招动作(奥特曼精彩大招场面)

作为一个奥特迷,每当和小伙伴干架的时候总会摆出一副奥特曼释放大招的姿势,就好像自己真的能发出激光一样,下面我们来盘点一些...

2023-11-06 03:34:30查看全文 >>

奥特曼的大招哪个最强(奥特曼大招动作都有哪个)

奥特曼的大招哪个最强(奥特曼大招动作都有哪个)

动漫不吐不快,文章新颖不赖。大家好,我是筱头。奥特曼这位荧屏英雄相信大家并不陌生,像大家熟知的迪迦奥特曼,泰罗奥特曼,佐...

2023-11-06 03:55:27查看全文 >>

奥特曼最强必杀技巧(奥特曼最强的五个绝招)

奥特曼最强必杀技巧(奥特曼最强的五个绝招)

第一名 诺亚奥特曼诺亚·奥特曼,“存在于传说中的奥特曼”,是从太古时代起便守护着宇宙的传说中的光之救世主,是奈克斯特·奥...

2023-11-06 03:30:44查看全文 >>

奥特曼的厉害大招(奥特曼100个大招)

奥特曼的厉害大招(奥特曼100个大招)

今天要跟大家说的是奥特曼中的3只很不一样的怪兽,在我们的印象里,怪兽看上去都是很笨重的样子,而且大多是用物理攻击的,但是...

2023-11-06 03:27:49查看全文 >>

多元线性回归模型计算公式(简单线性回归模型参数估计公式)

多元线性回归模型计算公式(简单线性回归模型参数估计公式)

1 问题概述数据集data.xlsx中包含238行的深度、岩性描述、水饱和度、油饱和度、岩心和毛管等相关参数信息,挑取有...

2023-11-06 03:45:31查看全文 >>

线性回归计算步骤(线性回归计算举例)

线性回归计算步骤(线性回归计算举例)

什么是线性回归?你是否有过这样的经历,当你看到一组数据时,你会想知道它们之间有没有什么规律?比如,当你看到一些房屋的面积...

2023-11-06 04:02:36查看全文 >>

多元线性回归模型计算(多元线性回归模型怎么计算)

多元线性回归模型计算(多元线性回归模型怎么计算)

1. 线性回归线性回归是一种统计方法,用于检查两个连续变量之间的关系:一个自变量和一个因变量。线性回归的目标是通过一组数...

2023-11-06 03:27:14查看全文 >>

简单线性回归模型公式(多重线性回归模型的公式)

简单线性回归模型公式(多重线性回归模型的公式)

简单线性回归也称为一元线性回归,也就是回归模型中只含一个自变量,否则称为多重线性回归。简单线性回归模型为:Y= a ...

2023-11-06 03:28:57查看全文 >>

线性回归数学模型(线性回归模型的计算)

线性回归数学模型(线性回归模型的计算)

编辑导语:在日常工作中,很多时候都会用到数据分析的方法,线性回归模型看起来非常简单,但实际上它的十分重要;本文作者分享了...

2023-11-06 04:03:51查看全文 >>

文档排行