当前位置: 首页 > >

回归分析的基本思想及其初步应用教程PPT课件_图文

发布时间:

1.1回归分析的基本 思想及其初步应用 2020/1/7 1 必修3(第二章 统计)知识结构 收集数据 (随机抽样) 整理、分析数据估 计、推断 用样本估计总体 变量间的相关关系 简分 系 单层 统 随抽 抽 机样 样 抽 样 2020/1/7 用样本 的频率 分布估 计总体 分布 用样本 数字特 征估计 总体数 字特征 线 性 回 归 分 析 2 问题1:现实生活中两个变量间的关系有哪些呢? 不相关 1、两个变量的关系 函数关系 线性相关 相关关 系 非线性相关 相关关系:对于两个变量,当自变量取值一定时, 因变量的取值带有一定随机性的两个变量之间的关 系。 2020/1/7 3 思考:相关关系与函数关系有怎样的不同? 函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般 的情况 2020/1/7 4 问题2:对于线性相关的两个变量用什么方法来刻 划之间的关系呢? 2、最小二乘估计 最小二乘估计下的线性回归方程: y? ? b?x ? a? n ?(xi ? X )( yi ? Y ) b? ? i?1 n ?(Xi ? X )2 i?1 2020/1/7 a? ? Y ? b?X 5 y? ? b?x ? a? n ?? ? xi yi ? n x y b^ ? i?1 n ?2 ? xi2 ? n x i ?1 ? ? a^ ? y? b^ x ? ? x ? 1 n n i ?1 xi ?? 回归直线必过样本点的中心 (x, y) ? ? y ? 1 n n i ?1 yi 2020/1/7 6 3、回归分析的基本步骤: 画散点图 求回归方程 预报、决策 这种方法称为回归分析. 回归分析是对具有相关关系的两个变量进行统计 202分0/1/析7 的一种常用方法. 7 回归分析知识结构图 问题背景分析 散点图 两个变量线性相关 线性回归模型 最小二乘法 残差分析 R2 两个变量非线性相关 非线性回归模型 应用 2020/1/7 8 比《数学3》中“回归”增加的内容 数学3——统计 1. 画散点图 2. 了解最小二乘法的 思想 3. 求回归直线方程 y=bx+a 4. 用回归直线方程解 决应用问题 2020/1/7 选修1-2——统计案例 5. 引入线性回归模型 y=bx+a+e 6. 了解模型中随机误差项e产生 的原因 7. 了解相关指数 R2 和模型拟合 的效果之间的关系 8. 了解残差图的作用 9. 利用线性回归模型解决一类非 线性回归问题 10. 正确理解分析方法与结果 9 教学情境设计 问题一:结合例1得出线性回归模型及随机误差。并且区分函数 模型和回归模型。 问题二:在线性回归模型中,e是用bx+a预报真实值y的随机误差, 它是一个不可观测的量,那么应如何研究随机误差呢? 问题三:如何发现数据中的错误?如何衡量随机模型的拟合效果? 问题四:结合例1思考:用回归方程预报体重时应注意什么? 问题五:归纳建立回归模型的基本步骤。 问题六:若两个变量呈现非线性关系,如何解决?(分析例2) 2020/1/7 10 问题一:结合例1得出线性回归模型及随机误差。并且区 分函数模型和回归模型。 例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。 编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。 解:1、选取身高为自变量x,体重为因变量y,作散点图: 2020/1/7 11 2.回归方程: y? ? 0.849x ? 85.172 身高172cm女大学生体重 y? = 0.849×172 - 85.712 = 60.316(kg) 探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果 不是,你能解析一下原因吗? 答:用这个回归方程不能给出每个身高为172cm的女大学生的体重的预测值, 只能给出她们平均体重的估计值。 2020/1/7 12 由于所有的样本点不共线,而只是散布在某一直线的附近,所 以身高和体重的关系可以用线性回归模型来表示: y ? bx ? a ? e 其中a和b为模型的未知参数,e称为随机误差. 2020/1/7 13 函数模型与“回归模型”的关系 函数模型:因变量y完全由自变量x确定 回归模型: 预报变量y完全由解释变量x和随机误差e确定 2020/1/7 14 思考:产生随机误差项e的原因 是什么? 注:e 产生的主要原因: (1)所用确定性函数不恰当; (2)忽略了某些因素的影响; (3)观测误差。 2020/1/7 15 问题二:在线性回归模型中,e是用bx+a预报真实值y的随机误差, 它是一个不可观测的量,那么应如何研究随机误差呢? e=y-(bx+a) 残差:一般的对于样本点(x1,y1),(x2,y2 ),...,(xn,yn ),它们的随机误差为 ? ? ? ? ei ? yi ? bxi ? a,i ? 1, 2,...n,其估计值为ei ? yi ? yi ? yi ? b xi ? a,i ? 1, 2,...n ? ei 称为相应于点(xi,yi)的残差。 结合例1除了身高影响体重外的其他因素是不可测量的,不能希望有某种方法获 取随机误差的值以提高预报变量的估计精度,但却可以估计预报变量观测值中所包 含的随机误差,这对我们查找样本数据中的错误和模型的评价极为有用,因此在此 我们引



友情链接: 传奇百科网 招聘百科网 非凡百科网 游艇百科网 口红百科网 创业百科网 软木百科网