以家庭为单位,某种商品的市场需求量年需求量Y,与该商品价格x之间的一组调查数据经计算

导读:答案一、单选题,1.答:联系:统计指标是建立在标志值的基础上的,统计指标与统计标志之间存在着相互转换关系,区别:(1)统计指标是说明统计总体的,统计标志是说明总体单位的,(2)统计指标都是用数量表示的,而统计标志可以用数量表示,(3)统计指标是由多个个体现象的数量综合的结果,而统计标志是未经任何综合只代表某一个体现象,结合基本统计数字估计总体指标数值,2.总指数有哪两种基本形式?各有什么特点?2.总指数有哪两种基本形式?各有什么特点? 3.变异指标有哪几种类型? 4.相关与回归分析的关系? 八、 计算题 1. 现有甲、乙两国钢产量和人口资料如下: 2000年 2001年 2000年 2001年 钢产量(万吨) 00 5250 年平均人口数(万人) 43 7192 试通过计算动态相对指标、强度相对指标和比较相对指标来简单分析甲、乙两国钢产量的发展情况。 2. 对生产某种规格的灯泡进行使用寿命检验,根据以往正常生产的经验,灯泡使用寿命标准差σ=0.4小时,而合格品率90%,现用重复抽样方式,在95.45%的概率保证下,抽样平均使用寿命的极限误差不超过0.08小时,抽样合格率的误差不超过5%,必要的抽样平均数应为多大? 3.某厂产品产量及出厂价格资料如下表: 产
量 出厂价格(元) 产品名称 计量单位 基期 报告期 基期 报告期 甲 吨 0 100 乙 台
50 60 丙 件
20 20 要求:对该厂总产值变动进行因素分析。(计算结果百分数保留2位小数) 4.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关,现对给定时期内的价格与需求量进行观察,得到下表所示的一组数据。 价格x(元) 10 6 8 9 12 11 9 10 12 7 需求量y(吨) 60 72 70 56 55 57 57 53 54 70 要求:①计算价格与需求量之间的简单相关系数。 ②拟合需求量对价格的回归直线。 ③确定当价格为15元时,需求量的估计值 答
案 一、单选题 1―5.DBCBD
6―10. DACBA
11―15. CAADB
16―20.BDBCD 二、多选题 1. BC
5.ACDE 三、简答题 1. 答:联系:统计指标是建立在标志值的基础上的,它是各个总体单位的数量值的加总。
统计指标与统计标志之间存在着相互转换关系。 区别:(1)统计指标是说明统计总体的,统计标志是说明总体单位的;(2)统计指标都是用数量表示的,而统计标志可以用数量表示,也可以不用数量表示;(3)统计指标是由多个个体现象的数量综合的结果,而统计标志是未经任何综合只代表某一个体现象。 2.答:总指数的两种基本形式是综合指数和平均指数。综合指数的特点是先综合,后对比。其编制要点是:将不能直接加总所研究的现象,通过同度量因素的加入,过渡到能够加总综合的价值指标;用来对比的两个时期的价值指标中,所加入的同度量因素必须令其固定在一个时期的水平上,以此对比得出的总指数就是所研究现象综合变动的程度。
平均指数的特点是先计算出各个项目的个体指数,然后再对这些个体指数进行加权以求得总指数。 3.答:(1)典型调查可以补充全面调查和其他非全面调查的不足;(2)在一定条件下,可以利用典型调查资料,结合基本统计数字估计总体指标数值;(3)典型调查可以研究新生事物。 4.答:联系:(1)先进行相关分析再进行回归分析,只有在确定两变量存在着相关分析后,才能分析两变量的回归分析。两变量间的相关程度越大,研究回归才更有意义。通过相关分析,可以大致判断现象与现象之间配合什么数学模型建立回归方程。区别:分析的目的不同,相关分析主要分析变量之间有无关系,使什么样的关系,有多大程度的关系;回归分析用于构建有联系的变量间的回归模型,用于推理变量之间的因果关系。相关分析的两个或两个以上的变量是随机变量。回归分析中的自变量是确定性的变量。 四、计算题 1. 甲国 乙国 比较相对指标(甲:乙)
发展速度发展速度2000年 2001年 2000年 2001年 2000年 2001年 (%) (%) 钢产量 0 5 60% 62.85% (万吨) 年平均人口数0 0.69
(万人) 人均钢产量0.5 0.55 110 0.7 0.73 104.28
(吨/人) 2.根据资料得:
国 P=n1n?8200?4%?p=P(1-P)n(1-)=0.0135 nN?p?t?p?2?0.所以,这批产品的废品率为(4%±2.7%),即(1.3%,6.7%)。因此,不能认为这批产品的废品率不超过5%。 x?3.解:总平均工资指数=?xx?平均工资水平固定指数=?x101f1/?f1f0/?f0??00/600?85..17% 0f1/?f1f1/?f1?85..29% 工人人数结构指数=?x?x00f1/?f1f0/?f075..78% 总平均工资提高14.17%,是由于各组工人平均工资变动,使其提高13.29%;由于工人人数结构变动,使总平均工资提高0.78% 4.(1)r=-0.8538
(2)b=-3.1209
(3)x=15 时,y=89.74-3..93(吨) 包含总结汇报、旅游景点、IT计算机、资格考试、word文档、出国留学、外语学习以及内蒙古科技大学统计学试卷及参考答案 3等内容。本文共3页
相关内容搜索当前位置: >>
概率论与数理统计 第九章
方差分析与回归分析
概率论与数理 统计主讲教师 陈 争 第8章 方差分析与回归分析§8.1 单因素试验的方差分析 §8.2 回归分析的概念 §8.3 一元线性回归 §8.1 单因素试验的方差分析一、基本概念 由于试验条件的影响,在进行试验时,可能使 试验结果表现出系统误差. 称可控制的试验条件为因 素,因素变换的各个等级为水平. 如果在试验中只有一个因素在变化,其它可控制 的条件不变,称它为单因素试验; 若试验中变化的因素多于一个,则称为多因素以 及多因素试验. 单因素试验中,若只有两个水平,就是第七章的 两个总体的比较问题. 超过两个水平时,也就是需要 多个总体进行比较,这时,方差分析是一种有效的方 法. 设单因素A具有r个水平,对每个水平进行重复 试验,列出试验记录表:试 验 批 号1因素2?j?ni行和行平均A1 A2 ? Ai ? ArX11 X12 ? X1 j ? X1ni X 21 X 22 ? X 2 j ? X 2 niT1? T2? ? Ti ? ? Tr ?X 1? X 2? ? X i? ? X r?水平? ? ? ? ? ? X i1 X i 2 ? X ij ? X i ni ? ? ? ? ? ?X r1 X r 2 ? X rj ? X r ni 其中 X ij 表示第i个等级进行第j次试验的可能结果.记 n ? n1 ? n2 ? ? ? nr .1 X i? ? nini j ?1?Xj ?1niij(i ? 1,2,?, r )(8.1) (8.2) (8.3)Ti? ? ? X ij ? ni X i?1 r ni 1 r X ? ?? X ij ? ? ni X i? n i ?1 j ?1 n i ?1T ? ?? X ij ? n Xi ?1 j ?1rni(8.4) 二、方差分析的假设前提 设单因素A具有r个水平,分别记为 A1 , A2 ,?, Ar , 在每个水平 Ai (i ? 1,2,?, r )下,要考察的指标可以看 成一个总体,故有r个总体,并假设(1) 每个总体均服从正态分布,而且 ?i , ? 2 未知; (2) 每个总体的方差相同; (3) 从每个总体中抽取的样本相互独立. 如果要检验的因素对试验结果没有显著影响, 则试验的全部结果 X ij 应来自同一正态总体 N (? , ? 2 ). 待检假设为 H 0 : ?1 ? ?2 ? ? ? ?r ? ?. H1 : ?1 , ?2 ??r 不全相等. 三、偏差平方和及其分解为了通过分析对比产生样本 X ij 之间差异性的 原因,从而确定因素A的影响是否显著,引人偏差平 2 方和 r ni 总偏差平方和 ST ? ?? X ij ? X ,??i ?1 j ?1ST 能反映全部试验试验数据之间的差异.组间(偏差)平方和 S A ? ? ni X i? ? X ,2 i ?1 r??S A 反映在每个水平下样本均值与样本总均值的差异,它是由因素A取不同水平引起的. 组内(偏差)平方和 S E ? ?? X ij ? X i? ,i ?1 j ?1rni??2S E 表示在水平 Ai 下样本值与该水平下的样本均值之间的差异,它是由随机误差引起的,故称为误差平方 和.平方和分解公式 ST ? S E ? S A 四、检验方法 如果组间差异比组内差异大得多,即说明因素 的各水平间有显著差异,r个总体部能认为是同一正 态总体,应认为假设不成立,此时,比值 ?n ? r ?S A ?r ? 1?S E 有偏大的趋势,为此,选统计量S A /(r ? 1) ?n ? r ?S A F? ? S E /(n ? r ) ?r ? 1?S E?n ? r ?S A 在 H 0 为真时,有 F ? ?r ? 1?S E~ F (r ? 1, n ? r ). 对给定的显著性水平α,查 F? (r ?1, n ? r )的值,由样本观察值计算 SE , S A , 从而得到F的值.F? 满足: P( F ? F? ) ? ?当 F ? F? (r ?1, n ? r ) 时,拒绝 H 0 , 表示因素A 的各水平下的效应有显著差异; 当 F ? F? (r ?1, n ? r ) 时,接受 H 0 , 表示没有理 由认为因素A的各水平下的效应有显著差异. 如果对因素的每一个水平试验次数相同,即r个 n 样本的容量都相同: 1 ? n2 ? ? ? nr ? s, 则称为等重 复试验;否则称为不等重复试验. 计算时,常用的公式:2 r T2 Ti? T 2 2 ST ? ?? X ij ? , S A ? ? ? , S E ? ST ? S A , n n i ?1 j ?1 i ?1 nirniT ? ?? X ij ? n X ,i ?1 j ?1rniTi? ? ? X ij ? ni X i? .j ?1ni单因素方差分析表 方差来源因素A平方和自由度均方和F值SA SE STr ?1误差E总和Tn?rn ?1SA r ?1 SE n?r(n ? r ) S A F? (r ? 1) S E 例1 粮食加工厂试验5种储藏方法,检验它们对 粮食含水率是否有显著影响. 在储藏前这些粮食的含 水率几乎没有差别,储藏后的含水率如下表所示,问 不同的储藏方法对含水率的影响是否有明显差异?含水率(%)试 验 批 号12348 .458 .3因素AA1 7 .3 A2 5 .4 A3 8 .1 A4 7 .9 A58 .3 7 .4 6 .47.6 7.19 .5 10.07 .1 解含水率(%) 试 验 批 号 行和12348 .458 .3Ti?39.9 19.9 14.5 27 .4 7 .12 Ti? / niA1 因 A 2素 A3 A7 .3 5 .4 8 .1 7 .9 7 .1ni8 .3 7 .4 6 .47.6 7.1318.4 132 105 .13 250 .25 50 .41A4 A5r9 .5 10.0rT ? ?? X ij ? 108.8,i ?1 j ?1 2 ij r ni2 Ti? ? n ? 856.19, i ?1 iT 2 (108.8) 2 ?? X ? 863.36, ? ? 845.53, i ?1 j ?1 n 14 T2 2 ST ? ?? X ij ? ? 863.36 ? 845.33 ? 17.83 n i ?1 j ?1 2 r Ti? T 2 SA ? ? ? ? 856.19 ? 845.53 ? 10.66, S E ? ST ? S A , n i ?1 nirni单因素方差分析表 方差来源 因素A 误差E 平方和 自由度 均方和 F值S A ? 10.66 5 ? 1 ? 4S E ? 7.17 14 ? 5 ? 9ST ? 17.83 14 ? 1 ? 13总和T2.665 SA ? 3.35 ? 2.665 F ? 0.796 4 SE F0.05 (4,9) ? 3.63, ? 0.796 ? F ? F? , 9 可认为没有显著差异. §8.2 回归分析的概念一、确定性关系和非确定性关系 1.确定性关系――即函数关系,总可以用形如 y=f(x)之类的函数来描述. 例如:y ? sin x, s ? ?R 2 . 2.非确定性关系――即两个变量之间存在某种相 互依赖的关系,但又不能用形如 y=f(x) 的函数关系来 确切描述,即不能由一个确定的 x 值,找到唯一确定的 y 值,这种关系称为非确定性关系.在非确定性关系中,很多情况是两个变量 x,y 之间, 尽管不存在确定性的函数关系,但是两个变量之间都 存在某种统计规律性所能刻画的相互关系,一般构成 这种统计规律的联系总是因为某种随机因素起作用的 结果. 这一类关系称为相关关系或统计相关. 在存在 相关关系的两个变量之间必然存在某种随机因素的作 用. 例1 人的身高与体重之间的关系. 例2 居民按人口计算的平均收入与某种商品的消 费量之间,有着一定的联系. 例3 森林中的同一种树木,其断面直径与高度之 间是有联系的. 例4 农作物的产量与施肥量、气候、农药也有这 种不确定的关系. 二、回归分析 1.回归关系 如果两个变量中一个是非随机变量,另一个是随 机变量,则这两个变量之间的关系为回归关系. 2.回归分析 由一个或一组非随机变量来估计或预测某一个随 机变量的观察值时,所建立的数学模型及所进行的统 计分析,称为回归分析. 3.回归函数 近似地描述具有相关关系的变量间联系的函数称 为回归函数. 三、回归分析的内容 1 初步判断是否建立回归模型,由相关分析的结 果,选择何种回归模型; 2 根据实际数据资料,估计回归方程未知参数, 计算估计值标准误差,建立回归模型; 3 进行回归模型检验,参数检验; 4 进行回归点预测,对给定的置信程度,构造回 归模型的区间预测. 进行回归控制;5 利用分析结果作出决策. §8.3 一元线性回归方程一、经验公式与最小二乘法 1.经验公式 在一元回归分析里,我们要考察的是: 随机变量 Y 与普通变量 x 之间的关系. x 的变化会引起 Y相应的变化,但它们之间的变 化关系是不确定的. 当 x 取任一可能值时,Y相应地服 从一定的概率分布,则称随机变量 Y 与 x 之间存在着相关关系.先考察两个变量的模型:y=f(x) 由于两个变量之间不存在完全确定的函数关系, 因此必须把随机波动产生的影响引入方程:Y ? f (x) ? ?其中 Y 是随机变量,x 是普通变量, ε是随机项. ε是其它因素对 Y 影响的总和. 对于观察点 ?xi , yi ?, 有yi ? f ( xi ) ? ? i?i ? 1,2,?, n?首先一个问题是如何根据已经试验的结果以及以往 的经验来确定回归函数的类型以及求出函数中的未知参 数的估计,得到经验公式. 例1 以家庭为单位,某种商品年需求量与该商品 价格之间的一组调查数据如下表所示:价格 x i (元) 1 2 232.3 2.52.7 2 .42.6 2.8 32.5 2 1.53.3 3.51.2 1.2需求yi (斤) 5 3.5从表上可以看出,价格不变,需求仍可能变化,价 格改变,需求也可能不变. 但是,总的趋势是家庭对该 商品的年需求量随着价格的上升而减少,它们之间存在着密切的联系. 我们要找出近似地描述它们之间关系的 回归函数,也就是求 y 对 x 的回归方程. 为了确定回归函数 y ? f (x ) 的类型,先把10对数 据作为直角坐标平面上点的坐标,并把这些点画在直 角坐标平面上. 这样得到的图称为散点图.?y5 4 3 2? ? ? ??? ?1? ??4 50123x 从图上可以看出,需求量与价格大致成线性关系. 因而可以决定该种商品的需求量 y对价格 x 的回归函数 类型为直线型. 我们把 y 对 x 的回归函数记为?y ? ? 0 ? ?1 x?关系式 y ? ? 0 ? ?1 x 称为 y 对 x 的回归方程. ? 其中 y 为y 的估计值或回归值. ?1 称为回归系数.即经验公式的形式已经确定. 要完全找出经验公式, 就需确定? 0 , ?1 . 从图上看,要找 ? 0 , ?1 是不难的,在图 上画一条直线 l, 使该直线总的看来最“接近”这10个点. 于是,这条直线在 y 轴上的截距就是 ? 0 , 斜率就是 ?1 . 注意: y ? ? 0 ? ?1 x 与y=f(x)+ε虽然形式不一样, 但本质上是等价的,都是考虑了随机影响的相关关系 ?表达式. 所不同的是 y ? ? 0 ? ?1 x 将y=f(x)+ε式中的???随机影响ε转移到记号 y 中去了. 显然 y 的估计值不 是直接由函数 y=f(x)计算得到,而是从样本信息通过估计分析得到,无疑包含了随机因素的影响. 这一形 式上的转化很重要,由于去掉了 y ? f (x) ? ? 式中 的随机部分,从而使模型大大简化,使定量分析成为 成可能. 对于具体问题,一元回归方程的建立,就转 化为确定系数 ? 0 , ?1 . 一般地,两个变量的线性回归模型为Y ? ?0 ? ?1 x ? ?? ~ N (0,? 2 ),E ?? ? ? 0取一个容量为 n 的样本 ( xi , yi ), 有 误差 ? 1 , ? 2 ,?, ? n 具有相同的分布且相互独立,并且假定:? i 表示第 i 次观察的随机误差.? i ~ N (0,? 2 )E?? i , ? j ? ? 0? ?Yi ? ?0 ? ?1 xi ? ? i(i ? 1,2,?, n, ? 2未 知 )(i ? j, i, j ? 1,2,?, n)利用样本 ( xi , yi )?i ? 1,2,?, n? 讨论如下两个问题: (1) 估计 ? 0 , ?1 ; (2) 检验数学模型的合理性. 2.参数估计 (最小二乘估计法) 设在一次抽样试验中,取得 n 对数据 ( xi , yi ), 这 n 对数据即为一组样本值,根据这一组样本值可以 但由于 Y 是一随机变量,所以通 寻求一对 ?0 , ?1 的值, 过另一组试验值又可以得到另一对 ?0 , ?1 的值. 显然用一组样本值求到的只能是回归系数的估计值,记做? 0 , ?1于是通过题设给出的一组样本值所求的回归方程为:? ???y ? ? 0 ? ?1 x???其中,? 0 , ?1是回归系数 ?0 , ?1 的估计值. 值? 0 , ?1的最常用的方法. 其基本原理与具体做法如下:对于上述给出的 n 对数据 ( xi , yi ) 构成的样本,随?最小二乘法:是求 y ? ? 0 ? ?1 x 式中回归系数估计????机变量Y的每一个试验值 yi 与 y ? ? 0 ? ?1 x 式中对应的 估计值???y i 的差( yi ? yi ), 在散点图中表现为两者纵坐???标之差 (或垂直偏差,或残差).?这个差值可正可负,其绝对值为 | yi ? yi |, 即散点 ( xi , yi ) 到回归直线上点( xi , yi ) 的距离. 记为 ? i (i ? 1,2,?, n)? i ? yi ? yi ( yi ? ? 0 ? ?1 xi )???? 显然这个总偏差不能用 ? i 的代数和 ? 1 ? ? 2 ? ?? n 来 表示,因为偏差有正有负, y 可能互相抵消,从而不? ?这 n 个样本值引起的垂直偏差 ? n 就构成了总偏差,y ? ? 0 ? ?1 x?能代表真正的偏差.为此,我们采用偏差 平方和,即用? 2yi?( xi , yi )| yi ? yi |??yi? ? yi ? yi ? 描述点 ( xi , yi ) ? ? ? 与它沿平行纵轴方向 0 到直线 l 的远近距离.?1?? ?(x , y ) i i?il?2?xi?x 对所有的 xi , 若 yi 与 yi 的偏离越小,则认为直线与所在试验点拟合得越好.?? ? ?? 于是 ? ? yi ? ? ? 0 ? ?1 xi ?? 就定量地描述了所有试 ? ?? i ?1 ?n ? ?2验值 yi 与回归直线 yi 的偏离平方和,这个量是随着不 同的直线而变化的,或者说,是随不同的 ? 0 , ?1 而变化? ??? ? ? ? 的,也就是说它是 ? 0 , ?1 的二元函数,记为 Q? ? 0 , ?1 ?, ? ?于是,要找一条直线,使该直线总的看来最“接 近” 这n个点的问题,就转化为如下问题:?? ? 0 ? ? 0 , ?1 ? ?1 处达到最小.即?要找两个数 ? 0 , ?1 ,???使二元函数 Q( ? 0 , ?1 ) 在? ? ?? Q? ? 0 , ?1 ? ? min Q?? 0 , ?1 ? ? ?由于Q?? 0 , ?1 ? 是n个平方之和, 所以“使 Q?? 0 , ?1 ?最小”的原则称为平方和最小原则,习惯上称为最小 二乘法.? ?? 0 , ?1 为 ? 0 , ?1 的最小二乘估计. ? 0 , ?1 的求法可以利用微积分中的极值求法.由极值存在的必要条件可知,? 0 , ?1 必须满足方程组:n ?Q ? ?2? ? yi ? ? 0 ? ?1 x? ? 0 ?? 0 i ?1(1)n ?Q ? ?2? ? yi ? ? 0 ? ?1 xi ?xi ? 0 ??1 i ?1(2) 由 (1) 得n n??y ? ?i ?1 in0? ?1 xi ? ? 0n n即? y ? ? ? ? ? ? x ? ? y ? n? ? ? ? xi ?1 i i ?1 0 i ?1 1 ii ?1 i 0 i ?1n1 i?0有 由 (2) 得 有n? 0 ? ?1 ? xi ? ? yinn(3)? ?x y ? ? x ? ? x ? ? 0n i ?1 i i 0 i 2 1 ii ?1i ?1? 0 ? xi ? ?1 ? xi2 ? ? xi yii ?1 i ?1 i ?1nnn(4) 方程组 (3) ,(4) 称为正规方程组,由 (3) 得??0 ??yi ?1nin??1 ? xii ?1?nn?? y ? ?1 x?(5)将 (5) 代入 (4) 得? ? 2 ? y ? ?1 x ?? xi ? ?1 ? xi ? ? xi yi ? ? i ?1 i ?1 i ?1? n n n 可得?1 ????x yi ?1 ini? n? x? y ? n? x2?xi ?1n(6)2 i由 (5)得? 0 ? y ? ?1 xy ? ? 0 ? ?1 x? ? ??于是所求的回归直线方程为 (即 x, y 之间的经验公式) 记Lxx ? ? xi ? x ? ? x ? n ? xi ?1i ?1 2 inn???2n2Lxy ? ? xi ? x yi ? y ? ? xi yi ? n ? x ? yi ?1i ?1????nLyy ? ? yi ? y ? ? y ? n ? yi ?1i ?1 2 in?2n2则?1 ??Lxy Lxx,? 0 ? y ? ?1 x.?? 现在,可根据 ?0 , ?1 的经验公式,求得例1中 x对y的回归方程. 为了清楚起见,列出回归计算表:价格 x 需求i1 5 5 12 3.5 7 42 3 6 42.3 2.7 6.212.5 2.4 62.6 2.5 6.5 6.76 6.25102.8 2 5.6 7.84 43 1.5 4.5 9 2.253.3 1.2 3.963.5 1.2 4.2yixi yix2 i2 i5.29 6.25 7.29 5.7610.89 12.25 1.44 1.44y25 12.25 9?xi ?110i? 25,?yi ?110i? 25,?x yi ?1 ii? 54.97, ?xi ?1102 i? 67.28,yi2 ? 74.68. ?i ?110?1 ????x yi ?1 n ini? nx y ? nx2?xi ?12 i54 .97 ? 10 ? 2.5 ? 2.5 ? ? ?1.58 2 67 .28 ? 10 ? 2.5?0 ? y ? ?1 x?? 2.5 ? (?1.58) ? 2.5 ? 6.45?所求的回归方程为: y? 6.45 ? 1.58x 二、线性相关显著性检验 经验公式仅仅是在一组经验数据下用最小二乘估 计得到,事先并不能知道 x 与 y 两个相关变量之间是 否具有线性相关关系. 因此,求到了经验公式后,还 有待于进一步检验两个变量之间的线性关系是否成立, 时否显著?经验公式是否有效?这就必须进行有关的 检验判断. 线性回归分析中,线性相关性的显著性检验通常采 用的方法有 F 检验法与 R 检验法. 要检验 y ? ? 0 ? ?1 x 式的线性相关关系是否成立, 只要检验回归系数 ?1 ? 0 是否成立. 这有两种可能: (1) 若 ?1 ? 0, 导致 y ? ? 0 , 表示 y 与 x之间不存在线 性关系; (2) 若 ?1 ? 0, 表示 y 与 x 之间线性关系成立. 因此,为了检验回归方程线性关系的显著性,可 以提出待检假设 H 0:?1 ? 0. 然后,使用前章假设检验 的方法检验判别 H 0 是否相容.?????? 1. F 检验法 为寻找检验 H 0 的方法,将 x 对 y 的线性影响与随机波动引起的变差分开,为此,先导出一个具有统计意义的分解公式.(1) 平方和分解公式 对于任意 n 组数据 ( x1, y1 ), ( x2 , y2 )?( xn . yn ), 恒有??n i ?1?? ? ? ?? yi ? y ? ? ?? yi ? yi ? ? ? yi ? y ?? ? ? ?? i ?1 ??2?n??2 2 ? 2 ? ? ? ?? ? ? ?? ? ? ? ? ? ? ?? yi ? yi ? ? 2? yi ? yi ?? yi ? y ? ? ? yi ? y ? ? ? ? ?? ? ? ? ? i ?1 ?? ? ? n由?yi ? ? 0 ? ?1 xi ,? ????? 0 ? y ? ?1 x??有? ? ? ? ? yi ? y ? ? 0 ? ?1 xi ? ? ? 0 ? ?1 x ? ? ?1 xi ? x ? ?? ???? ? ?? ?y ? y ?? ? ?x ? x ? yi ? yi ? yi ? y ? ? yi ? y ? i 1 i ? ? ? ?? ? ? ? yi ? yi ?? yi ? y ? ?? ? i ?1 ?n ? ?? ? ? ? ? ? ? yi ? y ? ?1 xi ? x ? ?1 xi ? x ? i ?1 ? n?? ?? ?? n?2? ? ? ?1 ?? xi ? x yi ? y ? ?1 ? xi ? x ? i ?1 ? i ?1 ? ? n??????Lxy ? ? ? ?1 ? Lxy ? ? Lxx ? ? 0 ? ? Lxx ? ?? ?记??n i ?1? ? ? ? yi ? y ? ? ? yi ? yi ? ? ? ? yi ? y ? ? i ?1 ? ? i ?1 ?n ? n ??222S 总 ? ? yi ? y ,i ?1nn??2总偏差平方和;? ? S剩 ? ? ? yi ? yi ? , ? i ?1 ??2剩余平方和;? ? S回 ? ? ? yi ? y ? , ? i ?1 ?n ?2回归平方和. ① 总偏差平方和 S 总S回 是 y1 , y 2 ,?, y n这n个数据对于其平均值 y的偏差平方和,它的大小描述了这n个数据的分散程度. ② 回归平方和 S回? ? ? ? ? S回 ? ? ? yi ? y ? 是 y1 , y 2 , ?, y n这n个数据对于其 ? i ?1 ?n ? 2平均值y 的偏差平方和,它反映了 y1 , y 2 ,?, y n这 n个x1 , x2 ,? xn的变化引起的,并且通???数据的分散程度. 而这一分散性是由于在回归直线上它 们所对应的横坐标 x对y的线性影响表现出来,故称为回归平方和. ? ? S回 ? ? ? yi ? y ? ? ? ?? 0 ? ?1 xi ? ? 0 ? ?1 x? ? ? i ?1 ? i ?1 ? ? ?n ?2n^^^^2? ? ? xi ? x ? ? Lxx ? ?1 Lxy2 i ?1n? 2 1??? 2 1?注: Lxx ? ? xi ? x 是i ?1n??2x1 , x2 ,? xn 这n个数据对于其平均值x 的离差平方和,它反映了 x1 , x2 ,? xn这 n 个数据的分散程度. 说明(1) y1 , y 2 ,?, y n 的平均数也是 y, 这是因为n ^ n ^ ^???1 ^ 1 n ^ 1 1 ? ?? n ? ? ? yi ? n ? ? ?0 ? ?1 xi ? n 0 n ? ?1 xi n i ?1 ? i ?1 i ?1 ?? ? 0 ? ?1 x ? y(2) y i ? ? 0 ? ?1 xi 的几何意义是回归直线 y ? ? 0 ? ?1 x 上,^ ^ ^^^y?^yiyiy ? ? 0 ? ?1 x^ ^ ^? ?xi , yi ?? ?? ? xi , yi ? ? ??其横坐标为 x i 的点的纵坐标.0xix ③ 剩余平方和 S 剩? ? ? ? S剩 ? ? ? yi ? yi ? ? ? ? yi ? ? 0 ? ?1 xi ? ? i ?1 ? ? i ?1 ?n ?n ^ ^22这在讲最小二乘法时讲过,它就是 Q(?0 , ?1 ) 的最小值,记作 S剩 , 它是对应于变量 x 的每一个取值 xi , 变量 y 的实际观察值yi 与回归函数值 y 的偏差平方和,?是由总误差中分离出 x 对 y 的线性影响之外的其余因素 而产生的误差. 在y=f(x)+ε的假定下,S剩 完全是随机项 ε引起的,称为残差平方和或剩余平方和. (2) 线性相关关系 x, y间是否存在线性相关关系的问题,一个很自然的想法是把回归平方和 (线性影响) 跟剩余平方和(其它影响) 进行比较.S回 来体现 x与 y 在数理统计中,选取量 F ? S剩 / n ? 2的线性相关关系的相对大小. 如果F的值相当大,则表明 x 对 y 的线性影响较大, 就可认为 y 与 x 有线性关系,反之,若 F 的值较小,就 没有理由认为 y 与 x 之间有线性相关关系.? (3) F检验法的步骤: 1 建立待检假设 H0 : ?1 ? 0 H1:?1 ? 0 2 选取统计量, 当 H 0 成立时,3 给定 ? , 查表确定临界值 F? ?1, n ? 2? 4 计算 F 的值,即计算 S回,S剩 的值;S回 F? ~ F (1, n ? 2) S剩 / n ? 2S回 ? ? Lxx ? ?1 Lxy,S剩 ? S总 ? S回,5 下结论,若 F ? F , 否定 H , 即认为x, y间 ? 0具有线性相关关系; 若 F ? F? , 接受 H 0 .? 2 1? 说明 为了检验相关性,也可选用样本相关系数R?LXY LXX LYY为统计量,并把R的临界值列成相关系数表. 这两种 检验方法是一致的,这是因为S回 S回 S回 F? ? ?n ? 2? ? (n ? 2) S剩 / n ? 2 S剩 Lyy ? S回L2 xy / Lxx (n ? 2) R 2 ? ( n ? 2) ? 2 ? Lxy ? 1? R2 ? Lyy ?1 ? ? L L ? xx yy ? ? 2. R检验法 引入统计量 R ?Lxy Lxx L yy, 可以证明R?nLxy Lxx Lyy?~ r ?n ? 2?? ?2由公式 S剩 ? ? ? yi ? yi ? 通过推倒可得到:? i ?1 ?S剩 ? Lyy 1 ? R2??由于S剩 ? 0, Lyy ? 0, 得到1 ? R 2 ? 0 即 ? 1 ? R ? 1 或|R|≤1. 由 S剩 ? Lyy 1 ? R?2? 可见,若| R | 越大,R2越接近于1,则 S剩 就越小,y 与 x 的线性关系越显著;反之,若 |R|越小或 R 2 越接近0,则 S剩 就越大, y 与 x 的线性关系越不显著. 特别地, 当|R|=0时, S剩 达到最大,这时,y与 x 不是 线性相关的; 当 | R |? 0 时,y 与 x 是线性相关的; 当|R|=1时,S剩 ? 0, 这时散点图上的散点全部 落在直线 y ? ? 0 ? ?1 x上,称 y与x完全线性相关.? ? ? R检验法的步骤如下: 1 建立待检假设 H 0:?1 ? 0.2 选取统计量 r ?Lxy Lxx L yy~ r (n ? 2).3 给定检验水平 ? ,查表确定临界值 r? ?n ? 2?.4 对于给定的样本值 ?xi , yi ? 计算| r |. 5 下结论:当 | r |? r? 时,拒绝 H 0 , 认为变量之间线性关系 显著;当 | r |? r? 时 ,接受 H 0 , 认为变量之间线性关系 不显著. 例2 对例1进行相关性检验. (F检验法)解 (1) 假设 H 0:?1 ? 0,H1:?1 ? 0. S回 ~ F (1, 8) (2) H0 成立时, F ? S剩 / 10 ? 2 (3) ? ? 0.05, F0.05 (1,8) ? 5.32, 拒绝域 F ? F0.05 (1,8). S回 8 ?11.86 (4) 计算 F ? ? ? 296 .5 S剩 / n ? 2 0.32(5) 由于F=296.5 && 5.32,所以否定 H 0 ,认为?1 ? 0,即变量x对y有极其显著的线性影响,也就是可以认为x与y之间存在线性关系. 由前面计算得: x ? 2.5,y ? 2.5,?xi ?1102 i? 67.28,2 i 2?yi ?1102 i? 74.68.?x yi ?1 i10i? 54.97,Lxx ? ? x ? n x ? 67.28 ?10? 2.52 ? 4.78i ?110Lyy ? ? y ? n y ? 74.68 ? 10? 2.52 ? 12.18i ?1 2 i 210Lxy ? ? xi yi ? n x y ? 54.97 ? 10 ? 2.5 ? 2.5 ? ?7.53i ?110 ? 7.53 ?1 ? ? ? ?1.58 Lxx 4.78?Lxy?S回 ? ?1 Lxy ? ?1.58? ?? 7.53? ? 11.86S剩 ? Lyy ? S回 ? 12.18 ? 11.86 ? 0.32 R 检验法: (1) 假设 H 0:?1 ? 0,(2) H0 成立时, ? RH1:?1 ? 0. Lxy ~ R ?8? Lxx L yy(3) ? ? 0.05 r0.05 (8) ? 0.6319 拒绝域 | r |? r? (8). , ,(4) 计算 | r |?Lxy Lxx Lyy?? 7.53 ? 0.?12.18(5) ?| r |? r? , 所以否定 H 0 , 即认为 x 与 y 之间存在线性关系. 三、一元线性回归方程的预测与控制经检验后确认有效的回归方程,明显地表现出两个 方面的作用: 取定一组x i 值,即可估计出一个 y,?因此由一般变量 x 来预测随机变量 Y 的取值或取值的置信区间 ,这就是回归预测要解决的问题; 由随机变量 Y的取值或事先要求的 Y 的可能取 值范围,反过来控制 x 的变动范围,这就是回归控制 所需解决的问题. 1. 回归预测(1) 点预测 设一元线性回方程的随机设定形式为? ~ N ?0,? ?. 当 x ? x0 时,因变量 y 为 y0 ? ?0 ? ?1 x0 ? ? , 由于随机因素的影响,还是无法确定 y0 , 可用样本回 ? ? ? 回归方程在 x ? x0 的拟合值 y0 ? ?1 ? ?1 x0 作为因变量y ? ?0 ? ?1x ? ? ,2y 在点 x ? x0 处的估计值. 因此,估计值 y 就作为因 即x?变量 y 在点 x ? x0 的预测值.? x0 时,y ? ?2.区间预测(略). 2. 回归控制 由对 y 所要求的取值范围,反过来控制 x 相应的 变动范围. 例3 市场上某种商品需求量与价格如下:价格(元/斤)x:2.5 需求量(吨)y:20.3 3.5 19.6 4.4 18.2 5.4 17.6 6.5 16.3 7.4 15.9 8.3 14.1求:(1) y与 x 之间是否存在一元线性关系; ?? ? 0.05? (2) 求出 y 与 x 之间的一元线性回归方程; (3) 当价格上升到11.4(元/斤),需求量估计是多少; (4) 当需求总量是12.7(吨)时,价格大约是多少? 解由题意得 n ? 7, x ? 5.43, y ? 17.43Lxy ? ? xi yi ? n x y? 635 .11 ? 7 ? 5.43 ?17.43 ? ?27.4043Lxx ? ? x ? n x2 i2? 232.92 ? 7 ? 5.43 ? 26.52572Lyy ? ? y ? n y2 i2? 215456 ? 7 ?17.43 ? 27.9257 .2 1. 相关性检验 (1) 假设 H 0: ?1 ? 0, H1:?1 ? 0.(2) H0 成立时, R ?LXY LXX LYY~ R?5?(3) ? ? 0.05, r0.05 (5) ? 0.7545 拒绝域 | r |? r? (5). ,(4) 计算| r |?LxyLxx L yy (5) ? | r |? r? , ∴拒绝 H ,即需求量 y 与价格 x 0?? 27..7之间存在一元线性关系. 2. 求一元线性回归方程 y ? ? 0 ? ?1 x ???? ?1 ???Lxy Lxx?? 27 .4023 ? ? ?1.02, 26 .5257? 0 ? y ? ?1 x ? 22.97∴ 一元线性回归方程为? y ? 22.97 ? 1.02x? 3. y ? ?0 ? ?1 x0 ? 22.97 ? 1.02 ?11.4 ? 11.344. x ? y0 ? ? 0 12.7 ? 22.97?1?? 1.02? 10.07 练习某校为了研究学生数学成绩 x 与物理成绩 y 之间的关系,随机抽取了10名学生的成绩 ?xi , yi ??i ? 1,2,?,10?,且计算出:? xi ? 758,i ?110?yi ?110i? 774,?x yi ?1 i10i? 59686 ,?xi ?1102 i? 58732 ,试求当 x=90 时,y 的线性回归估计值.1 ? ? 解 L ? ? x ? 10 x ? ? x ? 10 ? ? xi ? xx i ?1 ? i ?1 ? i ?110 2 i 210 10 2 i??2 1 ? 58732 ? ? 758 2 ? Lxy ? ? xi yi ? 10? x ? yi ?1 10 10 1 10 ? ? xi yi ? ? ? xi ? ? yi 10 i ?1 i ?1 i ?1101 ? 59686 ? ?158 ? 774 ?
Lxy 1016 .8 ? ? 0.797 ?1 ? Lxx 1275 .6?0??1 1 ? y ? ?1 x ? ? 774 ? ? 758 ? 774 ? 16.99 10 10?所以回归方程为?y ? 16.99 ? 0.797x?x=90时, y? 16.99 ? 0.797? 90 ? 88.72
赞助商链接
概率论与数理统计习题及答案---第9章习题详解 隐藏&& 习题九 1? 灯泡厂用 ...3.27. 表 9-4-1 得方差分析表 方差来源 饮料作用 品种作用 试验误差 总和...32 概率论与数理统计练习题专业 班 姓名 学号 第九章 方差分析与回归分析 1.粮食加工厂试验 5 种贮藏方法,检验它们对粮食含水率是否有显著影响,在贮藏前这些...32 概率论与数理统计练习题专业 班 姓名 学号 第九章 方差分析与回归分析 1.粮食加工厂试验 5 种贮藏方法,检验它们对粮食含水率是否有显著影响,在贮藏前这些...概率论、样本描述、参数估... 25页 免费 概率与统计课件方差与回归... 暂无...第九章 方差分析 ? (1) (2) (3) (4) 本章要点方差分析的概念; 单因素...《概率论与数理统计》习题答案(复旦大学出版社)第九章_工学_高等教育_教育专区...表 9-2-1 方差分析表 方差来源 因素影响 误差 总和 平方和 S 335.35 ...概率论与数理统计作业集 46 第九章 方差分析与回归分析 1 三个工厂生产同一型号的电池,进行质量评比时,从各工厂的产品中分别抽取 5 个 电池,测得电池的耐用时...第10 章 方差分析在生产实践和科学研究中,经常要分析各种因素对试验指标是否有...概率论与数理统计_回归分... 概率论与数理统计_正交试...1/2 相关文档推荐...《概率论与数理统计》 盛骤 谢式千 潘承毅编,高等教育出版社 重点内容: 第二章...检验法、偏度峰度检验法、秩和检验法 第九章 方差分析与回归分析 1.单因素试验...魏宗舒 概率论和数理统计魏宗舒 概率论和数理统计隐藏&& 第八章 方差分析和回归分析 8.1 考察温度对某一化工产品得率的影响, 选了五种不同的温度, 在同一温度...概率论与数理统计前三章_军事/政治_人文社科_专业资料。概率论与数理统计知识点...因素方差分析举例 第九章 回归分析 9.1 问题的提出 2 9.2 一元正态线性回归 ...
All rights reserved Powered by
www.tceic.com
copyright &copyright 。文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 在农村卖什么需求量大 的文章

 

随机推荐