【 】1、若住宅房地产“评估的房地产价值X”与“销售价格Y”之间建立的直线回归方程为yt1.983.1x,则二者的相关系数可能是 ..
A、-1.98 B、+3.1 C、+0.9237 D、-0.63 【 】2、单因素方差分析中,误差项离差平方和SSE实质上反映了 A、多种因素的综合作用带来的影响 B、系统因素带来的影响 C、随机因素带来的影响 D、随机因素和系统因素带来的影响
【 】3、单项式变量数列中,如果各标志值都扩大1倍,而频数都减少为原来的四分之一,则平均数 A、不变 B、扩大1倍 C、减少1/4 D、无法判断大小
【 】4、如果用P表示商品的价格,用q表示商品销售量,则p1q1p0q1综合反映
A、商品价格和商品销售量变动引起销售额变动的绝对值 B、商品销售额变动的相对数 C 、多种商品价格变动使商品销售额变动的绝对值 D、多种商品销售量变动使商品销售额变动的绝对值 【 】5、某研究人员发现,举重运动员的体重与他能举起的重量之间的相关系数为0.6,则 A、举重能力的60%归因于其体重
B、平均来说,运动员能举起其体重60%的重量
C、如果运动员体重增加10公斤,则可多举6公斤的重量 D、运动员体重和能举起的重量之间有正相关关系
【 】6、某企业最近几批产品的优质品率P分别为80%、85%、90%,为了对下一批产品的优质品率进行抽样检验,确定必要的抽样数目时,P应选
A、90% B、85% C、80% D、82%
【 】7、原始资料平均法计算季节指数时,计算各年同期(月或季)的平均数,其目的是消除各年同一季度(或月份)数据上的
A、季节变动 B、循环变动 C、长期趋势 D、不规则变动
【 】8、为了分析我校不同专业学生的某次统计学测验成绩是否有显著差异,可运用方差分析法。在1%的显著性水平下, 在12个专业计随机抽取60个学生进行调查,拒绝原假设的区域是 A、 F0.01(11,59),) B、F0.005(11,59),) C、F0.01(11,48),) D、F0.005(11,48),)
【 】9、一项对一所大学学生上课出勤情况及成绩的研究指出,一般来说,出勤率较高的学生,成绩也较好。若上课出勤率说明了成绩变异的36%,则
A、上课出勤率与成绩之间的相关系数是0.36 B、上课出勤率与成绩之间的可决系数是0.36 C、根据上课出勤率与成绩建立的回归方程中回归系数(斜率)是0.36 D、根据上课出勤率与成绩建立的回归方程中的常数项是0.36
【 】10、若一组数据的均值为28,众数为31,中位数为29,则大体上可断定数据的分布形态为 A、正态分布 B、左偏分布 C、右偏分布 D、尖峰分布
二、多项选择题
【 】1、可决系数r2=86.49%时,意味着
A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有86.49%可通过回归直线来解释 C、因变量的总变差中,有13.51%可由回归直线来解释 D、相关系数绝对值一定是0.93 E、相关系数绝对值一定是0.
【 】2、下列那些属于测度数据离散程度的指标
A、极差 B、内距 C、方差 D、标准差 E、离散系数 【 】3、假设检验中,关于两类错误与显著性水平,下列说法正确的有
A、第Ⅰ类错误称为弃真错误,犯第Ⅰ类错误的概率记为
B、第Ⅱ类错误称为取伪错误,犯第Ⅱ类错误的概率记为 C、当增大时,减小;当增大时,减小 D、要使和同时减小的唯一办法是增加样本容量
E、犯第Ⅰ类错误的概率被称为显著性水平
【 】4、在参数估计中,统计学家给出了评价估计量的一些标准,主要有以下几个:
A、相合性 B、有效性 C、均衡性 D、时效性 E、无偏性 【 】5、下列那些属于拉氏指数公式 A、Lqpqpq0010 B、Lppqpq00100 C、Pppqpq1101
D、Pqpqpq11 E、Hq10pqqqpq111
11三、填空题
1、单因素方差分析问题中,F=12.24,P-value=0.0056,表示拒绝原假设的概率为 。 2、如果物价指数上涨了18%,则现在1元钱只值原来的 元。 3、可决系数r2的取值范围为 。
4、均值的缺点主要是易受数据极端值的影响,对于偏态分布的数据,均值的代表性较 。
5、1、则1是比2更有效的一个估计量。在无偏估计的2都是总体参数的无偏估计量,若D(1)D(2),条件下,估计量方差越 估计也就越有效。
6、线性趋势的特点是其逐期变化量或趋势线的 基本保持不变。 7、偏态系数SK的值小于零时,可判断数据分布为 偏。 8、简单相关系数r 的取值范围为 。
9、显著性水平=0.05,表示拒绝原假设的概率为 %。 10、总指数的计算形式有综合指数和 指数两种。 四、判断题
【 】1、四水平的单因素方差分析,每个水平下的样本容量是5,则SSE的自由度必定为20。 【 】2、数据无需排序,位置在最中间的数值称为中位数。
【 】3、当峰度系数K的值大于0时,可判定该组数据为平峰分布 。 【 】4、x分布的形式与原有总体的分布和样本容量n的大小有关。
【 】5、无论单侧检验还是双侧检验,用P值进行决策的准则都是:如果P值,拒绝H0 ;P值,不拒绝H0 。
【 】6、当总体服从正态分布且2已知时,或者总体不是正态分布但为大样本时,样本均值x的分布均为t 分布。
【 】7、方差分析中,如果根据样本计算的统计量F=12.25,而临界值F=3.054,那么因素的作用不显著。
【 】8、假设检验具有100%的准确率。
【 】9、某企业产值2004—2006年3年的环比发展速度分别为102%、110%、115%,则2006年产值比2003年增长了29.03%。
【 】10、已知基期总值指标及个体指数时,可使用加权算术平均指数编制总指数。 五、简答题
1、一组数据的分布特征可以从哪几个方面进行测度?
2、某商店采用三种不同的方式推销商品。从三个总体中随机抽取容量相同的样本,得到12个销售量数据。方差分析表如下: 差异源 SS df MS F P-value F crit 组间 618.92 309.46 0. 4. 组内 66.44 总计 1216.92 11 完成上面的方差分析表,若显著性水平为0.05,检验三种不同推销方式对销售量的影响是否显著? 六、计算分析题
1、某车间两种产品的生产情况如下: 产品 计量 单位成本(元/件、台) 产量 名称 单位 基期 报告期 基期 报告期 甲 万吨 6 8 4 6 乙 万套 8 12 3 5 要求:建立适当的指数体系(V=Lq·Pp),从相对数和绝对数两方面对总成本的变动进行因素分析。
(10分)
2、甲、乙两单位各抽取了若干工人进行生产情况调查,测得有关资料如下: 日产量(件/人) 甲单位工人数(人) 乙单位工人数(人) 2 4 6 4 6 8 5 8 4 试通过计算分析:(1)哪个单位工人的平均日产量水平高?(2)哪个单位工人的日产量水平均衡?(10分) 3、一种汽车配件的平均长度要求为10cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验,结果平均长度x9.cm ,样本标准差S=0.43 。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?(Z1.96,t(n1)t0.025(9)2.262)(10分)
224、研究某市1990-2001年地方预算内财政收入(Y)与国内生产总值(X)的关系。通过Excel计算得到下面的有关结果(0.05):(10分) 回归统计 Multiple R R Square Adjusted R Square 0. 0. 0. 方差分析表 变差来源 df SS MS F 回归 1 68712. 68712.88884 1211. 残差 10 567.3831 56. 总计 11 69280.27 参数估计表 Coefficients 标准误差 t Stat P-value Intercept -3. 4.16179 -0. 0. X Variable 1 0. 0. 34.80013 9.0975E-12 要求(1)计算地方预算内财政收入与国内生产总值的简单相关系数; (3)对回归直线的(2)建立地方预算内财政收入对国内生产总值的直线回归方程,并对回归系数作出解释;拟合优度作出评价;
(4)对回归系数作t检验;
(t0.025(122)2.2281)(5)对回归系数作P值检验并与(4)作比较。
第一章 绪 论
一、 单项选择题
1、在整个统计工作过程中处于基础地位的是( )
A、统计学 B、统计数据搜集 C、统计分析 D、统计数据的整理 2、统计学的核心内容是( )
A、统计数据的搜集 B、统计数据的整理 C、统计数据的发布 D、统计数据的分析
3、某班三名学生期末统计学考试成绩分别为78分、84分和95分,这三个数字是( ) A、指标 B、标志 C、变量 D、变量值
4、某管理局有20个下属企业,若要调查这20个企业全部职工的工资收入情况,则统计总体为( ) A、20个企业 B、20个企业的每个职工 C、20个企业的全部职工 D、20个企业每个职工的工资 5、现代统计学的主要内容是( )
A、描述统计 B、理论统计 C、应用统计 D、推断统计 6、( )是整个统计学的基础。
A、理论统计 B、描述统计 C、推断统计 D、应用统计 二、多项选择题
1、统计学( )
A、主要特征是研究数据 B、研究具体的实际现象的数量规律 C、研究方法为演绎与归纳相结合 D、研究抽象的数量规律 E、研究有具体实物或计量单位的数据 2、数学( )
A、为统计理论和统计方法的发展提供数学基础 B、研究具体的数量规律 C、研究抽象的数量规律 D、研究方法为纯粹的演绎 E、研究没有量纲或单位的抽象的数 三、填空题
1、_________和_________是统计方法的两个组成部分。
2、统计过程的起点是_________,终点是探索出客观现象内在的______________。
3、统计数据的分析是通过___________和___________的方法探索数据内在规律的过程。
四、联系实际举例说明,为什么统计方法能够通过对数据的分析找出其内在的规律性?(要求举三个例子且不与教科书上的例子雷同)
第一章 参 一、单项选择题
1、 B 2、D 3、D 4、C 5、D 6、B
二、多项选择题
1、ABCE 2、ACDE 三.填空题
1、描述统计、推断统计 2、数据搜集、数量规律性 3、统计描述、统计推断
第二章 统计数据的搜集与整理
一、单项选择题
1、某种产品单位成本计划比基期下降3%,实际比基期下降了3.5%,则单位成本计划完成相对数为( D )
A、116.7% B、100.5% C、85.7% D、99.5% 2、计算结构相对数时,总体各部分数值与总体数值对比求得的比重之和( C ) A、小于100% B、大于100% C、等于100 %: D、小于或大于100% 3、将全班学生划分为“男生”和“女生”,这里采用的数据计量尺度位( C ) A、定比尺度 B、定距尺度 C、定类尺度 D、定序尺度 4、将全班学生期末统计学考试成绩划分为优、良、中、及格、不及格,这里采用的数据计量尺度为( C ) A、定类尺度 B、定距尺度 C、定序尺度 D、定比尺度
5、昆明市的温度为260C与景洪市的温度310C相差50C,这里采用的数据计量尺度位( A ) A、定距尺度 B、定类尺度 C、定比尺度 D、定序尺度
6、张三的月收入为1500元,李四的月收入为3000元,可以得出李四的月收入是张三的两倍,这里采用的数据计量尺度位( B )
A、定序尺度 B、定比尺度 C、定距尺度 D、定类尺度 7、一次性调查是指( C )
A、只作过一次的调查 B、调查一次,以后不再调查 C、间隔一定时间进行一次调查 D、只隔一年就进行一次的调查 8、在统计调查中,调查单位和填报单位之间( D )
A、无区别 B、是毫无关系的两个概念 C、不可能是一致的 D、有时一致,有时不一致 9、下列中,属于品质标志的是( B )
A、工人年龄 B、工人性别 C、工人体重 D、工人工资 10、商业企业的职工人数、商品销售额是( C )
A、连续变量 B、前者是连续变量,后者是离散变量 C、前者是离散变量,后者是连续变量 D、离散变量
11、对昆明市所有百货商店的工作人员进行普查,调查对象是( B )
A、昆明市所有百货商店 B、昆明市所有百货商店的全体工作人员 C、昆明市的一个百货商店 D、昆明市所有百货商店的每一位工作人员 12、在全国人口普查中,调查单位是( B )
A、全国人口 B、每一个人 C、每个人的性别 D、每个人的年龄 13、对某城市工业企业的设备进行普查,填报单位为( C )
A、全部设备 B、每台设备 C、每个工业企业 D、全部工业企业
14、某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( D )
A.普查 B、典型调查 C、抽样调查 D、重点调查 15、人口普查规定统一的标准时间是为了( A )
A、避免登记的重复和遗漏 B、确定调查的范围 C、确定调查的单位 D、登记的方便 16、( C )是对事物最基本的测度。
A、定序尺度 B、定比尺度 C、定类尺度 D、定距尺度 17、下列中,最粗略、计量层次最低的计量尺度是( A )
A、定类尺度 B、定序尺度 C、定比尺度 D、定距尺度 18、下列中,计量结果只能进行加减运算的计量尺度是( A )
A、定距尺度 B、定比尺度 C、定类尺度 D、定序尺度 二、多项选择题
1、某企业职工工资情况如下: 按月工资分组(元) 职工人数(人) 660——680 150 680——700 250 700——820 200 合 计 600 表中( C E ) A、变量是150、250、200 B、变量是660、680、700、820 C、工资是变量 D、变量有3个 E、组中值有3个 2、下列各项中,属于统计指标的是( A C E )
A、某地区2004年GDP1000亿元 B、某工人月工资850元 C、某地区2004年货物运输量2000万吨 D、某地区明年小麦预计产量21万吨 E、某地区去年人口自然增长率7‰ 3、抽样调查与重点调查的主要区别是( B C D )
A、抽选调查单位的多少不同 B、抽选调查单位的方式方法不同 C、取得资料的方法不同 D、在对调查资料的使用时所发挥的作用不同 E、原始资料的来源不同 4、某地区进行工业企业的现状调查,则每一个工业企业是( C E )
A、调查对象 B、统计总体 C、调查单位 D、调查项目 E、填报单位 5、搜集统计数据的具体方法主要有( A B C D E )
A、访问调查 B、邮寄调查 C、电话调查 D、座谈会 E、个别深度访问
6、某地区对集市贸易个体户的偷税漏税情况进行调查,1月5日抽选5%样本,5月1日抽选10%样本检查,这种调查是( A B D )
A、非全面调查 B、一次性调查 C、定期调查 D、不定期调查 D、经常性调查
7、为了研究全国乡镇工业企业的发展情况,国家决定对全国乡镇工业企业进行普查,则每一个乡镇工业企业是( B C E )
A、调查总体 B、调查单位 C、报告单位 D、调查对象 E、既是调查单位又是报告单位 8、在某一组距数列中( A B C E )
A、组数的确定应以能够显示数据的分布特征和规律为目的 B、组距大小与组数的多少成正比 C、组距大小与组数的多少成反比 D、组距宜取5或10的倍数 E、第一组的下限应低于最小变量值;最后一组的上限应高于最大变量值 三、 填空题
1、数量型统计数据通常有两种基本的形式,即__________和___________。
2、统计的原始数据都有一定的计量单位。绝对数的计量单位有__________、___________和_____________三种。
3、数字变量根据其取值的不同,可以分为___________和_____________。
4、离散变量只能取_________个值,而且其取值都以________断开,可以一一列举。 5、连续变量可以取________个值,其取值是___________的,不能一一列举。
6、从使用者的角度看,统计数据主要来源于两种渠道:一是来源于________________,二是来源于___________________。
7、根据对比的数量不同,相对数可分为_________和__________两种基本形式。
8、访问调查又称__________,它是调查者与被调查者之间通过________________而得到所需资料的调查方法。
9、在市场调查中,基本上都是采用_______调查方式,调查对象是确定_______框的基本依据。
10、调查表是用来登记调查数据的一种表格,一般由________、________和______________三部分组成。 11、调查时间包括_________________和___________________。
12、数据整理通常包括数据的________、____________、_______等几个方面的内容,它是__________之前的必要步骤。
13、数据的预处理是______________的先前步骤,内容包括数据的______与______、______等。 14、对于通过直接调查取得的原始数据应主要从_________和________两个方面去审核。 15、审核数据准确性的方法主要有____________和_____________。
16、对于其它渠道取得的第二手数据,除了对其_________和________进行审核外,还应着重审核数据的__________和___________。
17、按数量标志分组的方法主要有___________和_____________。 18、频数密度=_____________÷_________________。 19、闭口组组中值=(______+_______)÷2
20、直方图是用__________和__________来表示频数分布的图形 四、判断题
1、调查单位可以是调查对象的全部单位,也可以是调查对象的部分单位。( √ ) 2、人口普查的调查单位是每一个人。( √ )
3、调查项目是调查的具体内容,它可以是调查单位的数量特征,也可以是调查单位的某种属性或品质特征。( √ )
4、消费者购买某种产品的动机的调查,常用“座谈会”调查方法。( x ) 5、搜集与研究课题有密切关系的少数人员的倾向和意见,常用个别深度访问。( x ) 6、品质标志实际上就是定类尺度和定序尺度。( √ ) 7、数量标志实际上就是定距尺度和定比尺度。( √ ) 8、组距可以根据全部数据的最大值和最小值及所分的组数来确定。( √ ) 9、组数越多,数据分布越集中,组数越少,数据分布就越分散。( x ) 10、组距分组时,为了解决“不重”问题,习惯上规定“上组限不在内”。( x )
11、若一个班的统计学考试成绩的最高分为99分,最低分为2分,则在组距分组时宜采用“××以下”和“××以上”这样的开口组。( √ ) 12、用组中值作为一组数据的代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧称对称分布。( √ )
13、从变量值小的一方向变量值大的一方累加频数,称为向下累计。( x ) 14、从变量值大的一方向变量值小的一方累加频数,称为向上累计。( x ) 15、人和动物的死亡率分布近似服从正态分布。( x ) 16、经济学中的供给曲线呈现为正J型分布。( √ ) 五、简答题
1、普查作为一种特殊的调查方式具有哪些特点? 2、组距分组需要经过哪几个步骤? 六、计算分析题
1、某行业管理局40个企业1999年的产品销售收入统计数据如下(单位:万元):
152 124 129 116 100 103 92 95 127 104 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120
136 117 108 97 88 123 115 119 138 112 146 113 126 要求:
① 对上面的数据资料进行适当的分组,编制频数分布表,并绘制频数分布的直方图和折线图。 ② 根据频数分布表计算累计频数和累计频率。
③ 如果按企业成绩规定:销售收入在125万元以上为“先进企业”;115~125万元为“良好企业”;105~115万元为“一般企业”;105万元以下为“落后企业”。试按先进企业、良好企业、一般企业和落后企业进行分组。
6.1[解]:
(1)分组得出的“频数分布表”如下:(仅供参考) 按销售收入分组(万企业数(个) 频率(%) 累计频数 累计频率(%) 元) (个) 95以下 3 7.32 3 7.32 95——110 12 29.27 15 36.59 110——125 15 36.59 30 73.18 125——140 8 19.50 38 92.68 140以上 3 7.32 41 100.00 合 计 41 100.0 —— ——— 频数分布的折线图和直方图(略) (2)计算频数分布的累计频数和累计频率。(见上表) (3)分组如下: 按企业规定的销售成绩分组 企业数(个) 落后企业(105万元以下) 9 一般企业(105——115) 9 良好企业(115——125) 11 先进企业(125万元以上) 11 合 计 41 ④ 2、某车间按工人日产量分组资料如下: 日产量(件) 工人人数 (人) 50——60 6 60——70 12 70——80 18 80——90 10 90——100 7 合 计 53 要求:根据上表指出:①上表变量数列属于哪一种变量数列;②上表中的变量、变量值、上限、下限、次数(频数);③计算各组组距、组中值、频率。 6.2[解]:(1)该变量数列为“数量型变量数列”。 (2)表中:“变量”为“日产量”和“工人人数”;
“变量值”为:50-60,60-70,80-90,90-100和6,12,18,10,7。 上限分别为:60,70,80,90,100; 下限分别为:50,60,70,80,90;
各组次数(频数)为:6,12,18,10,7; (3)有关计算如下表: 日产量(件) 工人人数各组组各组组中值 各组频率(%) (人) 距 50——60 6 10 55 11.32 60——70 12 10 65 22. 70——80 18 10 75 33.96 80——90 10 10 85 18.87 90——100 7 10 95 13.21 合 计 53 ——————— 100.00 — 3、某商店有职工20人,月工资额(单位:元)分别如下: 550 550 0 0 660 660 680 680 700 700 720 720 740 740 690 690 698 698 590 590
要求:利用分组法,将上述20人的工资分成三个组,并说明该商店职工工资的分布特征。 6.3[解]:有关分组如下(参考): 按月工资分组(元) 工人人数 频率(%) (人) 525——625 4 20 625——725 14 70 725——750 2 10 合 计 20 100 从上表分组数据可以看出:该商店20名职工中有70%的职工月工资在625元至725元之间,且这20名职工的月工资额数据大致呈“右偏分布”,有90%的职工月工资额低于725元。 4、请用“√”或“×”完成下表(其中“√”说明具有某种数学特征,“×”说明不具有某种数学特征)。 计量尺定类尺度 定序尺度 定距尺度 定比尺度 度 数学特征 分类( = ,≠ ) 排序( < ,> ) 间距( + ,-) 比值( × ,÷) 6.4[解]:完成的表格如下: 定类尺度 定序尺度 定距尺度 定比尺度 分类(=,≠) √ √ √ √ 排序(<,> ) √ √ √ 间距(+,—) √ √ 比值(×,÷) √ 5、某地区人口统计资料如下表,请计算此表中空白处的数字,并填入表中。 按年龄人口数组组中频 率 向上累积 向下累积 分 组(人) 距 值 (%) 频数频率(%) 频数频率(%) (周岁) (人) (人) 0—4 192 5 —17 459 18—24 2 25—34 429 35—44 393 45— 467 65及以 318 上 合 计 6.5[解]:填表完成的表格如下: 按年龄分人口数 组距 组中频率 向上累计 向下累计 组(周岁) (人) 频率(%) 频数频率(%) (人) 0—4 192 7.61 2522 100.00 5—17 459 25.81 2330 92.39 18—24 2 36.28 1871 74.19 25—34 429 53.29 1607 63.72 35—44 393 68.87 1178 46.71 45— 467 87.39 785 31.13 65以上 318 100.00 318 12.61 合 计 2522 —————————— — — *6、兹有下列调查:A、为了了解钢材积压情况,上级机关向单位颁发一次性调查表要求填报。B、一批商品运到商业仓库,在这批商品中选出10件进行仔细检查,以判断和记录其质量。C、某乡在春播期间每隔5天向上级主管部门提交播种进度报告。D、为了了解科技人员分配、使用状况,有关部门向各单位布置调查表,要求填报。E、对大中型基本建设项目投资效果进行调查。F、选取部分企业进行调查,以了解扩大企业自主权试点后的成果及问题。 要求:(1)指出上述各项调查按组织方式分类各属于哪种调查?(2)指出上述各项调查按登记事物的连续性分类各属于哪种调查?(3)指出上述各项调查按调查对象的范围分类各属于哪种调查?(4)指出各项调查按收集资料的方法分类各属于哪种调查? 6.6[解]:属于该类“调查”的业务打“★”。 组织方式分连续性分类 对象的范围分 搜集资料的方法分类 类 类 统计 专门 经常一次全 面 非全直 采访报告法 报表 调查 性 性 调 查 面 接 法 调查 调 查 调 观察查 法 业务1 ★ ★ ★ ★ 业务2 ★ ★ ★ ★ 业务3 ★ ★ ★ ★ 业务4 ★ ★ ★ ★ 业务5 ★ ★ ★ ★ ★ ★ 业务6 ★ ★ ★ ★ ★ 第二章 参 一、单项选择题 1、D 2、C 3、C 4、C 5、A 6、B 7、C 8、D 9、B 10、C 11、B 12、B 13、C 14、D 15、A 16、C 17、A 18、A 二、多项选择题
1、CE 2、ACE 3、BCD 4、CE 5、ABCDE 6、ABD 7、BCE 8、ABCE 三、填空题
1、绝对数、相对数 2、实物单位、价值单位、复合单位 3、离散变量、连续变量 4、有限,整数位 5、无穷多、连续不断的 6、直接的调查和科学试验(第一手或直接的统计数据);别人调查或实验的数据(第二手或间接的统计数据) 7、比例、比率 8、派员调查、面对面地交谈 9、抽样调查、抽样 10、表头、表体、表外附加 11、调查数据所属的时间、调查工作的期限 12、预处理、分类或分组、汇总;统计分析 13、数据分组整理、审核、筛选、排序 14、完整性、准确性 15、逻辑检查法、计算检查法 16.完整性、准确性、时效性、适用性 17、单变量值分组、组距分组 18、频数、组距 19.下限值、上限值 20、矩形的宽度、高度
(%) 频数(人) 5 2.5 7.61 192 13 11.5 18.20 651 7 21.5 10.47 915 10 30 17.01 1344 10 40 15.58 1737 20 55 18.52 2204 — — 12.61 2522 —— —— 100.00 ———— 值 四、判断题
1、 √ 2、√ 3、 √ 4、× 5、× 6、 √ 7、 √ 8、√ 9、 × 10、√ 11、√ 12、 √ 13、 × 14、 × 15、 × 16、 √ 五、(略) 六、计算题
第三章 数据分布特征的描述
一、单项选择题
1、经验表明,当数据分布近似于正态分布时,则有95%的数据位于区间( B ) A、X B、X2 C、X3 D、X4
2、实际中应用最广泛的离散程度测度值是( C )
A、极差和平均差 B、平均差和四分位差 C、方差和标准差 D、异众比率和四分位差 3、集中趋势的测度值中,最主要的是( C )
A、众数 B、中位数 C、均值 D、几何平均数
4、有10个数据,它们对数据6的离差分别为:-3,-2,-2,-2,0,0,4,4,5,5。由此可知这10个数据的( D )
A、均值为0 B、均值为1 C、均值为6 D、均值为6.9
5、某生产小组由36名工人,每人生产的产量数量相同,其中有14人生产每件产品耗时8分钟;16人生产每件产品耗时10分钟;6人生产每件产品耗时5分钟,计算该生产小组生产每件产品的平均耗时应采用( C )
A、简单算术均值 B、简单调和算术均值 C、加权算术均值 D.、加权调和均值
6、某敬老院里有9位百岁老人的岁数分别为101、102、103、104、108、102、105、110、102 ,据此计算的结果是( B )
A、均值=中位数=众数 B、均值>中位数>众数 C、众数>中位数>均值 D、中位数>均值>中数 7、几何均值主要适合于( C )
A、具有等差关系的数列 B、变量值为偶数的数列 C、变量值的连乘积等于总比率或总速度的数列 D、变量值之和等于总比率或总速度的数列
8、加权算术均值不但受变量值大小的影响,也受变量之出现的次数多少的影响,因此下列情况中对均值不发生影响的是( A ) A、 变量值出现次数相等时 B、变量值较小、次数较多时 C、变量值较大、次数较少时 D、变量值较大、次数较多时 9、一组数据的均值为350,众数为200,则( D )
A、中位数为275,数据呈右偏分布 B、中位数为275,数据呈左偏分布 C、中位数为300,数据呈左偏分布 D、中位数为300,数据呈右偏分布 10、一组数据的均值为5,中位数为3,则( A )
A、数据呈右偏分布 B、数据呈对称分布 C、数据呈左偏分布 D、数据呈正态分布 11、经验表明,当数据分布近似于正态分布时,则变量值落在区间X的概率为( B ) A、95% B、68% C、99.86% D、95.45%
12、当众数(Mo)中位数(Me)和均值(X)三者的关系表现为:Mo=Me=X,则( C ) A、数据有极小值 B、数具有极大值 C、数据是对称分布 D、数据是左偏分布 E、数据右偏分布
13、在单项式数列中,假定标志值所对应的权数都缩小1/10,则算术平均数( A ) A、不变 B、无法判断 C、缩小1/100 D、扩大10倍
14、若单项式数列的所有标志值都减少一倍,而权数都增加一倍,则其算术平均数( B )
A、增加一倍 B、减少一倍 C、不变 D、无法判断 15、各变量值与其算术平均数的离差之和( C )
A、等于各变量值之和的平均数 B、等于最大值 C、等于零 D、等于最小值 16、各变量值与其算术平均数的离差平方之和( D )
A、等于各变量值之和的平均数 B、等于最大值 C、等于零 D、等于最小值 二、多项选择题
1、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:X<Me<Mo,则( A D ) A、数据是左偏分布 B、数据是右偏分布 C、数据是对称分布 D、数据存在极小值 E、数据存在极大值
2、当众数(Mo)、中位数(Me)和均值(X)三者的关系表现为:Mo<Me<X,则( A D ) A、数据是右偏分布 B、数据是对称分布 C、数据是左偏分布 D、数据有极大值 E、数据有极小值 3、 数据分布的两个重要特征是( B E )
A、正态分布 B、集中趋势 C、t分布 D、分布 E、离散程度
24、利用组距分组数据计算众数时,有一些基本假定,即( B D )
A、假定数据分布具有明显的离中趋势 B、既定数据分布具有明显的集中趋势 C、假定众数组的频数在该组内是正态分布 D、假定众数组的频数在该组内是均匀分布 E、假定众数组的频数在该组内是二项分布 5、众数( A B C D E )
A、是一组数据分布的最高峰点所对应的数值 B、可以不存在 C、也可以有多个 D、是位置代表值 E、不受数据中极端值的影响。 6、极差( A C D E )
A、是描述数据离散程度的最简单测度值 B、不易受极端值影响 C、易受极端值影响 D、不能反映出中间数据的分散状况 E、不能准确描述出数据的分散程度
7、一组数据为17、19、22、24、25、28、34、35、36、37、38。则( A B D E )
A、该组数据的中位数为28 B、该组数据的第一个四分位数为22 C、该组数据的众数为38 D、该组数据无众数 E、该组数据的第三个四分位数为36
8、下列标志变异指标中,与变量值计量单位相同的变异指标有( A B C ) A、全距 B、平均差 C、标准差 D、标准差系数 E、平均差系数 9、下列标志变异指标中,用无名数表示的有( D E )
A、全距 B、平均差 C、标准差 D、标准差系数 E、平均差系数 10、比较两个单位的资料发现,甲的标准差大于乙的标准差,甲的平均数小于乙的平均数,由此可推断( A D )
A、甲单位标准差系数大 B、乙单位标准差系数大 C、甲单位平均数代表性大 D、乙单位平均数代表性大 E、无法判断两单位平均数代表性大 11、已知100个零售企业的分组资料如下: 销售利润率(%) 企业数 销售额(万元) 10 60 800 15 40 200 这100个企业的平均销售利润率正确计算公式是 ( C E )
10%6015%40 B、10%×60%+15%×40% C、10%80%+15%20%
604010%15%10%80015%200D、 E、
2800200A、
三、填空题
1、中位数将全部数据分为两部分,一部分数据_____________,另一部分数据则________________。
2、根据未分组数据计算中位数时,若数据个数N为奇数时,则中位数Me=_____________;若数据个数为N为偶数时,则中位数Me=________________。
3、几何平均数是适用于特殊数据的一种平均数,它主要用于计算___________的平均;在实际应用中,几何平均数主要用于计算社会经济现象的___________________。
4、均值的主要缺点是易受数据___________的影响,对于_________的数据,均值的代表性较差。
5、均值的变形主要有_______________和_______________。前者主要用于__________________的数据,后者主要用于计算____________的平均数。
6、方差是__________与其均值___________的平均数。
7、极差也称_______,它是一组数据的___________和_________之差。
8、众数是一组数据中____________的变量值,从分布的角度看,它是具有明显_______________的数值。 四、 判断题
1、在均值加减3个标准差的范围内几乎包含了全部数据。( √ )
2、样本方差与总体方差在计算上的区别是:总体方差是通体数据个数或总频数减1去除离差平方和,而样本方差则是用样本数据个数或总频数去除离差平方和。( X )
3、从统计思想上看,均值是一组数据的重心所在,是数据误差相互抵消后的结果。( √ )
4、由于中位数是一个位置代表值,其数值的大小受极大值和极小值的影响,因此中位数据有稳健性的特点。( X )
5、中位数与各数据的距离最长。( X ) 6、i1NXiMemin(最小) ( √ )
7、从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置上的值,而均值则是全部数据的算术平均。( √ )
8、几何平均数的对数是各变量值对数的算术平均。( √ ) 9、根据Mo、Me和X之间的关系,若已知Me=4.5,X=5,则可以推算出Mo=3.5。 ( √ ) 10、对于具有偏态分布的数据,均值的代表性要好于中位数。( X )
11、当数据分布具有明显的集中趋势时,尤其是对于偏态分布,众数的代表性比均值要好。( √ ) 五、 简答题
1、权数的实质内容是什么?
2、数据集中趋势的测度值与离中趋势的测度值各有哪些? 3、试比较众数、中位数和均值三者的特点及应用场合。 4、什么是离散系数?为何要计算离散系数? 5、均值具有哪些重要的数学性质? 6、离散特征数在统计分析中的作用? 7、实际中几何平均数应用于哪些场合? 六、计算分析题 1、根据要求计算:
(1)已知X500,V=0.3 , 求方差σ²。
(2)已知X5.5 ∑X2=385, N=10 , 求离散系数V。 (3)已知σ=20 ,X60 ,求各数据值对50的方差。 (4)已知X350 ,V=0.4 ,求各数据值对400的标准差。
(5)已知X810,X265770,N=10,求标准差和离散系数V。 (6)已知:σ=100,X22600,求离散系数V
(7)已知:样本方差S2n-1=16,∑(X-X)2=784,求样本容量n。
2、某车间生产三批产品的废品率分别为1%、2%、1.5%,三批产品的产量占全部产量的比重分别为25%、35%、40%,试计算该车间三批产品的平均废品率。
3、某产品精加工车间加工零件5000件,其中合格品4500件,不合格品500件。 要求:计算是非标志的平均数、方差、标准差及离散系数。
4、有两个教学班进行《统计学》期中测验,甲班有45个学生,平均成绩为78分,标准差为8分;乙班有50个学生,平均成绩为72分,标准差额为10分。要求计算两个教学班总的平均成绩和标准差。
5、某厂长想研究星期一的产量是否低于其他几天,连续观察六个星期,所得星期一日产量(单位:吨)为:100 150 170 210 150 120 同期非星期一的产量整理后的资料如下表: 日产量(吨) 天数(天) 100——150 8 150——200 10 200——250 4 250以上 2 合 计 24 根据资料:(1)计算6个星期一产量的均值和中位数;(2)计算非星期一产量的均值、中位数、众数;(3)分别计算星期一和非星期一产量的标准差;(4)比较星期一和非星期一产量的离散程度哪一个大一些?(5)计算非星期一产量数据分布的偏态系数和峰度系数。
6、甲工厂工人的工资的离差的绝对值之和是乙工厂工人工资离差绝对值之和的3倍,即:而乙工厂工人工资的平均差却是加工厂工人工资平均差的3倍,即:A.D乙2A.D甲,x甲x甲3x乙x乙;
求:通过计算判断上述情况在什么情况下可能会发生?
7、从某地区抽取120家企业按利润额进行分组,结果如下: 按利润额分组(万元) 企业数(个) 200—300 19 300—400 30 400—500 42 500—600 18 600以上 11 合 计 120 要求:(1)计算120家企业利润的众数、中位数、和均值。 (3)计算分布的偏态系数和峰度系数,并作简要分析说明。
8、抽取10名成年人和10名幼儿进行身高(厘米)调查,结果如下: 成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 要求:(1)若要比较成年组和幼儿组的身高差异,应采用什么样的指标测度值?为什么?(文字回答即可)
(2)试通过计算,比较分析哪一组的身高差异大? 9、甲、乙两个企业生产三种产品的有关资料如下: 产品名称 单位成本 总成本(元) (元) 甲企业 乙企业 2
______A 15 2100 3255 B 20 3000 1500 C 30 1500 1500 试比较哪个企业的总平均成本高,并分析其原因。 10、甲、乙两单位各抽取了若干工人进行生产情况调查,测得有关资料如下: 日产量(件/人) 甲单位工人数(人) 乙单位总产量(件) 2 4 12 3 8 24 5 6 20 合 计 18 56 试通过计算分析:(1)哪个单位工人的平均日产量水平高? (2)哪个单位工人的日产量水平均衡? 11、已知某地区农民家庭按年人均收入分组的资料如表所示: 按人均收入分组(元) 家庭户数占总户数比重(%) 100以下 2.3 100—200 13.7 200—300 19.7 300—400 15.2 400—500 15.1 500—600 20.0 600以上 14.0 合 计 100.0 要求:(1)计算该地区平均每户家庭人均年收入的中位数、均值及标准差。 (2)根据计算结果回答,该地区平均每户家庭人均年收入与其平均数相比,平均相差多少元?(即是问标准差)
12、在某城市抽取100户家庭所做的一项抽样调查结果如下: 按月收入分组(元) 家庭户数占总户数比重(%) 300—400 24 400—500 27 500—600 28 600—700 10 700—800 7 800以上 4 你认为要分析该城市家庭的人均收入情况,用均值、众数和中位数哪一个测度值更好?试说明理由。(提示:用中位数。因为收入分布为右偏,且频数较多的几个组的家庭百分比相差不大,众数不十分明显。)
13、某厂两个主要生产车间工人某月奖金资料如下: 工人按奖金额分组 工人数(人) (元) 甲车间 乙车间 20以下 4 1 20—30 8 6 30—40 50 30 40—50 16 55 50以上 2 8 要求:(1)计算甲车间的众数、中位数和均值。根据计算结果描述众数、中位数及均值的关系,并据此判断甲车间数据分布的形态。
(2)通过计算判断哪个车间工人平均奖金额的代表性强? 14、某县两个乡在不同地块的粮食产量资料如下: 甲乡 乙乡 地块编号 平均亩产 粮食产量 平均亩产 播种面积 (公斤/亩) (公斤) (公斤/亩) (亩) 1 100 2500 100 125 2 150 15000 150 50 3 400 50000 400 75 试比较哪个乡的平均亩产高?并进一步分析原因。(提示:从两个乡产量水平不同的地块所占比重差异来分析)
15、某企业某种产品须经过4个车间的流水作业才能完成,如果第一车间的产品合格率为90%,第二车间的产品合格率为97%,第三车间的产品合格率为95%,第四车间的产品合格率为98%,求平均合格率。 16、某种产品的生产须经过10道工序的流水作业才能完成,有2道工序的合格率都为90%,有3道工序的合格率都为92%,有4道工序的合格率都为94%,有1道工序的合格率为98%,试计算平均合格率。 17、某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。根据给出的条件回答下面的问题:
(1)如果该班的男女学生各占一半,全班考试成绩的平均数是多少?标准差又是多少?
(2)如果该班中男生为36人,女生为24人,全班考试成绩的平均数是多少?标准差又是多少? (3)如果该班中男生为24人,女生为36人,全班考试成绩的平均数是多少?标准差又是多少? (1) 比较(1)、(2)和(3)的平均考试成绩有何变化,并解释其变化的原因。 (2) 比较(2)和(3)的标准差有何变化,并解释其原因。
(6)如果该班的男女学生各占一半,全班学生中考试成绩在.5分~90.5分的人数大概有多少? 18、某企业购进四批不同规格的原材料,每批价格及采购金额如下表所示,求这四批材料的总平均价格。 批次 价格(元/公斤) 采购金额(元) 第一批 35 10000 第二批 40 20000 第三批 45 15000 第四批 50 5000 合 计 — 50000 (提示:总平均价格采购总金额)
采购总数量19、已知某公司下属三个工厂的实际产值及计划完成程度资料如下: 工厂 计划完成程度(%) 实际产值(万 元) 甲 95 99.75 乙 105 210.00 丙 115 339.25 合计 — 9 试求:三个工厂的平均计划完成程度。 (提示:计划完成程度实际产值平均实际产值100%;平均计划完成程度100%计划产值平均计划产值
实际产值3实际产值100%100%)计划产值3计划产值第3章 数据分布特征的描述
一、单项选择题
1、B 2、C 3、C 4、D 5、C 6、B 7、C 8、A 9、D 10、A 11、B 12、C 13、A 14、B 15、C 16、D 二、多项选择题
1、AD 2、AD 3、BE 4、BD 5、ABCDE 6、ACDE 7、ABDE 8、ABC 9、DE 10、AD 11、CE 三、填空题
1、大于中位数、小于中位数 2、MeXN12,Me1NX22XN12 3、比率或速度、年平均发展速度 4、极端值、偏态分布 5、调和平均数、几何平均数、不能直接计算均值、比率数据 6、各变量值、离差平方 7、全距、最大值、最小值 8、出现次数最多、集中趋势 四、判断题
1、 √ 2、 × 3、√ 4、× 5、× 6、√ 7、 √ 8、√ 9、√ 10 × 11、√ 五、(略) 六、计算题 6.1[解]: (1)∵ VX ∴ V•X5000.3150
=22500
2(2)385X22X25.538.530.258.252.872 N10VX2.8720.522252.22% 5.522(XX0)(XX)NC2(3)(P.37)因为
(XX)N(XX0)22
22(XX0)(XX)22(XX0)2(XX0)得:
NN(上式左边即是各数据对X0的方差) 若令X050,则各数据对50的方差为:
2(XX0)222(XX0)202(6050)500
N(4) V•X3500.4140 各数据对400的标准差为:
X400222X4001402350400148.66
N265770810X2(5)X265776561164
N1010V2XXN40.04944.94% 81_____22X2600100250050
(6)2X2X2.......XV_____X100100.2 505022(7)S2n1xxxx......n1.. 2n1Sn12784xxn1150 Sn21166.2[解]:设X废品率
F为产量比重,则该车间三批产品的平均废品率:FXX•F1%25%2%35%1.5%40%1.55% F6.3[解]:N5000,N14500,N0500 是非标志的平均数PN145000.990% N5000是非标志的方差P1P0.90.10.09 是非标志的标准差P1P0.090.3
是非标志的离散系数VP1P0.30.333333.33% P0.96.4[解]:依题意N甲45 X甲78 甲8 N乙50 X乙72
乙10
784572507110NN74.84(分) 于是两个教学班总的平均成绩XX甲甲X乙乙455095N甲N乙X2X2 ∴根据已知条件得出方程组 ∵ N2X甲2456084276660X甲 解得: 22X乙2200100X乙5184502于是两个教学班总的标准差:
22X乙2766602200X甲2X274.849.604(分)
4550N甲N乙5.[解]:
(1)6个星期一产量的均值
100150170210150120900150 (吨) x1666个星期一产量的中位数
排序后产量为:100 120 150 150 170 210
N161中为数的位置=3.5,即:中位数在第3个数据和第4个数据之间的中间位置,亦即:
22150150150 (吨) Me2(2)非星期一产量的均值、中位数和众数的计算: 日产量(吨) 组中值(x) 天数(天)f xf 向上累计频数 100——150 125 8 1000 8 150——200 175 10 1750 18 200——250 225 4 900 22 250以上 275 2 550 24 合 计 ……. 24 4200 …… ∴ 非星期一产量的均值xf中位数的位置=
2xff4200175(吨) 242412 因为:向上累计频数18刚好大于12 2所以150——200这一组即为“中位数所在组”, 于是: L150 Sm18 fm10 i50 则:非星期一产量的中位数为:
fSm11282i15050170 MeL10fm因为:f10出现次数最多,所以他所在组150——200这一组即为“众数组”,于是:L150 f10
f18 f14 i50
则:非星期一产量的众数为: MOLff1108i15050162.5
ff1ff1108104(3)星期一和非星期一产量的标准差的计算: 星期一产量的标准差的计算表:(x1150)
变量值 100 -50 2500 150 0 0 170 20 400 210 150 120 -30 900 xx 2xx 60 0 3600 0 …….. 7400 所以星期一产量的标准差为: 7400xx35.12 (吨) 1n62非星期一产量的标准差的计算表:(x175) xx 组中值天数f xx2 (x) 125 8 -50 2500 175 10 0 0 225 4 50 2500 275 2 100 10000 24 …… ……… 所以,非星期一产量的标准差为: xxf 2xx3f xx 0 4f 20000 0 10000 20000 50000 - 0 50000xxf45. (吨) 2f242(3)星期一产量的离散系数:V1135.120.2341
x1150 非星期一产量的离散系数:V2245.0.2608
x2175因为:V1V2,所以非星期一产量的离散程度要大一些。 (4)非星期一产量数据的偏态系数和峰度系数:
3(xx)ffa33415000001500000xxf=0.66>0 呈“右偏分布” 33f•2422815.39645.3275000000275000000xxf2.<3 呈“扁平分布” a4442445.104134295.9f•X甲X甲X甲X甲....N甲6.6[解]:A•D甲
N甲A•D甲X甲X甲3X乙X乙因为:
..........A•D乙2A•D甲..........所以:N甲X甲X甲A•D甲3X乙X乙3N乙A•D乙6N乙
11A•D乙A•D乙22表明:只有在甲工厂的工人人数是乙工厂工人人数6倍的条件下,上述情况才能发生。
6.7[解]:有关计算表(见后面)
因为:400——500这一组出现次数42为最多,故它为“众数组” 于是:L400 f42 f130 则:这120家企业利润的众数为:
MOLff14230•i400100433.33(万元)
ff1ff142304218f118 i100
附表1: 按利润分组(万元) 组中值X 企业数 F 累计频数 200——300 250 19 19 300——400 350 30 49 400——500 450 42 91 500——600 550 18 109 600以上 650 11 120 合 计 —— 120 —————— F120中位数位置=“中位数所在组”,于60 因为累计频数91>60 所以其所在组400-500这一组就是
22是L400 Sm149
fm42 i100
则这120家企业利润的中位数为:
FSm160492•i400100426.19(万元 MeL42fm附表2:(接附表1) 组中值(X) 企业数(F) 250 19 350 30 450 42 550 18 650 11 合 计 120 XF 4750 10500 100 9900 7150 51200 XX -176.67 -76.67 23.33 123.33 223.33 XXF XXF XXF 234.41 .667 22860.1338 .2002 .1779 .668 -.5 -.3 .9216 .74 .6 .4616 .08 .08 所以:这120家企业利润的均值为:X这120家企业利润的标准差为:
XF51200426.67(万元) 120F1614666.668XXF115.998116
120F2这120家企业利润数据分布的偏态系数为:
XXF385349.4616385349.46160.20570.21>0 a333187307520120116F•3故:该组数据呈“正(右)偏分布”。
这120家企业利润数据分布的峰度系数为:
XXF51087441921.0851087441921.082.35<3 a4221727672000120116F•44故:该组数据呈“扁平分布”。
6.8[解]:(1)应采用“离散系数(标准差系数)”。 (2)有关计算如下表: 成年组 幼年组 序号 1 2 3 4 5 6 7 8 9 10 合计 身高X(cm) 166 169 172 177 180 170 172 174 168 173 1721
2xx2 身高X(cm) xx 37.21 68 10. 9.61 69 5.29 0.01 68 10. 24.01 70 1.69 62.41 71 0.09 4.41 73 2. 0.01 72 0.49 3.61 73 2. 16.81 74 7.29 0.81 75 13.69 158.9 713 56.1 x1721所以:成年组身高的均值:x成172.1(cm)
n10x713幼年组身高的均值:x幼71.3(cm)
n10158.9xx成年组的标准差:S成4.20(cm)
n1101256.1xx幼年组的标准差:S幼2.50(cm) n11012成年组的离散系数:V成S成4.200.024 x成172.1S幼2.500.035 71.3x幼幼年组的离散系数:V幼因为:V成V幼 所以幼年组的身高差异大。
6.9[解]:计算表如下: 产品单位成 总成本名称 本(元) (元) (x) (m) 甲企乙企业 业 A 15 2100 3225 B 20 3000 1500 C 30 1500 1500 合——— 6600 6225 计 — 根据表中计算可得: 甲企业的总平均成本:x1 总产量 (m/x) 甲企业 140 150 50 340 乙企业 215 75 50 340 产量比重(%) 甲企业 乙企业 比重 41.18 44.12 14.70 100.0 累计 41.18 85.30 100.0 —— 比重 63.24 22.06 14.70 100.0 累计 63.24 85.30 100.0 —— m660019.41 (元) m340xm622518.31 (元) m340x乙企业的总平均成本:x2显然,甲企业的总平均成本要高一些,乙企业的总平均成本要低一些。这是因为:在单位成本偏高的B、C两种产品中,两个企业累计产量比重相同,但单位成本最低的A种产品,甲企业的产量比重仅为41.18%,而乙企业的产量比重则高达63.24%,从而导致乙企业的总平均成本明显低于甲企业。 6.10[解]:
(1)计算表如下: 日产量(x) 甲单位工人数xf 乙单位总产量乙单位工人人数(m/x) (f) (m) 2 4 8 12 6 3 8 24 24 8 5 6 30 20 4 合 计 18 62 56 18 甲单位的平均日产量:x1xf623.44 (件) 18f乙单位的平均日产量:x2m563.11 (件) m18x可见,甲单位的平均日产量高于乙单位。
(2)由于两单位平均日产水平不同,所以应该用标准差系数比较. 有关计算表如下: 日产量 甲单位 x3.44 乙单位 x3.11 xx xx x f f xx2f xx2f 2 3 5 4 -1.44 8 6 -0.44 1.56 合 计 18 根据表中计算可得: 8.2944 1.5488 14.6016 -1.11 6 -0.11 8 1. 4 7.3926 0.0968 14.2884 24.4448 2 18 21.7778 24.4448xxf甲单位的标准差:S11.20 (件)
181f121.7778xxf乙单位的标准差:S21.13 (件)
181f12甲单位的离散系数:V1乙单位的离散系数:V2Sx111.200.35 3.441.130.36 3.11Sx22因为V1V2,所以甲单位日产量的离散程度小于乙单位,表明甲单位的日产量水平均衡。 6.11[解]:(1)有关计算如下表: 按人均 组中值f户数比重收入分组 (x) 100以下 100—200 200—300 300—400 400—500 500—600 600以上 合计 ff x•f xx•f2f向上累计 频率(%) 50 2.3 1.15 2708.14 2.3 150 13.7 20.55 8099.04 16.0 250 19.7 49.29 4036.34 35.7 350 15.2 53.20 282.88 50.9 450 15.1 67.95 488.19 66.0 550 20.0 110.0 4921.01 86.0 650 14.0 91.0 9236.79 100.0 ———— 100.0 393.14 29772.35 ———— 1中位数位置=0.5 因为:向上累计频率0.509>0.5 所以300-400这一组就是“中位数所在组”。于是:
2L300 Sm10.357
fm0.152 i100
FFSm10.50.3572•i300100394.08 (元) 故:中位数MeL0.152fm均值xx•f393.14 f标准差:Sxx2•f29772.35172.55 (元) f计算结果表明:该地区平均每户家庭人均年收入与其平均数相比,平均相差172.55元。 6.12[解]:有关计算如下表: 月收入分组中值 向上累计频f户数比重ff x• 组 (x) 率(%) f (%) 300-400 24 350 84.00 24 400-500 27 450 121.50 51 500-600 28 550 154.00 79 600-700 10 650 65.00 700-800 7 750 52.50 96 800以上 4 850 34.00 100 合 计 100.0 ——— 511 ———— 均值xx•f511 (元) f因为:500-600这一组出现的频率(0.28)相对较高,故该组就是“众数组”,于是:L500 f0.28
f10.27 f10.1 i100MOLff10.280.27•i500100505
ff1ff10.280.270.280.10中位数位置=
1,于是:0.5 因为向上累计频率0.51>0.5 所以400-500这一组就是“中位数所在组”
2L400 Sm10.24 fm0.28
i100 则中位数为:
FSm10.50.242L•i400100493 (元) Me0.28fm因为出现频率较多的几组家庭户数所占的比重相差不大,众数不太明显,其代表性较差;又因为
Me493x511,有“极大值”,表明数据呈“右偏分布”,此时均值的代表性不如中位数好。所以,要
分析该城市家庭的人均收入状况,采用“中位数”这个测度值更好。
6.13[解]:有关计算表如下: 奖金分组中工人人数(f) x x 向上累计频数 f1f2xx2f 组 值 甲车乙车(x) 间 间 甲车间 乙车间 甲车间 乙车间 20以下 20-30 30-40 40-50 50以上 15 25 35 45 55 4 8 50 16 2 1 6 30 55 8 60 200 1750 720 110 15 150 1050 2475 440 1681 882 12.5 1444 760.5 691.69 4 1594.14 12 1190.7 62 752.95 78 1501.52 80 1 7 37 92 100 合计 —— 80 100 2840 4130 4780 5731 ——————— — (1)因为:甲车间的最大频数为50,所以甲车间的众数组为30-40,于是:L30 f50 f18 f116
i10
则:甲车间奖金的众数:
MO1Lff1508•i301035.5336 (元)
ff1ff15085016因为:乙车间的最大频数为55,所以乙车间的众数组为40-50,于是:
L40 f55 f130 f18 i10 则:乙车间奖金的众数:
MO2Lff15530•i401043.47(元)
ff1ff15530558甲车间中位数的位置=
f28040,因为甲车间的向上累计频数62>40,所以甲车间的中位数组为30-40。2于是L30 Sm112
fm50 i10
则:甲车间奖金的中位数为:
fSm140122•i301035.636(元) Me1L50fm乙车间中位数的位置=
f100因为乙车间的向上累计频数92>50,所以乙车间的中位数组为:40-50。50,
22于是L40 Sm137
fm55 i10
则:乙车间奖金的中位数为:
fSm150372L•i401042.36(元) Me255fm甲车间的均值x1xf1284035.536 (元) 80f1xf2413041.3 (元) 100f2乙车间的均值x2对于甲车间而言:因为MO1Me1x136,所以甲车间奖金数据近似服从“对称分布”。
对于乙车间而言,因为x241.3Me242.36MO243.47,有“极小值”,表明乙车间奖金的数据分布呈“左篇(负偏)分布”。
4780xxf(2)甲车间的奖金的标准差为:17.73
f8025731xxf乙车间的奖金的标准差为:27.57
100f2甲车间的离散系数:V117.730.22
x135.5乙车间的离散系数:V227.570.18
x241.3因为:V1V2表明甲车间奖金的差异程度大,反映出乙车间平均奖金的代表性要好于甲车间。 6.14[解]:有关计算如下表: 地块 甲 乡 编号 平均产量 产量比重(%) 亩产 m 比重 累 计 x1 1 100 2500 3.70 3.70 2 150 15000 22.22 25.92 3 400 50000 74.08 100.00 合计 —— 67500 100.0 ——— 平均亩 产x2 100 150 400 乙 乡 播种 粮食产量 面 X2f 比重(%) 积f 125 12500 25 50 7500 15 75 30000 60 50000 100 播种面积m/x1 25 100 125 累计(%) 25 40 100 ——— 250 —— 250 — 甲乡的平均亩产:x1m67500270 (公斤/亩) m250x1x2f50000200 (公斤/亩) f250乙乡的平均亩产:x2结果表明:甲乡的平均亩产量明显高于乙乡。主要原因是:平均亩产量偏低的1号和2号地块的产量累计比
重甲乡仅为25.92%,而乙乡则高达40%;反之,平均亩产量最高(400公斤/亩)的3号地块的产量比重甲乡高达74.08%,而乙乡则只达到60%,从而导致甲乡的平均亩产高于乙乡。
6.15[解]:由于4个车间属于流水线作业,每一个车间的产品合格率的高低,对后续车间产品的合格率至关重要。该企业产品总合格率是4个车间产品合格率的连乘积。因此,宜采用“简单几何平均法”。于是该企业产品的平均合格率为:
4GMNX1X2....XN90%97%95%98%94.95%
6.16[解]:此题属于“加权几何平均法”。该产品的平均合格率为:
ffffGMX11X22...XNN1090%92%94%98%
2341 =92.97%
6.17[解]:依题意知:N60 X男75 男6 X女80 女6 (1)当N男N女N30时,则: 2•N男X女•N女7530803077.5 全班的平均成绩XX男60N男N女因为:标准差所以:
X2X2 N22X男X男2对于男生而言:男X男......6752
30N男2169830 解此方程得:X男22X女X女2对于女生而言:女X女........6802
30N女2193080 解此方程得:X女于是,全班考试成绩的标准差为:
22X女169830193080X男X277.526.5(分)
60N男N女(2)当N男36 N女24时,则全班考试成绩的平均数为:
•N男X女•N女75368024XX男77(分)
3624N男N女与前面相同的道理,可以推导出:
23636752361296202500203796X男 22X女3624802481536001544于是全班考试成绩的标准差为:
22X女2037961544X男X27726.48(分)
3624N男N女(3)当N男24 N女36 时,则全班考试成绩的平均数为:
75248036NNXX男男X女女78(分)
2436N男N女236247522481350001358X男同理可以推导出: 22X女363680361296230400231696则全班考试成绩的标准差为:
22X女1358231696X男X27826.48(分)
2436N男N女(4)比较:当“男女生人数各占一半”时,全班平均成绩为(70+80)÷2=77.5由于“男生的平均成绩”
低于“女生的平均成绩”,因而当“男生人数”多于“女生人数”时,则势必会拉低全班的平均成绩;而当“女生人数”多于“男生人数”时,则又会拉高全班的平均成绩。
(5)情况(2)和(3)相比,二者的“标准差”均等于6.48。这是因为:“男生考试成绩的标准差”等于“女生考试成绩的标准差”,均为6分,改变“男女生的人数比例”并不会改变“标准差的大小”。 (6)根据情况(1)计算可知:在“男女生人数各占一半”的条件下,全班考试成绩的均值X77.5,标准差6.5。又根据经验可知:全部数据落在“X2”范围内的“概率=95%”。于是本题中:(.5,90.5),进而表明当“男女生人数各占一半”时,全部考试X277.526.577.513,即:
成绩有95%的人数考试成绩在.5分至90.5分之间。
则:当男女生人数各占一半时,全班学生考试成绩在54.5分至90.5分之间的大致人数=6095%57人。 18、解:列计算表如下: 批次 价格(元/公斤) 采购金额(元) 采购量(公斤) x m m/x 第一批 35 10000 286 第二批 40 20000 500 第三批 45 15000 333 第四批 50 5000 100 合 计 — 50000 1219 平均每公斤价格为:xH
=
m=50000/1219=41.02(元/公斤)
mx19、解:此题不能直接计算加权均值,故变形为调和平均数。
平均计划完成程度9108.17%600实际产值100%m99.75210339.25m99.75210339.25计划产值x0.951.051.15
第4章 假设检验
一、单项选择题
1、假设检验的基本思想是( )
A、带有概率性质的反证法 B、小概率事件的出现是合理的 C、对总体均值的检验 D、对总体方差的检验 2、假设检验的显著性水平的一般取值为( )
A、大于0.10 B、大于0.01 C、小于0.80 D、不超过0.10 3、样本容量不变,犯第一类错误的概率减小,则犯第二类错误的概率( ) A、增大 B、减小 C、不变 D、变化不定
4、正态总体方差未知,且样本容量小于30,检验总体均值的统计量应取( ) A、Zx0Sn~N(0,1) B、Zx0n~N(0,1)
C、2(n1)S202~(n1) D、t2x0Sn~t(n1)
5、假设检验中的P值的意义为( )
A、拒绝原假设的最小显著性水平 B、拒绝原假设的最大显著性水平 C、接受原假设的最小显著性水平 D、接受原假设的最大显著性水平 二、多项选择题
1、实际推断原理的要件是( )
A、实验的次数 B、实验的次数以一次为限 C、事件发生的概率很小 D、事件不发生是主观的认定 E、事件不发生是客观事实
2、关于假设检验的显著性水平,以下说法正确的是( ) A、原假设H0为真却被拒绝的概率 B、原假设H0不真被拒绝的概率 C、改变检验的结论必随之改变 D、减小,拒绝原假设的概率减小 E、减小,犯采伪的错误必随之增大
3、关于假设检验中第一、第二类错误的概率,,以下的说法正确的是( ) A、同时减小,的方法是增大样本容量 B、1
C、拒真的代价大,取较小的而容忍较大的 D、(1)成为检验功效 E、采伪的代价大,取较大的以求较小的
4、以下属于参数假设的有( )
A、H0:100 B、H0:X~N(10,25) C、H0:1 D、总体X ,Y 有相同的分布 E、总体X ,Y 相互 5、对于假设H0:5,H0:5的检验,以下说法正确的有( ) A、这是一个单侧检验 B、这是右侧检验 C、这是左侧检验 D、这是双侧检验 E、检验统计量的数值大于上侧位临界值时拒绝原假设 6、关于假设检验中的P 值,以下说法正确的是( )
A、P为拒绝原假设的最小显著性水平 B、接受原假设的最大显著性水平 C、如果P,在显著性水平下拒绝原假设 D、P 值越小拒绝原假设的理由越充分 E、如果≤P ,则在显著性水平下接收原假设 三、填空题
1、某一假设检验为左侧检验,其原假设是H0:10,则备择假设为_________________________________。
2、原假设拒绝域和接受域的分界点坐标值,称为_______________________________________________。
3、假设检验的四种情况是:____________________________、_______________________、__________________________和___________________。
4、双侧检验的拒绝域位于统计量分布曲线的____________________________,右侧检验的拒绝域位于___________________________________,左侧检验的拒绝域位于统计量分布曲线的_________________________________。 5、“接受原假设”的含义是_______________________________________________________________________。
6、如果我们希望提高“拒绝原设”的说服力,那么应该_________________________________的数值。 7、双侧检验的P值等于_____________________________________________________________________________________________________。
8、如果改变显著性水平,假设检验的结论_________________________________________,因此假设检验又称为__________________________________________________。 四、判断题
21、假设检验一定有犯错误的风险。 ( ) 2、假设检验的结论具有100%的准确率。 ( ) 3、显著性水平=0.10,表示拒绝原假设的概率为10%。 ( ) 4、减小必然增大,故而假设检验中的犯第一、第二类错误互为逆事件。 ( )
5、建立假设时遵行的原则是“不轻易拒绝原假设”。 ( ) 6、改变假设检验的显著性水平,检验的结论有可能改变。 ( )
7、在假设检验中,减小一类错误的概率势必以另一类错误的概率增加为代价,除非扩大样本容量。 ( )
8、假设检验控制错误的方法是,先固定,然后选择(1)最小的检验方法。( )
9、要提高“拒绝原假设”的说服力,应增大显著性水平的数值。 ( ) 10、“拒绝原假设”和“接受原假设”具有相同的可靠程度。 ( )
11、在显著性水平=0.05之下,接受原假设等价于统计量的数值落入置信度为0.95的置信区间。 ( )
12、假设检验中的P值越大,拒绝原假设的理由越充分。 ( ) 五、简答题
1、假设检验的思想及步骤 2、假设检验中的错误
3、假设检验的显著性水平 4、假设检验的局限性
5、误用Z 统计量检验替代T 统计量的后果 六、计算分析题
1、已知某种零件的尺寸服从正态分布N(23.02,1.52),现从这一批零件中任抽七件进行测量,测得尺寸数据(单位:mm)如下:
21.00 22.04 22.32 24.01 24.68 25.02 21.63 能否认为这批零件的平均尺寸仍为23.02mm(0.05)。
2、假设英语四级考试中学生成绩服从正态分布。现随机抽取25名学生的考试成绩,算得平均分为67分,标准差为10分。在显著性水平0.01下,可否认为全体学生的平均考试成绩为72分?
3、某市统计局调查了30个集市上的鸡蛋价格,测得平均价格为6.50元/千克,已知以往的鸡蛋价格一般为5.80元/千克。假定该市的鸡蛋售价服从正态分布N(,0.),假定方差不变,能否认为当前鸡蛋的平均价格高于以往?(0.01)。
4、从一批保险丝种抽取8根,测得其熔化时间X(单位:毫秒),得如下数据: 50 48 50 53 51 55 52 51
设X 服从正态分布,质量标准为=35。问这批产品是否合格(0.05)?
5、某市声称人口普查的差错率为0.52‰,为了检验该结果是否可靠,随机抽查了了2000人,结果发现漏登2人,问可否认为原来的差错率正确(0.05)? 第4章 参 一、 单项选择题
1、A 2、D 3、A 4、D 5、A 二、多项选择题
21、BCD 2、ADE 3、ACDE 4、AC 5、ABE 6、ACDE 三、填空题
1、H1 :10 2、临界值
3、H0真,被接受、H0不真,被接受、H0真,被拒绝、H0不真,被拒绝 4、左右两侧、右侧、左侧 5、“无法否定原假设”或“无法拒绝原假设”
6、减小 7、显著性水平的一半 8、可能改变、显著性检验 四、判断题 1、(√) 2、(×) 3、(√) 4、(×) 5、(√) 6、(√) 7、(√) 8、(√) 9、(×) 10、(×) 11、(√) 12、(×) 五、简答(略) 六、计算题 1、H0:23.02;H1:23.02
因为,|Z|=|-0.1058|=0.1058 因为,t=4.7912>2.33=z0.01 ,所以,拒绝H0,可以认为鸡蛋的平均价格高于以往。 4、H0:235;H1:235 2因为,5、H00.992.167,所以,拒绝H0,可以认为产品质量合格。 :P0.52%;H1:P0.52 1.96,所以,接受H0,可以认为原来的差错率正确。 第5章 方差分析 2因为,|Z|=0.6792 A、方差相等 B、方差相异 C、均值相等 D、均值不等 2、方差分析使用的统计量F( ) A、是正态分布 B、是正偏态的 C、是负偏态的 D、取值小于零 3、设单因素方差分析中误差项离差平方和为125.00,水平项离差平方和为375,那么总离差平方和为( ) A、250 B、125.00 C、375.00 D、500 4、因素A 共4个水平,每个水平下重复5次实验,数据的平方和为1250,数据总和为150,A、125 B、-125 C、无法计算 D、1400 5、在单因素方差分析中,已知总离差平方和的自由度为24,水平项离差平方和的自由度为7,那么误差项离差平方和的自由度为( ) A、17 B、24 C、7 D、31 6、在一个双因素方差分析中,FA =2.300,FB =4.55相应的P- value依次为0.11和0.0018, 那么结论是( ) A、A的作用显著,B的作用不显著 B、A的作用不显著,B的作用显著 C、A的作用不显著,B的作用不显著 D、A的作用显著,B的作用显著 7、已知SST1440,SSA700,SSB560,fT30,fA6,fB8,那么FA=( ) A、1440 B、700 C、116.67 D、10.37 8、如果MSA12.25,fA4,MSB8.00,fB5,MSE2.25,fE16,那么SST( ) A、无法计算 B、22.5 C、25 D、125 二、多项选择题 1、方差分析假定的内容有( ) A、数据来自正态总体 B、数据来自二项总体 C、各总体相互 D、各总体不相关 E、各总体方差相等 2、一个单因素方差分析中,因素的水平为5,每个水平下的样本容量是6,SST =120,SSA=75 那么以下正确的是( ) A、n=30 B、dfA = 4 C、MSE=1.8 D、dfT =29 E、F=10.42 3、在一个单因素方差分析问题中,因素的水平为4,每个水平下的样本容量是5,那么下列说法正确的是( ) A、检验的原假设为H0:1234 B、检验的临界值为F(4,5) C、检验的原假设为H0:12345 D、检验的临界值为F(3,16) E、检验的统计量为FSSA3 SSE1、一个因素A有6水平,因素B有4水平的双因素方差分析中,以下正确的有( ) A、数据共24个 B、误差平方和的自由度为15 C、SSA的自由度为6 D、SST的自由度为3 E、SST=SSA+SSB+SSE 5、一个因素A有7水平,因素B有8水平的双因素方差分析中,SST=225,SSA=78,SSB=140以下正确的有( ) A、SSE=2 B、SSE=7 C、FA78 D、MSE=0.1667 E、因素A的作用显著 三、填空题 1、方差分析的英文缩写为:_____________________________________________________。 2、方差分析认为数据间的差异来自:__________________________和_________________________________________________ 。 3、单因素方差分析中,A共6个水平,SSA=___________________________;自由度df=______________________________。 4、单因素方差分析问题中,F= 12.24,P-value=0.00566,表示拒绝原假设的概率为____________。 5、因素A设4水平,因素B设6水平的双因素方差分析中,SSE的自由度为____________________。 6、某一双因素方差分析的计算结果为:F A =3.2101,FB=4.2254,P-value依次为0.1213,0.01023,那么结论应为_________________________________________________________________________________。 四、判断题 1、水平间的方差只包含有系统性因素。 ( ) 2、F分布的第一自由度越小,它右偏态的程度越大。 ( ) 3、方差分析,将总离差平方和分解为水平项离差平方和与误差项平方和,同时也将总的自由度分解为各个平方和的自由度之和。 ( ) 4、单因素方差分析的检验统计量为 FSSASSE ( ) 5、方差分析输出结果总的P-value越大,越应该拒绝原假设。 ( ) 6、方差分析每个水平下设置的样本容量都必须相等。 ( ) 7、双因素方差分析的两个因素间不会产生交互作用。 ( ) 8、因素A共6个水平,因素B共5个水平,那么随机误差项的自由度为20 ( ) 9、如果方差分析的结论是拒绝原假设的话,意味着所有水平之间存在着显著差异。 ( ) 10、如果统计量F =12.25 ,而F crit为3.054,那么因素的作用不显著。 ( ) 五、简答题 1、方差分析的原理 2、方差分析的原假设及其被拒绝的意义。 3、双因素方差分析中SSA 、SSB、SSE与SST的内容及关系 4、方差分析的步骤 六、计算分析题 1、设有五种治疗荨麻疹的药,为了比较它们的治疗效果,将30个病人随机分为5组,每组6人进行试验,结果如下: 药物A A1 A2 A3 A4 A5 治 6 4 6 7 9 愈 8 6 4 4 4 总和 T=169 天 7 6 4 6 5 数 7 3 5 6 7 总评均 x5.63 xij 10 5 3 3 7 8 6 2 5 6 和Ti 46 30 24 31 38 平均xi 平方和 7.675.004.005.176.33 362 158 106 171 256 1053 试检验五种药物的疗效有无显著差异(0.01) 2、对四种小麦进行产量(单位:kg/小区)的对比实验,假设各小区地力相同,在同样的管理条件下,得如下数据: 品种 A1 A2 A3 A4 序号 1 32.3 33.3 30.8 29.3 2 34.0 33.0 34.3 26.0 3 34.3 36.3 32.3 29.8 4 35.0 36.9 5 36.5 分析不同小麦品种小区产量有无显著差异(0.01)。 3、某种商品不同的装潢,在五个地区销售,资料如下: 地区(因素 装潢(因素A) B) A1 A2 A3 B1 41 45 34 B2 53 51 44 B3 54 48 46 B4 55 43 45 B5 43 39 51 检验商品的不同装潢和在不同地区销量之间是否有显著差异(0.05) 第5章 参 一、单选择题 1、C 2、E 3、D 4、A 5、A 6、B 7、D 8、D 二、多项选择题 1、ACE 2、ABCDE 3、ADE 4、ABE 5、BCDE 三、填空题 1、ANOVA 2、系统误差、随机误差 3、(xjx)、5 4、0.00566 5、15 6、A的作用不显著,B的作用显著 四、判断题 1、(×) 2、(√) 3、(√) 4、(×) 5、(×) 6、(×) 7、(×) 8、(√) 9、(√) 10、(×) 五、简答(略) 六、计算题 1、因为,FA5.554.18F0.01(4,25),所以,不同药物的疗效间存在显著差异。 2、因为,F.34716639.05763.59F0.05(3,11),所以不同品种小麦的小区产量将存在显著差异。 36.1688341174.133521.324.46F0.05(2,8),所以,不同装潢间的销量差异不显著。 224.5943823、因为,FA又因为,FB191.005541.70103.84F0.05(4,8),所以,不同地区间的销量差异不显著。 224.59438第6章 相关与回归分析 一、单项选题题 1、当自变量X减少时,因变量Y随之增加,则X和Y之间存在着( ) A、线性相关关系 B、非线性相关关系 C、正相关关系 D、负相关关系 2、下列属于函数关系的有( ) A、身高与体重之间 B、广告费用支出与商品销售额之间 C、圆面积与半径之间 D、施肥量与粮食产量之间 3、下列相关程度最高的是( ) A、r=0. B、r=-0.93 C、r=0.928 D、r=0.8 4、两变量x与y的相关系数为0.8,则其回归直线的判定系数为( ) A、0.80 B、0.90 C、0. D、0.50 5、在线性回归模型中,随机误差项被假定服从( ) A、二项分布 B、t分布 C、指数分布 D、正态分布 6、物价上涨,销售量下降,则物价与销售量之间的相关属于( ) A、无相关 B、负相关 C、正相关 D、无法判断 7、相关分析中所涉及的两个变量( ) A、必须确定哪个是自变量、哪个是因变量 B、都不能为随机变量 C、都可以是随机变量 D、不是对等关系 8、单位产品成本y(元)对产量x(千件)的回归方程为:yt1000.2xt,其中“—0.2”的含义是 ( ) A、产量每增加1件,单位成本下降0.2元 B、产量每增加1件,单位成本下降20% C、产量每增加1000件,单位成本下降20% D、产量每增加1000件,单位成本平均下降0.2元 E、产量每增加1000件,单位成本平均下降20% 二、多项选择题 1、下列说法正确的有( ) A、相关分析和回归分析是研究现象之间相关关系的两种基本方法 B、相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况 C、回归分析可以不必确定变量中哪个是自变量,哪个是因变量 D、相关分析必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量 E、相关分析中所涉及的变量可以都是随机变量,而回归分析中因变量是随机的,自变量是非随机的 2、判定现象之间有无相关关系的方法有( ) A、计算回归系数 B、编制相关表 C、绘制相关图 D、计算相关系数 E、计算中位数 3、相关关系按相关的形式可分为( ) A、正相关 B、负相关 C、线性相关 D、非线性相关 E、复相关 4、在直线回归方程yt=1+2Xt中,回归系数2的数值( ) A、表明两变量之间的平衡关系 B、其正、负号表明两变量之间的相关方向 C、表明两变量之间的密切程度 D、表明两变量之间的变动比例 E、在数学上称为斜率 5、下列那些项目属于现象完全相关( ) A、r=0 B、r= —1 C、r= +1 D、y的数量变化完全由X的数量变化所确定 E、r=0.98 6、在回归分析中,要求所涉及的两个变量x和y( ) A、必须确定哪个是自变量、哪个是因变量 B、不是对等关系 C、是对等关系 D、一般来说因变量是随机的,自变量是非随机变量 E、y对x的回归方程与x对y的回归方程是一回事 7、下列有相关关系的是( ) A、居民家庭的收入与支出 B、广告费用与商品销售额 C、产量与单位产品成本 D、 学生学习的时间与学习成绩 E、学生的身高与学习成绩 8、可决系数r2=86.49%时,意味着( ) A、自变量与因变量之间的相关关系密切 B、因变量的总变差中,有80%可通过回归直线来解释 C、因变量的总变差中,有20%可由回归直线来解释 D、相关系数绝对值一定是0.93 E、相关系数绝对值一定是0. 三、填空题 1、相关系数r的取值范围为 。 2、可决系数的取值范围为 。 3、客观现象之间的数量联系存在着两种不同的类型:一种是 关系;另一种是 关系。 4、已知r=0.90,x=20,y=40,又知y是x的3倍,则Y对X的回归直线方程为 。 5、若已知(xx)2是(yy)2的2倍,(xx)(yy)是(yy)2的1.2倍,则相关系数r等于 。 四、判断题 1、当自变量X按一定的数量变化时,因变量Y也相应随之等量变化,则X和Y之间存在着线性相关关系。( ) 2、可决系数是判断回归模型拟合优度优劣最常用的数量指标,但不是最佳指标。( ) 3、样本相关系数是总体相关系数的一致估计量。( ) 4、若有线性回归方程Y(元)=34.5+7.8X(元),则表明当X增加一元时,Y增加7.8元。( ) 5、若有线性回归方程Y(元)=160-52.5X(件),则表明当X增加一件时,Y平均减少52.5元。( ) 6、可决系数越大,则模型对样本的拟合程度越差。( ) 7、可决系数r2=0时,SSE=SSR。( ) 8、数学上可以证明,S 2e= 2tn2是2的无偏估计。( ) 9、回归估计标准误S越小,表明实际观测点与所拟合的样本回归线的离差程度越大,即回归线的代表性较 差。( ) 10、r=0时,表明两个变量之间不存在任何形式的相关关系。( ) 11、对于简单线性回归模型,相关系数r的平方等于可决系数。( ) 12、变量间的相关关系也就是函数关系。( ) 13、逻辑上没有关系,但却在数值上相互依存的相关关系称为“伪相关”。( ) 14、最小二乘法估计的样本回归直线yt=1+2Xt一定通过点(X,Y)。( ) 15、所有样本观测点全部在最小二乘法估计的样本回归直线yt=1+2Xt上。( ) 16、最小二乘法适用的前提是Y与X之间的关系确为Y=a+bX。( ) 17、对于可划为线性模型的非线性回归问题,一般先划为线性模型,然后再用最小二乘法估计参数。( ) 18、一元线性回归方程的回归系数2的符号与相关系数的符号完全一致。正号表示正相关,负号表示负相关。( ) 19、Y倚X的回归方程与X倚Y的回归方程是一回事。( ) 20、r=0时,只是表明两变量之间不存在线性相关关系,有可能存在非线性相关关系。( ) 21、相关分析中,所涉及的两个变量都可以是随机变量。( ) 22、相关系数是在所有情况下,用来说明两个变量相关关系密切程度的统计分析指标。( ) 23、两个变量中不论假定哪个变量为自变量X,哪个变量为因变量Y,都只能计算出一个相关系数。( ) 五简答题 1、试举例说明什么是相关关系?什么是函数关系? 2、试述回归分析中误差项的标准假定。 3、什么是单相关、复相关和偏相关?什么是线性相关和非线性相关?请各举一个你熟悉的例子说明。 4、相关分析与回归分析之间的联系与区别? 六、计算分析题 1、某商店想了解职工工龄长短与月工资的关系,调查了10名售货员的工龄和月工资情况。设工龄为X(年),月工资为Y(元)。经计算,已得到以下结果: y=0, x2=532 , xy=4754 x=70,y2=42816,要求:(1)计算相关系数r;(2)拟合以月工资为因变量的直线回归方程,并指出其回归系数的意义;(3)计算判定系数,并评价拟合优度。 2、设销售收入X为自变量,销售成本Y为因变量。现根据某百货公司10个月的有关资料计算出以下数据:(单位:万元) 22XYX-)=4250, =6.5, -)=2620, Y=5.5, (Yt-Y)(Xt-X)(X(Ytt=3300 要求;(1)计算简单相关系数,拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释;(2)计算可决系数和回归估计标准误差;(3)对2进行显著性水平为5%的显著性检验。 3、从某大学统计系的学生中随机抽取16人,对数学和统计学的考试成绩(单位:分)进行调查,结果如下: 学生编号 数学成绩 统计学成绩 学生编号 数学成绩 统计学成绩 1 81 72 9 83 78 2 90 90 10 81 94 3 91 96 11 77 68 4 74 68 12 60 66 5 70 82 13 66 58 6 73 78 14 84 87 7 85 81 15 70 82 8 60 71 16 54 46 要求:(1)根据上表数据绘制散点图,判断数学考试成绩与统计学考试成绩之间的关系形态;(2)计算数学考试成绩与统计学考试成绩之间的简单相关系数;(3)对相关系数的显著性进行检验(取=0.05),并说明数学考试成绩与统计学考试成绩之间的关系密切程度;(4)拟合统计学考试成绩对数学考试成绩的回归直线;(5)对回归方程的线性关系和回归系数进行显著性检验(取=0.05);(6)确定数学考试成绩为80分时,统计学考试成绩置信度为95%的预测区间。 4、某企业生产某种产品的产量和单位成本资料如下: 月 份 1 2 3 4 5 6 产量(千件) X 4 6 8 7 8 9 单位成本(元/件) Y 73 72 71 72 70 69 要求:(1)计算简单相关系数;(2)确定单位成本对产量的一元线性回归模型,并指出其回归系数的意义;(3)对该模型拟合优度进行评价;(4)分别对回归系数2及回归方程进行显著性水平为5%的显著性检验;(5)计算估计标准误差,并以95%的置信度求产量为10000件时单位成本的预测区间。 5、随机抽取某地12个居民家庭为样本,调查得到有关人均收入与食品支出的资料如下: 单位:元 编号 家庭人均生活费收入 人均食品支出 1 82 75 2 93 85 3 105 92 4 130 105 5 144 120 6 150 120 7 160 130 8 180 145 9 200 156 10 270 200 11 300 200 12 400 220 要求:(1)分析判断人均生活费收入与人均食品支出之间是否存在相关关系?其相关程度如何? (2)检验其相关系数(=0.05); (3)拟合适当的回归模型,并对该模型的拟合优度作出评价。 6、在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格 与需求量进行观察,得到如下一组数据: 价格x (元) 10 6 8 9 12 11 9 10 12 需求量y(吨) 60 72 70 56 55 57 57 53 54 要求:(1)计算价格与需求量之间的简单相关系数; (2)拟合需求量对价格的回归直线,并解释回归系数的实际意义; (3)计算判定系数r2和估计标准误S,分析回归直线的拟合程度; 7 70 (4)对回归方程的线性关系和回归系数进行显著性检验(取=0.05),并对结果作简要分析。 7、某农业科学院研究院在土质、面积、种子完全相同的条件下。测得8块试验田种植的小麦产量Y(千克)与化肥施用量X(千克)的数据如下表: 小麦产量Y(千克) 266 340 356 372 3 404 420 435 化肥施用量X(千克) 15 18 21 24 27 30 33 36 要求:(1)建立小麦产量Y对化肥施用量X的直线回归方程; (2)求方差2的无偏估计(即求S2); (3)检验回归效果是否显著(取=0.05) (4)求X=40千克时,小麦产量Y的预测区间。 8、从某项n=20的资料中已经求得: x=124.00(m2); y=67.80(千元); Lxx=(xx)2=2080; Lyy=(yy)2=71.20; Lxy=(xx)(yy)=296.00 要求:(1)计算相关系数r;(2)估计回归系数1、2; (3)计算估计标准误差。 9、已知两个变量,即亩产量(y)和施肥量(x)。假定两变量间存在线性关系,并已知:n=10,x=27, y=380, 222=985.5, x=101.2,y=12995, xy(yy2)=337,t=t0.10=1.86 t22要求:(1)建立亩产量对施肥量的线性方程,并说明回归系数的含义; (2)计算估计标准误S,并说明其含义; (3)计算相关系数r及判定系数r2,并说明其含义; (4)当施肥量Xf=35时,试以90%的置信度预测亩产量的区间。 10、下面是7个地区2000年的人均GDP和人均消费水平的统计数据: 地 区 人均GDP(元) 人均消费水平(元) 北京 22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州 2662 1608 陕西 4549 2035 要求:(1)以人均GDP做自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态; (2)计算两个变量之间的线性相关关系,说明两个变量之间的关系强度; (3)利用最小二乘法求人均消费水平对人均GDP的线性回归方程,并解释回归系数的实际意义; (4)计算判定系数,并解释其意义; (5)检验回归方程线性关系的显著性(=0.05); (6)如果某地区的人均GDP为5000元,预测其人均消费水平(点预测); (7)求人均GDP为5000元时,人均消费水平在95%置信水平下的预测区间。 *11、某农场通过试验取得早稻收获量与春季降雨和春季温度的如下数据: 收获量(公斤/公顷)y 1500 2300 3000 4500 4800 5000 5500 25 33 45 105 110 115 120 降雨量(mm)x1 温度(℃)x2 6 8 10 13 14 16 17 要求:确定早稻收获量对春季降雨和春季温度的二元线性回归方程,并解释回归系数的实际含义。 第6章 参 一、单项选择题 1、D 2、C 3、B 4、C 5、D 6、B 7、C 8、D 二、多项选择题 1、ABE 2、BCD 3、CD 4、BCDE 5、BCD 6、ABD 7、ABCD 8、ABD 三、填空题 1、-1≤r≤+1 2、0≤ r2 ≤1 3、函数 相关 4、-14+2.7X 5、 1.2 2四、判断题 1、√ 2、√ 3、√ 4、× 5、√ 6、× 7、× 8、√ 9、× 10、× 11、√ 12、× 13、√ 14、√ 15、× 16、√ 17、√ 18、√ 19、× 20、√ 21、√ 22、× 23、√ 五、1、答:相关关系是指当一个或几个相互联系的变量取一定值时,与之相对应的另一变量的值虽然不确定,但它仍按一定规律在一定范围内变化。相关关系是一种非确定性的关系。例如收入与支出的关系。函数关系是指当一个或几个变量取一定的值时,另一个变量有确定值与之相对应。函数关系是一种确定性的关系。例如圆面积与半径之间的关系。 2、答:在回归分析中,对误差项共有五条标准假定:(1)误差项的期望值为0;(2)误差项的方差为常数;(3)误差项之间不存在序列相关关系,其协方差为0;(4)自变量是给定的变量,与随机误差项线性无关;(5)随机误差项服从正态分布。 3、答:单相关,是指两个现象的相关,即一个变量对另一个变量的相关关系,例如销售量与销售价格之间的关系;复相关,是一个变量对两个或两个以上其它变量的相关关系,例如商品销售量与销售价格及其广告支出额之间的关系;偏相关,是指在某一现象与多种现象相关的场合,当假定其它变量不变时,其中两个变量的相关关系,例如假定销售价格不变,商品销售量与广告支出额之间的关系。 当两种相关现象之间的关系大致呈现为线性关系时,称之为线性相关,例如居民收入与储蓄之间的关系;当两种相关现象之间的关系不表现为线性关系而是近似于某种曲线方程的关系,称为非线性相关,例如失业率和通货膨胀率之间的关系。 4、答:所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。所谓相关分析,就是用一个指标来表明现象间相互依存关系的密切程度和方向。相关分析和回归分析有着密切的联系,它们不仅有共同的研究对象,而且在具体应用时互相补充。相关分析依靠回归分析表明现象数量相关的具体形式,回归分析依靠相关分析表明现象数量变化的相关程度。相关分析与回归分析都是定量分析的手段。 相关分析和回归分析在研究目的和方法上有明显区别。(1)相关分析研究变量之间相关的方向和相关的程度,不指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分 析研究变量之间相互关系的具体形态,选择一个合适的数学模型,从而为估算和预测提供一个重要的方法。(2)相关分析中的变量不必区分哪个是自变量,哪个是因变量,可以都是非随机的;而回归分析要确定哪个是自变量,哪个是因变量,一般而言因变量是随机的,自变量是非随机的。 六、计算题 1、解:(1)r = nxyxynx(x)22ny(y)22 = 10475470010532(70)21042816(0)2=0.9814 (2)2=(10×4754-70×0)/(10×532-702)=6.5238 1=(0/10)-6.5238×(70/10)=18.3334 yt =18.3334+6.5238 xt 回归系数表示:工龄每增加一年,月工资将平均增加6.5238元。 (3)判定系数r2=(0.9814)2=0.9631, 这说明在月工资的总变差中,有96.31%可由工龄与月工资之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。 2、解:(1)r = (xx)(yy)= 22(xx)(yy)3300=0.98 425026202=(xx)(yy)3300==0.7765 24250(xx)1=5.5-0.7765×6.5=0.4528 yt =0.4528+0.7765 xt 回归系数表示:销售收入每增加一万元,销售成本将平均增加0.7765万元。 (2)r2=0.982=0.9779 由r2=1-S= SSE,推出SSE=57.902 SSTSSE57.902==2.69(万元) n2102(3)回归系数的检验: H0:2=0, H1:20 t= 220S= 0.7765S=0.7765÷(2.69/4250)=18.82 2i(xx)t=18.82>t=2.306,拒绝H0,回归系数显著。 223、解:(1)略;(2)r =0.78476;(3)t=4.737> t=2.1448,r 显著;(4) 2yt =5.422+0.9427xt ;(5)F=2.4445>F=4.60,回归关系显著;t=4.737>t=2.1448,回归系数显 22著;(6)预测区间:[61.9;99.7]分。 4、解:(1)x=42, y=427, x2=310 ,y2=30399, xy=2977 n=6 r= nxyxynx(x)22ny(y)22=-0.9115 ˆnxyxy=-0.75 (2)22nx2xˆ1ynˆ=76.42 2xnyt =76.42-0.75xt,回归系数表示产量每增加1千件,单位成本平均下降0.75元。 (3)r2=(-0.9115)2=0.8308,这说明在单位成本的总变差中,有83.08%可由产量与单位成本之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。 (4)对回归系数的检验: H0:2=0, H1:20 S= y21y2xyn2= 3039976.42427(0.75)2977=0.32(元/件) 62S2S(xtx)0.3220.32x2(x)/n2 = 310(42)2/6 =0.08 t 2 20 S 2 =-0.75/0.08 =-9.375 |t|=9.375>t0.025(4)=2.77,拒绝原假设,表明产量对单位成本的影响是显著的 对回归方程的检验: H0:2=0, H1:20 r2(n2) F==19.65>F0.05(1,4)=7.71,拒绝H0,表明产量与单位成本之间的线性关系是显著的,回 1r2归方程有效 (5)S= y21y2xyn2=0.32(元/件) 222(xx)x(x)ttt/n=310-(42×42)/6=16 Sef=S11n(xx)2(xfx)21(107)2=0.321616=0.2592 yf=76.42-0.75×10=68.92 预测区间为: yft(n-2) Sef=68.922.77×0.2592 2即:[68.20;69.](元/件) 5、解:(1)r=0.97,人均生活费收入和人均食品支出之间存在高度正相关关系。 (2)t= rn21r2=12.6>t0.025(10)=2.2281,r通过显著性检验。 (3)yt =46.56+0.492 x 拟合优度r2=0.9409,这说明在人均食品支出的总变差中,有94.09%可由人均生活费收入与人均食品支出之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。表明该回归模型是合适的。 6、解:(1)r =-0.85375 (2)yt =.74-3.1209xt,回归系数表示价格每增加1元,需求量平均下降3.1209吨。 (3)r2=(-0.85375)2=0.72,这说明在需求量的总变差中,有72.%可由价格与需求量之间的线性关系来解释,二者之间有较强的线性关系,回归直线拟合的较好。 估计标准误S=4.0269(吨)。S数值不大,说明回归直线拟合的较好。 (4)线性关系的检验: H0:2=0, H1:20 计算检验统计量:F= S回/1=(SSR/1)÷(SSE/n-2) S残(/n2)SSE=y-21y-xy=36968-.74×604-(-3.1209)×55 2=129.7276 SSE由r2=1-,推出SST=SSE/(1-r2)=129.7276/(1-0.72)=478.523 SSTSSR=SST-SSE=478.523-129.7276=348.7954 F=(348.7954/1)÷(129.7276)/(10-2)=21.5094 r2(n2)0.728(或:F===21.5094) 21r10.72检验统计量F=21.5094>F0.05(1,8)=5.32,拒绝H0,说明需求量与价格之间的线性关系是显著的。 回归系数的检验: H0:2=0, H1:20 检验统计量︴t︴=4.6753>t0.025=2.3060, 拒绝H0,回归系数显著,即价格对需求量的影响是显著的。 7、解:(1)x=204, y=2982, x2=5580, xy=78657,n=8 y2= nxyxy8786572042982==6.92 22285580204nxxˆ2ˆ1ynˆ2x=29826.92204=196.29 n88小麦产量Y对化肥施用量X的直线回归方程为:yt =196.29+6.92 x (2)2的无偏估计: n2n21131638196.2929826.92786571994.78==332.46 826n2S 2e= 2t(yy)y== 2t21y2xy(3)H0:2=0, H1:20 根据已知数据计算得 SST=y2t(yt)2n298221131638=20097.5, 8SSE=et21994.78 SSR=SST-SSE=20097.5-1994.78=18102.72, F= S回/1=(SSR/1)÷(SSE/n-2)=18102.72÷(1994.78/6)=54.45 S残(/n2)F=54.45>F0.05(1,6)=5.99,拒绝原假设,说明Y对X的回归效果非常显著。 (4)yf=196.29+6.92 ×40=473.09,t0.025(6)=2.4469, (xx)x22(x)2n20425580=378 8S= y21y2xyn2= 1131638196.2929826.9278657 82=18.23 21(xfx)1(4025.5)2Sef=S1=18.23×1=23. 28378n(xx)预测区间为:yft(n-2) Sef=473.092.4469×23. 2即:[415.25,530.93] 8、解:(1)r= LxyLxxLyy=0.7692 (2)2= LxyLxx=0.1423 1=67.8-0.1423×124=50.1548 (3)SST= Lyy=(yy)2=71.20 由r2=1-S= SSESSE,得:0.76922=1-,SSE=29.07 SST71.2SSE=1.27(千元) n29、解: 22(1)2= xy/x=985.5/101.2=9.7381 1=380-9.7381×27=117.0713 yt =117.0713+9.7381xt 回归系数表明:施肥量每增加1个单位,亩产量将平均增加9.738个单位。 2et337n2102(2)S=位。 =65.09,表明yt的实际观察值与其估计值之间的平均离差为65.09个单 (3)r = xy/xy=0.8594;r=0.7386,表明在亩产量的总变差中,有73.86%可以由施肥量同亩产量的依存关系来解释,只有26.14%属于随机因素的影响。因此,这条回归直线是基本合适的。 (4)yf=117.0713+9.7381 ×35=457.9048,t0.05(8)=1.86, 22(xx)nx10101.21012 22S= et2n2337=65.09, 1021(3527)21101012 21(xfx)Sef=S1=65.09×2n(xx)=70.2019 预测区间为:yft(n-2) Sef=457.90481.86×70.2019 2即:[327.33;588.48] 10、解:(1)散点图(略),二者之间为高度的正相关关系。 (2)r =0.,二者之间为高度的正线性相关关系。 (3)估计的回归方程为:yt =734.6928+0. xt。回归系数2=0.表示人均GDP每增加1元,人均消费水平将平均增加0.元。 (4)判定系数r2=0.。表明在人均消费水平的变差中,有99.6259%是由人均GDP决定的。 (5)检验统计量F=1331.692>F=6.61,拒绝原假设,线性关系显著。 (6)y5000=734.6928+0.×5000=2278.1078(元) (7)预测区间:[1580.463;2975.750]元。 *11、解:(此题供参考,借此了解偏回归系数的含义) yt=-0.394+14.924 x1+218.447 8x2,2=14.924表示假定温度不变,降雨量每增加1mm,早稻产量 将平均增加14.924公斤/公顷;3=218.4478表示假定降雨量不变,温度每增加1℃,早稻产量将平均增加218.4478公斤。 第8章 抽样与抽样估计 一、单项选择题 1、实际工作中,小样本是指( ) A、样本容量大于30的样本 B、样本容量小于30的样本 C、样本容量等于30的样本 D、样本容量小于等于30的样本 2、从5个字母中随机抽取2个字母作为样本,采用重复抽样,考虑顺序,则可能的样本个数为( ) A、10个 B、20个 C、25个 D、30个 3、当总体方差未知,且样本容量小于30时,进行正态总体均值的区间估计应采用的临界值为( ) A、F值 B、Z值 C、t值 D、x2值 4、当总体方差已知,无论样本容量n的大小如何,进行正态总体均值的区间估计应采用的临界值为( ) A、F值 B、Z值 C、t值 D、x2值 5、在总体内部情况复杂、且各单位之间差异程度大、单位数又多的情况下,宜采用( ) A、等距抽样 B、整群抽样 C、简单随机抽样 D、类型抽样 6、根据重复抽样的资料,甲单位工人工资方差为25,乙单位为100,乙单位抽的人数比甲单位多3倍,则抽样平均误差( ) A、甲单位较大 B、甲单位较大 C、无法判断 D、甲、乙单位相同 7、某学校在全校学生中随机重复抽取100人调查身高,计算出抽样平均误差为5cm。如果改用不重复抽样方法,在其他条件不变时,其抽样平均误差将会( ) A、大于5cm B、小于5cm C、等于5cm D、不确定 8、纯随机重复抽样条件下,样本容量扩大为原来的9倍,其它条件不变,则( ) A、抽样允许误差不变 B、抽样允许误差缩小为原来的九分之一 C、抽样允许误差缩小为原来的三分之一 D、抽样允许误差增大为原来的九倍 二、多项选择题 1、影响抽样平均误差的因素主要有( ) A、总体方差或标准差 B、样本容量 C、抽样方法 D、抽样组织方式 E、抽样的对象 2、下列说法中错误的有( ) A、抽样误差是不可避免的 B、抽样误差是可以避免的 C、抽样误差可以计算但不能加以控制机 D、抽样误差是由于抽样的随机性而产生的样本估计量与总体参数之间的代表性误差 E、抽样误差是指登记性误差 3、评价估计量的优劣常用下列三个标准( ) A、一致性 B、有效性 C、合理性 D、代表性 E、无偏性 4、抽样推断过程包括相互联系的三项内容( ) A、随机抽样 B、统计估计 C、假设检验 D、抽样精度 E、置信度 5、下列说法正确的有( ) A、总体参数是唯一的、确定的,但又是未知的 B、总体参数是随机变量 C、样本统计量是随机变量 D、样本统计量是唯一的、确定的 E、样本所包含的总体单位个数称为样本容量 6、概率抽样最基本的组织方式有( ) A、简单随机抽样 B、分层抽样 C、等距抽样 D、整群抽样 E、配额抽样 7、抽样估计中的抽样误差( ) A、无法避免 B、可以控制 C、只能在估计结束才能知道 D、可以计算 E、不可控制 8、抽样平均误差是指( ) A、所有可能样本的样本指标与总体指标的平均离差 B、所有可能样本的样本指标对总体指标的标准差 C、已抽出样本的标准差 D、等价于极限误差 E、已抽出样本的平均差 三、填空题 1、概率抽样也叫随机抽样,是指按照 原则抽取样本。 2、在其他条件不变的情况下,如果允许误差缩小为原来的二分之一,则样本容量扩大为原来的 倍。 3、当n趋近于无穷大时,卡方分布趋近于 分布。 四、判断题 1、抽样估计中所谓的抽样误差,是指系统误差。( ) 2、编制抽样框,是实施抽样的基础。( ) 3、F分布不以正态分布为其极限分布,它总是一个正偏态分布。( ) 4、若总体平均数和方差有限,当样本容量n充分大时,无论总体分布形式如何,样本平均数近似服从t分布。( ) 5、根据中心极限定理,当n趋近于无穷大时,二项分布趋近于正态分布。( ) 6、在其他条件不变的情况下,扩大抽样极限误差会降低估计的置信度。( ) 7、抽样平均误差越小,则样本对总体的代表性越小。( ) 8、在其他条件相同的情况下,不重复抽样的抽样误差总是大于重复抽样的抽样误差。( ) 9、总体方差是影响抽样数目的因素之一。在其他条件不变的情况下,总体单位的差异程度大,则应少抽,反之可以多抽一些。( ) 10、重复抽样所产生的样本是彼此的。( ) 11、总体参数的数值是客观存在的确定的,但又是未知的,需要用样本资料去估计。( ) 12、样本统计量不含未知参数,它是随样本不同而不同的随机变量。( ) 13、全面调查也可产生代表性误差。( ) 14、在其他条件不变的情况下,提高估计精度会提高估计的置信度。( ) 15、样本方差S 2n11= n1(xi1nix)2是总体方差的无偏估计量。( ) 16、估计量是参数的无偏估计,可以保证它对参数的估计没有系统偏差。( ) 17、样本比例是总体比例的无偏估计。( ) 18、登记性误差是抽样调查所特有的。( ) 19、抽样推断是归纳推断法中的一种。( ) 20、参数估计和假设检验是抽样推断的两个组成部分。( ) 五、简答题 1、什么是抽样框?抽样框有哪三种主要形式? 2、什么是抽样平均误差、抽样方差、抽样极限误差?它们之间有何关系? 3、必要抽样数目受哪些因素影响? 4、什么叫估计量?评价估计量优劣的标准有哪三项? 5、点估计常用的方法有哪两种?其基本思想是什么? 六、计算分析题 1、某电池的寿命(单位:分钟)的95%置信区间是430<μ<470。假设这个结果是根据一个样本容量为100的样本得出的。试问: (1) 样本的均值是多少 (2) 样本的标准误差是多少 (3) 如果置信区间419<μ<481是从相同样本数据得出的,置信度是多少(置信度为68.27% 90% 95% 95.45% 99.73%时,正态分布概率值分别是(1 1.5 1.96 2 3) 2、调查公司想要估计全日制的大学生每周花在看电视上的时间(单位:小时)平均有多少小时。当极限误差为0.25小时时,计算估计均值所需要的样本容量。(假设想要达到的置信度为95%。标准差估计为1.87小时。) 3、一个样本中包含75台若干年前购买的电视机。这些电视机的置换时间为12.2年,标准差为1.1年。试对那一时期所有电视机的平均置换时间构建一个95%的置信区间。怎样才能减小这一区间。 4、一个样本容量为400的随机样本取自均值μ和标准差σ均未知。已算出 x2280, x238532。求μ的95%的置信区间。 5、当你选购一种商品时,考虑得最多的是什么?是价格还是商品的质量?某市场调查公司调查了2000名成年人,结果又%的人说他们主要根据价格做出购买决策。 (1) 试对根据价格做出购买决策的成年人的真正百分率构造95.45%的置信区间。 (2) 对此区间做出解释 (3) 如果将置信度从95.45%降到90%,(1)中的置信区间将会发生什么变化。 6、一个研究者想要估计年龄在12-18岁之间、在学校使用计算机的学生比例。如果他想要99.73%的把握程度相信极限误差为5%,必须要对多少名随机选择的学生进行调查? (1) 假设我们将先前的一项研究中得出的百分比82%作为p的估计值 (2) 假设我们事先没有信息可以提供p的可能值 7、某厂对当年生产的产品进行质量检查,从50000件产品中随机抽取200件产品,发现其中有15件不合格,试应用恰当的方法在95.45%(Z=2)的概率保证下,对全部不合格产品作可能范围估计。 8、某进出口公司出口一种名茶。按规定这种茶叶每包重量应不低于150克,现用不重复抽样的方法抽取1%进行检验,其结果如下 每包重量(克) 包数(包) 148—149 149—150 150—151 151—152 合计 要求: ①试以0.9973的概率(Z=3)估计这批茶叶平均平均每包的重量范围。以便确定是否达到规定要 求。 ②以95%的把握程度估计这批茶叶包装合格率的范围 9、某地区粮食播种面积共8000亩。随机抽取100亩进行调查,结果平均亩产量为580公斤,亩产量的标准差为40公斤,试以99.73%的置信度(Z=3)估计该地区粮食平均亩产量的可能范围和粮食总产量的可能范围。 10、一个容量为n=16的随机样本来自总体均值和方差未知的正态分布总体。如果样本有均值x27.9和标准差s=3.23,则总体均值的95%的置信区间是多少?在重复研究中,n多大时,才能使得总体的允许误差为1.25?这个样本容量数,对于95%的置信区间要求的允许误差为1.25能达到吗? 11、一个从事市场研究的公司想知道某市内至少有一个成员看过某种报纸广告的家庭占多大比例。为了估计这个比例,首先要确定抽多少个家庭做调查。该公司希望以90%的置信水平对这个比例作出估计,并使估计值处在真正比例附近0.04范围内。在一个由15个家庭组成的样本中,有35%的响应者指出他们家中有某个人看过这种广告,试问应取多大的样本? 12、设已知某果园某种果树单株产量按正态分布。随机抽取6株计算其年产量(单位:kg)为:221.2 190.4 201.9 205 256.1 236 试以95%的置信水平,估计全部果树的平均年产量的置信区间。 13、某灯泡厂为了使生产的螺丝口和卡口灯泡的比例能很好地适应用户需要,从全市所有电灯中随机抽出1500盏灯作为样本。查得其中螺丝口灯头占15%,试以95%的置信度系数求卡口灯头的真正百分比的置信区间。 第8章 参 一、单项选择题 1、B 2、C 3、C 4、B 5、A 6、D 7、B 8、C 二、多项选择题 1、ABCD 2、BCE 3、ABE 4、ABC 5、ACE 6、 ABCD 7、BD 三、填空题 1、随机 2、4 3、正态 10 20 50 20 100 四、判断题 1、× 2、√ 3、√ 4、× 5、√ 6、× 7、× 8、× 9、× 10、√ 11、√ 12、√ 13、× 14 、× 15、√ 16、√ 17、√ 18、× 19、√ 五、(要点) 1、抽样框是包含全部抽样单位的名单框架。主要有三种形式:名单抽样框;区域抽样框;时间表抽样框。 2、样本估计量的标准差定义为抽样平均误差;抽样平均误差的平方为抽样方差;一定概率下抽样误差的可能范围,称为极限误差 3、(1)总体方差(或总体标准差) (2)允许误差范围 (3)置信度 (4)抽样方法 (5)抽样组织形式 4、样本指标又称样本统计量与或估计量。 标准为:无偏性;有效性;一致性 5、一是矩估计法。其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛与总体矩。因此,只要总体x的k阶原点矩存在,就可用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。 二是极大似然估计法。其基本思想是:设总体分不函数形式已知,但又未知参数,未知参数可以取很多值,在未知参数的一切可能取值中选一个使样本观测值出现的概率为最大的参数作为估计量。 六、计算题 1、(1)xx430,x(470430)/220, x20430 解得:x450 (2)xZ(x),即:201.96(x) 2解得:样本的标准误差(x)10.204 (3)如果置信区间419<μ<481是从相同样本数据得出的, 则:x(481419)/231,xZ(x),即31Z10.204 22解得:Z3.043,即:置信度是99.73%。 22、条件分析:本题为估计总体均值时所需的样本容量。由于N不知,视为重复抽样。 z221.9621.872n214.94215(人) 22x0.253、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N不知,视为重复抽样。 所有电视机平均置换时间的置信区间为: xZ(x)xZ(x)222即:12.21.961.11.112.21.9675752 即:[11.95105,12.445]年 怎样减小区间——降低置信度或者增加样本容量! 4、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N不知,视为重复抽样。 xs2x22805.7n400222280x238532x 400nn1399s2(x)0.4n400置信区间为:5.71.960.45.70.784即: [4.916;6.484] 5、(1)P=%,Z22 %36% 2000置信区间:PpZ(P)%22即:[61.85%,66.15%](2)我们有95.45%的把握相信从61.85%到66.15%这个区间实际包含了p的真实值。 (3)此时区间变窄 6、解题分析:此题为估计总体比例时所需的样本容量。由于N不知,故视为重复抽样。 Z/2P(1P)3282%18%(1)n531.36532(名) 2p5%2Z/2P(1P)320.50.5(2)n900(名)2p5%27、条件分析:由于N已知,视为不重复抽样。 首先求不合格产品率的置信区间: 7.5%92.5%200(1) 20050000即:[3.85%;11.15%]7.5%2则全部不合格产品的可能范围为:[3.85%×50000;11.15%×50000],即[1925;5575]件 8、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N可推知,故视为不重复抽样。N=100/1%=10000(包) 样本标准差: s(xx)2n1(148.5150.3)2(151.5150.3)20.8762整批茶叶平均每包重量范 1001围为: xZ(x)xZ222n(1)nN 150.330.87622100(1)150.30.2610010000即:[150.04;150.56],达到了规定要求 (2)样本包装合格率:p7070% 100整批茶叶包装合格率的范围为: PpZ(P)pZ22P(1-P)n(1)nN 70%1.9670%30%100(1)70%8.94%10010000即:[61.06%;78.94%] 9、条件分析:总体方差不知,但为大样本。此时样本均值近似服从正态分布。由于N已知,故视为不重复抽样 平均亩产量的可能范围:xZ(x)5803240100(1)58011.9210080002 即:[568.08;591.92]公斤总产量的可能范围:[568.08×8000;591.92×8000],即:~公斤之间 10、(1)条件分析:正态总体、总体方差不知,且为小样本。此时样本均值服从自由度为16-1的t分布。由于N不知,故视为重复抽样 总体均值的置信区间为: xt(x)xt22s3.23227.92.131527.91.72 16n即:[26.18;29.62](2)样本容量: z221.9623.232n25.72622x1.25(3)如果n26 则 2.05953.2321.3 1.2526“允许误差为1.25”不能达到。 11、解题分析:此题为估计总体比例时所需的样本容量。由于N不知,故视为重复抽样。 2Z1P)1.5235%65% /2P(n384.76385(个)22p0.0412、条件分析:正态总体、未知、小样本。此时样本均值服从自由度为6-1的t 分布。 经计算得:x2xn218.43kg;s(xx)2n124.39kg 全部果树平均年产量的置信区间: sxt(x)xtn22 24.39218.432.5706218.4325.596即:[192.84;244.02]公斤 13、p85%,Z1.96,由于N未知,故视为重复抽样 2卡口灯头真正百分比的置信区间: PpZ(p)pZ22P(1-P)85%15%85%1.96n1500 即:[83.19%,86.81%]第九章 统计指数 (一)单选题 1、如果销售额增加10%,零售物价指数下降5%,则销售量( ) A、增加5% B、增加10% C、增加15.79% D、无法判断 2、综合指数是依据以下方式来编制的 A、先对比,后平均 B、先综合,后对比 C、先除后乘 D、先加后除 3、平均指数是依据以下方式来编制的 A、先对比,后平均 B、先综合,后对比 C、先除后乘 D、先加后除 4、通常在指数体系的完整框架中,质量指标指数是以( )计算的。 A、拉氏公式 B、帕氏公式 C、马-埃公式 D、费雪公式 5、通常在指数体系的完整框架中,数量指标指数是以( )计算的。 A、拉氏公式 B、帕氏公式 C、马-埃公式 D、费雪公式 6、某商店销售多种商品,报告期与基期相比销售额未变,但销售量增长了15%,则销售价格指数为( ) A、115% B、100% C、85% D、86.96% 7、编制平均指数的基本问题之一是( ) A、指数化指标的选择问题 B、合理加权问题 C、同度量因素的固定问题 D、以上答案均错 8、用于比较不同地区或国家各种商品价格综合差异程度的指数是( ) A、个体价格指数 B、时间价格指数 C、空间价格指数 D、平均价格指数 9、我国的消费者价格指数(CPI)是采用( )来编制的。 A、固定加权算术平均的形式 B、固定加权调和平均的形式 C、固定加权几何平均的形式 D、简单算术平均的形式 10、采用标准比值法编制综合评价指数时,个体指数的计算方法为( ) A、参评指标标准值比相应指标报告期值 B、参评指标报告期值比相应指标基期值 C、参评指标计划值比相应指标标准值 D、参评指标实际值比相应指标标准值 11、P表示商品价格,q表示商品销售量,则p1q1p0q1的意义是综合反映多种商品的( ) A、销售量变动的绝对额 B、价格变动的绝对额 C、因价格变动额增减的销售额 D、因销售量变动额增减的销售额 12、以个体指数为基础计算总指数的指数形式是( ) A、综合指数 B、平均指数 C、可变构成指数 D、固定构成指数 13、某商品价格发生变化,现在的100元只值原来的90元,则价格指数为( ) A、10.00% B、90.00% C、110.00% D、111.11% 14、某企业职工工资总额,今年比去年减少2%,而平均工资上升5%,则职工人数减少( ) A、3.0% B、10.0% C、75.0% D、6.7% 二、多项选择题 1、以下属于时间指数的是( ) A、股票价格指数 B、计划完成情况指数 C、零售物价指数 D、地区间的价格比较指数 E、工业生产指数 2、以下属于质量指标指数的是( ) A、股价指数 B、物价指数 C、成本指数 D、产量指数 E、销售量指数 3、以下属于数量指标指数的是( ) A、工业生产指数 B、商品销售额指数 C、总产值指数 D、产量指数 E、销售量指数 4、个体指数( ) A、是反映个别现象或个别项目数量变动的指数 B、采用先综合、后对比的方式编制 C、采用先对比、后综合的方式编制 D、也有质量指标指数和数量指标指数之分 E、是总指数的重要形式之一 5、同度量因素的作用有( ) A、“同度量”的作用 B、“平衡”的作用 C、对指数化指标“加权”的作用 D、“平均”的作用 E、以上均对 6、某商店报告期全部商品的销售量指数为120%,这个指数是( ) A、个体指数 B、总指数 C、数量指标指数 D、质量指标指数 E、平均数指数 7、可变构成指数的意义及公式( ) A、可变构成指数反映了各组的变量水平及总体结构两个因素的影响 B、可变构成指数仅反映总体结构的影响 C、可变构成指数的计算公式为: x假定x0f1x0f0 f1f0x0 D、可变构成指数的计算公式为: x1x1f1x0f0 f1f0x0 E、可变构成指数的计算公式为: x1x1f1x0f1 f1f1x假定8、固定构成指数的意义及公式( ) A、固定构成指数反映了各组的变量水平的影响 B、固定构成指数反映了总体结构的影响 C、固定构成指数的计算公式为: x假定x0f1x0f0 f1f0x0 D、固定构成指数的计算公式为: x1x1f1x0f0 f1f0x0 e、固定构成指数的计算公式为: x1x1f1x0f1 f1f1x假定9、结构影响指数的意义及公式( ) A、结构影响指数反映了各组的变量水平的影响 B、结构影响指数反映了总体结构的影响 C、结构影响指数的计算公式为: x假定x0f1x0f0 f1f0x0 xfxfxD、结构影响指数的计算公式为: 11100f1f0x0 x1x1f1x0f1E、结构影响指数的计算公式为: f1f1x假定 10、加权总指数的编制方式有( ) A、先综合、后对比 B、先加后减 C、先减后加 D、先对比、后平均 E、先除后乘 11、总指数的计算形式有( ) A、综合指数 B、销售量指数 C、销售价格指数 D、平均指数 E、产量指数 三、填空题 1、在我国,工业生产指数是通过计算各种工业产品的 产值来加以编制的。 2、价格下降后,同样多的人民币可以多购买12%的商品,则物价指数为 %。 3、采用标准比值法编制综合评价指数时,个体指数可以围绕着 %上下取值,最小值通常不能 于零。 4、功效系数的取值范围为 ;而改进的功效系数一般在 到 分之间取值。 5、统计指数按指数化指标的性质可分为 指数和 指数。 四、判断题 1、指数作为一种对比性的统计指标具有相对数的形式,通常表现为百分数。( ) 2、指数分析中,将那种个别现象的数量不能直接加总或不能简单对比的总体称为复杂现象总体。( ) 3、加权总指数的核心问题是“权数”问题。( ) 4、拉氏数量指标指数采用报告期质量指标作为同度量因素。( ) 5、帕氏价格指数采用基期数量指标作为同度量因素。( ) 6、在现实经济生活中,依据同样一些现象的资料计算的帕氏指数一般大于拉氏指数。( ) 7、编制综合指数的基本问题是“同度量”的问题,解决这一问题的方法就是编制加权综合指数。( ) 8、在指数编制的实践中,平均指数仍然是一种相对的总指数编制方法,而不仅仅是综合指数的变形.( ) 9、用指数体系作两因素分析时,同度量因素必须都是同一时期的。 ( ) 10、总指数编制的基本问题是综合与对比的问题。( ) 11、特殊情况下,根据同样资料计算的帕氏指数有可能大于拉氏指数。( ) 12、当个体指数与总指数之间存在一一对应关系时,基期加权的算术平均数指数可视为拉氏指数的变形。( ) 13、已知基期总值指标及个体指数时,可使用加权算术平均指数编制总指数。( ) 14、加权综合指数的计算通常需要掌握全面的资料,而加权平均指数则既可以依据全面的资料来编制,也可以依据非全面资料来编制。从这个意义上来说,加权平均指数在实际中应用得更为广泛。( ) 15、在制定了产量计划的条件下,产品成本指数的编制应该采用计划规定的产量水平作为同度量因素。( ) 16、消费者价格指数可用于测定通货膨胀的状况。( ) 17、综合反映结构和水平两个因素共同变化所引起的总平均数变动的指数是固定构成指数。( ) 18、结构变动影响指数单纯反映总体结构变化对总平均数的影响。( ) 五、简答题 1、试述指数的概念、作用和种类。 2、何为指数体系?它有何作用? 3、工业生产指数和消费者价格指数的含义? 4、拉氏指数和帕氏指数各有什么特点? 六、计算分析题 1、某商店三种商品的销售情况如下: 商品 计量 销售量 销售价格(元/台、吨、名称 单位 件) 基期 报告期 基期 报告期 甲 万台 2 3 10 12 乙 万吨 5 5 8 7 丙 万件 4 6 2 4 要求:(1)计算三种商品的销售量个体指数和销售价格个体指数; (2)用拉氏公式编制三种商品的销售量总指数和销售价格总指数; (3)再用帕氏公式编制三种商品的销售量总指数和销售价格总指数; (4)比较(1)、(2)两种公式编制出来的销售量总指数和销售价格总指数的差异。 2、某车间两种产品的生产情况如下: 产品 计量 单位成本(元/件、台) 产量 名称 单位 基期 报告期 基期 报告期 A 万件 10 12 3 5 B 万台 3 6 2 6 要求:建立适当的指数体系(V=Lq·Pp),从相对数和绝对数两方面对总成本的变动进行因素分析。 3、某商店2000年的销售额为200万元,比上年增长了10%。2000年销售量总的增长了5%。 要求:(1)求商品销售价格总指数; (2)从相对数和绝对数两方面分析销售量和销售价格两因素变动对销售额的影响。 4、某企业生产三种不同的产品,有关的产量、成本和销售价格资料如下: 产品 计量 产量 单位成本出厂价格种类 单位 (元) (元) 基期 报告期 报告期 报告期 A 件 270 340 50 65 B 台 32 35 800 1000 C 吨 190 150 330 400 要求:(1)以单位成本为同度量因素,编制帕氏产量指数; (2)以出厂价格为同度量因素,编制帕氏产量指数; (3)比较说明两种产量指数具有何种不同的经济分析意义。 5、某企业生产三种产品的有关资料如下: 产品名称 总生产费用(万元) 报告期产量比基期增长% 基期 报告期 A 45.4 53.6 14.0 B 30.0 33.8 13.5 C 55.2 58.5 8.6 要求:(1)计算三种产品的生产费用总指数; (2)计算以基期生产费用为权数的产量总指数; (3)根据(1)(2)推算单位成本总指数; (4)根据(1)(2)(3)分析产量和单位成本变动对总生产费用的影响。(参考:贾俊平《统计学》,中国人民大学出版社) 6、某城市三个市场上同一种商品的销售资料如下: 市场 销售价格(元/公斤) 销售量(公斤) 基期 报告期 基期 报告期 A市场 2.50 3.00 740 560 B市场 2.40 2.80 670 710 C市场 2.20 2.40 550 820 合 计 — — 1960 2090 要求:(1)编制该商品总平均价格的可变构成指数、固定构成指数和结构变动影响指数; (2)建立指数体系,从相对数和绝对数两方面对总平均成本的变动进行因素分析; (3)进一步综合分析销售价格变动和销售量结构变动对该种商品销售总额的影响。 7、生产同种产品的甲、乙、丙三个工厂有关资料如下: 工厂 劳动生产率(万元/人) 工人数(人) 基期 报告期 基期 报告期 甲 2 3 100 100 乙 4 6 150 190 丙 3 4 80 90 试问:(1)由于各厂劳动生产率及总体人数结构两个因素变动而使总平均劳动生产率提高了百分之几?因此而增加的总产值为多少? (2)由于各厂劳动生产率水平变动而使总平均劳动生产率提高了百分之几?因此而增加的总产值为多少? (3)又由于工人人数结构变动而使总平均劳动生产率提高了百分之几?因此而增加的总产值为多少? 8、某地区粮食作物的生产情况如下: 粮食 播种面积(亩) 亩产(百公斤/亩) 作物 2002年 2003年 2002年 2003年 水稻 5 4 4 5 小麦 7 9 3 4 要求:分别计算粮食总平均亩产的可变构成指数、固定构成指数和结构变动影响指数,从相对数和绝对数两方面对总平均亩产的变动进行因素分析。 9、已知某地区2002年的农副产品收购总额为360亿元,2003年比上年的收购总额增长12%,农副产品收购价格总指数为105%。试考虑,2003年与2002年相比:(1)农民因交售农副产品共增加多少收入?(即是问农副产品收购总额增加了多少);(2)农副产品收购量增加了百分之几?农民因此增加了多少收入?(3)由于农副产品收购价格提高5%,农民又增加了多少收入?(4)验证以上三方面的分析结论能否保持协调一致。 10、已知某市商品零售资料如下表: 指数(%) 固定权数(%) 1、食品类 51.5 (1) 粮食 101.8 20 (2) 副食品 102.4 50 (3) 烟酒茶 101.2 16 (4) 其他食品 108.2 14 2、衣着类 99.5 23 3、日用品类 101.5 12.7 4、文化用品类 102.4 4.8 5、医药类 102.6 4.0 6、燃料 100.4 4.0 要求:计算该市的食品类指数和零售物价总指数。 11、推算指数: (1)价格上涨后,同样多的人民币只能购买基期商品的80%,求物价指数。 (2)假设某造纸厂2002年比2001年的产量增长了13.6%,生产费用增长了12.9%,问该厂2002年的产品成本比2001年降低了多少? (3)报告期粮食总产量增长12%,粮食播种面积增加9%,则粮食作物单位面积产量增加了多少? (4)某厂2003年职工的工资水平提高了3.2%,职工人数增加了2%,则该厂工资总额如何变动? 第九章 统计指数 一、单项选择题 1、C 2、B 3、A 4、B 5、A 6、D 7、B 8、C 9、A 10、D 11、C 12、B 13、D 14、D 二、多项选择题 1、ACE 2、ABC 3、ADE 4、AD 5、AC 6、BC 7、AD 8、AE 9、BC 10、AD 11、AD 三、填空题 1、不变价格 2、.29% 3、100 小 4、0≤di≤1 60 100 5、数量指标 质量指标 四、判断题 1、√ 2、√ 3、√ 4、× 5、× 6、× 7、√ 8、√ 9、× 10、√ 11、√ 12、√ 13、√ 14、√ 15、√ 16、√ 17、× 18、√ 五、1、答:广义地讲,任何两个数值对比形成的相对数都可以称为指数。例如动态相对数、比较相对数、计划完成相对数等都可称为指数;狭义地讲,指数是一种特殊的相对数,专门用于测定数量上不能直接相加和对比的复杂现象总体综合变动的程度。例如使用价值不同的多种商品的销售量总指数。 作用:反映复杂社会经济现象总体的综合变动程度;分析社会经济现象变动中各个因素的影响;对多指标复杂社会经济现象进行综合测评。 种类:略。参见书P.212-214 2、答:指数体系有两种不同的涵义:广义的指数体系和狭义的指数体系。广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数所结成的体系。狭义的指数体系仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。 指数体系的作用主要有两个方面:一是进行因素分析,即分析现象的总变动中各有关因素的影响程度;二是进行指数推算,即根据已知的指数推算未知的指数。 3、答:工业生产指数,是概括反映一个国家或地区各种工业产品产量的综合变动程度的指数,是衡量经济增长水平的重要指标之一。在我国,工业生产指数是通过计算各种工业产品的不变价格产值来加以编制的。 消费者价格指数,是综合反映各种消费品和生活服务价格的变动程度的重要经济指数。是制定物价和工资的重要依据。在我国,消费者价格指数是采用固定加权算术平均指数方法来编制的。 4、答:拉氏指数是在计算一组项目的综合指数时,把作为权数的同度量因素固定在基期。帕氏指数是把作为权数的同度量因素固定在报告期。拉氏指数由于以基期变量值为权数,可以消除权数变动对指数的影响,从而使不同时期的指数具有可比性。但拉氏指数也存在一定的缺陷,比如物价指数是在假定销售量不变的情况下价格的变动水平,这一指数尽管可以单纯反映价格的变动水平,但不能反映出消费量的变化。从实际生活角度看,人们更关心的是在报告期销售量条件下,由于价格变动对实际生活的影响。因此,拉氏物价指数在实际中应用得很少。而拉氏物量指数,是假定价格不变的条件下报告期销售量的综合变动,它不仅可以单纯反映出销售量的综合变动水平,也符合计算销售量指数的实际要求,因此,拉氏物量指数在实际中应用得较多。 帕氏指数因以报告期变量值为权数,不能消除权数变动对指数的影响,因而不同时期的指数缺乏可比性。但帕氏指数可以同时反映出价格和消费结构的变化,具有比较明确的经济意义。在实际应用中,常采用帕氏公式计算价格、成本等质量指标指数。而帕氏物量指数由于包含了价格的变动,意味着是按调整后的价格来测定物量的综合变动,这本身不符合计算物量指数的目的,因此帕氏数量指数在实际中应用得较少。 采用拉氏和帕氏公式所得的计算结果是有一定差别的,且这种差别带有一定的规则。如果所考察的质量指标个体指数与数量指标个体指数之间存在着负相关关系,则依据同样资料所计算的拉氏指数通常大于帕氏..指数。 六、计算分析题 1、①销售价格个体指数:甲: ip=乙:ip= p112==120% p010p1p=7/8=87.5% 丙:ip=1=4/2=200% p0p0销售量个体指数:甲:iq乙:iqq1=3/2=150%; q0q1=5/5=100% 丙:iqq0q1=6/4=150% q0②Lqpq= pq0010=82/68=120.59% Lppq= pq1000=75/68=110.29% ③Pq= pq1p1q10=95/75=126.67% Pppq= pq11=95/82=115.85% 01④由于拉氏指数和帕氏指数各自选取的同度量因素时期不同,利用同样资料编制的结果,两者的计算结果存在差异。本题中:Pq>Lq ;Pp>Lp。 2、 VLqpp Vp1q1p0q096/36266.67% qp0q0963660(万元) P11 Lqp0q1p0q068/36188.% (万元) P0q1p0q0683632 Ppp1q1p0q196/68141.81% q1p0q1966828(万元)P 1 相对数:266.67%=188.%×141.18% 绝对数:60(万元)=32(万元)+28(万元) 结果表明:由于产量增长88.%,使总成本增加了32万元;又由于单位成本上升41.18%,使总成本增加了28万元。两个因素共同作用的结果,使总成本上升了166.67%,即增加了60万元。 3、① V= Lq·Pp, Pp= VLq=110%÷105%=104.76% ② p0q0=200÷110%=181.82 p1q1=200 由 Lqpq= pq0010= 得:p0q1=105%×181.82=190.911 010pqpq0110pq= pq0pq× pq0111,110%=105%×104.76%% pq -pq1100=(p0q1-p0q0)+(p1q1-p0q1) 200-181.82=(190.911-181.82)+(200-190.911) 18.18(万元)=9.091(亿元)+9.0(亿元) 结果表明:由于销售量增长5%,使销售额增加了9.091万元;又由于销售价格上升4.76%,使销售额增加了9.0万元。两个因素共同作用的结果,使销售额增长了10%,即增加了18.18万元。 4、①P1=报告期单位成本 Pq= p1q1=94500/=92.83% p1q0② P1=报告期出厂价格 Pq= p1q1=/=93.27% p1q0③:①以报告期单位成本为同度量因素,说明它是在报告期单位成本水平基础上来考察各产品产量的综合变动程度的,其分子与分母之差表明报告期由于产量下降而使总成本降低了7300元;②以报告期出产价格为同度量因素,说明它是在报告期出产价格水平基础上来考察各产品产量的综合变动程度的,其分子与分母之差表明报告期由于产量下降而使总产值减少了8450元。 5、①V= pqpq0110=145.9/130.6=111.72% q1qp0q00②Aq==(114%×45.4+113.5%×30+108.6%×55.2)/130.6 p0q0=111.60% ③单位成本总指数:111.72%÷111.60%=100.11% ④111.72%=111.60%×100.11% (145.9-130.6)=(145.7532-130.6)+(145.9-145.7532) 15.3(万元)=15.1532(万元)+0.1468(万元) 结果表明:由于产量增长111.6%,使总生产费用增加了15.1532万元;又由于单位成本上升0.11%,使总成本增加了0.1468万元。两个因素共同作用的结果,使总成本上升了11.72%,即增加了15.3万元。 6、x1xff10001135602.87102.48202.69 2090x0xff2.57402.46702.25502.38 1960x假定xff1012.55602.47102.28202.35 1960①I可变= x1x0=2.69/2.38=113.03% x假定I结构= x0x1x假定=2.35/2.38=98.74% I固定= =2.69/2.35=114.47% ② 113.03%=114.47%×98.74% (0.31)(元)=(0.34)元+(-0.03)(元) 结果表明:由于产量结构变化,使总平均价格下降1.26%,即降低了0.03元;又由于各市场销售价格水平的变化,使总平均价格上升14.47%,即提高了0.34元。两个因素共同作用的结果,使总平均价格上升了13.03%,即提高了0.31元。 ③ 销售价格变动对该种商品销售总额的影响 (2.69-2.35)×2090=710.6(元) 销售量结构变动对该种商品销售总额的影响 (2.35-2.38)×2090=-62.7(元) 7、 x1x0x1f1f1310061904904.74 380x0f0f02.10041503803.15 330210041903903.24 330x假定x0f1f0① I可变x14.74150.48% 3.15x0总平均劳动生产率提高了50.48% 因此增加的产值为:(4.74-3.15)×380=604.2(万元) ② I固定= x1x假定x假定x0=4.74/3.24=146.29%,提高了46.29% 因此增加的产值为:(4.74-3.24)×380=570(万元) ③ I结构= =3.24/3.15=102.86%,提高了2.86 % 因此增加的产值为:(3.24-3.15)×380=34.2(万元) 8、 x1xff11154494.31 130x0xff0045373.42 12x假定xff01144393.31 13x1I可变= x0=4.31/3.42=126.02% x假定I结构= x0x1x假定=3.31/3.42=96.78% I固定= =4.31/3.31=130.21% 126.02%=96.78% ×130.21% 4.31-3.42=(4.31-3.31)+(3.31-3.42) 0.(百公斤)=-0.11(百公斤)+1(百公斤) 结果表明:由于播种面积结构变化,使总平均亩产降低3.22%,即减少了0.11百公斤;又由于各种作物亩产量水平的变化,使总平均亩产提高30.21%,即增加了1百公斤。两个因素共同作用的结果,使总平均亩产提高了26.02%,即增加了0.百公斤。 9、①p1q1-p0q0=360×112%-360=403.2-360=43.2(亿元) 农民因交售农副产品共增加了43.2亿元的收入 ②收购量指数=112%÷105%=106.67%,上升了6.67% 推算得:P0q1=360×106.67%=384.012(亿元) 农民因此而增加的收入:p0q1p0q0=384.012-360=24.012(亿元) ③由于收购价格提高而使农民增加的收入为 p1q1p0q1=403.2-384.012=19.188(亿元) (4)验证:112%=106.67%×105% 43.2(亿元)=24.012(亿元)+19.188(亿元) 表明以上三方面的分析结论是协调一致的 10、解:(更正:题目中表格的第一行三列指标内容分别是第一列为:“类别”;第二列为:“类指数”;第三列为:“固定权数”) 食品类类指数:IpIpw100=(101.8%×20+102.4%×50+101.2%16+108.2%×14)/100=102.9% 零售物价总指数=IpIpw100 =(102.9%×51.5+99.5%×23+101.5%×12.7+102.4%×4.8+102.6%×4+100.4%×4)/100=101.8% 11、解:(1)物价指数=100%/80%=125% (2)单位成本指数=生产费用指数/产量指数=112.9%/113.6%=99.38% 2002年的产品成本比2001年降低了0.62% (3)单位面积产量指数=粮食总产量指数/播种面积指数 =112%/109%=102.75% 粮食作物单位面积产量增加了2.75% (4)工资总额指数=职工人数指数×平均工资指数 =102%×103.2%=105.26% 工资总额增加了5.26%
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- baijiahaobaidu.com 版权所有 湘ICP备2023023988号-9
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务