

岱左吧

代做作业_国开电大作业代做_奥鹏作业代写_各科作业辅导

上海开放大学《概率与数理统计》课程实践2代做案例

admin 2024-05-08 775

微信号：wuyouhw
添加微信好友, 获取更多信息
复制微信号

1 参数估计 1

1.1 一个总体均值的区间估计 1

1.2 两个总体均值差的区间估计 3

2 假设检验 5

2.1 一个总体均值的检验 5

2.2 两个总体比例差的检验 6

3 卡方检验 7

3.1 期望频数相等的卡方检验 7

3.2 期望频数不相等的卡方检验 9

4 方差分析 12

4.1 单因子方差分析 12

4.2 多重比较 15

1 参数估计

1.1 一个总体均值的区间估计

【实验数据】习题1.1 16只灯泡的使用寿命

【实验题目】已知某种灯泡的使用寿命服从正态分布，现从一批灯泡中随机抽取16只，测得其使用寿命（单位：小时），数据见：“习题1.1 16只灯泡的使用寿命.xls”。请用Excel和SPSS26分别建立该批灯泡平均使用寿命95%的置信区间。

解：

由于总体服从正态分布但未知，且为小样本，因此需要采用分布来建立总体均值的置信区间。

根据样本数据计算得到。

用Excel方法：利用Excel的【T.INV.2T】函数

使用寿命95%的置信区间：

用SPSS26方法：

第一步：打开数据

图1 打开习题1.1 16只灯泡的使用寿命.xls数据

第二步：使用【分析】【比较平均值】【单样本T检验】，见表1和表2。

图2 分析过程

表1 基本描述统计

单样本统计

个案数平均值标准偏差标准误差平均值

使用寿命 16 1490.00 24.766 6.191

表1 灯泡平均使用寿命95%的置信区间

单样本检验

检验值 = 0

t 自由度 Sig.（双尾）平均值差值差值 95% 置信区间

下限上限

使用寿命 240.657 15 0.000 1490.000 1476.80 1503.20

1.2 两个总体均值差的区间估计

【实验数据】习题1.2 10名学生两套试卷的测试得分

【实验题目】由10名学生组成一个随机样本，让他们分别采用A和B两套试卷进行测试，结果见数据：“习题1.2 10名学生两套试卷的测试得分”。假定两套试卷分数之差服从正态分布，请用Excel和SPSS26分别建立两种试卷平均分数之差的95%的置信区间。

解：根据习题1.2 10名学生两套试卷的测试得分，可以计算得到：

；

Excel方法：由Excel中的【T.INV.2T】函数得到

根据公式在置信水平下的置信区间为：

故：，95%的置信区间为（6.3,15.7）

SPSS方法：

第一步：打开数据

图3 打开习题1.2 10名学生两套试卷的测试得分

第二步：使用【分析】【比较平均值】【成对样本T检验】，见表3，表4，表5。

图4 分析过程

表3 基本描述统计

配对样本统计

平均值个案数标准偏差标准误差平均值

配对 1 试卷A 72.60 10 14.073 4.450

试卷B 61.60 10 14.759 4.667

表4 相关性

配对样本相关性

个案数相关性显著性

配对 1 试卷A & 试卷B 10 0.898 0.000

表5 两种试卷平均分数之差的95%的置信区间

配对样本检验

配对差值 t 自由度 Sig.

（双尾）

平均值标准

偏差标准误差

平均值差值95%置信区间

下限上限

配对 1 试卷A - 试卷B 11.000 6.532 2.066 6.327 15.673 5.325 9 0.000

2 假设检验

2.1 一个总体均值的检验

【实验数据】习题2.1 50个零件尺寸的误差数据

【实验题目】一种机床加工零件尺寸绝对平均误差为1.35毫米。生产厂家准备采用一种新的机床进行加工，以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从新机床生产的零件中随机抽取50个进行检验。50个零件尺寸的绝对误差（单位：毫米）数据见“习题2.1 50个零件尺寸的误差数据”。检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低（）。

解：

这个实验题目关心的是新机床加工的零件尺寸的平均误差与旧机床相比是否有显著的降低，也就是是否小于1.35，属于左侧检验。

提出的假设为：

根据样本数据计算得到：

当样本方差已知时，检验统计量为，公式为：

计算检验统计量：

利用Excel中的【NORM.S.DIST】函数，小于0.05，所以，拒绝原假设：新机床加工的零件尺寸的平均误差与旧机床相比有显著的降低。

2.2 两个总体比例差的检验

【实验题目】一所大学准备采取一项新的上网收费措施，为了了解男女学生对这一措施的看法是否有差异，分别抽取200名男生和200名女生进行调查。其中的一个问题是：“你收否赞成采取新的上网收费的措施？”。男生表示赞成的比例为27%，女生表示赞成的比例为35%。调查者认为，男生中表示赞成的比例显著低于女生。取显著性水平，样本提供的证据是否支持调查者的看法？

解：

设男生中表示赞成的比例

女生中表示赞成的比例

依据提议提出如下假设：

两个样本的比例分别为：

由于要检验“男生中表示赞成的比例显著低于女生”，所以选择的检验统计量公式为：

，其中，

利用Excel中的【NORM.S.DIST】函数：NORM.S.DIST(-1.72976,TRUE)，可以计算得到。因为，所以拒绝原假设，样本提供的证据是支持调查者的看法的：男生中表示赞成的比例显著低于女生。

3 卡方检验

3.1 期望频数相等的卡方检验

【实验数据】习题3.1 500个消费者对不同品牌牛奶的偏好数据

【实验题目】为研究消费者对不同品牌的牛奶是否有明显的偏好，一家调查公司抽样调查了500个消费者对4种品牌的偏好情况，数据见“习题3.1 500个消费者对不同品牌牛奶的偏好数据”。请用Excel和SPSS26分别检验消费者对牛奶品牌的偏好是否有显著差异（）。

解：

牛奶品牌类别变量，共有4个类别值，每个类别的偏好人数称为观察频数(observed frequency)，即类别变量各取值的实际频数。如果消费者对各品牌没有明显偏好，则各观察频数应该是相等或近似相等的，也就是不同品牌牛奶的消费者人数都是125人（500/4）,这就是各类别的期望频数(expected frequency)。如果调查者想分析消费者对不同品牌牛奶的偏好是否有显著差异，实际上也就是检验观察频数与期望频数是否一致，此时拟合优度检验也称为一致性检验(test of homogeneity)。这种检验所使用的就是卡方分布。

第一步：提出假设。

：观察频数与期望频数无显著差异（无显著偏好）

：观察频数与期望频数有显著差异（有显著偏好）

第二步：计算检验统计量。如果消费者对牛奶品牌的偏好无显著差异，意味着各期望频数相等，即不同品牌的期望频数均为125。统计量的计算过程如表6。

表6 统计量的计算

品牌观察频数期望频数

A 150 125 5.0

B 180 125 24.2

C 90 125 9.8

D 80 125 16.2

合计 500 500 55.2

第三步：做出决策。由于自由度为4-1=3，利用Excel中的【CHISQ.DIST.RT】函数计算统计量的为6.23366E-12。值接近于0，拒绝原假设，表明消费者对牛奶品牌的偏好有显著差异。

用SPSS26进行期望频数相等的卡方检验

第一步：打开数据，见图5。

图5 打开“习题3.1 500个消费者对不同品牌牛奶的偏好数据”

第二步：指定“频数”变量，点击【数据】→【个案加权】,选择【个案加权依据】，将“频数”选入【频率变量】，点击【确定】。

第三步：选择【分析】→【非参数检验】→【旧对话框】→【卡方】。

第四步：将频数变量选入【检验变量列表】。点击【确定】。

第五步：分析结果解读，见表7和表8。

表7 消费者品牌偏好的卡方检验1

人数

实测个案数期望个案数残差

80 80 125.0 -45.0

90 90 125.0 -35.0

150 150 125.0 25.0

180 180 125.0 55.0

总计 500

表8 消费者品牌偏好的卡方检验2

检验统计

人数

卡方 55.200a

自由度 3

渐近显著性 0.000

a. 0 个单元格 (0.0%) 的期望频率低于5。期望的最低单元格频率为 125.0。

表7给出了按从小到大排序的各品牌的观察频数、相应的期望频数以及观察频数与期望频数的差值。表8给出了统计量的值、自由度和渐近显著性水平。由于值接近于0，拒绝原假设，表明消费者对牛奶品牌的偏好有显著差异。

3.2 期望频数不相等的卡方检验

【实验数据】习题3.2 某一线城市居民对房价满意度评价的频数分布

【实验题目】一项针对全国的住房价格调查表明，城镇居民对房价表示非常不满意的占15%，不满意的占45%，一般的占25%，满意的占9%，非常满意的占6%。为研究一线城市的居民对住房价格的满意程度，一家研究机构在某一线城市抽样调查300人，其中的一个问题是：“您对目前的住房价格是否满意?”调查共设非常不满意、不满意、一般、满意、非常满意5个选项。调查结果的频数分布见“习题3.2 某一线城市居民对房价满意度评价的频数分布”。请用Excel和SPSS26分别检验该城市居民对住房价格满意度评价的频数与全国的评价频数是否一致（）。

解：

第1步：提出假设。

：该城市居民对住房价格的评价频数与全国的评价频数没有显著差异。

：该城市居民对住房价格的评价频数与全国的评价频数有显著差异。

第2步：计算期望频数和检验统计量。

由于全国的调查比例（即期望比例）是已知的，但期望频数需要计算。如果该城市居民的满意度评价与全国一样，那么，在所调查的300人中，各回答类别的观察频数所占的比例与全国的期望比例应该一致。因此，用期望比例乘以总的观察频数（即样本量）即得期望频数。计算结果见表9。

表9 某城市居民对房价满意度评价的期望频数

回答类别观察频数期望比例（%）期望频数=期望比例样本量

非常不满意 36 15

不满意 126 45

一般 81 25

满意 30 9

非常满意 27 6

合计 300 100 300

有了期望频数就可以计算检验的统计量了，结果见表10。

表10 某城市居民对房价满意度评价的统计量

回答类别观察频数期望频数

非常不满意 36 45 1.800

不满意 126 135 0.600

一般 81 75 0.480

满意 30 27 0.333

非常满意 27 18 4.500

合计 300 300 7.713

第三步：做出决策。由于自由度为5-1=4，利用Excel中的【CHISQ.DIST.RT】函数计算统计量的值为0.102662，由于值大于0.05，不能拒绝原假设，说明没有证据表明该城市居民对房价满意度的评价和全国有显著差异。

用SPSS26进行期望频数不相等的卡方检验

第一步：打开数据，见图6。

图6 打开“习题3.2 某一线城市居民对房价满意度评价的频数分布”

第二步：对各类别的观察频数按从小到大的顺序排列。

第二步：指定“频数”变量，点击【数据】→【个案加权】,选择【个案加权依据】，将“频数”选入【频率变量】，点击【确定】。

第三步：选择【分析】→【非参数检验】→【旧对话框】→【卡方】，进入主对话框。

第四步：将频数变量选入【检验变量列表】。

第五步：在【期望值】下选择【值】，并将相应的期望例依次输入框内并点击【添加】(每次只能输入一个，并点击【添加】，然后再输入另一个，再点击【添加】，依此类推)。点击【确定】。

第六步：分析结果解读，见表11和表12。

表11 某城市居民对房价满意度评价的卡方检验1

人数

实测个案数期望个案数残差

27 27 18.0 9.0

30 30 27.0 3.0

36 36 45.0 -9.0

81 81 75.0 6.0

126 126 135.0 -9.0

总计 300

表12 某城市居民对房价满意度评价的卡方检验2

检验统计

人数

卡方 7.713a

自由度 4

渐近显著性 0.103

a. 0 个单元格 (0.0%) 的期望频率低于 5。期望的最低单元格频率为 18.0。

通过表12可以看出，SPSS26和Excel得到的检验统计量和显著性水平是一致的。

4 方差分析

【实验数据】习题4.1 超市位置、竞争者数量和销售额数据

【实验题目】一家超市连锁店进行一项研究，想确定超市所在的位置和竞争者的数量对销售额是否有显著影响，将超市位置按居民区、商业区和写字楼分成3类，并在不同位置分别随机抽取 3 家超市，竞争者数量按零个、一个、二个和三个及以上分成4类，获得的年销售额数据(单位：万元)如表13所示。

表13 超市位置、竞争者数量和销售额

竞争者数量（B）

零个一个二个三个及以上

超市位置（A）居民区 265 290 445 430

310 350 480 428

220 300 500 530

商业区 410 380 590 470

305 310 480 415

450 390 510 390

写字楼 180 220 290 246

290 170 283 275

330 256 260 320

4.1 单因子方差分析

【实验数据】习题4.1 超市位置、竞争者数量和销售额数据

【实验题目】检验超市位置对销售额是否有显著影响（）

解：由于只考虑超市位置一个因子，所以用单因子方差分析进行显著性检验。

设超市位置对销售额的效应分别为（居民区），（商业区），（写字楼）。第一步：提出假设检验：

（超市位置对销售额影响不显著）

至少有一个不等于0（超市位置对销售额影响显著）

第二步：向SPSS26导入数据。

图7 导入超市位置、竞争者数量和销售额数据的第二个sheet

第三步：观察数据

图8 观察数据

第四步：开始分析数据，选择模型

图9 选择模型

第五步：分析结果解读

表14 超市位置和销售额

主体间因子

个案数

超市位置居民区 12

商业区 12

写字楼 12

表15 超市位置和销售额描述统计

描述统计

因变量:销售额

超市位置平均值标准偏差个案数

居民区 379.00 102.266 12

商业区 425.00 81.212 12

写字楼 260.00 49.878 12

总计 354.67 105.420 36

表16 超市位置和销售额各效应检验

主体间效应检验

因变量:销售额

源 III 类平方和自由度均方 F 显著性

修正模型 174008.000a 2 87004.000 13.357 0.000

截距 4528384.000 1 4528384.000 695.190 0.000

超市位置 174008.000 2 87004.000 13.357 0.000

误差 214958.000 33 6513.879

总计 4917350.000 36

修正后总计 388966.000 35

a. R 方 = 0.447（调整后 R 方 = 0.414）

表17 超市位置和销售额方差分析模型的参数估计

参数估算值

因变量:销售额

参数 B 标准误差 t 显著性 95% 置信区间

下限上限

截距 260.000 23.299 11.159 0.000 212.599 307.401

[超市位置=居民区] 119.000 32.949 3.612 0.001 51.964 186.036

[超市位置=商业区] 165.000 32.949 5.008 0.000 97.964 232.036

[超市位置=写字楼] 0a

a. 此参数冗余，因此设置为零。

根据表16，“修正模型”一行是整个方差分析模型的检验。

原假设是：模型中的因子（超市位置）对因变量（销售额）没有显著影响，检验后，显著性水平接近0，说明该模型是显著的。

根据表17，居民区的参数，表示超市位置在居民区是，对销售额的附加效应，即比平均销售额（参加标准为写字楼的平均销售额，表15）高出119万元。同理，商业区的参数，表示超市位置在商业区时对销售额的附加效应，即平均销售额（参照标准为写字楼的平均销售额，表15）高出165万元。

4.2 多重比较

为了进一步分析哪些位置的超市之间的销售额差异显著，可以进行多重比较。

第一步：SPSS26进行数据分析

图10 多重比较

第二步：结果解读

表18 超市位置和销售额方差分析的多重比较

多重比较

因变量:销售额

LSD

(I) 超市位置 (J) 超市位置平均值差值

(I-J) 标准误差显著性 95% 置信区间

下限上限

居民区商业区 -46.00 32.949 0.172 -113.04 21.04

写字楼 119.00* 32.949 0.001 51.96 186.04

商业区居民区 46.00 32.949 0.172 -21.04 113.04

写字楼 165.00* 32.949 0.000 97.96 232.04

写字楼居民区 -119.00* 32.949 0.001 -186.04 -51.96

商业区 -165.00* 32.949 0.000 -232.04 -97.96

基于实测平均值。

误差项是均方（误差）= 6513.879。

*. 平均值差值的显著性水平为 .05。

根据表18，显著性水平显示，居民区和商业区的销售额之间差异不显著；居民区和写字楼的销售额之间差异显著，商业区和写字楼的销售额之间差异显著。

本文链接：https://daizuozuoye8.com/?id=873

转载声明：本站发布文章及版权归原作者所有，转载本站文章请注明文章来源！

代做作业_国开电大作业代做_奥鹏作业代写_各科作业辅导

上海开放大学《概率与数理统计》课程实践2代做案例

相关文章

请发表您的评论