上海开放大学《概率与数理统计》课程实践1代做案例
目录
添加微信好友, 获取更多信息
复制微信号
1 用图表展示数据 1
1.1 用SPSS展示类别数据 1
1.1.1 启动SPSS26并读取数据 2
1.1.2 制作频数分布表和条形图 4
1.1.3 存储SPSS26查看器文件 8
1.1.4 频数分布和条形图实验报告 8
1.1.5 制作帕累托图 10
1.1.6 制作饼图 11
1.2 用SPSS展示连续型数据 13
1.3 用Excel展示环形图 16
1.4 用SPSS展示箱型图及对箱型图解释 17
1.5 用SPSS展示散点图及对箱型图解释 19
2 用统计量描述数据 20
2.1 网购数据分析 20
2.2 组装方法比较 22
3 概率计算 24
1 用图表展示数据
【实验目的】:可以借助SPSS软件对分类数据和连续型数据进行图表展示,需要掌握的图表有:
(1)、频数分布表;
(2)、条形图;
(3)、帕累托图;
(4)、饼图;
(5)、直方图;
(6)、环形图;
(7)、箱形图;
(8)、散点图。
【实验要求】:以教师提供的5套数据作为源数据,创建不同统计图表,依据实验过程撰写实验报告。
【实验环境】:SPSS 26
1.1 用SPSS展示类别数据
【实验数据】习题1.1.1 服务质量
【实验题目】为评价电信行业售后服务的质量,随机抽取由100个家庭构成的一个样本,服务质量的等级分别表示为:A. 好;B. 较好;C. 一般;D. 较差;E. 差。所用数据见“习题1.1.1 服务质量.xls”
(1)、制作频数分布表。
(2)、绘制条形图反映评价等级的分布。
(3)、绘制平均等级的帕累托图。
(4)、绘制饼图反映评价等级的构成。
1.1.1 启动SPSS26并读取数据
第一步:启动SPSS 26,见图1.1。
图1.1 SPSS26 启动界面
第二步:导入习题1.1.1 服务质量Excel文件。见图1.2 SPSS 导入Excel文件:习题 1.1.1 服务质量.xls。见图1.3 SPSS读取Excel文件。
图1.2 SPSS 导入Excel文件
图1.3 SPSS读取Excel文件
第三步:在SPSS中观察变量“评价等级”。见图1.4 在SPSS中观察变量。
图1.4 在SPSS中观察变量
第四步:保存SPSS文件。见图1.5 保存SPSS文件。注意,SPSS文件的后缀名为.sav。
图1.5 保存SPSS文件
1.1.2 制作频数分布表和条形图
第一步:制作频数分布表,条形图。
(一)、图1.6 制作频数分布表和条形图。
(二)、图1.7 勾选频数分布表。
(三)、图1.8 勾选条形图。
(四)、图1.9 频数分布表输出。
(五)、图1.10 条形图输出。
图1.6 制作频数分布表和条形图。
图1.7 勾选频数分布表
图1.8 勾选条形图
图1.9 频数分布表输出
图1.10 条形图输出
第六步:修改条形图格式。
(一)、双击条形图,鼠标右键点击任何一个蓝色竖条。见图1.11 修改条形图格式。
(二)、关闭窗口。条形图上显示了数据标签。见图1.12 条形图格式修改完成。
图1.11 修改条形图格式
图1.12 条形图格式修改完成
1.1.3 存储SPSS26查看器文件
存储SPSS查看器文件。见图1.13 SPSS查看器文件保存。注意,SPSS的查看器的文件后缀名为.spv。
图1.13 SPSS查看器文件保存
1.1.4 频数分布和条形图实验报告
第一步:将频数分布表和条形图从查看器中拷贝至实验报告中。频数分布表,见表1.1 评价等级。联系实验题目,对频数分布表进行调整,见表1.2 服务质量等级评价的频数分布表。
表1.1 评价等级
频率 百分比 有效百分比 累积百分比
有效 A 14 14.0 14.0 14.0
B 21 21.0 21.0 35.0
C 32 32.0 32.0 67.0
D 18 18.0 18.0 85.0
E 15 15.0 15.0 100.0
总计 100 100.0 100.0
表1.2 服务质量等级评价的频数分布表
服务质量等级 家庭数(频数) 频率(%)
A 14 14.0
B 21 21.0
C 32 32.0
D 18 18.0
E 15 15.0
总计 100 100.0
第二步:条形图。见图1.14 评价等级。
图1.14 评价等级
1.1.5 制作帕累托图
第一步:制作过程。见图1.15。
图1.15 帕累托图制作
第二步:帕累托图参数选择,见图1.15。
图1.16 帕累托图参数选择
图1.15 帕累托图制作
第三步:帕累托图完成制作,见图1.16。
图1.16 帕累托图
1.1.6 制作饼图
第一步:制作过程,见图1.17。
图1.17 饼图制作
第二步:饼图结果输出,见图1.118。
图1.18 饼图结果输出
1.2 用SPSS展示连续型数据
【实验数据】习题1.1.2 灯泡的使用寿命
【实验题目】为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所用数据见“习题1.1.2 灯泡的使用寿命.xls”。
(1)、以组距为10进行分组生成频数分布表。
(2)、绘制直方图,说明数据分布的特点。
第一步:用SPSS 26打开数据“习题1.1.2 灯泡的使用寿命.xls”
图1.19 打开数据
第二步:按“使用寿命”进行分组
图1.20 数据分组
第三步:点击“生产分割点”按钮,并在“第一个分割点位置”输入“650”,在“宽度”输入“10”,“分割点数”由SPSS自动生成。见图1.21。
图1.21 生成分割点
第四步:进行数据分析。生成频数分布表和带正态分布曲线的直方图。见图1.22。
图1.22 频数分布表和直方图生成
第五步:结果。将频数分布表进行整理,得到最终分析结果。
按使用寿命分组(小时) 频率 百分比
650-660 2 2.0
660-670 5 5.0
670-680 6 6.0
680-690 16 16.0
690-700 26 26.0
700-710 18 18.0
710-720 12 12.0
720-730 9 9.0
730-740 3 3.0
740-750 3 3.0
总计 100 100.0
1.3 用Excel展示环形图
【实验数据】习题2.3 环形图
【实验题目】为根据甲乙两个班级学生的统计学考试分数的汇总结果,绘制环形图,比较两个班不同等级人数的构成。
人数
考试成绩 甲班 乙班
60以下 4 2
60—70 9 8
70—80 18 9
80—90 6 15
90以上 3 6
【实验工具】 Office 365 中的Excel表格工具
图1.23 环形图
1.4 用SPSS展示箱型图及对箱型图解释
【实验数据】习题2.4 箱型图
【实验题目】根据习题2.4提供的数据,绘制子女身高、父亲身高和母亲身高的箱型图,并分析其分布特征。
第一步:用SPSS 26打开数据“习题2.4 箱型图.xls”。见图1.24。
图1.24 习题2.4数据
第二步:生成箱型图过程。见图1.25。
图1.25 箱型图生成
第三步:展示箱型图,见图1.26,并给与解释。
图1.26 箱型图
根据图1.26所示,子女身高、父亲身高和母亲身高都呈现大致的对称分布,子女身高的离散程度相对较大。
1.5 用SPSS展示散点图及对箱型图解释
【实验数据】继续使用习题2.4 箱型图中的数据进行散点图展示
【实验题目】根据习题2.4提供的数据,绘制子女身高、父亲身高和母亲身高的散点图,并说明它们之间的关系。
第一步:用SPSS 26打开数据“习题2.4 箱型图.xls”。见图1.24。
第二步:用SPSS制作散点图过程,见图1.27。
图1.27 制作散点图过程
第三步:编辑散点图,生成拟合线。见图1.28。
图1.28 在散点图上生成拟合线
根据图1.28所示,子女身高与父亲身高和母亲身高均为正的线性关系。
2 用统计量描述数据
2.1 网购数据分析
【实验数据】习题3.1 消费者网购
【实验题目】随机抽取50个网络购物的消费者,调查他们某月的网购金额,结果见“习题3.1 消费者网购.xls”。
(1)计算平均数、中位数、标准差、极差和四分位数。
(2)计算10%,25%,50%,75%,90%分位数。
(3)计算标准分数检测数据的离群点。
(4)计算偏度系数和峰度系数,分析网购金额的分布特点。
第一步:用SPSS 26打开数据“习题3.1 消费者网购.xls”。见图1.29。
图1.29 网购金额数据
第二步:分析数据,见图1.30。
图1.30 分析数据
第三步:数据输出,见表1.3。
表1.3 网购金额分析输出
网购金额
个案数 有效 50
缺失 0
平均值 1032.64
中位数 985.50
众数 928
标准 偏差 385.373
偏度 0.663
偏度标准误差 0.337
峰度 1.220
峰度标准误差 0.662
范围 1981
百分位数 10 532.20
25 825.75
50 985.50
75 1248.50
90 1490.90
根据表1.3结果计算四分位差为:。偏度系数显示网购金额呈现中等程度的右偏分布。
2.2 组装方法比较
【实验数据】习题3.3 组装方法比较
【实验题目】一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用随机抽取50个网络购物的消费者,调查他们某月的网购金额,结果见“习题3.3 组装方法比较.xls”。
第一步:用SPSS 26打开数据“习题3.3 组装方法比较.xls”。见图1.31。
图1.31 组装方法数据
第二步:分析数据,见图1.32。
图1.32 组装方法数据分析过程
第三步:输出结果,见表1.4。
表1.4 组装方法分析输出
方法A 方法B 方法C
个案数 有效 15 15 15
缺失 0 0 0
平均值 165.60 128.73 125.53
中位数 165.00 129.00 126.00
众数 164a 128 126
标准 偏差 2.131 1.751 2.774
偏度 0.351 -0.174 -3.238
偏度标准误差 0.580 0.580 0.580
峰度 -0.135 0.455 11.663
峰度标准误差 1.121 1.121 1.121
范围 8 7 12
最小值 162 125 116
最大值 170 132 128
第四步:根据表1.4,分别计算3种方法的离散系数。
方法A的离散系数:
方法B的离散系数:
方法C的离散系数:
第五步:方法比较。
从集中度、离散度和分布形状三个角度的统计量来评价3种方法。根据表1.4和3种方法的离散系数,从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形态看,方法A和方法B的偏斜程度都不大,方法C则较大。综合来看,应该选择方法A,因为平均水平较高且离散程度较小。
3 概率计算
从均值为200,标准差为50的总体中,抽取的简单随机样本,用样本均值估计总体均值。
(1)的期望值是多少?
(2)的标准差是多少?
(3)的概率分布是多少?
解:
(1)
(2)
(3)由中心极限定理可知,的概率分布近似正态分布。
本文链接:https://daizuozuoye8.com/?id=872
转载声明:本站发布文章及版权归原作者所有,转载本站文章请注明文章来源!
请发表您的评论