第一部分:原始资料和数据
资料来源:某班级29名同学实际情况
编号 姓名 性别 学科背景 年龄 身高
体重 体测成绩 1 吕鑫 2 王阳 3 洪华阳 4 刘卫秀 5 吴梦琦 6 韩玮 7 汤丽娟 8 江桂英 9 熊如意 10 余婵 11 彭茜 12 赵丹 13 安怡君 14 武阳帆 15 倪亚萍 16 张明辉 17 张春旭 18 刘晓伟 19 黄炜 20 李强 21 温明煌 22 雷翀翀 23 陈志强 24 尹传萍 25 郑南 26 幸恒恒 27 李拓 28 张发宝 29
杨涛
0 文科 0 文科 0 理科 0 理科 0 文科 0 文科 0 文科 0 理科 0 文科 0 文科 0 文科 0 文科 0 文科 0 文科 0 文科 1 文科 1 理科 1 文科 1 文科 1 文科 1 文科 1 理科 1 文科 1 文科 1 理科 1 文科 1 理科 1 理科 1 理科 20.5 164.2 20 158.3 21 171 21 165.5 21 166.2 20 164.3 21 162.8 20 157.2 20 166.5 19.5 156.2 20 165.4 20.5 174.3 20 175 20.5 162.4 22 157.5 21.5 170 20.5 168.5 21 170.5 20.5 171 20.5 167.5 21.5 170 21 168.5 22 180 21.5 165.2 21.5 168.5 21.5 168.5 21.5 172 21 160.5 21.5 176 54.2 81 46.2 75 57.2 71 54 75 48 69 47 61 48.2 66 44.2 70 54.5 73 45.5 77 52.4 66 55.6 76 56.2 72 55.5 67 48.6 74 60 71 57.8 80 59.5 70 62.2 76 56.5 68 60 75 60 79 70.4 79 55.6 78 55.9 64 58 79 68.1 66 52.5 73 70.5 72
第二部分:数据分析
一、描述统计
打开文件“某班级29名同学的身高、体重、年龄数据”,通过菜单兰中的分析选项,进行描述性分析,选择年龄、体重和身高,求最大值、最小值、方差、偏度、峰度和均值, 得到如下结果:
描述统计量 身高 体重 有效的 N (列表状态) N 统计量 29 29 29 极小值 统计量 156.20 44.20 极大值 统计量 180.00 70.50 均值 统计量 167.0172 55.6655 方差 统计量 33.840 46.780 偏度 统计量 -0.015 0.437 标准误 0.434 0.434 峰度 统计量 -0.146 0.159 标准误 0.845 0.845 表1-1统计量描述分析
年龄 有效 19.50 20.00 20.50 21.00 21.50 22.00 合计 频率 1 6 6 7 7 2 29 百分比 3.4 20.7 20.7 24.1 24.1 6.9 100.0 有效百分比 3.4 20.7 20.7 24.1 24.1 6.9 100.0 累积百分比 3.4 24.1 44.8 69.0 93.1 100.0 表1-2年龄分布表
图1-3身高分布直方图
图1-4体重分布条形图
文字描述:从SPSS分析结果中可以得出,有效数据共有29个。其中年龄主要分布在19.5-22.0岁之间,其中又以20.5-21.5之间最多。身高的极小值为156.20cm,极大值为180.00cm,均值为167.01,方差为33.84,该项指标方差过大,说明身高存在较大差异,当然极值的出现对此影响较大,从条形分布图中看出身高在165-175之间人数较多,身高的偏度为负,呈现右偏分布状态。体重的极小值为44.20kg,极大值为70.5kg,均值为55.67kg,方差为46.78,该指标方差偏大,个体之间差异性显著,从条形图中可以看出50-60kg之间分布较多,体重的偏度为负,呈现出右偏分布状态,峰度为负,分布呈低峰态。这些数据都可以从图表中轻易得出。
二、相关分析(以身高和体测成绩为例进行相关性分析)
图4-1身高和体测成绩之间的散点图
身高 体测成绩 身高 Pearson 相关性 1 .097
显著性(双侧) .615
N 29 29
体测成绩 Pearson 相关性 .097 1
显著性(双侧) .615 N 29 29 表4-1身高和体测成绩之间的相关性分析
按【图形】→【旧对话框】→【散点图】的流程,以身高为横轴,体测成绩为纵轴,得到如上如所示的散点图,可以看出各点分布较多零散,相关性不强。再做【分析】→【相关】→【双变量】操作,得出如4-1所示的表格,可以看出相关系数仅为0.097,相关性较弱,与上面散点图所呈现出的状态相符合。这表明身高和体测成绩之间的相关性不大。
三、均值检验(在此以身高为例,其他指标分析类似)
易知该样本总体服从正态分布,从中选出吴梦琪166.20cm,熊如意166.50cm,刘晓伟170.00cm,尹传萍165.20cm共4个数据。计算得出的平均值为166.975。我们现在以单样本T检验为例,对身高进行均值检验。建立原假设H0:总体均值与检验值之间不存在显著性差异。下面我们对此进行分析:选择菜单【分析】→【比较均值】→【单样本t检验】得出结果如下图
单个样本统计量
N 均值 标准差 均值的标准误
身高
29 167.0172 5.81722 1.08023 单个样本检验
检验值 = 166.975
t 身高 0.039 df 28 Sig.(双侧) 均值差值 0.969 0.04224 差分的 95% 置信区间 下限 -2.1705 上限 2.2550 表2-1,单样本T检验分析结果
由图表可知:样本总体均值为167.02,标准差为5.82,均值标准误差为1.08023.样本检验值为166.975,第二列是统计量的观测值0.039;第三列是自由度;第四列是统计量观测值的双尾概率P值;第五列是样本均值与检验的差值;第六列和第七列是总体均值与原假设值差的
95%的置信区间,因为167.0172在置信区间(164.8045,169.23)内,所以我们有95%的把握认为总体均值和样本均值之间不存在显著性差异。
四、回归分析(在此以身高和体重之间的关系为例进行分析)
有科学研究表明,身高和体重存在一定得线性相关关系,在此我们以某班级29个样本为例为此作出分析。选择【分析】→【回归】→【线性】进行分析,得到如下的输出结果:
输入/移去的变量 模型 1 输入的变量 体重 ab移去的变量 方法 . 输入 a. 已输入所有请求的变量。 b. 因变量: 身高 表5-1
模型汇总 标准 估计的误模型 1 R .847 aR 方 .717 调整 R 方 .706 差 3.15356
a. 预测变量: (常量), 体重。 表5-2
从表5-2中可以看出相关系数R=0.847,即身高和体重之间存在较强的线性相关关系。
a 系数
非标准化系数 标准系数
模型 B 标准 误差 试用版 t Sig.
1 (常量) 126.939 4.886 25.982 .000
体重 .720 .087 .847 8.263 .000
a. 因变量: 身高 Anova 模型 1 回归 残差 总计 平方和 679.007 268.514 947.521 df 1 27 28 均方 679.007 9.945 F 68.276 Sig. .000 ab a. 预测变量: (常量), 体重。 b. 因变量: 身高
系数 Bootstrap Bootstrap 显著性水平(双模型 1 (常量) 体重 B 126.939 .720 偏差 -.719 .014 标准 误差 5.924 .104 侧) .033 .033 93.3% 置信区间 下限 113.641 .514 上限 139.147 .962 aa. Unless otherwise noted, bootstrap results are based on 29 bootstrap samples
从上图中可以得出体重x对身高y的线性关系可以用二元线性函数表示,a=0.72,b=126.939.相应的直线方程为y=0.72x+126.939.
因篇幅问题不能全部显示,请点此查看更多更全内容