统计学课内实验
实验一:组距数列编制与图形显示
时间:第3周星期 上午/下午第 节 2013年月日实验目的:掌握组距数列编制方法及直方图的绘制;
实验要求:在excel统计软件中根据数值型数据编制组距数列并编制直方图。
实验内容:利用Excel软件编制组距数列并编制直方图实验资料:
某系50名男生的身高数据如下(单位:厘米)
160 | 163 | 165 | 166 | 167 | 167 | 168 | 168 | 169 | 169 |
169 | 170 | 171 | 171 | 171 | 172 | 172 | 172 | 172 | 172 |
173 | 173 | 174 | 174 | 174 | 175 | 175 | 175 | 175 | 175 |
175 | 175 | 176 | 176 | 176 | 177 | 177 | 178 | 178 | 179 |
179 | 180 | 180 | 181 | 182 | 183 | 185 | 185 | 191 | 166 |
要求:
(1)根据身高的变化范围确定一个合适的分组数目,确定组距;
(2)根据确定的组距编制开口组和不设开口组的组距数列,并比较两者的优劣;
(3)根据组距数列绘制直方图。
实验步骤:
第一步:运用Excel对原始数据进行排序,计算出数据的极差R。
160163 165 166 166 167 167 168 168 169 169 169 170 171 171 171 172 172172 172 172 173 173 174 174 174 175 175 175 175 175 175 175 176 176176 177 177 178 178 179 179 180 180 181 182 183 185 185 191
R=191-160=31
第二步:根据身高的变化范围确定一个合适的分组数目
根据经验公式: | K | ? | 1 | ? | ln | m |
| | | | | ln | 2 |
其中m为数据个数
则 | K | ? | 1 | ? | ln | m | ? | 1 | ? | ln | 50 | ? | 6 | ~ | 7 | |
| | | | | ln | 2 | | | | ln | 2 | | | | | |
初步确定开口组为K=5组,不设开口组为K=7组。开口组的组距d=R/K=31/5≈6-7其组距确定为5不设开口组人组距d为R/K=31/7≈5
第三步:运用Excel编制不设开口组的组距数列各组变量值如下:
158-163
163-168
168-173
173-178
178-183
183-188
188-193
运用Excel编制不设开口组的组距数列具体操作如下:(1)在使用Excel的直方图工具前准备数据的接受区域:163
168
173
178
183
188
193
注意:在连续型变量数据情况下,采用重叠分组时,Excel遵循上组限在内的原则,因此对确定的各组上限要做适当的减少。
(2)在Excel中 工具—加载宏—分析工具库—直方图;在输入区域选定原始数据区域,在接受区域将准备好的接受区域数据选定;选定输出区域;确定图表输出。
处理结果如下图:
身高 | 人数 |
158-163 163-168 168-173 173-178 178-183 183-188 188-193 | 1 |
合计 | 50 |
人数 | 20 | 某系50名男生身高数据 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
17
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
15 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
10 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
5 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 |
158-163163-168 168-173 173-178 178-183 183-188 188-193
运用Excel编制开口组的组距数列:
各组变量值如下:
165以下
165-170
170-175
175-180
180以上
运用EXCEL操作步骤同不设开口组的组距数列。结果如下:
身高分组 | 人数 |
165以下165-170 170-175 175-180 180以上 | 2 |
合计 | 50 |
人数 20 | 某系列50名学生身高人数分布
|
165以下165-170170-175 175-180 180以上
分析开口组和不设开口组的组距数列两者的优劣优劣:开口组能较好地将极端值汇总进来,避免出现次数为0的空白组或造成数列组数过多,从而反映出数据分布的特征。而不设口组可能因为极大值或极小值的存在,造成空白组过多,不能很好的体现数据的特征。