《抽样调查》习题
重庆工商大学统计专业适用
概述
一、选择题
1、概率抽样与非概率抽样的根本区别是( )
A.是否能保证总体中每个单位都有完全相同的概率被抽中
B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中C.是否能减少调查误差
D.是否能计算和控制抽样误差
2、优良估计量的标准是()
A.无偏性、充分性和一致性
C. 无误差性、一致性和有效性
B.无偏性、一致性和有效性
D.无误差性、无偏性和有效性
3、以下哪种抽样不属于非概率抽样()
A、判断抽样 B、方便抽样 C、不等概率抽样 D、配额抽样
4、抽样调查的根本功能是( )
A. 获取样本资料 B. 计算样本资料
C . 推断总体数量特征 D. 节约费用
5、以下哪个选项不是概率抽样的特点( )
A、总体中每个单元都有一定的非0 概率被抽中
B、当用样本对总体目标量进行估计时,要考虑样本(或每个样本单元)的入样概率
C、计算并控制抽样误差
D、使用范围比非概率抽样广
二、判断题
(1) 营业员从笼中抓取最靠近笼门的母鸡,该种抽样方式属于非概率抽样。
(2) 某企业想了解其产品在市场的占有率,宜采用全面调查。
(3) 偏倚与抽样误差一样都是由于抽样的随机性产生的。
三、简答分析题
1、 结合以下所列情况讨论哪些适合用全面调查,哪些适合用抽样调查,并说明理由;
(1) 研究居住在某城市所有居民的食品消费结构;
(2) 调查一个县各村的粮食播种面积和全县生猪的存栏头数;
(3) 为进行治疗,调查一地区小学生中患沙眼的人数;
(4) 调查一地区结核病的发生率;
(5) 估计一个水库中草鱼的数量;
(6) 某企业想了解其产品在市场的占有率;
(7) 调查一个县中小学教师月平均工资。
2、讨论以下所列情况是否属于概率抽样,并说明理由:
(1) 从一个包含有100只兔子的实验室大笼子里抓10只兔子做实验。研究人员不经任
何挑选抓到哪只就算那一只,抓满10只为止。
(2) 将笼中的100只兔子编上1~100号,任意列出10个不重复的数字(为1~100之
间的整数),以相应的兔子作为抽中作试验的样本;
(3)从钱包中随便抽出一纸币,凡兔子号码尾数与该纸币编号尾数相同者及作为抽中
的样本。
3、 某刊物对其读者进行调查,调查表随刊物送到读者手中,对寄回的调查表进行分析。
试问这是不是一项抽样调查?样本抽取是不是属于概率抽样?为什么?
4、 要抽样调查一个城市的家庭总收入。回答以下问题:
(1)定义什么是总体,在确定总体时应作哪些说明。
(2)选择合适的抽样框和确定抽样单位;若有其他的抽样框和抽样单位,试比较其优
缺点。
5、 两家机构在同一城市调查吸烟与肺癌的关系。一家机构以吸烟者全体为总体,
抽样调查肺癌发病率;另一家机构以肺癌病人为总体,抽样调查有吸烟史者所占比
例。试评注这两种方法。如果由你来组织这次调查,总体选择什么,如何抽样?
6、 要抽样调查一本数理统计书的总字数。回答以下问题:
(1) 定义什么是总体,在确定总体时应作哪些说明。
(2) 选择合适的抽样框和确定抽样单位;若有其他的抽样框和抽样单位,试比
较其优缺点。
简单随机抽样
一、选择题
1、假设根据抽样方差公式确定的初始样本量为400,有效回答率为0.8,那么实际样本量应
为:( | ) | B 800 | C 400 | D 480 |
A 320 |
2、已知某方案的设计效应为0.8,若计算得简单随机抽样的必要样本量为300,则该方案
所需样本量为()
A 375 | B 540 | C 240 | D 360 |
3、假设根据抽样方差公式确定的初始样本量为400,如现在要将抽样相对误差降低20%,
则样本量应为:( )
A 256 B 320 C 500 D 625
4、与简单随机抽样进行比较,样本设计效果系数Deff>1表明( )
A.所考虑的抽样设计比简单随机抽样效率低
B.所考虑的抽样设计比简单随机抽样效率高
C.所考虑的抽样设计与简单随机抽样效率相同
D.无法判断
6、 | 抽样标准误差的大小与下列哪个因素无关( | ) ) | ||||||||||||
A.样本容量 | B.抽样方式、方法 | |||||||||||||
C.概率保证程度 | D.估计量 | |||||||||||||
7、 | 抽样标准误差与抽样极限误差之间的关系是( | |||||||||||||
A. | ? | ? | SE | (?)? | B. | ? | ? | tSE | (??) | |||||
? | | |||||||||||||
C. | ? | ? | tSE | (?)? | D. | ? | ? | SE | (??) | |||||
| ? | t | | |||||||||||
二、判断题
1. 样本分布就是抽样分布。
2. 简单随机抽样,每个单位被抽中的概率相等,每个可能的样本被抽中的概率也相等。
3. 总体(1~17)。抽法:从1~100中随机抽取一个数R,除以17,以余数作为抽中的数。这
是等概率抽样。
4. 抽样方差加偏差即为均方误差
5. 其他条件相同时,重复抽样的误差小于不重复抽样的误差。
6. 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:
128157 506 455 127 7 867 954 938 622
7. 对于同一总体,样本容量同抽样标准误差之间是正相关关系。()
8. 设总体容量为N,样本容量为n,采用有顺序放回简单随机抽样,所有可能样本数为
CNn
。( )
9. 当调查单位的抽样框不完整时,无法直接实施简单随机抽样。( )
三、简答分析题
1. 讨论下列从总体中筹得的样本是否是等概率抽选(回答“是”或“否”);
(1) 总体(1-112)。抽法:从数1-56中随机抽取一个数r,再从数1-2中抽取一个
数,以决定该数为r或56+r;
(2) 总体(1-112)。抽法:首先从1-2中抽选一个数以决定两个群1-100或
101-112,再从抽中的群中随机抽选一个数r;
(3) 总体(1-1109)。抽法:从1-10000中抽选一个随机数r,若第一位是偶数,则 用后面的三位数来表示1-1000(以000代表1000);若第一位数是奇数,当后面的 三位数在101-109之间就代表1001和1109,若在110和1000之间被抛弃,重新 抽选r;
(4) 4.总体(67084-68192)。抽法:从1-1109中抽选一个随机数r,然后用r+67083 作为被抽选的数;
四、计算题
2、某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,得?=12.5,s2=12.52。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本?
4. 从一叠单据中用简单随机抽样方法抽取了250张,发现其中有50张单据出现错误,试以95%的置信度估计这批单据中有错误的比例。若已知这批单据共1000张,你的结论有何变化?若要求估计的绝对误差不超过1%,则至少抽取多少张单据作样本?
分层抽样
一、选择题
单选题
1、最优分配分层抽样,()。
A.可以使抽样误差最小 C.样本均数是无偏的
B.可以使调查费用最小
D.要求的样本含量最小
2、分层抽样的设计效应一般()。
A.等于1 B.小于1 C.大于1 D.无法判断
3、分层抽样分层的原则是()。
A.层内差异小,层间差异大 B.层内差异大,层间差异小
C.层间差异小 D.层内差异大
8、 最优分配、比例分配的分层随机抽样与相同样本量的简单随机抽样的方差之间的关
系为()
A、最优分配<比例分配<简单随机抽样
B、最优分配>比例分配>简单随机抽样
C、比例分配<简单随机<最优分配
D、简单随机<最优分配<比例分配
9、 | 下面哪种样本量分配方式属于奈曼分配? ( | ) | ||||||||||||
A. | n h | ? | n | B. | n h | ? | N S h | h | / | | c h | |||
| N | h | | N | | n | | L h?1 | N S h | h | / | c h | | |
C. | n k | ? | N S h | h | h | D. | n h |
| ? | W S h | h | | ||||||
n | L h?1 | N S h | | n | ) | | L h?1 | W S h | h | |||||||||
E. | n h | ? | W S h | h | / | / | c h | |||||||||||
n | L h?1 | W S h | h | c h | ||||||||||||||
10、分层抽样又被称为( | ||||||||||||||||||
A.整群抽样 B.类型抽样 C.分类抽样
D.系统抽样 E.逆抽样
11、最优分配(Vopt)、比例分配(Vprop)的分层随机抽样与相同样本量的简单随机抽
样(Vsrs)的精度之间的关系式为( )
A、Vopt?Vprop?Vsrs B、Vprop?Vopt?Vsrs
C、Vprop?Vopt?Vsrs D、Vsrs?Vprop?Vopt
12、 事后分层的适用场合有( )
A、一般场合都可以适用
B、几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难
C、一个单位到底属于哪一层要等到样本数据收集到以后才知道
D、总体规模太大,事先分层太费事
13、在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用
( )
A.分层比估计 B.联合比估计 C.分别回归估计
D.联合回归估计 E.分别简单估计
14、 | 分层抽样设计效应满足( | ) | deff ? | 1 | D、 | deff ? | 1 | |||||
A、 | deff ? | 1 | B、 | deff ? | 1 | C、 | ||||||
二、判断题
1、分层抽样在划分层时,要求层内差异尽可能大,层间差异尽可能小。
三、简答分析题
教材1、2、4
1. 某大学统计系接受一项有关计算机的社会调查,组织者将全市分为学校、机关、医 院、等若干不同行业,按一定比例让学生自行赴各行业走访直到满足该行业指定的 调查额为止。这是分层抽样吗?试评价此方法。
2. 简述分层抽样中样本量在各层的三种主要分配方法,并说明各种方法的主要思想。
四、计算题
比估计与回归估计一、选择题
1、某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123
个村,抽取13 个村调查今年的产量,得到 | y | ? | 118 . 63 | 吨,这些村去年的产量平均 | |||||
为 | x | ? | 104 . 21 | 吨。试采用比率估计方法估计今年该地区小麦总产量( | ) | ||||
A.12820.63 | B.14593.96 C.12817.83 | D.14591.49 | |||||||
2、当 | ?为某一特定常数时,比率估计量可看成是回归估计量的特例,此时该常数值为 | ||||||||
( | ) | ||||||||
y
A.1 | | B.0 | ? | f | C. | x | ?2 | S | 2 | D. | x |
| 达到极小值的 | ?值为( | | ||||||||||||
V | ( | y | ) | ? | 1 | ( | S | 2 | ? | ? | 2?S | YX | |||||||||||||||
lr | | | | n | | Y | | | X | |
| ) | |||||||||||||||
3、能使 | |||||||||||||||||||||||||||
A. | S ?Y | S | X | B. | S | YX | C. | S | YX | D. | S2 YX | ||||||||||||||||
| S | YX | | | | | | | S | 2 | | | | | | S | 2 Y |
| | S | X | | |||||
4、应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间
大致成( | )关系 | C.负相关 | D.以上皆是 |
A.正比例 | B.反比例 |
二、判断题
1. 采用比率估计的原因之一是在估计总体均值或总体总量时可以通过一个辅助变量来提高 抽样效率
2. 比估计量是有偏估计量。
三、简答分析题
四、计算题
不等概率抽样
一、选择题
二、判断题
1. 不等概率抽样可以改善估计量,提高抽样效率
2. 推算总体总量时,此时若总体单元的差异较大,则进行简单随机抽样的效率比不等概率
抽样要低。( )
3. 使用PPS抽样,其入样概率是由说明总体单元大小的辅助变量确定的,即辅助变量确定
每一个总体单元的入样概率。()
教材120页2、3、4
1、研究人员欲估计一批电子元件板上的缺陷数,由于缺陷数与板上的电子元件数目有关,故
采用与元件数目成比例的放回的PPS抽样。设N=10,每块板上电子元件的数目按顺序分
别为10,12,22,8,16,24,9,10,8,31,设n=4。现要求
(1) 说明样本的抽选方法;
(2) 若抽中的单元按前面排列的序号是第2,3,5,7这四个元件板,其缺陷数分
别为1,3,2,1,试根据这一抽样结果,估计这批元件上共有多少个缺陷数。
(3) 给出上述估计量的方差估计。
三、简答分析题
1. 如果设想从全市中随机抽取若干商业企业调查以估计全市某年零售总值。
(1)你认为是等概率还是不等概率抽样为好?请说明理由;
(2)如果采用不等概率抽样,那么各商业企业入样概率以什么指标计算为佳?
(3)请具体选择一种不等概率抽样方法来实施,要求简单说明方法、步骤。
四、计算题
整群抽样
一、选择题
1、关于群规模大小不等时,下列说法错误的是( )
A、 若群规模相差不多,则一般以平均群大小代替,依照群规模大小相等的情形处
理
B、 如果群规模相差较大,可将群按大小分层,使每一层内群的规模大小基本相等,
从而仍可使用群规模大小相等时的处理方法
C、 对群仍用简单随机抽样,采用比率估计的形式
D、 对群仍用简单随机抽样,采用简单估计的形式
2、关于整群抽样(群规模相等)的设计效应,下面说法正确的有()
A. | deff | ? | V y ( ) | ??1 ( | M | ? | 1)? | | | | | | ||
| | | V | srs | ( ) | | | | c | 1 ( | M | ? | 1)?c | 倍 |
B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的 | ||||||||||||||
C.群内相关系数的估计值为 | ?c | ? | s | 2 | s | 2 | ? | s | 2 | s | 2 | |
b | ||||||||||||
? | ( | M | ? | 1) | ||||||||
b | ? | |||||||||||
D.要提高整群抽样估计效率,可通过增大群内单元的差异实现
E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高
3、整群抽样中的群的划分标准为()。
A.群的划分尽可能使群间的差异小,群内的差异大 B、群的划分尽可能使群间的差异大,群内的差异小 C、群的划分尽可能使群间的差异大,群内的差异大 D、群的划分尽可能使群间的差异小,群内的差异小
4、下面关于群内相关系数的说法错误的是()
A、若群内次级或基本单元变量值都相等则群内相关系数取最大值1B、若群内方差大于总体方差时,则群内相关系数取负值
C、群内相关系数值愈小,则群内单元的差异愈大
D、群内相关系数越大,整群抽样设计效应越小
二、判断题
4. 整群抽样设计总是比简单随机抽样效率低。
5.一般而言整群抽样设计效应较大。
6.构造群的抽样框同构造简单随机抽样的抽样框一样都很容易。
7.在PPS抽样时,若用代码法,则单元愈大被赋予的代码数就愈多,使每个单元入样的 概率与单元大小成比例。
8. PPS抽样是放回的简单随机抽样,由于抽样是放回的,就使某个单元可能在样本中出 现多次。
9. 群内相关系数值愈小,则群内单元的差异愈大
10.整群抽样对中选的群中的所有总体单元进行调查()
11.对于自然形成的群,无法通过调整群内单元而控制,这时要提高抽样效率就只能增大样 本量。( )
12.整群抽样有构造抽样框相对简单,样本量相对集中、调查费用节约的特点。( )
13.一个调查单位只能对应于一个抽样单位。()
14.
三、简答分析题
1、 若欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合 适,如果不合适你认为采用什么抽样方式好。
(1)少数民族的居住比较集中;
(2)少数民族比较均匀得分布在各街道;
(3)少数民族分散在各街道但比重不同。
2、 | 假设整群抽样的样本群数为n,每个群有M 个单元,群间方差为 | S | b | 2 | ,群内方差为 | S | w | 2 |
试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(抽样比f可忽略不
计)。
四、计算题(教材)
多阶抽样
一、选择题
1、在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用( )。
A.系统抽样 B、简单随机抽样 C、不等概率抽样 D、非概率抽样
2、在初级单元大小相等的二阶段抽样中,当抽取次级单元的数量相等时,二阶段抽样的方
差与整群抽样方差以及分层抽样方差之间的关系通常为()。 | ||||||||||||||||||
A、 | 二阶段抽样的方差<整群抽样的方差<分层抽样的方差 | |||||||||||||||||
B、 | 二阶段抽样的方差>整群抽样的方差>分层抽样的方差 | |||||||||||||||||
C、 | 分层抽样的方差<二阶段抽样的方差<整群抽样的方差 | |||||||||||||||||
D、 | 分层抽样的方差>二阶段抽样的方差>整群抽样的方差 | |||||||||||||||||
3、两阶(段)抽样中,对于一个估计量?? 的均值可以表示为()。 | ||||||||||||||||||
A. | E | (??) | ? | E 1 | [ | E | 2 | (??)] | ||||||||||
B. | E | (??) | ? | E | 2 | [ | E 1 | (??)] | ||||||||||
C. | E | (??) | ? | 1 | [ | E 1 | (??) | ? | E | 2 | (??)] | |||||||
2 | ||||||||||||||||||
D. | E | (??) | ? | 1 | [ | E 1 | (??) | ? | E | 2 | (??)] | |||||||
2 | ||||||||||||||||||
4、关于多阶段抽样的阶段数,下列说法最恰当的是()。 | ||||||||||||||||||
A、越多越好 | B、.越少越好 | |||||||||||||||||
C、.权衡各种因素决定 D、根据主观经验判断
二、判断题
1. 多阶段抽样各阶段样本方差都分别是其总体方差的无偏估计。
2. 当二阶段抽样基本单位数一定时,要减少抽样方差,应多抽初级单元,少抽次级单元,
这有可能造成费用上升。( )
3. 二阶抽样当第一阶对初级单元进行PPS抽样,第二阶采用简单随机抽样时,且每个初级
单元内的二级单元样本量相等,得到的估计量是自加权的。( )
4.
三、分析题
1、以某高校的学生全体为总体,你能否给出二个有关多阶段抽样的例子,一个是初级
单元大小相等的,另一个是初级单元大小不相等的。
四、计算题
等距抽样
一、选择题
1、以下哪点不是系统抽样的优点( )
A、 简便易行,容易确定样本单元
B、样本单元在总体中分布较简单随机抽样均匀;
C、采用有关标志排队可提高估计的精度
D、 系统抽样的方差估计较为简便
二、判断题
1. 当N不为k的整数倍时,按循环等距抽样方法抽取的样本为有偏偏样本。
2. 当系统抽样的间隔恰好与循环周期的整数倍相一致时,系统抽样的误差将会很大。
3. 总体单元按有关标志排队就是指各单元的排列顺序与所研究的内容无关,但与总体单元
的规模大小有关。
4. 对称系统抽样与一般系统抽样的主要区别在于此时起始单元不是一个而是两个,它们的
位置对称,数值大小相抵,因而改进了估计量的精度。( )
5. 系统抽样可以看成整群抽样的一个特例,从k群中随机抽取1个群的整群抽样。
( )
6.
三、分析题
1、假设某书共有555页,现欲每隔20页抽1页作样本,以估计该书的字数。
(1)从l一20中抽取一个随机起点用直线等距(系统)抽样,并有多少个可能的样本,样
本量是多少?
(2)若从1一555中抽取—个随机数除以20,将余数作为随机起点(余数为0代表20),
然后每隔20页抽取l页,这种抽样方法与前—种方法有什么区别?
(3)采用圆形系统抽样如何抽选.一共有多少个可能样本?
(4)以上的抽选方法中以样本均值来估计总体均值,哪些是有偏的,哪些是无偏的?
2、设N=35,按对称系统抽样抽取样本,n=7,若随机起点r=4,试分别用塞蒂的层内
对称系统抽样方法和辛的总体对称系统抽样方法列出抽中样本单元的顺序号码
3、一个审计员欲估计一个企业的应收帐户,准备从应收帐户中抽取10%来核对帐面金
额与实际审计结果的差别。
(1) 假设帐户的顺序是按时间排列的,过去帐户的金额比较小,现在帐户的金额比
较大。你准备采用系统抽样还是简单随机抽样?
(2) 假设帐户的金额大小是随机的,你准备采用什么抽样?假设帐户是按企业的部
门分类,然后按时间排列,帐户的金额过去小现在大,你建议采用什么抽样方法?
四、计算题