数据的统计与分析综合测试题(含答案)

发布时间 : 星期日 文章数据的统计与分析综合测试题(含答案)更新完毕开始阅读

25.今年是我国施行“清明”小长假的第二年,在长假期间,某校团委要求学生参加一项社会调查活动。九年级学生小青想了解她所居住的小区500户居民的家庭人均收入情况,从中随机调查了40户居民家庭的人均收入情况(收入取整数,单位:元)并绘制了如下的频数分布表和频数分布直方图: 频数分布直方图户数 22分组 频数 频率 20Ⅰ:600-799 2 0.05 1816Ⅱ:800-999 6 0.15

14Ⅲ:1000-1199 0.45

12Ⅳ:1200-1399 8 0.20 10 8Ⅴ:1400-1599 6Ⅵ:1600-1800 2 0.05 4 合计 40 1.00 2组 0ⅠⅡⅢⅥⅣⅤ

根据以上提供的信息,解答下列问题: (1)补全频数分布表、频数分布直方图;

(2)这40户家庭收入的中位数落在哪一个小组?

(3)被调查的家庭中,参加“清明扫墓“活动的家庭统计如下表:

收入情况 600-799 1 2800-999 13 1000-1199 1200-1399 14 1400-1599 1 1600-1800 1 参加扫墓家庭数被调查家庭数16 问:估计该小区共有多少户家庭参加了扫墓活动.

参考答案:

1-6:CACDCA 7-12:BBADAB 13.4 14.24 15.8

16.600,600或500,700 17.略

118.(1)x=10(106+99+100+113+111+97+104+112+98+110)=105(克).由此

估计这一批油桃中,每个油桃的平均质量为105克;

4(2)10×100%=40%,900×40%=360(千克).

估计这一批油桃中优级油桃占总数的40%,其质量为360千克. 19.(1)被污染处的人数为11人。设被污染处的捐款数为x元,则11x+1460=50×38, 解

得 x=40。答:(1)被污染处的人数为11人,被污染处的捐款数为40元。(2)捐款金额的中位数是40元,捐款金额的众数是50元. 20.(1)计算学生总数的时候,我们可以把各组频数进行相加即可得出:共抽取了300名学生的数学成绩进行分析;(2)在这300名学生中,共有105名学生80分以上(包括80分),在样本里面的优生率为35%,根据样本估计总体可知,该市的优生率为大约是35%;(3)在这300个学生中,60分及60分以上人数为210人,频率为0.7, 22000×0.7=15400(人),所以全市60分及60分以上人数估计为15400人。 21.(1)∵(540+450+300×2+240×6+210×3+120×2)÷15 =3900÷15=260(件), ∴这15名工人该月加工零件数的平均数为260件,

∵数据由低到高排序为: 120,120,210,210,210,240,240,240,240,240,240,300,300,450,540∴中位数为240. ∵240出现了6次,所以众数是240.

(2)工作任务确定为260件,不合理,

由题意知每月能完成260件的人数是4人,有11人不能完成任务.

尽管260是平均数,但不利于调动工人的积极性,而240既是中位数,又是众数.故任务确定为240较合理.

22.解:(1) 小明 小亮 第1次 第2次 13.4 13.4 第3次 第4次 13.2 第5次 (2)小明,波动小. (3)小明:平均数为13.3,极差为0.1,方差为:0.0283 小亮:平均数为13.3,极差为0.4,方差为:0.0632

23.解:(1)甲、乙、丙的民主评议得分分别为:50 分,80 分,70 分.

75?93?50218?≈72.67(分),

3380?70?80230?≈76.67(分) 乙的平均成绩为,

3396?68?70228??76(分) 丙的平均成绩为.

33 (2)甲的平均成绩为

由于76.67>76>72.67,所以候选人乙将被录用.

(3)如果将笔试、面试、民主评议三项测试得分按4∶3∶3的比例确定个人成绩,那

4?75?3?93?3?50?72.9(分),

4?3?34?80?3?70?3?80?77(分)乙的个人成绩为:,

4?3?34?90?3?68?3?70?77.4(分)丙的个人成绩为:.

4?3?3么甲的个人成绩为:

由于丙的个人成绩最高,所以候选人丙将被录用.

24.(1)调查:230÷46%=500人,a=20%,=12%,(2)略 (3)3500÷20%×(22%+46%)=11900(人)

25.略

(1) 第三组 (2) 11 一)单选题(10题,每题3分,总分30分) 1. SPSS主要应用于以下哪种类型的数据 ( ) A、横截面数据 B、数据序列数据 C、面板数据 D、以上都不对

2. SPSS处理多选题格式在以下哪个菜单里进行( ) A、设定表 B、多响应集 C、均值过程 D、交叉表

3. 检查异常值常用的统计图形( ) A、条形图 B、箱体图 C、帕累托图 D、线图 4. 使用SPSS变换长形或宽形数据结构的过程是( ) A、排列变量 B、正交设计 C、数据重组 D、数据转置

5. 线性回归里的残差分析不可能用于诊断( ) A、残差独立性 B、变量分布 C、异常值侦察 D、最大迭代次数

Photoshop学习教程Photoshop介绍Photoshop教程Photoshop快捷键Photoshop抠图技巧Photoshop动态图片

2 / 4

6. 使用单尾还是双尾检验主要依据( ) A、统计检验 B、理论依据 C、样本量大小 D、偏度或峰度值

7. 因子分析的主要作用( ) A、对变量进行降维 B、对变量进行判别 C、对变量进行聚类 D、以上都不对

8. 关于K-means 聚类过程正确的是( ) A、使用的是迭代的方法 B、均适用于对变量和个案的聚类 C、对变量进行聚类 D、以上都不对 9. 编程的基本语法规则错误的是( ) A、一条语句可占多行 B、选择待执行的语句后再运行

C、具体的选项用斜杠和语句主体相连 D、最后用分号结束语句

10. spss主要面向的商业应用领域是( ) A、大型企业 B、中小企业 C、连锁超市 D、以上都对

(二)判断题(5题,每题4分,总分20分)(对或错) 1. spss可以使用多线程技术处理海量数据。 ( )

2. t检验主要用于多分类(类别数大于等于3)类别检验的情景。 ( ) 3. 在一次实验中,概率小(p<0.05)事件不可能发生。 ( ) 4. 变量间的相关性可以是非线性的。 ( )

5. logistic回归模型的因变量是二分类的变量。 ( ) 3 / 4

(三)简答题(30题,每题15分,总分30分)

1.根据企业需要建立线性回归方程需要注意哪些问题,如何处理? (例如异方差、共线性、分布等模型方面)

2.请简要分析线性回归、因子分析、聚类分析在具体商业中的应用? 及其优缺点。 4 / 4

(四)论述题(20分)

阐述数据处理的整个流程,及其相关注意事项

1.计算平均有哪些指标,各有哪些优缺点 2.数据库查询语句,给了两个表 3.相关分析和回归分析有什么关系

4.给出一组数据说是服从正态分布,求方差和均值 5.给出一个概率分布函数,求极大似然估计

6.决策树和神经网络在数据预处理过程中用到哪些方法 7.数据挖掘的应用步骤

8.给出浙江移动的移动客户数和缺失率,问如何建立客户缺失率预测模型会遇到哪些难题如何解决

9.给了一段文字,大概是说预测彩信用户量的。三个小问题,a,问会用到哪些统计数学模型,如何选择模型为什么 b 如何客户变量间的数据相关性 c 如何评价模型 第三部分 逻辑推理题 2道

1.给出4个论述,说其中只有一人是正确的,给出了5个答案,说出哪个答案正确 2.5个人分100颗钻石问题

个海盗分100颗宝石 每个人提出一种意见 如果意见有半数或以上通过 就算通过并实施 否则把提出意见得丢海里干掉 如果第一个人意见没通过就杀掉并由第二个人提出建议,以此类推。

条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择。第一保命,第二挣钱,第三尽可能多的杀人

问题:第一个海盗提出怎样的分配方案才能够使自己的收益最大化 参考答案: 如果2个人 100,0 如果3个人

99,0,1(如果不想一无所得的话,最后一个人肯定同意) 如果四个人 99,0,1,0 如果5个人 98,0,1,0,

联系合同范文客服:xxxxx#qq.com(#替换为@)