一、统计(核心思想:用样本估计总体) 1.抽样(每个个体被抽到的概率相等) (1)简单随机抽样 :抽签法与随机数表法 (2)系统抽样(等距抽样) (3)分层抽样 2.用样本估计总体:
(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差 (2)样本频率分布估计总体:频率分布直方图与茎叶图
3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法) 4.独立性检验
二、概率(随机事件发生的可能性大小) 1.基本概念
(1)随机事件A的概率PA0,1
(2)用随机模拟法求概率(用频率来估计概率) (3)互斥事件(对立事件) 2.概率模型
(1)古典概型(有限等可能) (2)几何概型(无限等可能) 三、参考练习题
1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .
2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.
第1 页,共12页
3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教类 别 人数 师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年老年教师 900 教师人数为_______ .
中年教师 1800 4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是_____. 青年教师 1600 5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____. 合 计 4300 6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图: 则这组数据的中位数是________.
7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
8.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),… ,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;
(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (Ⅲ)估计居民月均用水量的中位数.
文科数学 第2 页,共12页
满意度评分 低于70分 70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 9.(2015全国Ⅱ文)某公
司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表. A地区用户满意度评分的频率分布直方
图
B地区用户满意度评分的频数分布表 满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频 数 2 8 14 10 6 (Ⅰ)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分
的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
第3 页,共12页
(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:
试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (Ⅰ)应收集多少位女生的样本数据?
(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;
(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
0.10 0.05 0.01 0.005 附:K2nadbc2PK2k0 abcdacbd
k2.706 3.841 6.635 7.879 0
文科数学 第4 页,共12页
11.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值分组 [75,85) [85,95) [95,105) [105,115) [115,125] 频 数 6 26 38 22 8
(Ⅰ)在下表中作出这些数据的频率分布直方图:
(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);
(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
第5 页,共12页
12.(2014广东文)某车间20名工人年龄数据如下表:
(Ⅰ)求这20名工人年龄的众数与极差;
(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; (Ⅲ)求这20名工人年龄的方差.
13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .
14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .
15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .
16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .
文科数学 第6 页,共12页
17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为
11,甲获胜的概率是,则甲不23输的概率为_________ .
18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .
19.某单位N名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表. 区间 [25,30) [30,35) [35,40) [40,45) [45,50] a b 人数 25
(Ⅰ)求正整数a,b,N的值;
(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?
(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.
20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )
24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .
25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x(cm) 儿子身高y(cm) 174 175 176 175 176 176 176 177 178 177
则y对x的线性回归方程为( )
ˆx1 B.yˆx1 C.yˆ88 A.y26.某产品的广告费用x与销售额y的统计数据如下: 广告费用x(万元) 销售额y(万元) 4 49 2 26 3 39 1ˆ176 x D.y25 54
ˆxaˆ为9.4,据此模型预报广告费用为6万元时销售额为 ˆbˆ中的b根据上表可得回归方程y A.63.6万元 B.65.5万元 C.67.7万元 D.72.0万元
27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年 份 时间代号t 储蓄存款y(千亿元) 2011 1 5 2012 2 6 2013 3 7 2014 4 8 2015 5 10 1123 A. B. C. D.
323421.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) 7533 B. C. D. 10881022.在区间[-2,3]上随机选取一个数x,则x1的概率为_____ .
23.若将一个质点随机投入如图所示的长方形ABCD中,其中AB=2,BC=1,则质点落在以AB为直径的半圆内的概率是_______ . A.
ˆtaˆbˆ; (Ⅰ)求y关于t的回归方程y (Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情
第7 页,共12页 文科数学 第8 页,共12页
甲 校 乙 校 总 计 况,并优 秀 预测非优秀 该地总 计 区2016
年(t=6)的人民币储蓄存款.
nˆiyinty 附:回归方程yˆbtaˆ中,bˆti1n,aˆybˆt. t2int2i1
28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:
分 组 [70,80) [80,90) [90,100) [100,110) 频 数 3 4 8 15 分 组 [110,120) [120,130) [130,140) [140,150] 频 数 15 x 3 2 乙校:
分 组 [70,80) [80,90) [90,100) [100,110) 频 数 1 2 8 9 分 组 [110,120) [120,130) [130,140) [140,150] 频 数 10 10 y 3
(1)计算x,y的值;
第9 页,共12页
(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.
参考数据与公式:由列联表中数
据
计
算
PK2k0.010 0 0.10 0.05 k0 2.706 3.841 6.635 2K2nadbcabcdacbd;
临界值表:
29.一次考试中,5名学生的数学、物理成绩如下表所示:
学生 A B C D E 数学成绩x(分) 89 91 93 95 97 物理成绩y(分) 87 89 89 92 93 (1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;
文科数学 第10 页,共12页
(2)根据上表数据作散点图,分组(岁) 频数 求y与频数x的线性回归 [20,25) 5 0.050 [25,30) 20 0.200 [30,35) a 0.350 [35,40) 30 b [40,45] 10 0.100 合计 100 1.000 方程(系数精确到0.01).
nxixyiy 附:回归直线的方程是:yˆbˆxaˆ,其中bˆi1n,aˆybˆx; xx2ii1525 x93,y90,xix40,xixyiy30.
i1i1
30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取
第11 页,共12页
100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.
(1)求频率分布表中a、b的值,并补全
频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;
31.(2016新课标Ⅱ)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:
上年度出险次数 0 1 2 3 4 5 保费 0.85a a 1.25a 1.5a 1.75a 2a 设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数 0 1 2 3 4 5 概率 0.30 0.15 0.20 0.20 0.10 0.05 (Ⅰ)求一续保人本年度的保费高于基本保费的概率;
32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机
文科数学 第12 页,共12页
摸出2只球,则这2只球颜色不同的概率为____________ .
33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求: (1)所取的2道题都是甲类题的概率; (2)所取的2道题不是同一类题的概率.
34.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89 B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79
(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
第13 页,共12页
文科数学第14 页,共12页
因篇幅问题不能全部显示,请点此查看更多更全内容