第四节 概率与统计的综合问题
考点一 概率与统计图表的综合问题
[典例] 学校将高二年级某班级50位同学期中考试的数学成绩(均为整数)分为7组进行统计,得到如图所示的频率分布直方图.观察图中信息,回答下列问题.
(1)试估计该班级同学数学成绩的平均分;
(2)现准备从该班级数学成绩不低于130分的同学中随机选出两人参加某活动,求选出的两人在同一组的概率.
[解] (1)由频率分布直方图可知,所求数学成绩的平均分为85×0.06+95×0.1+105×0.24+115×0.28+125×0.2+135×0.08+145×0.04=113.6,
故该班级同学数学成绩的平均分约为113.6.
(2)由频率分布直方图可知,数学成绩不低于130分的人数为50×0.08+50×0.04=4+2=6,其中,分数在[130,140)的有4人,分别记作a,b,c,d,分数在[140,150]的有2人,分别记作m,n.
从该班级数学成绩不低于130分的同学中选出2人共有15个基本事件,列举如下:ab,ac,ad,am,an,bc,bd,bm,bn,cd,cm,cn,dm,dn,mn.其中,选出的两人在同一组的有7个基本事件,分别是:ab,ac,ad,bc,bd,cd,mn.
7故选出的两人在同一组的概率P=.
15[对点训练]
如图所示的茎叶图记录了甲、乙两组各四名同学的植树棵数,其中有一个数据模糊,无法确认,在图中以X表示.
贾老师数学同步辅导精讲精练教材
(1)如果X=8,求乙组同学植树棵数的平均数和方差;
(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率. 解:(1)当X=8时,由茎叶图可知,乙组四名同学的植树棵数分别是8,8,9,10,故x=35353521352119-2+10-2=. ,s=×8-4×2+441644
(2)当X=9时,记甲组四名同学分别为A1,A2,A3,A4,他们植树的棵数依次为9,9,11,11;乙组四名同学分别为B1,B2,B3,B4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,其包含的基本事件为{A1,B1},{A1,B2},{A1,B3},{A1,B4},{A2,B1},{A2,B2},{A2,B3},{A2,B4},{A3,B1},{A3,B2},{A3,B3},{A3,B4},{A4,B1},
{A4,B2},{A4,B3},{A4,B4},共16个.设“选出的两名同学的植树总棵数为19”为事件C,则事件C中包含的基本事件为{A1,B4},{A2,B4},{A3,B2},{A4,B2},共4个.
41
故P(C)==.
164
考点二 概率与随机抽样的综合问题
[典例] 已知某中学高三文科班学生共有800人参加了数学与地理的水平测试,现学校决定利用随机数表法从中抽取100人进行成绩统计,先将800人按001,002,003,…,800进行编号.
(1)如果从随机数表的第8行第7列的数开始向右读,请你依次写出最先抽取到的3个人的编号. (2)所抽取的100人的数学与地理的水平测试成绩如下表:
人数 地 优秀 数学 优秀 7 良好 20 及格 5 8+8+9+10
=4
贾老师数学同步辅导精讲精练教材
理 良好 及格 9 a 18 4 6 b
成绩分为优秀、良好、及格三个等级,横向、纵向分别表示地理成绩与数学成绩,例如表中数学成绩为良好的人数为20+18+4=42.若在该样本中,数学成绩优秀率为30%,求a,b的值.
(3)若a≥10,b≥8,求“在地理成绩为及格的学生中,数学成绩为优秀的人数比及格的人数少”的概率.
附:(下面摘取了随机数表的第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 [解] (1)依题意,最先抽取到的3个人的编号依次为785,567,199. 7+9+a
(2)由题意可得=0.3,解得a=14.
100
因为7+9+a+20+18+4+5+6+b=100,所以b=17. (3)由题意知a+b=31,且a≥10,b≥8,
则满足条件的(a,b)有(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),(16,15),(17,14),(18,13),(19,12),(20,11),(21,10),(22,9),(23,8),共14组.
其中满足“在地理成绩为及格的学生中,数学成绩为优秀的人数比及格的人数少”的(a,b)有(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),共6组.
63故所求概率P==.
147
[对点训练]
某大型手机连锁店为了解销售价格在区间[5,30](单位:百元)内的手机的利润情况,从2018年度销售的一批手机中随机抽取75部,按其价格分成5组,频数分布表如下:
价格分组(单位:百元) 频数(单位:部) [5,10) 5 [10,15) 10 [15,20) 20 [20,25) 15 [25,30] 25 (1)用分层抽样的方法从价格在区间[5,10),[10,15)和[20,25)内的手机中共抽取6部,其中价格在区间[20,25)内的有几部?
(2)从(1)中抽出的6部手机中任意抽取2部,求价格在区间[10,15)内的手机至少有1部的概率.
解:(1)因为在区间[5,10),[10,15)和[20,25)内的手机的数量之比为5∶10∶15=1∶2∶3,所以抽取的3
6部手机中价格在区间[20,25)内的有6×=3(部).
6
(2)这6部手机中价格在区间[5,10)内的有1部记为a,在区间[10,15)内的有2部,分别记为b1,b2,在
贾老师数学同步辅导精讲精练教材
区间[20,25)内的有3部,分别记为c1,c2,c3,从中任取2部,可能的情况有(a,b1),(a,b2),(a,c1),(a,c2),(a,c3),(b1,b2),(b1,c1),(b1,c2),(b1,c3),(b2,c1),(b2,c2),(b2,c3),(c1,c2)(c1,c3),(c2,c3),共15种;
设“价格在区间[10,15)内的手机至少有1部”为事件A,则事件A包含的情况有(a,b1),(a,b2),(b1,b2),(b1,c1),(b1,c2),(b1,c3),(b2,c1),(b2,c2),(b2,c3),共9种.
93故P(A)==.
155
考点三 概率与数字特征的综合问题
[典例] (2019·重庆六校联考)2019年高考特别强调了要增加对数学文化的考查,为此某校高三年级特命制了一套与数学文化有关的专题训练卷(文、理科试卷满分均为100分),并对整个高三年级的学生进行了测试.现从这些学生的成绩中随机抽取了50名学生的成绩,按照[50,60),[60,70),…,[90,100]分成5组,制成了如图所示的频率分布直方图(假定每名学生的成绩均不低于50分).
(1)求频率分布直方图中x的值,并估计所抽取的50名学生成绩的平均数、中位数(同一组中的数据用该组区间的中点值代表);
(2)用样本估计总体,若高三年级共有2 000名学生,试估计高三年级这次测试成绩不低于70分的人数;
(3)若利用分层抽样的方法从样本中成绩不低于70分的学生中抽取6人,再从这6人中随机抽取3人参加这次考试的分析会,试求成绩在[80,100]的学生至少有1人被抽到的概率.
[解] (1)由频率分布直方图可得第4组的频率为1-(0.01+0.03+0.03+0.01)×10=0.2,则x=0.02. 故可估计所抽取的50名学生成绩的平均数为(55×0.01+65×0.03+75×0.03+85×0.02+95×0.01)×10=74(分).
由于前两组的频率之和为0.1+0.3=0.4,前三组的频率之和为0.1+0.3+0.3=0.7,故中位数在第3组中.
贾老师数学同步辅导精讲精练教材
220
设中位数为t分,则有(t-70)×0.03=0.1,得t=,
3220
即所求的中位数为分.
3
(2)由(1)可知,50名学生中成绩不低于70分的频率为0.3+0.2+0.1=0.6,用样本估计总体,可以估计高三年级2 000名学生中成绩不低于70分的人数为2 000×0.6=1 200.
(3)由(1)可知,后三组中的人数分别为15,10,5,由分层抽样的知识得这三组中所抽取的人数分别为3,2,1. 记成绩在[70,80)的3名学生分别为a,b,c,成绩在[80,90)的2名学生分别为d,e,成绩在[90,100]的1名学生为f,则从中随机抽取3人的所有可能结果为(a,b,c),(a,b,d),(a,b,e),(a,b,f),(a,c,d),(a,c,e),(a,c,f),(a,d,e),(a,d,f),(a,e,f),(b,c,d),(b,c,e),(b,c,f),(b,d,e),(b,d,f),(b,e,f),(c,d,e),(c,d,f),(c,e,f),(d,e,f),共20种.
其中成绩在[80,100]的学生没人被抽到的可能结果为(a,b,c),只有1种, 119故成绩在[80,100]的学生至少有1人被抽到的概率P=1-=.
2020
[解题技法]
本题主要考查概率与数字特征,涉及频率分布直方图,平均数、中位数、分层抽样、古典概型的概率计算等知识.解决此类问题的关键是正确理解图表中各个量的意义,牢记相关定义和公式,在利用频率分布直方图,求平均值时,不要与求中位数,众数混淆.
[对点训练]
(2019·唐山五校联考)某篮球队在本赛季已结束的8场比赛中,队员甲得分统计的茎叶图如下:
(1)求甲在比赛中得分的均值和方差;
(2)从甲比赛得分在20分以下的6场比赛中随机抽取2场进行失误分析,求抽到2场都不超过均值的概率.
11
解:(1)甲在比赛中得分的均值x=×(7+8+10+15+17+19+21+23)=15,方差s2=×[(-8)2+
88(-7)2+(-5)2+02+22+42+62+82]=32.25.
(2)甲得分在20分以下的6场比赛分别为:7,8,10,15,17,19. 从中随机抽取2场,这2场比赛的得分如下:
(7,8),(7,10),(7,15),(7,17),(7,19),(8,10),(8,15),(8,17),(8,19),(10,15),(10,17),(10,19),(15,17),(15,19),(17,19),共15种,
其中抽到2场都不超过均值的情形是:
(7,8),(7,10),(7,15),(8,10),(8,15),(10,15),共6种,
贾老师数学同步辅导精讲精练教材
62
所以所求概率P==.
155
考点四 概率与统计案例的综合问题
[典例] 里约奥运会中国女排勇夺金牌,某校高一课外小组为了解金牌争夺战现场直播时同学们的观看情况,从本年级500名男生、400名女生中按分层抽样的方式抽取45名学生进行了问卷调查,观看情况分成以下三类:全程观看、部分观看、没有观看,调查结果统计如下:
男生 女生 (1)①求出表中x,y的值; ②从没有观看的同学中随机选取2人进一步了解情况,求恰好男生、女生各1人的 概率; (2)根据表格统计的数据,完成下面的列联表,并判断是否有90%的把握认为全程观看与性别有关.
全程观看 非全程观看 总计 附:K2=
男生 女生 总计 全程观看 18 10 部分观看 x 6 没有观看 2 y nad-bc2,其中n=a+b+c+d.
a+bc+da+cb+d
P(K2≥k0) k0 0.10 2.706 0.05 3.841 0.01 6.635
500
[解] (1)①由分层抽样知抽取的男生人数为×45=25,抽取的女生人数为45-25=20,因而x=25
900-20=5,y=20-16=4.
②从表中数据可以得出,没有观看的同学共6人,2名男生分别记为A1,A2,4名女生分别记为B1,B2,B3,B4,则从中随机选取2人,有A1A2,A1B1,A1B2,A1B3,A1B4,A2B1,A2B2,A2B3,A2B4,B1B2,B1B3,B1B4,B2B3,B2B4,B3B4,共15种情况,记“男生、女生各1人”为事件M,其包含的情况有A1B1,A1B2,A1B3,A1B4,A2B1,A2B2,A2B3,A2B4,共8种,
8所求概率P(M)=.
15(2)由题意得列联表如下:
全程观看 非全程观看 男生 18 7 女生 10 10 总计 28 17 贾老师数学同步辅导精讲精练教材
总计 45×180-702
K=≈2.288<2.706,
28×20×17×25
2
25 20 45 因而没有90%的把握认为全程观看与性别有关.
[对点训练]
某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:
日期 昼夜温差x/℃ 就诊人数y/个
该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻两个月的概率;
(2)若选取的是1月份与6月份的两组数据,请根据2月份至5月份的数据,求出y关于x的线性回归^^^方程y=bx+a;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
1月10日 2月10日 3月10日 4月10日 5月10日 6月10日 10 11 13 12 8 6 22 25 29 26 16 12 xiyi-n x y
^
参考公式:b=
i=1
n
n
^^
,a=y-b x.
2
x2i-n x
i=1
参考数据:11×25+13×29+12×26+8×16=1 092, 112+132+122+82=498.
解:(1)设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,且每种情51
况都是等可能的,其中,选到相邻两个月的数据的情况有5种,所以P(A)==.
153
(2)由表中2月份至5月份的数据可得x=11,y=24,xiyi=1 092,x2i=498,
i=1
i=1
4
4
贾老师数学同步辅导精讲精练教材
xiyi-4 x y
^所以b=
i=1
4
4
18=, 7
2
xi2-4 x
i=1
30^^
则a=y-b x=-,
7
^1830
所以y关于x的线性回归方程为y=x-.
77150^150
-22<2; (3)当x=10时,y=,7778^78
-12<2. 当x=6时,y=,77所以该小组所得线性回归方程是理想的.
[课时跟踪检测]
1.(2019·太原八校联考)为了解甲、乙两个快递公司的工作状况,假设同一个公司快递员的工作状况基本相同,现从甲、乙两公司各随机抽取一名快递员,并从两人某月(30天)的快递件数记录结果中随机抽取10天的数据,制图如下:
每名快递员完成一件货物投递可获得的劳务费情况如下:
甲公司规定每件4.5元;乙公司规定每天35件以内(含35件)的部分每件4元,超出35件的部分每件7元.
(1)根据图中数据写出甲公司员工A在这10天投递的快递件数的平均数和众数;
(2)为了解乙公司员工B每天所得劳务费的情况,从这10天中随机抽取1天,他所得的劳务费记为X(单位:元),求X>182的概率;
(3)根据图中数据估算两公司的每位员工在该月所得的劳务费.
1
解:(1)甲公司员工A在这10天投递的快递件数的平均数为(32+33+33+38+35+36+39+33+41
10+40)=36,众数为33.
(2)设a为乙公司员工B每天的投递件数,则 当a=35时,X=140,
当a>35时,X=35×4+(a-35)×7,
令X=35×4+(a-35)×7>182,得a>41,则a的取值为44,42,
贾老师数学同步辅导精讲精练教材
42
所以X>182的概率P==.
105
(3)根据题图中数据,可估算甲公司的每位员工该月所得劳务费为4.5×36×30= 4 860(元),易知乙公司员工B每天所得劳务费X的可能取值为136,147,154,189,203,
所以乙公司的每位员工该月所得劳务费约为165.5×30=4 965(元).
2.(2018·湖北五校联考)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:
爱好 不爱好 总计
(1)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由.
(2)利用分层抽样的方法从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派2人参加某项校际挑战赛,求选出的2人中恰有1名女大学生的概率.
附:
P(K2≥k0) k0 K2=0.050 3.841 0.010 6.635 0.001 10.828 男 40 15 55 女 20 25 45 总计 60 40 100 1
×(136+147×3+154×2+189×3+203)×30=10
nad-bc2
,其中n=a+b+c+d.
a+bc+da+cb+d
100×40×25-20×152
≈8.249>6.635,
55×45×60×40
解:(1)∵K2=
∴有99%的把握认为是否爱好该项运动与性别有关.
(2)由题意,抽取的6人中,有男生4名,分别记为a,b,c,d;女生2名,分别记为m,n. 则抽取的结果共有15种:(a,b),(a,c),(a,d),(a,m),(a,n),(b,c),(b,d),(b,m),(b,n),(c,d),(c,m),(c,n),(d,m),(d,n),(m,n),
设“选出的2人中恰有1名女大学生”为事件A,事件A所包含的基本事件有8种:(a,m),(a,n),(b,m),(b,n),(c,m),(c,n),(d,m),(d,n).
8
则P(A)=.
15
8
故选出的2人中恰有1名女大学生的概率为.
15
3.(2019·西安八校联考)某工厂有25周岁以上(含25周岁)的工人300名,25周岁以下的工人200名.为了研究工人的日平均生产件数是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,
贾老师数学同步辅导精讲精练教材
得到如图所示的频率分布直方图.
(1)根据“25周岁以上(含25周岁)组”的频率分布直方图,求25周岁以上(含25周岁)组工人日平均生产件数的中位数的估计值(四舍五入保留整数);
(2)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(3)规定日平均生产件数不少于80的工人为生产能手,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
25周岁以上(含25周岁)组 25周岁以下组 总计 附:K2=
nad-bc2,n=a+b+c+d.
a+bc+da+cb+d
P(K2≥k0) k0 0.100 2.706 0.050 3.841 0.010 6.635 0.001 10.828 生产能手 非生产能手 总计 300解:采用分层抽样,“25周岁以上(含25周岁)组”应抽取工人100×=60(名),“25周岁以
300+200200
下组”应抽取工人100×=40(名).
300+200
0.5-0.05-0.35
(1)由“25周岁以上(含25周岁)组”的频率分布直方图可知,其中位数为70+10×=
0.3570
20
≈73(件). 7
综上,25周岁以上(含25周岁)组工人日平均生产件数的中位数的估计值为73件.
(2)由频率分布直方图可知,样本中日平均生产件数不足60件的工人中,25周岁以上(含25周岁)的工人共有60×0.005×10=3(名),设其分别为m1,m2,m3;25周岁以下的工人共有40×0.005×10=2(名),
贾老师数学同步辅导精讲精练教材
设其分别为n1,n2,则从中抽取2人的所有基本事件为(m1,m2),(m1,m3),(m1,n1),(m1,n2),(m2,m3),(m2,n1),(m2,n2),(m3,n1),(m3,n2),(n1,n2),共10个.
记“至少抽到一名‘25周岁以下组’的工人”为事件A,事件A包含的基本事件共7个. 7
故P(A)=.
10
(3)由频率分布直方图可知,25周岁以上(含25周岁)的生产能手共有60×[(0.02+0.005)×10]=15(名),25周岁以下的生产能手共有40×[(0.032 5+0.005)×10]=15(名),则2×2列联表如下:
25周岁以上(含25周岁)组 25周岁以下组 总计 K2=100×15×25-15×452≈1.786<2.706.
60×40×30×70
生产能手 15 15 30 非生产能手 45 25 70 总计 60 40 100 综上,没有90%的把握认为“生产能手与工人所在的年龄组有关”.
4.某商店为了更好地规划某种商品进货的量,该商店从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下表所示(x(吨)为该商品进货量,y(天)为销售天数):
x/吨 y/天
2 1 3 2 4 3 5 3 6 4 8 5 9 6 11 8
(1)根据上表数据在网格中绘制散点图;
^^^
(2)根据上表提供的数据,求出y关于x的线性回归方程y=bx+a;
(3)在该商品进货量x(吨)不超过6吨的前提下任取2个值,求该商品进货量x(吨)恰有一个值不超过3吨的概率.
贾老师数学同步辅导精讲精练教材
xi-xyi-y
^
参考公式和数据:b=
i=1
n
88
^^2,a=y-b x.xi=356,xiyi=241.
n
xi-x
i=1
2
i=1i=1
解:(1)散点图如图所示:
1
(2)依题意,得x=(2+3+4+5+6+8+9+11)=6,
81
y=(1+2+3+3+4+5+6+8)=4,
8
xi-xyi-yxiyi-8x y
^b=
i=1
8
i=1
88
=2
xi-x
i=1
x2i-8x
i=1
8
=2
241-8×6×449
=, 68356-8×62
4911^
∴a=4-×6=-,
6834
^4911
∴y关于x的线性回归方程为y=x-.
6834
(3)由题意知,该商品进货量不超过6吨的有2,3,4,5,6共有5个,任取2个有(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共10种情况,故该商品进货量恰有一次不超过3吨的有(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),共6种情况,
63
故该商品进货量恰有一次不超过3吨的概率P==.
105
因篇幅问题不能全部显示,请点此查看更多更全内容