人口老龄化加剧的背景下,我国先后颁布了一系列生育政策,根据不同政策要求,分为两个时期 T1 和 T2.根据部分调查数据总结出如下规律:对于同一个家庭,在 T1 时期内生孩 X 人,在 T2 时期生孩 Y 人,(不考虑多胞胎)生男生女的概率相等.X 服从 0−1 分布且 P(X=0)=15.Y 分布列如下图: Y012Ppp+qp−q
现已知一个家庭在 T1 时期没生孩子,则在 T2 时期生 2 个孩子概率为 124;若在 T1 时期生了 1 个女孩,则在 T2 时期生 2 个孩子概率为 16;若在 T1 时期生了 1 个男孩,则在 T2 时期生 2 个孩子概率为 112,样本点中 T1 时期生孩人数与 T2 时期生孩人数之比为 2:5(针对普遍家庭).
1、求 Y 的期望与方差.
2、由数据 zi(i=1,2,⋯,n)组成的样本空间根据分层随机抽样分为两层,样本点之比为 a:b,分别为 xi(i=1,2,⋯,k)与 yi(i=1,2,⋯,m,k+m=n,总体样本点与两个分层样本点均值分别为 ¯z,¯x,¯y,方差分别为 S20,S21,S22,证明:S20=aa+b(S21+(¯x−¯z)2)+ba+b(S22+(¯y−¯z)2),
并利用该公式估算题设样本总体的方差.
解析
1、根据题意,有 X 的分布列为X01P1545
根据 Y 的分布列,可得p+(p+q)+(p−q)=1⟹p=13,
而根据全概率公式,一个家庭在 T2 时期升 2 个孩子的概率为15⋅124+25⋅16+25⋅112=13120,
从而p−q=13120⟹q=27120,
这样就有 Y 的分布列为Y012P136712013120
进而可计算得 Y 的期望为 3140,方差为 18774800.
2、根据题意,有RHS=1n⋅(k∑i=1(xi−¯x)2+k(¯x−¯z)2+m∑i=1(yi−¯y)2+m(¯y−¯z)2)=1n⋅(k∑i=1x2i−k¯x2+k¯x2−2k⋅¯x⋅¯z+k¯z2+m∑i=1y2i−m¯y2+m¯y2−2m⋅¯y⋅¯z+m¯z2)=1n⋅(n∑i=1z2i+(k+m)¯z2−2¯z⋅(k¯x+m¯y))=1n⋅(n∑i=1z2i−n¯z2)=LHS,
命题得证.根据题意,有E(X)=45,D(X)=425,E(Y)=3140,D(Y)=18774800,
于是总体均值¯z=27⋅45+57⋅3140=219280,
题设样本总体的方差为27⋅(425+(45−219280)2)+57⋅(18774800+(3140−219280)2)≈0.3252.