第六章数理统计基本概念2020版概率与统计学习导引
时间:2020-11-23 20:23:02 来源:勤学考试网 本文已影响 人
实用文档 用心整理
PAGE
PAGE 1
千里之行 始于足下
第六章 数理统计的基本概念
一、内容提要
数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带有随机性的数据,建立数学方法,去揭示所研究问题的统计规律性。它的主要内容是由样本来推断总体。
(一)基本概率
1. 总体、个体与样本:研究对象的全体称为总体,用X、Y等表示。组成总体的每个元素称为个体或单元。从总体中按一定的规律抽出一些个体就称为抽样,所抽及的个体称为样本,用X1,X2,…,Xn表示。一般样本容量小于50的样本称为小样本,样本容量大于等于50的样本称为大样本,但在样本不易实现时,样本容量大于30的样本可看作大样本。
包含有限个个体的总体称为有限总体,包含无限个个体的总体称为无限总体。
2. 简单随机抽样与简单随机样本:如果总体中各个个体被抽到的机会是均等的,并且在抽取一个个体后总体的成分不变,那么,抽得的一些个体就能很好地反映总体的情况,基于这种想法抽取个体的方法称为简单随机抽样。抽得的这些个体构成一个样本,用(X1,X2,…,Xn)表示,n为样本容量,X1,X2,…,Xn应是n个相互独立的且与总体X同分布的随机变量,并将这种样本称为简单随机样本,简称样本。
本书所讨论的样本,如无特别声明,均指简单随机样本。
样本(X1,X2,…,Xn)是n个相互独立的且与总体同分布的随机变量,而一次抽取之后,(X1,X2,…,Xn)又是n个具体的数据x1,x2…,xn,即样本的一组观测值,在不致引起混淆的情况下,样本和样本值都用(X1,X2,…,Xn)表示,这就是样本的二重性。
3. 样本分布函数(或经验分布函数):设样本(X1,X2,…,Xn)的观测值按由小到大次序排列后为:
定义
,
为样本分布函数
对于样本的不同观测值(x1,x2…,xn),我们将得到不同的Fn(x),所以Fn(x)是一个随机变量。对于这个随机变量,可以证明:
格利文科(W.Gliveoko)定量:当n→∞时,Fn(x)以概率1关于x均匀地收敛于总体的分布函数F(x),即
4. 统计量:凡是由样本构成的不含任何未知参数的函数称为统计量。样本是随机变量,则统计量亦为随机变量,从而也都有确定的分布。一旦取得了样本值X1,X2,…,Xn以后,统计量又是具体的数,这就是统计量的二重性。
5. 样本均值、样本方差与样本标准差:
样本均值:称为样本(X1,X2,…,Xn)的样本均值。
样本方差:
=
称为样本(X1,X2,…,Xn)的样本方差。
样本标准差:称为样本(X1,X2,…,Xn)的样本标准差,又称标准误。
对于样本的一组观测值(x1,x2…,xn),样本均值,样本方差和样本标准差都是具体的数值,记作
(6.1)
(6.2)
(6.3)
若对于一容量为n的样本,已知观测值x1,x2…,xl的相应的频数为f1,f2,…,fl,且。则可用下列公式计算样本均值及样本方差:
(6.4)
(6.5)
(二)抽样分布
统计量的分布又称为抽样分布。将重要的抽样分布及其概率密度、图像列于表6.1。
(三)百分位点、双侧百分位点的概念
设X~N(0,1)若Zα满足P{X>Zα}=α,即,则称Zα为N(0,1)分布的上100α百分位点。1-α称为置信概率,α称为显著性水平,如图6-1。
由对称性知:。
若满足,则称为N(0,1)分布的双侧100α百分位点,如图6-2。
图6-1 图6-2
2. 分布
设~(n),对给定的α,称满足条件,即的点,为分布的上100α百分位点,如图6-3。
类似N(0,1)分布,可定义分布的双侧百分位点与满足,如图6-4。
图6-3 图6-4
3. t分布
设t~t(n),对给定的α,称满足条件
表6.