参数估计
的有关信息介绍如下:参数估计,是根据样本的数据,按照一定公式计算出某个数字特征(平均数、方差等),来估计总体的某些数字特征。参数估计分点估计(或称定值估计)与区间估计两种。
在此之前,样本可理解为从一批样品中,通过观测或化验得到的一批固定数据,如γ照射量率、径迹密度、微量元素的含量等。但是,由于上述变量的随机性,加上抽样的随机性,因而容量为n的样本,实质上是一个n维随机变量。于是样本的特征数,如平均数
(一)样本特征数与总体特征数之间的关系
如果总体的均值为μ、方差为σ2;样本容量为n,样本平均值�x的均值为
1)样本平均数�x的均值等于总体的均值,即
放射性勘探技术
放射性勘探技术
2)样本平均数的方差等于总体方差除于样本容量n,即
放射性勘探技术
放射性勘探技术
3)样本方差的均值等于总体的方差,即
放射性勘探技术
放射性勘探技术
但这时s2的计算公式要用
上述式(8-17)~式(8-19)是用“样本”推断“总体”的理论根据。
(二)样本平均数
1)总体服从正态分布N(μ,σ2),则不论样本容量大小(即不论n为多大),样本平均数
2)若总体不服从正态分布,但样本容量很大(n>30~50)时,则样本平均数
3)若总体服从正态分布,只要样本容量n>20,则样本标准差S的分布近似正态分布N[μ,σ2/(2n)]。
上述这些关系是很重要的,是统计推断的重要理论根据。
(三)点估计
点估计是对总体参数做一定数值的估计。就是选择一个统计量(即根据样本数值,经过某种运算得到的特征数,如均值、均方差、偏度、峰度等),假如
由式(8-17)和式(8-18)可知,无论总体服从何种分布,也无论样本容量n为多少,总有样本平均数�x是总体均值μ的无偏估计量。样本方差s2是总体方差σ2的无偏估计量。因此实际工作中往往用一批γ照射量率观测数据的众数(或平均数)来估计某岩体(测区)的γ照射量率底数,以一批铀矿石样品的平均品位来估计某矿带或矿床的铀平均品位;用样本的方差s2来估计总体方差σ2。
(四)区间估计与信度
点估计(定值估计)难免有偏差,而且偏差的程度也不好估计。因此往往用区间估计来估计总体参数。区间估计不仅能对总体参数做出估计,且能指出总体参数落在此区间内的概率大小(概率用P来表示)。若以A表示某随机事件,则其概率记为P{A}。显然,概率小于等于1(必然事件),大于等于0(不可能事件),即0≤P≤1。
由前已知,当样本容量大(即n>30~50)时,不论总体服从何种分布(总体均值为μ,方差为σ2),总有样本平均数�x服从正态分布。根据本项目学习任务二的几个常用概率值可知
放射性勘探技术
放射性勘探技术
根据以上分析可知,任何一个用来估计的区间,都联系于一定的概率值。这种概率反映了用该区间做估计的可信程度,故称置信概率,也称保证概率。然而,实际工作中,往往是先定出置信概率的大小,然后推算出一个具有这个置信概率的估计区间。通常人们在给出置信概率大小时,又不是直接给出置信概率,而是给出1与置信概率的大小的差,并用α来表示(即α=1-置信概率),α称为信度(或信任系数、置信水平、显著性水平),α介于0~1之间,表示犯错误的概率。由于置信概率=1-α,如α=5%,则置信概率=1-0.05=0.95。于是总体参数μ的估计区间定为
估计区间可用来确定抽样误差、预测矿石品位等方面。确定抽样误差(用样本的特征数,如平均数与方差来估计总体的特征数如均值与方差时所产生的偏差),就是在一定信度α下确定该误差范围,即置信区间。抽样误差用m来表示。例如用样本平均数μ来估计总体均值μ时的抽样误差范围,就是在一定信度下用区间(X-m,X+m)来估计总体均值μ,即
放射性勘探技术
放射性勘探技术
式中:m——抽样误差;
t——概率系数;
σ——总体标准差;
n——样本容量。
因此,确定抽样误差,也就是在一定信度下,用区间
下面用一个例子来说明区间估计的应用。
[例8-3]用FD-3013B型仪器在某燕山早期第三阶段花岗岩体(
解:由于信度α=0.05,故置信概率=1-α=0.95。所求的抽样误差m应满足下式:
放射性勘探技术
放射性勘探技术
即
放射性勘探技术
放射性勘探技术
当α=0.05时,查得t=1.96,又由于n=154是个大样本,于是可用样本标准差s代替总体标准差σ,则抽样误差是
放射性勘探技术
放射性勘探技术
所以该岩体的放射性γ照射量率为(42.3±2.2)γ,也就是说,在信度为5%的条件下,该岩体放射性γ照射量率置信区间为(40.1γ,44.5γ)。