Warning: include(../include/header.inc.php) [function.include]: failed to open stream: No such file or directory in /data/foodmate/lesson/41/2-3.php on line 12

Warning: include() [function.include]: Failed opening '../include/header.inc.php' for inclusion (include_path='.:/usr/local/php/lib/php') in /data/foodmate/lesson/41/2-3.php on line 12
 

第三节 离散程度的统计描述指标

描述数值变量资料频数分布的另一主要特征是离散程度,用变异指标表示。只有把集中指标和离散指标结合起来才能全面反映资料的分布特征。常用变异指标有全距、四分位数间距、方差、标准差、变异系数。

1.全距(range,简记为R):亦称极差,是一组同质观察值中最大值与最小值之差。它反映了个体差异的范围,全距大,说明变异度大;反之,全距小,说明变异度小。用全距描述定量资料的变异度大小,虽然计算简单,但不足之处有:①只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度;②样本含量越大,抽到较大或较小观察值的可能性越大,则全距可能越大。因此样本含量相差悬殊时不宜用全距比较。

2.四分位数间距(quartile,简记为Q):为上四分位数QU(即P75)与下四分位数QL(即P25)之差。四分位数间距可看成是中间50%观察值的极差,其数值越大,变异度越大,反之,变异度越小。如例2.7中,已求得QU=P75=35.82小时,QL=P25=15.34小时,则四分位数间距Q= QU-QL==35.82-15.34=20.48(小时)。由于四分位数间距不受两端个别极大值或极小值的影响,因而四分位数间距较全距稳定,但仍未考虑全部观察值的变异度,常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。

3.方差(variance):为了全面考虑观察值的变异情况,克服全距和四分位数间距的缺点,需计算总体中每个观察值X与总体均数的差值(X-),称之为离均差。由于Σ(X-μ)=0,不能反映变异度的大小,而用离均差平方和Σ(X-)2(sum of squares of deviations from mean)反映之,同时还应考虑观察值个数N的影响,故用式(2.9)即总体方差σ2表示。

(2.9)

在实际工作中,总体均数μ往往是未知的,所以只能用样本均数作为总体均数的估计值,即用代替,用样本例数n代替N,但再按式(2.9)计算的结果总是比实际小。英国统计学家W.S.Gosset提出用n-1代替n来校正,这就是样本方差s2其公式为:

(2.10)

式中的n-1称为自由度( degree of freedom)。

4.标准差(standard deviation):方差的度量单位是原度量单位的平方,将方差开方后与原数据的度量单位相同。标准差大,表示观察值的变异度大;反之,标准差小,表示观察值的变异度小。计算见公式(2.11)和(2.12)。

(1.11)

(1.12)

离均差平方和常用SSlXX表示。数学上可以证明:,所以,样本标准差的计算公式可写成:

直接法:(2.13)

加权法:(1.14)

5.变异系数(coefficient of variation,简记为CV):常用于比较度量单位不同或均数相差悬殊的两组或多组资料的变异度。其公式为

(2.15)


 

Warning: include(../include/footer.inc.php) [function.include]: failed to open stream: No such file or directory in /data/foodmate/lesson/41/2-3.php on line 53

Warning: include() [function.include]: Failed opening '../include/footer.inc.php' for inclusion (include_path='.:/usr/local/php/lib/php') in /data/foodmate/lesson/41/2-3.php on line 53