第一节 计数资料常用指标
作者:徐荣祥 出书社:中国科学手艺出书社 刊行日期:2009年7月
一、 率的抽样误差和标准误
关于抽样误差的看法已在第一章中作了先容,在抽样研究中,获得的样本率与总体率或各样本率之间一定也保存着“率”的抽样误差。均数抽样误差爆发的缘故原由与之相同。体现率(比)抽样误差巨细的统计指标叫率的标准误。如某医生视察了某乡某种疾病的患病率为15%(即视察1 000人有150人患这种疾�。�,但在抽样历程中一定会有抽样误差。被视察的这个乡是一个整体,若是再次重复视察1 000人,其患病率纷歧定是15%,可能高一点,也可能低一点。这种差别是由于抽样所造成的。率的标准误凭证公式盘算:
式中αp为率的标准误,π为总体率,n为样本的含量。
由于π为总体率,现实事情中一样平常不知道它的数值,故常用样本率p来取代,从而盘算出率的标准误的预计值(Sp),盘算公式为:
式中Sp为率的标准误预计值; p为样本率;n为样本的含量
示例341某医生用一种新药治疗烧伤康复期血虚,100例病人有75例血液血红卵白增添至10g/L以上,求血红卵白增添率的标准误。
【解题办法】
1盘算血红卵白增添率:75÷100=075,或750%。
2将数值代入公式342,盘算血红卵白增添率的标准误:
3剖析:血红卵白增添率为750%,其标准误为185%。由此可见,率的标准误反应率的抽样误差巨细,是权衡样本率的稳固性和可靠性的指标。率的标准误越小,体现率的抽样误差越小,用以预计总体率的可靠性越大。反之,率的标准误也越大,则由样本预计总体率的可靠性就越小。
4意义:有了率的标准误,可以用其来确定总体率的可信区间;还可用于样本率与总体率及两个样本率之间差别的显著性磨练。
二、总体率的可信区间
由于样本率与总体率之间保存误差,以是我们只能凭证样本率来推算总体率的可能性。当总体率π不太靠近0或1时,且每次抽样的样本视察数n又不是太小时,样本率的漫衍也属正态漫衍。因此可以凭证率的标准误,模拟预计均数可信区间要领预计总体率所在的规模,这个规模即为总体率的可信区间。
总体率的可信区间公式为:
式中p为标准率,Sp为率的标准误,U为常量。
总体率区间的表达参数与公式:①求95%可信区间的参数接纳196; ②求99%可信区间的参数接纳258。
即:总体率95%可信区间为:
总体率99%可信区间为:
示例342某医院用新疗法治疗大面积烧伤病人243例,治愈236例,殒命7例,病死率为288%。求其总体病死率95%和99%的可信区间。
【解题办法】
1凭证例中提供的资料已知:病死率P=288%,(1-P)=9712%,n=243。
2将以上数据代入公式(342),求病死率的标准误:
3凭证公式(344)、(345),求出95%、99%的可信区间:
(1)总体率95%的可信区间规模为:P±196SP,即288%±196×(107)=288%±210%。说明总体病死率有95%的可能性在078%~498%之间。
(2)总体率99%的可信区间规模为:P±258SP,即288%±258×(107)=288%±276%。说明总体病死率有99%的可能性在012%~564%。
4剖析:由于抽样误差的保存,当发明两个率或两个以上的率之间保存差别时,应思量到差别是真正保存的,照旧由于抽样误差造成的,故应举行显著性磨练。