横断面研究又称横断面调查,因为所获得的描述性资料是在某一时点或在一个较短时间区间内收集的,所以它客观地反映了这一时点的疾病分布以及人们的某些特征与疾病之间的关联。由于所收集的资料是调查当时所得到的现况资料,故又称现况研究或现况调查(prevalence survey);又因横断面研究所用的指标主要是患病率,又称患病率调查。
编辑本段二、研究目的 1.描述疾病或健康状况的三间分布情况 通过对某一地区或人群的调查,获得某种疾病在时间、地区和人群中的分布,从而发现高危人群或发现有关的病因线索,为疾病的防治提供依据。
2.描述某些因素或特征与疾病的关联,确定危险因素 如通过对冠心病及其危险因素的调查,发现高血压、高血脂、超重、吸烟及有关职业与冠心病的关系,从而为降低危险因素、减少冠心病发生提供依据。
3.为评价防治措施及效果提供有价值的信息 如在采取措施若干时期后,重复进行横断面研究,根据患病率差别的比较,可以考核前段时期所施行措施的效果。
4.为疾病监测或其他类型流行病学研究提供基础资料。
编辑本段三、研究的用途 1.描述疾病或健康状况的分布。
2.评价一个国家或地方的健康水平。
3.研究影响人群健康和与疾病有关的因素。
4.用于卫生服务需求的研究。
5.用于医疗或预防措施及其效果的评价。
6.用于有关卫生标准的制定和检验。
7.用于检查和衡量既往资料的质量。
8.用于社区卫生规划的制定与评估。
编辑本段四、横断面研究的分类(一)普查 普查是指为了解某病的患病率或某人群的健康状况,在一定时间内对一定范围内的人群中的每一成员作调查或检查。这里强调的是"一定范围内的人群中的每一个成员"。例如某居民点的全体居民。一定时间可以是1-2天或1-2周,大规模的普查也可在2-3个月内完成。普查的时间不能拖的太长,以免人群中的疾病或健康状况发生变动,而影响普查的质量。
我国开展普查工作有较丰富的经验。对肿瘤、心血管疾病、甲状腺肿、乙型肝炎、结核病等都进行过大规模的普查工作。其中有些疾病通过早期治疗与反复防治已得到控制或基本控制,取得了显著的成果。
普查的主要目的是为了早期发现病例并给予及时治疗。普查的疾病最好是患病率比较高的,以便短时间内调查能得到足够的病例。
普查由于是调查某一人群的所有成员,所以在确定调查对象上比较简单;而且所获得的数据可以了解疾病的三间分布特征,因此对疾病的流行因素能有一定的启示。
但普查不适用于病程短、患病率低或检查方法复杂的疾病调查。由于普查对象多,难免漏诊、误诊;因参加普查的工作人员多,掌握调查技术和检验方法的熟练程度不等,调查员质量不易控制;同时由于工作量大,很难进行深入细致的调查。
(二)抽样调查 在实际工作中通常是从总体中随机抽取部分观察单位(统计学上称为样本)进行调查称为抽样调查。抽样调查是根据抽取样本所调查的结果来估计出样本所代表总体的某些特征,因此抽样调查必须遵循随机化原则,才能获得较好代表性样本。抽样调查可以节省人力、物力、时间。因其调查范围小,故调查工作易做得细致。但抽样调查的设计、实施与资料分析较复杂,重复和遗漏不易发现,不适用于变异过大的研究对象。
常用的随机抽样方法如下:
1.单纯随机抽样(simple random sampling) 即先将调查总体的全部观察单位编号,再用随机数字表或抽签等方法随机抽取部分观察单位组成样本。
目前,在横断面研究中,因调查的观察单位太多时,很难将全部观察单位编号,故使用单纯随机抽样的机会不多,但它是实施其他抽样方法的基础。
2.系统抽样(systematic sampling) 又称等距抽样或机械抽样。即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第K号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位组成样本。
例1 欲了解某单位职工HBSAg阳性率,该单位有职工1000人,试按系统抽样法,抽取一例数为100的样本。
今总体例数N=1000,样本例数=100,抽样间隔=1000/100=10,先在1-10之间随机确定一个数字,比如为4,于是以职工工作证号4,14,24,34,…,994者组成样本。
3.分层抽样(stratified sampling) 又称分类抽样。即先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计学上叫“层”,Strata),再从每一层内随机抽取一定数量(可按比例或最优分配确定)的观察单位,合起来组成样本。
例如,先将欲调查的总体按年龄、性别或疾病严重性等特征分成不同层次,在各层再作随机抽样。分层抽样可以减少由各层特征不同而引起的抽样误差。
4.整群抽样(cluster sampling) 在整群抽样中,被抽样的不是一个一个的个体,而是由一个一个的个体组成的若干个集团(群)。整群抽样是先将总体划分为K个"群"组(如K个地区等),每个群包括若干观察单位。再从K个群中随机抽取若干个群,并将被抽取的各个群的全部观察单位组成样本。
例如,作钩虫病调查时,抽查某县的几个乡的全体乡民。作计划生育调查时,抽查城市里几个居委会的全部居民。
因抽样调查是从总体中随机抽取部分观察单位作为调查对象,所以抽样调查不可避免产生抽样误差,抽样误差的大小因抽样方法不同而异,一般情况下,抽样误差从小到大的顺序为分层抽样、系统抽样、单纯随机抽样、整群抽样。
(三)抽样调查的样本大小 求估计总体均数(或率)所需样本例数n的方法如下(作假设检验时,n的估计方法详见实验设计)。
1.均数的抽样 对于计量资料,欲估计总体均数时,可用公式估计样本例数
n=[(tαs)/d]2 (15-1)
式中n为样本例数,d为允许误差,即样本均数与总体均数相差所允许的限度(事先指定的),s为估计的标准差,可通过前人资料或小规模的调查得到。当α确定后,式中tα可查t界值表(取双侧)。通常,若样本较大,α取0.05,tα=1.96,近似为2,则
n=(4s2)/d2 (15-2)
例2 现拟调查小学生血红蛋白含量,估计标准差为3g/dl,希望d不超过0.5g/dl,α=0.05,问需调查多少人?
本例s=3,d=0.5, α=0.05,按公式15-2计算:
n=(4×32)/0.52=144(人)
即需要调查144人。
2.率的抽样 对于计数资料,欲估计总体率时,可用公式估计样本例数。
n=[tα2P(1-P)]/d2 (15-3)
式中P为估计率,其余符号的意义同前。
设d=rP(r为P的允许误差系数),则公式成为:
n= (tα2/r2)[(1-P)/P] (15-4)
通常设: α=0.05,r=0.1,用公式16-4变换为:
n=(4/0.12)[(1-P)/P]=400×[(1-P)/P] (15-5)
例3 现拟调查血吸虫感染率,据过去资料估计流行率P=30%,设α=0.05,d=0.1P,问需调查多少人?
本例,P=0.30,α=0.05,r=0.1,按公式15-5计算:
n=400×[(1-0.3)/0.3]=933(人)
即需要调查933人。
(四)横断面研究的资料分析 横断面研究所得资料,可按下列步骤进行整理分析。
1.检查与核对原始资料,检查原始资料的准确性与完整性,填补缺漏,删去重复,纠正错误。
2.对疾病或某种健康状态按已明确规定好的标准,将全部调查对象分组归类。
3.将原始资料分组进行比较,了解疾病或某健康状态在不同地区、不同时间以及不同人群组中的分布。
(五)横断面研究中常见的偏倚 当某一研究(观察)结果,与它的真值之间,出现了某种差值,这种差异的现象或结果,即称为偏倚(bias)。
1.无应答偏倚(nonresponse bias) 对访问调查或通信调查获得应答的比例称应答率。影响应答率的因素有:1)群众对调查了解的程度;2)调查方式或调查内容是否适当;3)调查对象身体健康,故不关心疾病调查;4)调查对象身体不好,或高龄拒绝调查;5)调查对象外出未遇等。如果无应答者比例较高,例如在抽样调查中达30%,即可造成偏倚。
2.回忆偏倚或报告偏倚 这是由调查对象所引起的偏倚。例如某病患者常能较好地回忆既往的暴露史,而健康人则常遗忘以往的暴露。当调查某些敏感性问题时,调查对象可能不愿做正确答复而造成报告偏倚。
3.调查人员偏倚 例如调查员有意识地对具有某些特征的对象深入调查,对另一些则否。有时为了获得自已所需要的内容或答案,进行诱导性询问等。
4.测量偏倚 由于仪器不准、试剂不统一、实验条件不同等造成测量结果不正确,可使调查结果偏离真值。
(六)横断面研究中的质量控制 质量控制即偏倚的控制,这是现况调查成败的关键。上述偏倚应在设计阶段预先考虑防止发生。主要的控制方法如下。
1.坚持随机化原则,严格按照抽样设计方案进行研究对象的选取。及时分析无应答的原因,补漏调查,提高受检率。
2.选用精良的仪器设备并事先做好校准,保证测试结果的准确与可靠。 3.严格培训调查员,并对其进行监督和质量控制,统一调查程序和方法