【IPR Group】临床流行病学：分析流行病学研究Day3

9/29/2019

IPR Group

全科之窗|ABC平台

1779

9/29/2019 12:00:00 AM

除了前述5个通用的科研板块【科学思维&集成创新】、【文献检索&分析管理】、【研究设计&研究方法】、【数据处理&统计分析】、【科学写作&公开发表】。医学科研还有其独特的属性和内容，即临床流行病学、循证医学、医学伦理学、卫生经济学、医学科技成果转化，五大模块。

在【科研相关的医学辅修课】版块，我们将一一系统介绍以上五门学科的主要内容，供大家有基本了解。

以下内容均为IPR Group原创内容，请勿未经允许转载！

前一篇：三、流行病学研究方法介绍：（一）描述流行病学研究（descriptive study）

本篇：（二）分析流行病学研究

分析流行病学是对流行病学所假设的病因或流行因素进行检验的方法。它是探讨疾病发生的条件的规律，验证所提出的假设。分析流行病学主要有病例对照研究和队列研究两种方法。前者按是否患病将研究对象分组，了解他们在研究因素的暴露方面有无差别；后者则按是否暴露于所研究的可疑病因将研究对象分组，前瞻性地观察他们的发病水平是否有差别。

1. 病例对照研究（case-control study）

1.1 概念：

病例对照研究（case-control study）属于回顾性的研究（retrospective studies）的方法。它是分析流行病学最基本和最重要的方法之一，其研究的时间顺序是从“果”到“因”。通常是在有了某种现象的情况下，去探索引起这种现象的原因。病例对照研究的结果，可以有助于在现况研究中因果关系的判断，但并不能完全推测因果关系。下图所示

病例对照研究的设计模式

1.2 研究的基本方法与步骤

1.2.1 提出假设、确定待检验的危险因素

病例对照研究一般是在现况研究结果的基础上进一步的分析疾病与影响因素之间的关系。通常在现况研究中所得到的疾病相关因素就是病例对照研究的初步假设，但是，在病例对照研究中，所假设的因素不宜太多，通常选择主要因素进行调查和分析。

1.2.2 选择研究对象

在病例对照研究中，研究对象包括病例组和对照组的选择，如下图所示

病例组和对照组的来源比较

病例

对照（非病例）

在一定范围人群中所有的病例

在某人群中随机抽取的所有病例

在某人群中各个医院诊断的全部病例

在个别医院中诊断的所有病例

在一所或几所医院中诊断的所有病例

以上任何一个方法选择的病例

在该人群中随机抽取的样本

在该人群抽样的样本中所有非病例或样本

在该人群各个医院中与调查疾病无关的其他病例抽取的对照样本

在同一医院中与调查该病无关的其他病例的对照样本

与病人居住在同一街区或邻居的居民抽样的样本

从兄弟姐妹或病人亲属、邻居、同学中选取对照

1.2.2.1 病例的选择：

主要是确定判断病人的标准和如何获得符合标准的病人。病例一般以社区来源为优，代表性较强，但实施难度较大。使用医院来源的病例，可节省费用，容易获得，合作好，信息较完整、准确，但容易发生选择偏倚。

（1）对疾病的规定：有些疾病的诊断标准容易确定；有些疾病则需要制订具体而明确的诊断标准。

（2）对病例其他特征的规定：如性别、年龄、民族等。其目的是控制外部因素即非研究因素以增强两组的可比性。

（3）如何保证病例达到有关规定的标准：可要求具备某一级医院或实验室的诊断，或病人必须经过某项检查等。

1.2.2.2选择对照的方法：

对照的选择应满足以下4个原则：排除选择偏倚；缩小信息偏倚；缩小不清楚或不能很好测量的变量引起的残余混杂；在满足真实性要求和逻辑限制的前提下使统计把握度达到最大。对照最好是全人群的一个无偏样本，或是产生病例的人群中全体未患该病者的一个随机样本。

（1）成组设计病例对照研究：在病例和对照人群中分别选取一定数量的研究对象，仅要求对照数量等于或多于病例数量，无其他规定。

（2）配比研究（pair-matched study），通过配比，使对照组在一些特征方面与病例相似，在进行配比时，应尽可能的使可能的混杂因素在两组一致，已经匹配的因素，在以后的分析中，再也不能分析其病因作用。因此，要防止匹配过头（overmatching），即将研究的危险因素作为配对条件而无法分析其危险因素。匹配的方法常见的有1：1、1：2、或1：4进行配比研究，即一个病例选择1、2或4个除了研究因素以外，其他因素都相同或相似的对照进行配比研究。但注意配比的因素不宜太多，更不能将危险因素当着配比的条件。

实际工作中的对照来源主要有：①同一或多个医疗机构中诊断的其他病例；②病例所在住宅区的健康人或非该病病人；③社会团体人群中的非该病病人或健康人；④社区人口中的非该病病人或健康人；⑤病例的配偶、同胞、亲戚、同学或同事等。

1.2.3 暴露因素的搜集

在调查时，不只是搜集调查对象的姓名、性别、年龄、住址等一般情况，而更重要的是要收集病例组和对照组危险因素的暴露情况。如吸烟、饮酒、有毒有害物质接触史等。最好能对暴露因素的强度进行分级或计量，如吸烟量达到每天多少支，饮酒量每天多少克等，以便考察暴露级别与发病强度的关系，即剂量反应关系。可以设计同时调查多个暴露的因素。在收集暴露因素时，应该设计相同的调查项目对病例组与对照组进行调查，调查时需注意避免诱导，尽量采用客观指标记录过去的暴露情况。对病例组和对照组应该同等认真对待，避免产生偏性。

1.2.4 调查资料的整理与统计分析

病例对照研究所得结果可归纳为下表（成组、配对）所示。在病例对照研究中，由于病例和对照最多只是所有病例和对照的有代表的样本，并不知道暴露组和未暴露组观察数是多少，因此无法直接计算真实的患病率，无法直接计算相对危险度。但可以估计相对危险度，通过回顾和比较病例组和对照组在发病前暴露于某种可能的危险因素的差异，分析暴露与疾病的联系。

成组设计病例对照研究的调查结果的资料如下表

The model of data in case-control study ( groups design)

Group exposure No-exposure totel %

Case a c a+c p1=a/(a+c)

Control b d b+d p0=b/(b+d)

Totel a+b c+d a+b+c+d

病例组暴露的比值为：
对照组的暴露比值为：

1）比值比：

OR=

2）比值比的标准误：可以采用Woolf氏和Miettinen氏两种方法计算。

Woolf氏法：OR标准误=

Miettinen氏法：OR标准误=

3）OR的95%可信区间（confidence interval, C.I）计算：

OR 95% C.I=

4) 比值比的显著性检验：采用χ2检验进行比较。

配比设计病例对照研究的调查结果的资料如下表

The model of data in case-control study ( paired design)

control

group exposure No-exposure total

case exposure a c a+c

No-exposure b d b+d

Totel a+b c+d a+b+c+d

比值比的计算：

OR的95%可信区间：OR 95% C.I=

Х2检验:

Mantel-Haenszel法在病例对照研究中，当存在混杂因素的影响时，需要按混杂因素进行的情况进行分层，这时，其OR值的计算和Х2检验都应采用Mantel-Haenszel法进行分析。分层资料通常整理下表的格式：

The model of data in case-control study (stratified case-control study)

Strata 1 Strata 2

exposure no-exposure total exposure no-exposure total

a1 c1 m11 a2 c2 m21

b1 d1 m21 b2 d2 m22

n11 n21 n1 n21 n22 n2

比值比的计算：

Mantel-HaenszelХ2检验：

上式中:，

1.3病例对照研究的应用

病例对照研究适合于：发病率比较低和罕见病病因研究；潜伏期较长的疾病；需要在较短时间内得出结果，找出原因的疾病的研究。

病例对照研究的优点在于简便、快速、节省费用，需要调查的对象少；同一项调查可以识别一个以上的危险因素；可以利用病史的记录进行研究；对研究对象多无损害，不存在医德问题；不仅应用于病因的探讨，而且广泛应用于许多方面，例如疫苗免疫学效果的考核及暴发调查等。

病例对照研究的局限性在于不适于研究人群中暴露比例很低的因素，因为需要很大的样本量；选择研究对象时，难以避免选择偏倚；信息的真实性难以保证，暴露与疾病的时间先后常难以判断；获取既往信息时，难以避免回忆偏倚；不能测定暴露组和非暴露组疾病的率。

2. 队列研究（cohort study）

2.1 概念：

队列研究又称定群研究。在时间顺序上是从“因”到“果”的研究。它是将人群按是否暴露于某可疑因素及其暴露程度分为不同的亚组，追踪各自的结局，比较不同亚组之间结局频率的差异，从而判定暴露因子与结局之间有无因果关联以及关联大小的一种观察性研究方法。队列研究与病例对照研究相比，其检验病因假设的效能优于病例对照研究。

2.2 分类：

前瞻性队列研究（prospective cohort study）通常是指研究开始时，暴露因素已经存在，但还没有疾病的发生。一般是将研究对象按其自然状况下是否可能接受暴露分为暴露组（exposure group）和非暴露组（no-exposure group）,追踪、随访并详细记录暴露组和非暴露组健康状况的改变和疾病的发生情况，通过比较分析，找出两组间的差异，从而推断疾病的发生是否与暴露因素有关。

回顾性队列研究（retrospective cohort study）又称为回顾性定群研究（historical prospective study）。其特点是在研究开始时暴露和疾病都已经发生，研究者先追溯有关历史资料确定暴露组和对照组，然后通过各种途径查找这些对象发病和死亡情况。比较和分析两组的发病率和死亡率，从而推断暴露与疾病之间的联系。

研究实例：印度尼西亚维生素A缺乏与儿童死亡率的关系

选定一个研究人群，随机分为实验组（维生素A补充组，n=229)，对照组(n=221)，由研究者向实验组提供维生素A。随访一年后两组儿童的死亡率，维生素A补充组4.9%，对照组7.3%（P<0.05)。结论：维生素A缺乏可增加儿童死亡率。本案例具有如下特点：维生素A由研究者提供；是否补充维生素A随机决定。

2.3 研究内容和步骤

（1）确定研究人群

根据研究人群是否变动，队列研究的研究人群分为固定队列（fixed cohort）和流动人群（dynamic population）两种类型。固定队列是指在整个研究过程中，暴露组和非暴露组人群固定不变，如在职业损害的队列研究中，尽管暴露对象因健康损害离开了暴露环境，但仍然将他们归为暴露组。在职业流行病学中，研究对象通常都是固定队列。流动人群在整个研究过程中，人群的数量和具体对象都在不断发生变化，研究者无法确切的随访具体某个对象的暴露情况和患病情况，但可以估计整个群体发病率水平。

（2）暴露人群的选择

队列研究暴露人群可以是有某种特殊暴露史的人群，也可以是一般普通的暴露。前者的暴露常常是要研究单一的暴露因素与健康损害的关系，如在二战时期日本广岛遭受原子弹爆炸后存活的居民，就具有特殊的接受辐射的暴露史，可以作为研究辐射与健康研究的特殊暴露人群。而一般暴露人群常常是由不同暴露因素的个体组成。根据研究目的和研究条件的不同，研究人群的选择有不同的方法。暴露人群通常有4种选择：职业人群；特殊暴露人群；一般人群；有组织的人群团体。

（3）对照组人群

队列研究的对照组人群大致分为三种：1）内对照：即研究人群中的无暴露或暴露最低剂量的同一研究人群；2）外对照：没有暴露或暴露最低剂量的其他人群，采用外对照人群，要注意各组的年龄、性别、住地、文化程度及随访时间等特征的可比性；3）一般社会人群作对照：利用一般社会人群作对照可以节约经费和时间，但由于社会人群数量大，发病率稳定，常常导致暴露与疾病的关系被低估；4）多重对照：即同时用上述两种或两种以上的形式选择多则人群作对照。

（4）暴露资料的收集

暴露的含义是广泛的，并非单指对健康有害的因素，也可以是健康的保护性因素，如某地长期饮用某种矿泉水的人群，可能其健康状况比其他地区要好，这就是一种有益的暴露，一种保护因子。对暴露因素应该尽可能地定量，定量的研究可以了解剂量反应关系；增强对疾病因果关系的可行性；并为制定卫生标准提供依据。在收集暴露资料时，还需要注意记录暴露的时限，以便资料的统计分析。

（5）资料的整理和分析

随着计算机应用的普及，流行病学调查资料的数据管理和统计分析已经非常方便，常用数据库软件对数据进行管理，如Foxpro.等。队列研究累积发病率的调查结果常整理成如下表格式：

危险因素发病未发病合计发病率

exposure a b ne=a+b a/ne

no-exposure c d nn=c+d c/nn

合计 ni=a+c n0=b+d nt= ni+ n0 ni/ nt

但在队列研究中，有时由于观察时间较长，观察对象变动，不断有失访、死亡和增加，造成计算发病率的分母不稳定，因而，常用人时发病率的计算代替累积发病率。这时，资料应按暴露时间长短进行整理

1）计算对照组和各暴露组分年龄、性别或暴露时间的发病率或死亡率；

2）计算标准化发病比（standard incidence ratio, SIR）、标化死亡比（Standard mortality ratio, SMR）；

3）率差（rate difference, RD）、率比（rate ratio, RR）比较和分析暴露与不暴露发病率或死亡率的差别；

4）采用各种统计模型，如Logistic回归模型、二项分布回归模型、Poisson回归模型等分析影响发病率或死亡率的因素。

2.4 研究之队列研究的应用

前瞻性队列研究适用于发病率高，潜伏期短的疾病研究；当病例对照研究已初步验证病因的基础上，可以采用队列研究作进一步的病因分析；可用于某些疾病治疗的副作用观察研究。

队列研究的优点如下：资料可靠，一般不存在回忆偏倚；可以直接获得暴露组和对照组人群的发病率或死亡率，可直接计算出RR和AR等反映疾病危险关联的指标；由于病因发生在前，疾病发生在后，因果现象时间顺序合理；有助于了解人群疾病的自然史；样本量大，结果比较稳定。

队列研究的局限性在于不适于发病率很低的疾病的病因研究；容易产生各种各样的失访偏倚；研究耗费的人力、物力、财力和时间都较多；对研究设计的要求严密。

上一个：【IPR Group】医疗科技成果转化：1-中华人民共和国促进科技成果转化法下一个：护理科研包——一沓不错的护理科研资料

更多专题

排行榜

历史排行
月排行
周排行

【IPR Group】临床流行病学：分析流行病学研究Day3

9/29/2019

IPR Group

全科之窗|ABC平台

1779

9/29/2019 12:00:00 AM

热门专题

关于印发《上海市妇幼健康职业技能竞赛实施方案》的通知

关于上海市2023年度“科技创新行动计划”科普专项项目立项的通知

排行榜

【医窗-悉动态】

【科研学堂】

【医窗-悉动态】

【医路-拓认知】

【医窗-悉动态】

【全科知识库】

【全科知识库】

【全科知识库】

【全科知识库】

友情链接

【IPR Group】临床流行病学：分析流行病学研究Day3

9/29/2019

IPR Group

全科之窗|ABC平台

1779

9/29/2019 12:00:00 AM

热门专题

关于印发《上海市妇幼健康职业技能竞赛实施方案》的通知

关于上海市2023年度“科技创新行动计划”科普专项项目立项的通知

排行榜

【医窗-悉动态 】

【科研学堂 】

【医窗-悉动态 】

【医路-拓认知 】

【医窗-悉动态 】

【全科知识库 】

【全科知识库 】

【全科知识库 】

【全科知识库 】

友情链接

【医窗-悉动态】

【科研学堂】

【医窗-悉动态】

【医路-拓认知】

【医窗-悉动态】

【全科知识库】

【全科知识库】

【全科知识库】

【全科知识库】