大多数 IMG 都了解他们的心脏病学和药理学。然后出现了关于敏感性和特异性的问题,标记悄然消失。这令人沮丧,因为这些问题遵循可预测的模式——一旦你理解了逻辑,它们就会可靠地奖励你。
为什么统计问题感觉比实际更难
诚实的答案是,经过多年的临床培训,您订购测试、阅读结果并做出决定,医学统计感觉很抽象。没有人要求您在病房中重新计算似然比。
但 PLAB 1 并不是测试是否可以进行临床试验。它正在测试您是否能够批判性地阅读研究并应用证据——这是良好医疗实践原则下 GMC 的核心期望。因此,这些问题是狭窄且可重复的。一小群概念几乎涵盖了考试中的所有统计数据和循证医学分数:敏感性和特异性、阳性和阴性预测值、需要治疗的数量 (NNT)、需要伤害的数量 (NNH)、绝对和相对风险降低、置信区间和 p 值。掌握这八个想法,你就已经涉足了领域。
敏感性和特异性:用词准确
这两个术语会让人们感到困惑,因为它们听起来可以互换,除非你正确地锚定它们。
敏感性是测试本身的一个属性,在患有该疾病的人中进行测量。高度敏感的测试很少会错过真实病例 - 阴性结果令人放心(“SnNout”:敏感测试,当为阴性时,则排除)。想想用于肺栓塞的 D-二聚体等筛查测试:它的设计非常敏感,因此很少有病例被遗漏。
特异性也是测试的一个特性,在没有疾病的人中进行测量。高度特异性的测试很少会标记误报 - 阳性结果是有意义的(“SpPin”:特定测试,当呈阳性时,规则为 In)。诸如梅毒 VDRL 之类的验证性测试旨在具有特异性。
阳性预测值 (PPV) 和 阴性预测值 (NPV) 取决于患病率。这是临床小插图中最常测试的概念:相同的测试在低流行人群中的 PPV 低于在高风险诊所中的 PPV。如果问题告诉您该测试具有 95% 的敏感性和 95% 的特异性,但在只有千分之一的人患有该疾病的人群中使用,则 PPV 仍然较低。用实数来完成这个逻辑一次,它就会一直伴随着你。
绝对风险、相对风险和 NNT
PLAB 1 中的循证医学问题几乎总是围绕“相对”和“绝对”风险降低之间的差异,因为这种差异在临床实践和评估药物试验中非常重要。
- 绝对风险降低 (ARR) = 对照组风险 – 治疗组风险。
- 相对风险降低 (RRR) = ARR ÷ 对照组风险,以百分比表示。
- 需要治疗的人数 (NNT) = 1 ÷ ARR (其中 ARR 以小数表示)。
- 造成伤害所需的数量 (NNH) 使用相同的公式,但适用于不良事件。
一个有效的例子:如果一种药物将中风风险从 4% 降低到 2%,则 ARR 为 2% (0.02),因此 NNT 为 1 ÷ 0.02 = 50。RRR 为 50% — 相同的数据,但这个数字听起来更令人印象深刻。药品广告往往引用 RRR; PLAB 1 中的评估问题要求您计算 NNT。 NNT 越低越好(您需要治疗更少的患者才能受益)。
没有数学学位的 P 值和置信区间
您不需要在 PLAB 1 中计算 p 值。您需要正确解释 p 值。
p 值低于传统阈值 0.05 意味着结果“具有统计显着性”——也就是说,假设原假设为真,则不太可能仅偶然发生。它不意味着该效应在临床上很重要、很大或有因果关系。大规模试验可能会返回 p = 0.001,但效果太小,在实践中不重要。置信区间 (CI) 告诉您真实值可能所在的范围。对于比率(相对风险、比值比、风险比),95% CI 超过 1.0 意味着结果不具有统计显着性 — 效应可能为零。对于绝对值(如平均差),CI 过零具有相同的含义。该问题通常会要求您确定结果是否显着,或者选择 CI 显示真正效果的研究。
研究设计:了解哪个研究回答哪个问题
PLAB 1 有时会要求您针对给定的临床问题选择最合适的研究设计。简短的参考列表:
- 随机对照试验(RCT)——治疗效果最佳;减少混杂。
- 队列研究——最适合前瞻性检查风险因素;给出相对风险。
- 病例对照研究——对罕见疾病有效;给出优势比,而不是相对风险。
- 横断面研究——某一时间点的患病率;无法建立因果关系。
- 系统审查/荟萃分析 — 如果实施得当,可为临床决策提供最高水平的证据。
如果问题询问新药有效性的最佳证据,答案几乎总是随机对照试验或随机对照试验的系统评价。如果询问一种罕见的癌症及其潜在的职业暴露,病例对照研究通常是正确的。
如何在考试前练习这些概念
理解理论就成功了一半;在定时条件下应用它是另一半。这些主题奖励主动练习而不是被动重读。通过解决呈现 2×2 表并要求您计算灵敏度的单一最佳答案问题,或者为您提供试验数据并要求 NNT 的问题,构建考试所需的模式识别能力。 Ant PLAB 题库包括一个专门的证据和统计集群,其中包含有效的解释,因此当您选择不正确的选项时,您可以准确地看到逻辑出了问题的地方 - 如果该蓝图区域持续消耗您的分数,性能分析将会标记出来。
PLAB 1 中的统计簇很小。在整个会议中,它可能只能解释少数问题。但这些问题的答案显然是正确的,并且受到一组有限概念的限制,许多候选人不战而屈人之兵。你在这次考试中投入了太多的精力,以至于无法在一个下午就能学会的公式上留下分数。
常见问题解答
简单来说,敏感性和特异性有什么区别? 敏感性衡量的是测试检测“患有”某种疾病的人的能力(真阳性率),而特异性衡量的是它识别“没有”疾病的人的能力(真正的阴性率)。高度敏感的测试有助于排除诊断;高度具体的测试有利于做出裁决。
如何根据 PLAB 1 中的临床试验结果计算 NNT? 从对照组的事件发生率中减去治疗组的事件发生率,即可得到绝对风险降低 (ARR)。 NNT = 1 ÷ ARR(ARR 为小数)。例如,5% (0.05) 的 ARR 给出的 NNT 为 20。
p 值低于 0.05 是否意味着治疗在临床上有用? 不一定。统计显着性(p < 0.05)意味着结果不太可能是偶然的,但它没有说明效果的大小或临床重要性。一项非常大的研究可以检测到统计上显着的差异,但该差异太小而无法使任何个体患者受益。