PLAB 1 医疗统计：别再丢掉简单分数

大多数 IMG 都了解他们的心脏病学和药理学。然后出现了关于敏感性和特异性的问题，标记悄然消失。这令人沮丧，因为这些问题遵循可预测的模式——一旦你理解了逻辑，它们就会可靠地奖励你。

为什么统计问题感觉比实际更难

诚实的答案是，经过多年的临床培训，您订购测试、阅读结果并做出决定，医学统计感觉很抽象。没有人要求您在病房中重新计算似然比。

但 PLAB 1 并不是测试是否可以进行临床试验。它正在测试您是否能够批判性地阅读研究并应用证据——这是良好医疗实践原则下 GMC 的核心期望。因此，这些问题是狭窄且可重复的。一小群概念几乎涵盖了考试中的所有统计数据和循证医学分数：敏感性和特异性、阳性和阴性预测值、需要治疗的数量 (NNT)、需要伤害的数量 (NNH)、绝对和相对风险降低、置信区间和 p 值。掌握这八个想法，你就已经涉足了领域。

敏感性和特异性：用词准确

这两个术语会让人们感到困惑，因为它们听起来可以互换，除非你正确地锚定它们。

敏感性是测试本身的一个属性，在患有该疾病的人中进行测量。高度敏感的测试很少会错过真实病例 - 阴性结果令人放心（“SnNout”：敏感测试，当为阴性时，则排除）。想想用于肺栓塞的 D-二聚体等筛查测试：它的设计非常敏感，因此很少有病例被遗漏。

特异性也是测试的一个特性，在没有疾病的人中进行测量。高度特异性的测试很少会标记误报 - 阳性结果是有意义的（“SpPin”：特定测试，当呈阳性时，规则为 In）。诸如梅毒 VDRL 之类的验证性测试旨在具有特异性。

阳性预测值 (PPV) 和 阴性预测值 (NPV) 取决于患病率。这是临床小插图中最常测试的概念：相同的测试在低流行人群中的 PPV 低于在高风险诊所中的 PPV。如果问题告诉您该测试具有 95% 的敏感性和 95% 的特异性，但在只有千分之一的人患有该疾病的人群中使用，则 PPV 仍然较低。用实数来完成这个逻辑一次，它就会一直伴随着你。

绝对风险、相对风险和 NNT

PLAB 1 中的循证医学问题几乎总是围绕“相对”和“绝对”风险降低之间的差异，因为这种差异在临床实践和评估药物试验中非常重要。

绝对风险降低 (ARR) = 对照组风险 – 治疗组风险。
相对风险降低 (RRR) = ARR ÷ 对照组风险，以百分比表示。
需要治疗的人数 (NNT) = 1 ÷ ARR （其中 ARR 以小数表示）。
造成伤害所需的数量 (NNH) 使用相同的公式，但适用于不良事件。

一个有效的例子：如果一种药物将中风风险从 4% 降低到 2%，则 ARR 为 2% (0.02)，因此 NNT 为 1 ÷ 0.02 = 50。RRR 为 50% — 相同的数据，但这个数字听起来更令人印象深刻。药品广告往往引用 RRR； PLAB 1 中的评估问题要求您计算 NNT。 NNT 越低越好（您需要治疗更少的患者才能受益）。

没有数学学位的 P 值和置信区间

您不需要在 PLAB 1 中计算 p 值。您需要正确解释 p 值。

p 值低于传统阈值 0.05 意味着结果“具有统计显着性”——也就是说，假设原假设为真，则不太可能仅偶然发生。它不意味着该效应在临床上很重要、很大或有因果关系。大规模试验可能会返回 p = 0.001，但效果太小，在实践中不重要。置信区间 (CI) 告诉您真实值可能所在的范围。对于比率（相对风险、比值比、风险比），95% CI 超过 1.0 意味着结果不具有统计显着性 — 效应可能为零。对于绝对值（如平均差），CI 过零具有相同的含义。该问题通常会要求您确定结果是否显着，或者选择 CI 显示真正效果的研究。

研究设计：了解哪个研究回答哪个问题

PLAB 1 有时会要求您针对给定的临床问题选择最合适的研究设计。简短的参考列表：

随机对照试验（RCT）——治疗效果最佳；减少混杂。
队列研究——最适合前瞻性检查风险因素；给出相对风险。
病例对照研究——对罕见疾病有效；给出优势比，而不是相对风险。
横断面研究——某一时间点的患病率；无法建立因果关系。
系统审查/荟萃分析 — 如果实施得当，可为临床决策提供最高水平的证据。

如果问题询问新药有效性的最佳证据，答案几乎总是随机对照试验或随机对照试验的系统评价。如果询问一种罕见的癌症及其潜在的职业暴露，病例对照研究通常是正确的。

如何在考试前练习这些概念

理解理论就成功了一半；在定时条件下应用它是另一半。这些主题奖励主动练习而不是被动重读。通过解决呈现 2×2 表并要求您计算灵敏度的单一最佳答案问题，或者为您提供试验数据并要求 NNT 的问题，构建考试所需的模式识别能力。 Ant PLAB 题库包括一个专门的证据和统计集群，其中包含有效的解释，因此当您选择不正确的选项时，您可以准确地看到逻辑出了问题的地方 - 如果该蓝图区域持续消耗您的分数，性能分析将会标记出来。

PLAB 1 中的统计簇很小。在整个会议中，它可能只能解释少数问题。但这些问题的答案显然是正确的，并且受到一组有限概念的限制，许多候选人不战而屈人之兵。你在这次考试中投入了太多的精力，以至于无法在一个下午就能学会的公式上留下分数。

常见问题解答

简单来说，敏感性和特异性有什么区别？ 敏感性衡量的是测试检测“患有”某种疾病的人的能力（真阳性率），而特异性衡量的是它识别“没有”疾病的人的能力（真正的阴性率）。高度敏感的测试有助于排除诊断；高度具体的测试有利于做出裁决。

如何根据 PLAB 1 中的临床试验结果计算 NNT？ 从对照组的事件发生率中减去治疗组的事件发生率，即可得到绝对风险降低 (ARR)。 NNT = 1 ÷ ARR（ARR 为小数）。例如，5% (0.05) 的 ARR 给出的 NNT 为 20。

p 值低于 0.05 是否意味着治疗在临床上有用？ 不一定。统计显着性（p < 0.05）意味着结果不太可能是偶然的，但它没有说明效果的大小或临床重要性。一项非常大的研究可以检测到统计上显着的差异，但该差异太小而无法使任何个体患者受益。

PLAB 1 医疗统计：千万不要出错的一小群问题