Большинство IMG хорошо знают свою кардиологию и фармакологию. Потом возникает вопрос о чувствительности и специфичности, и отметки незаметно исчезают. Это расстраивает, потому что эти вопросы следуют предсказуемым шаблонам — и как только вы поймете логику, они вас надежно вознаградят.
Почему вопросы по статистике кажутся сложнее, чем они есть на самом деле
Честный ответ: медицинская статистика кажется абстрактной после многих лет клинической подготовки, когда вы заказали тест, прочитали результат и приняли решение. Никто не просил вас пересчитывать отношение правдоподобия в середине раунда.
Но PLAB 1 не проверяет, сможете ли вы провести клиническое испытание. Это проверка того, можете ли вы критически читать исследования и применять доказательства — это основное ожидание GMC в соответствии с принципами надлежащей медицинской практики. Поэтому вопросы узкие и повторяющиеся. Небольшой кластер концепций учитывает почти всю статистику и оценки доказательной медицины на экзамене: чувствительность и специфичность, положительные и отрицательные прогностические значения, количество, необходимое для лечения (NNT), количество, необходимое для нанесения вреда (NNH), абсолютное и относительное снижение риска, доверительные интервалы и значения p. Овладейте этими восемью идеями, и вы покрыли всю территорию.
Чувствительность и специфичность: правильно подбирайте слова
Эти два термина сбивают людей с толку, потому что они кажутся взаимозаменяемыми, пока вы не закрепите их должным образом.
Чувствительность — это свойство самого теста, измеряемое у людей, страдающих этим заболеванием. Высокочувствительный тест редко пропускает истинные случаи — отрицательный результат обнадеживает («SnNout»: чувствительный тест, когда отрицательный результат, исключает «Аут»). Подумайте о скрининговом тесте на легочную эмболию, таком как D-димер: он разработан так, чтобы быть чувствительным, чтобы пропустить лишь несколько случаев.
Специфичность также является свойством теста, измеряемого у людей, не страдающих этим заболеванием. Высокоспецифичный тест редко выявляет ложноположительные результаты — положительный результат имеет значение («SpPin»: конкретный тест, если он положительный, означает «In»). Подтверждающий тест, такой как VDRL на сифилис, предназначен для специфичности.
Прогностическая ценность положительного результата (PPV) и прогностическая ценность отрицательного результата (NPV) зависят от распространенности. Эту концепцию чаще всего проверяют в клинических примерах: тот же тест имеет более низкий PPV в популяции с низкой распространенностью, чем в клинике высокого риска. Если в вопросе вам сказано, что тест имеет чувствительность 95% и специфичность 95%, но используется в популяции, где только 1 из 1000 человек болен этим заболеванием, PPV все равно будет низким. Проработайте эту логику один раз с реальными числами, и она останется с вами.
Абсолютный риск, относительный риск и NNT
Вопросы доказательной медицины в PLAB 1 почти всегда связаны с разницей между относительным и абсолютным снижением риска, поскольку эта разница имеет огромное значение в клинической практике и при оценке испытаний лекарств.
- Абсолютное снижение риска (ARR) = риск в контрольной группе − риск в группе лечения.
- Относительное снижение риска (RRR) = ARR ÷ риск в контрольной группе, выраженный в процентах.
- Количество, необходимое для лечения (NNT) = 1 ÷ ARR (где ARR выражается в десятичном формате).
- Число, необходимое для нанесения вреда (NNH) использует ту же формулу, но применяется к нежелательным явлениям.
Проработанный пример: если лекарство снижает риск инсульта с 4% до 2%, ARR составляет 2% (0,02), поэтому NNT составляет 1 ÷ 0,02 = 50. RRR составляет 50% — те же данные, но цифра звучит гораздо более впечатляюще. Реклама лекарств обычно цитирует RRR; оценочные вопросы в PLAB 1 предполагают, что вы рассчитаете NNT. Чем ниже ЧБНЛ, тем лучше (вам нужно лечить меньшее количество пациентов, чтобы один из них получил пользу).
P-значения и доверительные интервалы без степени по математике
Вам не нужно вычислять значение p в PLAB 1. Вам необходимо его правильно интерпретировать.
Значение p ниже обычного порога 0,05 означает, что результат статистически значим, то есть маловероятно, что он возник случайно, если предположить, что нулевая гипотеза верна. Это не означает, что эффект является клинически важным, значительным или причинным. Массовое исследование может дать результат p = 0,001 для эффекта, который слишком мал, чтобы иметь значение на практике.Доверительный интервал (ДИ) указывает диапазон, в котором, вероятно, находится истинное значение. Для соотношения (относительный риск, отношение шансов, отношение рисков) 95% ДИ, пересекающий 1,0, означает, что результат не является статистически значимым — эффект может быть нулевым. Для абсолютного значения (например, средней разницы) CI, пересекающий ноль, имеет то же значение. В вопросе обычно вас просят определить, является ли результат значимым, или выбрать исследование, ДИ которого предполагает реальный эффект.
Дизайн исследования: определение того, какое исследование отвечает на какой вопрос
PLAB 1 иногда просит вас выбрать наиболее подходящий дизайн исследования для конкретного клинического вопроса. Краткий список литературы:
- Рандомизированное контролируемое исследование (РКИ) — наилучшее определение эффективности лечения; уменьшает путаницу.
- Когортное исследование — лучше всего подходит для проспективного изучения факторов риска; дает относительный риск.
- Исследование «случай-контроль» — эффективно при редких заболеваниях; дает отношение шансов, а не относительный риск.
- Перекрестное исследование — распространенность в определенный момент времени; не может установить причинно-следственную связь.
- Систематический обзор/метаанализ — наивысший уровень доказательности для принятия клинических решений при правильном проведении.
Если вопрос касается наилучших доказательств эффективности нового препарата, ответом почти всегда будет РКИ или систематический обзор РКИ. Если там спрашивают о редком раке и его потенциальном профессиональном воздействии, исследование «случай-контроль» обычно является правильным.
Как отработать эти понятия перед экзаменом
Понимание теории – это половина дела; применение его в определенных условиях – это вторая половина. Эти темы вознаграждают за активную практику, а не за пассивное перечитывание. Работа с вопросами с одним лучшим ответом, которые представляют собой таблицу 2 × 2 и просят вас рассчитать чувствительность или которые дают вам данные испытаний и запрашивают NNT, выстраивает распознавание образов, необходимое для экзамена. Банк вопросов Ant PLAB включает в себя специальный кластер фактических данных и статистики с проработанными объяснениями, так что вы можете точно увидеть, где логика идет не так, когда вы выбираете неправильный вариант, а аналитика производительности укажет, если эта область плана постоянно стоит вам баллов.
Кластер статистики в PLAB 1 небольшой. За все заседание может быть задано лишь несколько вопросов. Но это вопросы с явно правильными ответами, ограниченными ограниченным набором понятий, от которых многие кандидаты сдаются без боя. Вы вложили слишком много труда в этот экзамен, чтобы оставить на столе оценки по формуле, которую можно выучить за полдня.
Часто задаваемые вопросы
В чем простыми словами разница между чувствительностью и специфичностью? Чувствительность измеряет, насколько хорошо тест выявляет людей, страдающих заболеванием (истинно положительный показатель), тогда как специфичность измеряет, насколько хорошо он выявляет людей, у которых нет заболевания (истинно отрицательный показатель). Высокочувствительный тест позволяет исключить диагноз; для принятия решения подойдет высокоспецифичный тест.
Как рассчитать NNT по результатам клинического исследования PLAB 1? Вычтите частоту событий в группе лечения из частоты событий в контрольной группе, чтобы получить абсолютное снижение риска (ARR). NNT = 1 ÷ ARR (где ARR — десятичное число). Например, ARR 5% (0,05) дает NNT 20.
Означает ли значение p ниже 0,05, что лечение клинически полезно? Не обязательно. Статистическая значимость (p < 0,05) означает, что результат вряд ли является случайным, но ничего не говорит о величине или клинической значимости эффекта. Очень крупное исследование может обнаружить статистически значимую разницу, которая слишком мала, чтобы принести пользу отдельному пациенту.