Thống kê y tế PLAB 1: Ngừng đánh mất điểm dễ dàng

Hầu hết các IMG đều hiểu rõ về tim mạch và dược lý của họ. Sau đó, một câu hỏi về độ nhạy và độ đặc hiệu xuất hiện, và các dấu vết lặng lẽ biến mất. Điều đó thật khó chịu vì những câu hỏi này tuân theo những khuôn mẫu có thể đoán trước được - và một khi bạn hiểu được logic, chúng sẽ mang lại cho bạn một kết quả đáng tin cậy.

Tại sao các câu hỏi về thống kê lại khó hơn thực tế

Câu trả lời trung thực là số liệu thống kê y tế có vẻ trừu tượng sau nhiều năm đào tạo lâm sàng, nơi bạn yêu cầu xét nghiệm, đọc kết quả và đưa ra quyết định. Không ai yêu cầu bạn tính toán lại tỷ lệ khả năng xảy ra ở giữa vòng.

Nhưng PLAB 1 không kiểm tra xem bạn có thể tiến hành thử nghiệm lâm sàng hay không. Nó đang kiểm tra xem bạn có thể đọc nghiên cứu một cách phản biện và áp dụng bằng chứng hay không - kỳ vọng cốt lõi của GMC theo nguyên tắc Thực hành Y tế Tốt. Do đó, các câu hỏi rất hẹp và có thể lặp lại. Một nhóm nhỏ các khái niệm chiếm gần như tất cả số liệu thống kê và điểm y học dựa trên bằng chứng trong kỳ thi: độ nhạy và độ đặc hiệu, giá trị tiên đoán dương và âm, số lượng cần điều trị (NNT), số lượng cần thiết để gây hại (NNH), giảm nguy cơ tuyệt đối và tương đối, khoảng tin cậy và giá trị p. Nắm vững tám ý tưởng đó và bạn đã nắm vững được lãnh thổ.

Độ nhạy và độ đặc hiệu: Nói đúng chính xác

Hai thuật ngữ này khiến mọi người cảm thấy khó chịu vì chúng có vẻ có thể hoán đổi cho nhau cho đến khi bạn neo chúng đúng cách.

Độ nhạy là một đặc tính của chính xét nghiệm, được đo ở những người mắc bệnh. Một xét nghiệm có độ nhạy cao hiếm khi bỏ sót các trường hợp thực sự — một kết quả âm tính khiến bạn yên tâm ("SnNout": một xét nghiệm nhạy cảm, khi Âm tính, loại trừ). Hãy nghĩ đến một xét nghiệm sàng lọc như D-dimer để phát hiện tắc mạch phổi: nó được thiết kế nhạy cảm để ít trường hợp bị bỏ sót.

Độ đặc hiệu cũng là một đặc tính của xét nghiệm, được đo ở những người không mắc bệnh. Một xét nghiệm có độ đặc hiệu cao hiếm khi gắn cờ kết quả dương tính giả — kết quả dương tính có ý nghĩa ("SpPin": một xét nghiệm cụ thể, khi Dương tính, quy định là Bên trong). Một xét nghiệm xác nhận như VDRL cho bệnh giang mai được thiết kế để mang tính cụ thể.

Giá trị tiên đoán dương (PPV) và giá trị tiên đoán âm (NPV) phụ thuộc vào mức độ phổ biến. Đây là khái niệm thường được thử nghiệm nhất trong một mô hình lâm sàng: cùng một xét nghiệm có PPV thấp hơn ở nhóm dân số có tỷ lệ mắc bệnh thấp so với ở phòng khám có nguy cơ cao. Nếu câu hỏi cho bạn biết xét nghiệm có độ nhạy 95% và độ đặc hiệu 95% nhưng được sử dụng trong cộng đồng mà chỉ có 1 trên 1.000 người mắc bệnh thì PPV sẽ vẫn ở mức thấp. Hãy xử lý logic đó một lần với những con số thực và nó sẽ ở lại với bạn.

Rủi ro tuyệt đối, Rủi ro tương đối và NNT

Các câu hỏi về y học dựa trên bằng chứng trong PLAB 1 hầu như luôn xoay quanh sự khác biệt giữa giảm thiểu rủi ro tương đối và tuyệt đối, bởi vì sự khác biệt đó có ý nghĩa vô cùng quan trọng trong thực hành lâm sàng và đánh giá các thử nghiệm thuốc.

Giảm rủi ro tuyệt đối (ARR) = rủi ro ở nhóm đối chứng − rủi ro ở nhóm điều trị.
Mức giảm rủi ro tương đối (RRR) = ARR `rủi ro ở nhóm đối chứng, được biểu thị bằng phần trăm.
Số cần xử lý (NNT) = 1 ÷ ARR (trong đó ARR được biểu thị dưới dạng số thập phân).
Số cần gây hại (NNH) sử dụng cùng một công thức nhưng áp dụng cho các tác dụng phụ.

Một ví dụ thực tế: nếu một loại thuốc làm giảm nguy cơ đột quỵ từ 4% xuống 2%, ARR là 2% (0,02), do đó NNT là 1 0,02 = 50. RRR là 50% - cùng một dữ liệu, nhưng một con số nghe có vẻ ấn tượng hơn nhiều. Quảng cáo thuốc có xu hướng trích dẫn RRR; các câu hỏi đánh giá trong PLAB 1 yêu cầu bạn tính toán NNT. NNT thấp hơn sẽ tốt hơn (bạn cần điều trị ít bệnh nhân hơn để một người được hưởng lợi).

Giá trị P và Khoảng tin cậy khi không có Bằng Toán

Bạn không cần tính giá trị p trong PLAB 1. Bạn cần diễn giải giá trị đó một cách chính xác.

Giá trị p dưới ngưỡng thông thường là 0,05 có nghĩa là kết quả có ý nghĩa thống kê - nghĩa là, khó có thể xảy ra một cách ngẫu nhiên nếu giả sử giả thuyết khống là đúng. Nó không có nghĩa là tác động đó quan trọng về mặt lâm sàng, lớn hoặc có tính nhân quả. Một thử nghiệm lớn có thể trả về p = 0,001 cho một hiệu ứng quá nhỏ để có thể áp dụng trong thực tế.khoảng tin cậy (CI) cho bạn biết phạm vi mà giá trị thực có thể nằm trong đó. Đối với một tỷ lệ (rủi ro tương đối, tỷ lệ chênh lệch, tỷ lệ rủi ro), CI 95% vượt qua 1,0 có nghĩa là kết quả không có ý nghĩa thống kê - ảnh hưởng có thể bằng 0. Đối với một giá trị tuyệt đối (như chênh lệch trung bình), CI vượt qua 0 cũng có ý nghĩa tương tự. Câu hỏi thường sẽ yêu cầu bạn xác định xem kết quả có quan trọng hay không hoặc chọn nghiên cứu có CI gợi ý tác động thực sự.

Thiết kế nghiên cứu: Biết nghiên cứu nào trả lời câu hỏi nào

PLAB 1 đôi khi yêu cầu bạn chọn thiết kế nghiên cứu thích hợp nhất cho một câu hỏi lâm sàng nhất định. Danh sách tham khảo ngắn:

Thử nghiệm ngẫu nhiên có đối chứng (RCT) — tốt nhất về hiệu quả điều trị; làm giảm sự nhiễu loạn.
Nghiên cứu đoàn hệ — tốt nhất để kiểm tra các yếu tố nguy cơ theo thời gian; mang lại rủi ro tương đối.
Nghiên cứu bệnh chứng — hiệu quả đối với các bệnh hiếm gặp; đưa ra tỷ lệ chênh lệch, không phải rủi ro tương đối.
Nghiên cứu cắt ngang — tỷ lệ lưu hành tại một thời điểm; không thể thiết lập được mối quan hệ nhân quả.
Đánh giá có hệ thống/phân tích tổng hợp — mức độ bằng chứng cao nhất cho việc ra quyết định lâm sàng, khi được tiến hành tốt.

Nếu một câu hỏi hỏi về bằng chứng tốt nhất về hiệu quả của một loại thuốc mới, câu trả lời hầu như luôn là RCT hoặc đánh giá có hệ thống về RCT. Nếu nó hỏi về một căn bệnh ung thư hiếm gặp và khả năng phơi nhiễm nghề nghiệp của nó thì một nghiên cứu bệnh chứng thường đúng.

Cách luyện tập những khái niệm này trước ngày thi

Hiểu lý thuyết là một nửa công việc; áp dụng nó trong điều kiện thời gian là nửa còn lại. Những chủ đề này khuyến khích việc thực hành tích cực hơn là đọc lại một cách thụ động. Làm việc thông qua các câu hỏi có câu trả lời tốt nhất trình bày bảng 2 × 2 và yêu cầu bạn tính toán độ nhạy hoặc cung cấp cho bạn dữ liệu thử nghiệm và yêu cầu NNT, xây dựng khả năng nhận dạng mẫu mà kỳ thi yêu cầu. Ngân hàng câu hỏi Ant PLAB bao gồm một cụm thống kê và bằng chứng chuyên dụng với các giải thích phù hợp để bạn có thể biết chính xác logic sai ở đâu khi bạn chọn tùy chọn không chính xác — và phân tích hiệu suất sẽ gắn cờ nếu khu vực kế hoạch chi tiết này liên tục khiến bạn mất điểm.

Cụm thống kê trong PLAB 1 có kích thước nhỏ. Trong suốt thời gian ngồi, nó có thể chỉ giải đáp được một số ít câu hỏi. Nhưng đó là những câu hỏi có câu trả lời chính xác rõ ràng, bị giới hạn bởi một loạt khái niệm hạn chế, khiến nhiều ứng viên đầu hàng mà không đấu tranh. Bạn đã bỏ ra quá nhiều công sức cho bài kiểm tra này nên không thể để lại điểm trên bàn về một công thức mà bạn có thể học trong một buổi chiều.

##Câu hỏi thường gặp

Sự khác biệt giữa độ nhạy và độ đặc hiệu một cách đơn giản là gì? Độ nhạy đo lường mức độ xét nghiệm phát hiện những người mắc bệnh (tỷ lệ dương tính thực sự), trong khi độ đặc hiệu đo lường mức độ xác định những người không mắc bệnh (tỷ lệ âm tính thực sự). Một xét nghiệm có độ nhạy cao sẽ tốt cho việc loại trừ chẩn đoán; một bài kiểm tra rất cụ thể sẽ tốt cho việc đưa ra quyết định.

Làm cách nào để tính NNT từ kết quả thử nghiệm lâm sàng trong PLAB 1? Trừ tỷ lệ biến cố trong nhóm điều trị khỏi tỷ lệ biến cố trong nhóm đối chứng để có được mức giảm rủi ro tuyệt đối (ARR). NNT = 1 `ARR (với ARR là số thập phân). Ví dụ: ARR là 5% (0,05) cho NNT là 20.

Giá trị p dưới 0,05 có nghĩa là phương pháp điều trị có ích về mặt lâm sàng phải không? Không nhất thiết phải như vậy. Ý nghĩa thống kê (p < 0,05) có nghĩa là kết quả này khó có thể xảy ra ngẫu nhiên, nhưng nó không nói gì về quy mô hoặc tầm quan trọng lâm sàng của tác dụng. Một nghiên cứu rất lớn có thể phát hiện ra sự khác biệt có ý nghĩa thống kê nhưng lại quá nhỏ để mang lại lợi ích cho từng bệnh nhân.

Thống kê y tế PLAB 1: Nhóm câu hỏi nhỏ mà bạn không bao giờ nên mắc sai lầm