Ước tính cỡ mẫu là một khâu rất quan trọng trong thiết kếnghiên cứu. Cỡ mẫu nhỏ sẽ không giúp phát hiện sự khác biệt, ngược lại cỡ mẫulớn sẽ hao tốn tiền bạc và thời gian.

Đang xem: Công thức tính cỡ mẫu trong nghiên cứu khoa học

Tuy vậy nhiều người cảm thấy lúng túng khi phải tính cỡ mẫu chomột nghiên cứu bởi vì việc tính cỡ mẫu không phải chỉ đơn thuần là thế số vàomột công thức đã định sẵn mà còn tùy thuộc vào kinh nghiệm và kiến thức của nhànghiên cứu.

*

Việc ước tính cỡ mẫu tốt cần phải dựa vào các thông số của điềutra trong dân số hoặc dựa vào các công trình của các tác giả đã công bố trướcđây và đôi khi nhà nghiên cứu phải làm các nghiên cứu dẫn đường (pilot) để ướctính các thông số này. Muốn ước tính cỡ mẫu phải dựa vào 4 yếu tố chính sauđây:
(1) Sai sót loại I (a): Cho rằng hai nhómkhác biệt nhưng thực sự chúng không khác hoặc kết luậndương tínhgiả. Thông thường mức sai sót α được chọn là 0,05, nghĩa là nhànghiên cứu mong muốn có ít hơn 5% cơ hội rút ra một kết luận dương
(2) Sai sót loại II (b) hoặc lực mẫu (power là1-b): Cho rằng hai nhóm không khác biệt nhưng thựcsự chúng có khác biệt hoặc kết luậnâm tính giả. Thôngthường mức sai sót β được chọn là 0,2 (hoặc lực mẫu=0,8), nghĩa là nhà nghiêncứu mong muốn có 80% cơ hội tránh được một kết luận âm tính giả.
Trong ước tính cỡ mẫu thường mức sai sótađược chọn là 0,05 hoặc 0,01 và mức sai sótbđược chọn là 0,20 hoặc 0,10. Từ hai thông số này ta có thểtính Z2αvà Z2β(đơn vị độ lệch của phân phốichuẩn) theo bảng 1.
(1) Độ dao động trong dân số của biến kết cục. Nếu biến kết cục làmột biến số liên tục (ví dụ trị số huyết áp tâm thu, chiều cao, cân nặng…) thìcần biết độ lệch chuẩn (s) của phân phối này.Muốn biết được độ lệch chuẩn này, trước hết phải dựa vào các số liệu điều tratrong dân số hoặc dựa vào các công trình nghiên cứu trước đây hoặc đôi khi phảitiến hành thử nghiệm dẫn đường (pilot) để ước tính.
Nếu biến kết cục là biến số liên tục thìsự khác biệtnày là một số đại số. Ví dụ: Khi nghiên cứu về hiệu quả điều trị củamột loại thuốc mới điều trị tăng huyết áp (nhóm thực nghiệm), nhà nghiên cứu sẽước tính loại thuốc mới này làm giảm hơn được bao nhiêu mmHg (ví dụ giảm 10hoặc 20mmHg) so với thuốc cũ (nhóm chứng). Mức độ giảm ước tính càng lớn, nghĩalà độ ảnh hưởng càng cao thì cỡ mẫu cần cho nghiên cứu càng nhỏ đi.
Nếu kết cục là biến phân loại thì sựkhác biệt này là tỉlệ %. Ví dụ khi so sánh về hiệu quả của kháng sinh mới (nhóm thựcnghiệm) trong điều trị nhiễm khuẩn do tụ cầu với biến kết cục (Khỏi/Không khỏibệnh) thì nhà nghiên cứu phải ước tính loại thuốc mới này có hiệu quả hơn baonhiêu % (chẳng hạn hiệu quả hơn 10 hoặc 20%) so với thuốc cũ (nhóm chứng).
Ngoài ra, còn tùy theo loại thiết kế nghiên cứu mà nhà nghiên cứucần phải ước tính một số thông số khác như tỉ lệ hiện hành (prevalence) trongnghiên cứu cắt ngang, nguy cơ tương đối (relative risk: RR) trong nghiên cứuđoàn hệ, tỉ số odds trong nghiên cứu bệnh-chứng, hệ số tương quanrtrongnghiên cứu về tương quan.
Sau đây tôi xin trình bày một số công thức tính cỡ mẫu thường haysử dụng trong các thiết kế nghiên cứu đượclàm tại bệnh viện hoặc trong cộng đồng.
Thường được dùng để điều tra các chỉ số về hình thái học (chiềucao, cân nặng, vòng đầu…), các chỉ số tim mạch (tần số tim, huyết áp tâm thu,huyết áp tâm trương..), các chỉ số sinh hóa (urea, creatinin, cholesterol…)hoặc các chỉ số tế bào máu (hồng cầu, bạch cầu, tiểu cầu…) của một dân số.
Ví dụ 1.Theo kết quả điều tratrị số huyết áp tâm thu của người lớn bình thường ở ViệtNamlà 114 ±10mmHg. Như vậy cỡ mẫu là bao nhiêu với khoảng tin cậy 95%, với sai sóta=0,05 và sai sótb=0,2 (lực mẫu=0,8). Cỡ mẫuđược tính theo công thức:
Ví dụ 1.

Xem thêm: (Pdf) Mẫu Đề Cương Nghiên Cứu Khoa Học Hoàn Chỉnh File Word, Đề Cương Nghiên Cứu Khoa Học

Theo kết quả điều tra trị số huyết áp tâm thu của người lớn bình thường ở ViệtNamlà 114 ± 10mmHg. Như vậy cỡ mẫu là bao nhiêu với khoảng tin cậy 95%, với sai sóta=0,05 và sai sótb=0,2 (lực mẫu=0,8). Cỡ mẫu được tính theo công thức:

*

*

Ví dụ 2. Tính cỡ mẫu để ước tính chiều cao đàn ông ViệtNamvới sai sốdtrong vòng 1cm. Biết rằng độ lệch chuẩn trong các nghiên cứu trước đây là 4,6cm.

*

Thường được dùng để tính tỉ lệ hiện hành (prevalence) một bệnh nào đó trong cộng đồng (ví dụ: suy dinh dưỡng, tăng huyết áp, đái tháo đường…)
Ví dụ 3. Kết quả điều tra tỉ lệ suy dinh dưỡng ở trẻ em dưới 5 tuồi tại một thành phố là 20 ± 2 %. Hỏi xem cỡ mẫu cần bao nhiêu để công bố tỉ lệ suy dinh dưỡng này.
2% chính là khoảng tin cậy 95% của tỉ lệ được quan sát hoặc còn gọi là sai sốɛ. Nếu muốn sai số này càng nhỏ thì cỡ mẫu càng lớn và ngược lại.

*

Như vậy đề ước tính cỡ mẫu trong điều tra tỉ lệ hiện hành của một bệnh cần phải biết 2 thông số: sai sốɛmong muốn và tỉ lệ hiện hànhp(prevalence) trong dân số. Tỉ lệ ước đoánpcó thể tham khảo từ các công trình điều tra trước đây. Nếu không có được thì chop= 0,50 khi đó cỡ mẫu sẽ có trị số lớn nhất.
Tùy theo kết cục của nghiên cứu là biến số hoặc biến nhị phân ta sẽ có công thức tính cỡ mẫu khác nhau.
Ngoài xác định mức sai sóta(ví dụ 0,05) vàb(ví dụ 0,10), nhà nghiên cứu phải ước tính mức sai biệtdcủa 2 nhóm thực nghiệm và nhóm chứng là bao nhiêu và độ lệch chuẩnslà bao nhiêu đơn vị? Ví dụ so sánh giữa 2 loại thuốc điều trị tăng huyết áp, loại thuốc mới B (nhóm thực nghiệm) làm giảm trị số huyết áp tâm thu hơn thuốc cũ A (nhóm chứng) là 10 mm Hg. Các điều tra trong dân số trước đây cho biết độ lệch chuẩn của phân phối trị số huyết áp tâm thu là 10 mmHg.
Như vậy:d= 10 mmHg vàs=10 mmHg. Vớia=0,05 thì Z2a=1,96;b=0,10 thì Z2b=1,28. Thế vào công thức (2) ta có:
Trong nghiên cứu đoàn hệ, ngoài xác định mức sai sóta(ví dụ 0,05) vàb(ví dụ 0,10), nhà nghiên cứu cần ước tính nhóm bị phơi nhiễm có nguy cơ mắc bệnh gấp bao nhiêu lần so với nhóm không phơi nhiễm, nói cách khác là nguy cơ tương đối (RR: relative risk) bằng bao nhiêu. Ví dụ một nghiên cứu đoàn hệ xác định mối liên hệ giữa mẹ uống thuốc ngừa thai và tật bẩm sinh tim ở thai nhi. Các nghiên cứu trước đây cho biết RR khoảng bằng 2. Như vậy nếu tỉ lệ mắc tim bẩm sinh nhóm không phơi nhiễm là p1thì ở nhóm phơi nhiễm p2= p1RR
Ví dụ: nhóm chứng có tỉ lệ phát sinh (incidence) bệnh tim bẩm sinh là 8 phần ngàn (0,008), thì p2= 2 x 0,008=0,016
Trong nghiên cứu bệnh-chứng, nhà nghiên cứu cần ước tính tỉ số nguy cơ (odds ratio:OR) ở nhóm bệnh so với nhóm chứng. Ngoài ra còn phải ước tính được tỉ lệ hiện hành của yếu tố phơi nhiễm trong dân số. Ví dụ: nguy cơ mắc tim bẩm sinh cao gấp 2 lần (OR = 2) ở nhóm mẹ có uống thuốc ngừa thai và tỉ lệ mẹ có uống thuốc ngừa thai trong dân số là 20% (0,20). Với mức chọn sai sóta= 0,05 vàb= 0,10, tính cỡ mẫu cho nghiên cứu này?
Nếu gọi p1là tỉ lệ mẹ uống ngừa thai trong nhóm chứng (p1=0,20), với khả năng nguy cơ tăng gấp 2 (OR=2) ở nhóm bệnh thì tỉ lệ mẹ uống thuốc ngừa thai (p2) trong nhóm bệnh là bao nhiêu?
Trong nghiên cứu này, biến kết cục được tính theo thời gian sống sót trung bình nên nhà nghiên cứu phải ước tính đượcq là tỉ số giữa thời gian sống sót trung bình giữa nhóm thực nghiệm (ví dụmElà 3 năm) và nhóm chứng (ví dụmClà 2 năm). Như vậy
Ví dụ: Một nghiên cứu về liên quan giữa lượng đường huyết (mg/dL) và tỉ lệ % HbA1C trong hồng cầu. Các nghiên cứu trước đây cho biết mối tương quan giữa 2 trị số này vào khoảng 60% (r= 0,60). Tính cỡ mẫu cần cho nghiên cứu này.
Các cách tính cỡ mẫu trình bày ở phần trên khi hai nhóm thực nghiệm và nhóm chứng có số đối tượng bằng nhau. Tuy nhiên đôi khi trong các nghiên cứu mà nhóm thực nghiệm là những bệnh hiếm gặp, để tăng lực mẫu (power), nên số đối tượng hai nhóm khác nhau (thường nhóm chứng có số đối tượng lớn hơn nhóm thực nghiệm). Nếu gọimlà số đối tượng nhóm thực nghiệm vàrmlà số đối tượng nhóm chứng với cỡ mẫu làncho mỗi nhóm thì:
Ví dụ: Nếu cỡ mẫu cho 2 nhóm bằng nhau vớin=120. Hỏi nếu muốn nhóm chứng có số đối tượng gấp 3 (r=3) nhóm thực nghiệm thì cỡ mẫu mỗi nhóm là bao nhiêu?
1.Armitage P.,BerryG., Mattews JNS. 2005. Sample size determination. InStatistical Methods in Medical Research. 4thEdition. Blackwell Science. pp. 137-146.
2.Schlesselman JJ. Sample size requirements in cohort and case-control studies of disease. Am J Epidemiol. 1974 Jun;99(6):381-4.
3.Donner A. Approaches to sample size estimation in the design of clinical trials-a review. Stat Med. 1984 Jul-Sep;3(3):199-214.
5.Sikaris K. The correlation of hemoglobin A1c to blood glucose. J Diabetes Sci Technol. 2009 May 1;3(3):429-38.

Xem thêm: Điểm Chuẩn Khoa Y Đại Học Quốc Gia Thành Phố Hồ Chí Minh, Điểm Chuẩn Khoa Y

6.Nguyễn Văn Tuấn. Phương pháp ước tính cỡ mẫu, Y học thực chứng.Nhà xuất bản Y học 2008.Trang 75-106.
PHƯƠNG PHÁP ĐỊNH LƯỢNG”S BLOG GỬI LỜI CẢM ƠN CHÂN THÀNH TỚI CÁC BẠN HỌC VIÊN, BẠN BÈ, ĐỒNG NGHIỆP, KHÁCH HÀNG ĐÃ ỦNG HỘ CHÚNG TÔI!
PHƯƠNG PHÁP ĐỊNH LƯỢNG”S BLOG GỬI LỜI CẢM ƠN CHÂN THÀNH TỚI CÁC BẠN HỌC VIÊN, BẠN BÈ, ĐỒNG NGHIỆP, KHÁCH HÀNG ĐÃ ỦNG HỘ CHÚNG TÔI!

Leave a Reply

Your email address will not be published. Required fields are marked *