Nghiên cứu y học ở Việt Nam – đặc điểm, thiếu sót, và sai sót
Nguyễn Văn Tuấn
Sự có mặt của y học Việt Nam trên trường quốc tế còn rất khiêm tốn, bởi vì phần lớn các nghiên cứu y học ở Việt Nam được công bố trong các tạp chí y học trong nước. Trong một phân tích tổng hợp gần đây của tác giả Phạm Duy Hiển, trong thời gian 1995 đến 2004, trung bình hàng năm giới nghiên cứu y khoa Việt Nam công bố khoảng 1000 bài báo y sinh học trong các tập san y học trong và ngoài nước; trong số này chỉ có 5 bài trong các tập san y học quốc tế [1]. Nói cách khác, chỉ có khoảng 0,5% nghiên cứu y học từ Việt Nam có mặt trên các diễn đàn y học quốc tế. Con số này còn rất khiêm tốn nếu so với các nước lân cận như Thái Lan hay Mã Lai.
Có nhiều lí do tại sao các nghiên cứu chỉ công bố trên các tạp chí địa phương, kể cả sự liên quan của nghiên cứu đối với tình hình và bối cảnh Việt Nam, soạn thảo bằng tiếng Việt, hay không được chấp nhận cho công bố trên các tập san quốc tế. Nhưng hoạt động khoa học là một lĩnh vực phi biên giới, cho nên dù là nghiên cứu từ Việt Nam, nhưng nếu các nghiên cứu có chất lượng tốt (như ý tưởng mới hay phương pháp nghiên cứu đúng tiêu chuẩn khoa học) thì các nghiên cứu đó vẫn có giá trị khoa học, và vẫn có thể xuất hiện trong các tập san y học quốc tế. Do đó, vấn đề chất lượng các nghiên cứu đã công bố trong các tạp chí y học ở Việt Nam cần được đặt ra để tìm một hướng đi tích cực hơn.
Người viết bài này đã điểm qua một số bài báo khoa học xuất hiện trong các tạp chí y học thuộc trường Đại học Y Hà Nội, Đại học Y Dược Thành phố Hồ Chí Minh, Tạp chí Y học thực hành, Tạp chí Nghiên cứu Y học, và Tạp chí Dược học. Các bài báo này được công bố trong khoảng thời gian từ 2001 đến 2006. Trong mỗi số và mỗi tạp chí, tôi ngẫu nhiên chọn ra 3 bài ở mục “nghiên cứu y học” (hay tương tự). Tất cả có 56 bài được chọn, và tôi đọc tất cả và ghi chú những điểm cần lưu ý về ý tưởng, phương pháp và cách trình bày kết quả nghiên cứu.
Điểm qua các bài báo này, tôi thấy nhiều nhà nghiên cứu trong nước đã có những công trình nghiên cứu có ích với ý tưởng hay, có thể ứng dụng vào việc chăm sóc bệnh nhân. Chẳng hạn như những công trình nghiên cứu về HIV và so sánh phương pháp xét nghiệm sinh hóa (do các nhà nghiên cứu thuộc Đại học Y Dược TPHCM tiến hành) hay nghiên cứu về độ tuổi mãn kinh và các yếu tố liên quan đến mãn kinh (Đại học Y Hà Nội) mà kết quả rất thú vị và có thể khai triển thêm thành một nghiên cứu có ích cho bệnh nhân. Ngoài ra, còn có một số nghiên cứu mang tính phát triển phương pháp xét nghiệm và chẩn đoán mới với kết quả rất đáng khích lệ. Trong điều kiện hạn hẹp kinh phí và cơ sở vật chất mà các đồng nghiệp trong nước đã tiến hành những nghiên cứu qui mô lớn và công phu như thế quả là một nỗ lực đáng trân trọng. Tôi thiết nghĩ những công trình như thế đáng lẽ phải có mặt trong các tập san y học uy tín trên thế giới, nhưng rất tiếc điều đó chưa xảy ra.
Vấn đề đặt ra là tại sao các nghiên cứu như thế không có mặt trên các diễn đàn y học quốc tế? Điểm qua các nghiên cứu này một cách cẩn thận, tôi cho rằng nguyên nhân là do thiết kế nghiên cứu chưa được thỏa đáng và chưa có hệ thống. Ngoài ra, còn có rất nhiều nghiên cứu với khá nhiều thiếu sót và sai lầm, vì khiếm khuyết trong phương pháp nghiên cứu và do đó chất lượng không mấy cao. Có khi những thiếu sót và sai lầm này rất nghiêm trọng đến độ kết quả nghiên cứu rất khó diễn dịch, và có thể nói là không có giá trị khoa học gì cả. Trong bài viết này, tôi sẽ nêu lên một số thiếu sót phổ biến nhất và sẽ đưa ra một số đề nghị để nâng cao chất lượng nghiên cứu y học ở trong nước.
Ý tưởng: thiếu cái mới
Giá trị một nghiên cứu y học có thể đánh giá qua bốn câu hỏi chính: tại sao nghiên cứu (ý tưởng hay vấn đề nghiên cứu), đã làm gì (phương pháp), phát hiện cái gì (kết quả), và kết quả đó có ý nghĩa gì (thảo luận về kết quả). Về phần ý tưởng nghiên cứu, có thể nói ngắn gọn rằng gần như tất cả các nghiên cứu xuất hiện trong các tập san y học trong nước xoay quanh 4 chủ đề chính như sau:
- Nghiên cứu mô tả thuần túy ở một nhóm bệnh nhân hay quần thể, như chỉ số sinh hóa ở bệnh nhân tai biến mạch máu não, chỉ số lipid ở bệnh nhân cao huyết áp, tế bào lymphô và CD4 ở bệnh nhân AIDS/HIV, mật độ xương ở đàn ông, v.v… Vì tính chất mô tả, cho nên các nghiên cứu này chưa thể đào sâu và phân tích các vấn đề bệnh lí, lâm sàng.
- Nghiên cứu tìm hiểu các yếu tố nguy cơ cũng chiếm một phần khá lớn trong các nghiên cứu lâm sàng ở Việt Nam. Các nghiên cứu này có mục tiêu chính là phát hiện các yếu tố có thể liên quan đến bệnh. Một số nghiên cứu tiêu biểu như yếu tố miễn dịch ở bệnh nhân viêm cầu thận, nguyên nhân của tình trạng thiếu máu ở trẻ em, mối liên hệ giữa homocysteine và nhồi máu não, yếu tố dự đoán phù não tử vong, v.v… Nhưng các nghiên cứu này đáng lẽ phải được tiến hành theo thời gian (tức theo dõi đối tượng một thời gian để xác định các yếu tố nguy cơ ban đầu và phát triển bệnh về sau), nhưng rất tiếc các nghiên cứu ở Việt Nam chỉ giới hạn ở dạng “cắt ngang”, thành ra, giá trị khoa học không cao; thậm chí, mục tiêu đề ra cũng không đạt được. Một số nghiên cứu, tuy mục đích là tìm “nguyên nhân” của bệnh, nhưng vì cách thiết kế, cho nên tác giả báo chỉ có thể kết luận là “yếu tố nguy cơ” chứ không thể là “nguyên nhân” được.
- Nghiên cứu về chẩn đoán như tiêu chuẩn chẩn đoán ung thư phế quản bằng cách sử dụng tế bào học, chẩn đoán màng não trẻ em bằng kĩ thuật PCR, so sánh kết quả chẩn đoán, hay giá trị chẩn đoán của siêu âm ở các bệnh nhân với sỏi đường mật. Đọc qua các nghiên cứu này, tôi thấy rất nhiều tác giả hiểu không đúng (hoặc quá đơn giản) về giá trị chẩn đoán, cho nên có những kết luận quá lạc quan. Thật ra, phần lớn nghiên cứu đều khó mà ứng dụng trong thực tế lâm sàng, bởi vì phương án nghiên cứu chỉ, một lần nữa, dừng lại ở dạng “nghiên cứu cắt ngang”. Đáng lẽ ra, các nghiên cứu này phải là những nghiên cứu theo thời gian (prospective study) để kết quả có thể ứng dụng trong việc tiên đoán bệnh tật cho một cá nhân.
- Nghiên cứu dược thảo thường tập trung vào các phân tích sinh hóa và độc tính của một số dược thảo như độc tính của cây trâm bầu. Các nghiên cứu này nói chung là khá đơn giản về kĩ thuật, và vì cách mô tả nghiên cứu không rõ ràng nên rất khó đánh giá giá trị khoa học của chúng.
Đại đa số các nghiên cứu trên cũng chỉ dừng lại ở mức độ đơn giản, chứ chưa đi sâu vào lĩnh vực phân tích (analytical research). Phần lớn các nghiên cứu chỉ giải quyết các vấn đề mang tính địa phương, những vấn đề mang tính vi mô, chứ chưa nhằm trả lời những câu hỏi lớn của y học. Một số lớn nghiên cứu mang tính [mà tiếng Anh hay gọi là] “me too”, tức là nghiên cứu lặp lại ý tưởng của người khác, hoàn toàn không có một phát kiến gì mới. (Xin nói thêm, đó chỉ là một nhận xét thực tế, chứ không phải một phê phán).
Giá trị khoa học: dưới trung bình
Ngoài ý tưởng mới, giá trị khoa học của một nghiên cứu y học thường được đánh giá qua phương pháp, nhất là phương pháp thiết kế và thu thập dữ liệu. Theo y học thực chứng, có 7 loại thiết kế nghiên cứu chính như sau (xếp theo thứ bậc giá trị khoa học từ thấp nhất đến cao nhất):
- Nghiên cứu cơ bản trên chuột và động vật cấp thấp trong phòng thí nghiệm về một phân tử hay tác nhân cụ thể;
- Báo cáo lâm sàng (case reports) trong thực tế là những kinh nghiệm điều trị về một hay vài trường hợp lâm sàng đặc biệt và hiếm thấy;
- Nghiên cứu đối chứng (case-control study) là những nghiên cứu nhằm mục đích tìm hiểu mối liên hệ giữa một yếu tố nguy cơ và bệnh tật bằng cách xem xét và so sánh sự phân phối một yếu tố nguy cơ giữa nhóm bệnh nhân và nhóm không mắc bệnh (đối chứng);
- Nghiên cứu tiêu biểu tại một thời điểm (cross-sectional study) là những nghiên cứu cắt ngang, mà mục đích thường là ước tính tỉ lệ hiện hành của bệnh (prevelance) và các yếu tố liên quan đến bệnh trong một quần thể;
- Nghiên cứu theo thời gian (prospective / longitudinal study) là những nghiên cứu theo dõi một nhóm đối tượng, kể cả bệnh nhân, một thời gian nhằm ước tính tỉ lệ phát sinh của bệnh (incidence) và các yếu tố liên quan đến bệnh trong một quần thể;
- Thử nghiệm lâm sàng đối chứng ngẫu nhiên (randomized controlled clinical trial – RCT) là những thí nghiệm công phu hơn thường được sử dụng trong việc thẩm định mức độ hiệu nghiệm của một thuật điều trị lâm sàng trong một nhóm đối tượng cụ thể; và
- Phân tích tổng hợp (meta-analysis), như tên gọi, là những nghiên cứu tổng hợp các kết quả nghiên cứu RCT, cross-section, longitudinal và case-control để đi đến một kết luận chính xác và đáng tin cậy hơn.
Đại đa số các nghiên cứu y học công bố trong các tạp chí y học ở Việt Nam là những nghiên cứu đối chứng và nghiên cứu cắt ngang. Chưa thấy một nghiên cứu cơ bản, RCT hay một phân tích tổng hợp nào trong các tạp chí ở Việt Nam. Như vậy, các tạp chí y học ở trong nước chỉ công bố những công trình nghiên cứu có giá trị khoa học thấp dưới trung bình.
Ngay cả những nghiên cứu đối chứng và nghiên cứu cắt ngang, các đối tượng thường là bệnh nhân trong các bệnh viện, chứ không được tiến hành trong một quần thể dân số được lấy mẫu một cách có hệ thống. Một ví dụ tiêu biểu là nghiên cứu về mối liên hệ giữa homocysteine huyết tương và chứng nhồi máu não được tiến hành bằng cách so sánh một nhóm bệnh nhân nhồi máu não với một nhóm bệnh nhân ngoại trú. Vì cách chọn đối tượng nghiên cứu từ bệnh viện (tức là những người đã có nguy cơ bệnh cao) cho nên kết quả không mang tính khách quan cao, và rất khó mà ứng dụng cho một quần thể lớn hơn.
Có một số nghiên cứu nhằm mục đích chẩn đoán bệnh, nhưng vì chủ yếu là nghiên cứu cắt ngang hay nghiên cứu đối chứng (mà đối tượng thường là bệnh nhân từ bệnh viện), cho nên kết quả rất khó diễn dịch, nếu không muốn nói là chẳng áp dụng vào thực hành lâm sàng được. Tiêu biểu cho nghiên cứu dạng này là một nghiên cứu thẩm định giá trị siêu âm trong việc chẩn đoán sỏi đường mật, các nhà nghiên cứu chỉ xem xét các bệnh nhân đã được giải phẫu mà không có nhóm đối chứng (không bệnh), cho nên kết quả chẳng có ý nghĩa gì dù các tác giả kết luận rằng “Siêu âm là một phương pháp hữu hiệu trong chẩn đoán sỏi đường mật chính nói chung Sn=95,9%.” (Chú ý Sn là tỉ lệ dương tính thật). Nhưng tác giả “quên” đề cập tỉ lệ âm tính thật, bởi vì tỉ lệ này không thể ước tính được!
Một số nghiên cứu nhằm mục đích phát triển chẩn đoán nhưng vì thiết kế không phù hợp (như nghiên cứu cắt ngang, hay dựa vào bệnh nhân nội trú), cho nên các kết quả và kết luận chẳng có ý nghĩa gì và chẳng đáp ứng được mục đích đặt ra.
Một nghiên cứu có giá trị khoa học phải được thiết kế sao cho tuân thủ ba nguyên tắc: ngẫu nhiên hóa (randomization), có nhóm đối chứng (control), lặp lại nhiều lần (replication) hoặc phân nhóm (blocking). Một số lớn nghiên cứu trong bệnh viện thậm chí không có nhóm đối chứng (một “vi phạm” cơ bản trong phương pháp nghiên cứu), cho nên kết quả dù được trình bày ở dạng nào vẫn rất khó diễn dịch và chẳng có giá trị khoa học gì đáng kể.
Phương pháp nghiên cứu: quá nhiều sai sót
Một công trình nghiên cứu y học được xem là một cống hiến mới nếu công trình đó nêu lên được một vấn đề mới, một ý tưởng mới, hay sử dụng một phương pháp mới cho một vấn đề cũ. Do đó, phương pháp nghiên cứu đóng một vai trò then chốt về chất lượng của một nghiên cứu. Phương pháp ở đây là cách thiết kế nghiên cứu, phương pháp phân tích vấn đề, kể cả phân tích số liệu, và phương pháp đo lường hay thu thập dữ liệu.
Theo một thống kê những nguyên nhân mà các bài báo không được chấp nhận cho công bố trên các tạp chí y học quốc tế, 70% là do có vấn đề về phương pháp, và trong số này hơn 50% là do phân tích số liệu sai phương pháp, và phần còn lại là vấn đề đo lường. Những ai có kinh nghiệm nghiên cứu khoa học đều có thể đánh giá giá trị của một bài báo qua phần phương pháp.
Phân tích dữ liệu bằng các mô hình thống kê đóng một vai trò then chốt trong các nghiên cứu y khoa. Thống kê cung cấp cho nhà nghiên cứu một cách suy nghĩ về dữ liệu, để hiểu và diễn dịch ý nghĩa của dữ kiện. Giá trị khoa học của kết luận từ một nghiên cứu không chỉ tùy thuộc vào phương án (thiết kế) của nghiên cứu mà còn tùy thuộc một phần lớn vào việc áp dụng đúng phương pháp thống kê. Để áp dụng đúng phương pháp thống kê, người phân tích chẳng những phải hiểu rõ các giả định đằng sau những phương pháp này, mà còn phải nắm vững mục đích nghiên cứu, am hiểu phương pháp đo lường và cách thu thập dữ liệu. Chẳng hạn như kiểm định t hay phân tích phương sai (analysis of variance) chỉ có thể áp dụng phân tích các biến số tuân theo luật phân phối chuẩn (normal distribution); nhưng nếu các phương pháp này được ứng dụng cho các biến số không theo phân phối chuẩn hay các biến số không liên tục (discrete variable) thì kết quả sẽ trở nên vô nghĩa và kết luận cũng sai.
Các nghiên cứu y học xuất hiện trong các tạp chí y học trong nước có quá nhiều sai sót về phương pháp phân tích. Có thể nói không ngoa rằng 100% các bài báo mà tôi đọc qua đều có ít nhất là một sai sót, một sai lầm về phương pháp phân tích số liệu. Có khi sai sót rất nghiêm trọng, có lẽ xuất phát từ việc hiểu sai mô hình thống kê, cho nên kết quả và kết luận sai. Những sai sót trong phần này có thể chia thành 5 nhóm sau đây:
Ứng dụng sai phương pháp. Như đề cập trên, mỗi phương pháp phân tích thống kê đều có những giả định đằng sau và chỉ thích hợp cho một số dạng nghiên cứu hay một số loại số liệu cụ thể. Chẳng hạn như phương pháp kiểm định thống kê cho các “nghiên cứu trước – sau” (before-after study, tức các nghiên cứu mà một nhóm đối tượng được thẩm định trước và sau khi điều trị) không thể áp dụng để so sánh hai nhóm bệnh nhân độc lập.
Trong một nghiên cứu về tác dụng điều trị viêm dạ dày, các tác giả so sánh tình trạng viêm (5 thứ bậc: viêm nông, viêm teo nhẹ, viêm teo vừa, viêm teo nặng, và niêm mạc bình thường) trong một nhóm bệnh nhân trước và sau điều trị. Kết quả nghiên cứu được phân tích bằng kiểm định Chi bình phương (Chi square test) với 3 bậc tự do (degrees of freedom). Ứng dụng phương pháp phân tích Chi bình phương rất sai trong dạng nghiên cứu này, bởi vì số liệu thu thập trước và sau điều trị không độc lập với nhau. Con số bậc tự do cũng sai!
Vi phạm và bất chấp giả định. Các phương pháp kiểm định thông thường nhất như kiểm định t (t-test) tuy rất dễ tính toán, nhưng kết quả có khi cũng rất dễ sai lầm nếu không xem xét đến sự phân phối của số liệu. Nếu hai biến không có cùng phương sai thì kiểm định t không thể áp dụng. Ấy thế mà nhầm lẫn này thường rất phổ biến trong các nghiên cứu y học từ Việt Nam. Một ví dụ về sai lầm tiêu biểu là trong một nghiên cứu mô tả về bệnh AIDS, các tác giả viết “số lượng tuyệt đối tế bào CD4 của các bệnh nhân AIDS là 229 ± 35 tb/ml so với số TCD4 ở nhóm người bình thường khỏe mạnh là 879 ± 232 tb/ml … giảm có ý nghĩa thống kê với p<0,001”! Tuy tác giả không cho biết con số đằng sau dấu “±” là gì, nhưng chắc chắn đó là chỉ số phản ánh độ dao động của số lượng tế bào CD4, và qua báo cáo trên, có thể thấy rằng nhóm đối tượng bình thường có độ dao động rất cao so với nhóm bệnh nhân (232 so với 35 tb/ml), và do đó hai nhóm này không có cùng dạng phân phối, cho nên kết quả từ kiểm định t có vấn đề.
Nhưng cũng có trường hợp tác giả biến đổi số liệu một cách vô lí do. Chẳng hạn như một nghiên cứu về homocysteine (một loại axít trong máu nghi ngờ là có liên hệ đến bệnh tim), các nhà nghiên cứu biến đổi đo lường homocysteine qua đơn vị logarít: “Do homocysteine huyết tương có độ lệch là 1,11 nên tính biến đổi log và trung vị”. Nhưng khi đọc kĩ bài báo, tôi thấy độ homocysteine trung bình là 9,67 mmol/L và độ lệch chuẩn là 3,07 mmol/L (chứ không phải 1,1 mmol/L), và nhìn vào biểu đồ phân phối của homocysteine tôi thấy việc biến đổi số liệu này không cần thiết, nếu không muốn nói là làm cho kết quả khó hiểu hơn (một người bình thường đã khó hiểu đơn vị mmol/L, và càng cảm thấy rối rắm hơn trước đơn vị như log của mmol/L!)
Phân nhóm tùy tiện. Trong phần lớn các bài báo khoa học, các tác giả có xu hướng chia một biến số liên tục (như độ tuổi, lymphocyte, thời gian, v.v…) thành nhiều nhóm một cách cực kì tùy tiện. Chẳng hạn như có tác giả chi độ tuổi thành từng nhóm theo 10-tuổi như 40 đến 49, 50 đến 59, và 60 đến 70, nhưng một nghiên cứu khác có tác giả chia thành nhóm tuổi lẻ như 35 đến 45, 46 đến 55, và trên 55! Có khi ngay trong một nghiên cứu, tác giả lại tự mình mâu thuẫn: lúc đầu thì chia thành 4 nhóm độ tuổi (1 đến 12 tháng, 1 – 5 tuổi, 6-10, 10-15) nhưng ngay sau đó lại chia thành 3 nhóm (1 – 12 tháng, 13 tháng đến 5 tuổi, và 6 đến 15 tuổi)! Ngay cả các biến như huyết áp cũng bị cắt thành từng nhóm như thế, và cách chia cắt đó hoàn toàn không có một lí do lâm sàng nào.
Đứng trên phương diện lí thuyết đo lường và phân tích thống kê, việc biến đổi một một biến số liên tục thành một biến số không liên tục (như cách chia cắt trên) là một sai sót, bởi vì việc biến đổi đó làm cho thông tin bị mất (loss of information) của biến. Chẳng hạn như một phân tích tiên đoán xác suất mắc bệnh dựa vào hai biến liên tục như độ tuổi và trọng lượng của bệnh nhân lúc nào cũng cần ít thông số hơn là một phân tích dựa vào nhóm tuổi và nhóm trọng lượng.
Ngoài ra, đứng trên phương diện logic và thực tế lâm sàng, không có lí do gì để chia hai bệnh nhân với áp suất máu 110 mmHg và 111 mmHg thành hai nhóm khác nhau cả. Chính vì thế mà các tập san y khoa và nhà thống kê khuyến cáo nên tránh cách phân chia một biến số liên tục một cách tùy tiện.
Phân tích theo kiểu “câu cá”, thiếu kế hoạch. Cũng như người câu cá, nếu chịu khó kiên trì câu cá hết nơi này sang nơi khác và tháng này sang tháng nọ, thì thể nào cũng câu được một con cá (dù con cá này không nằm trong dự tính ban đầu), nhà nghiên cứu cũng có thể kiên trì tìm cách phân tích hết nhóm này sang nhóm nọ đến khi “phát hiện” được một khác biệt nào đó mà nhà nghiên cứu không nghĩ đến lúc khởi đầu nghiên cứu. Đó là những phát hiện mà giới khoa học gọi là “fishing expedition” (chuyến câu cá). Một công trình nghiên cứu thông thường đo lường nhiều biến số phản ánh tình trạng của bệnh nhân. Với nhiều biến số như thế và nhiều cách phân nhóm bệnh nhân theo giới tính, độ tuổi hay các chỉ tiêu lâm sàng khác, nhà nghiên cứu có thể có hàng trăm, thậm chí hàng ngàn, nhóm nhỏ đối tượng để phân tích. Trong trường hợp đó, một số kết quả phân tích sẽ có “ý nghĩa thống kê” chỉ vì yếu tố ngẫu nhiên mà chẳng có ý nghĩa sinh học nào cả.
Rất nhiều nghiên cứu y khoa từ Việt Nam mà tôi đọc qua mang tính câu cá như mô tả trên. Chẳng hạn như một nghiên cứu về mối liên hệ giữa lipid và chứng cao huyết áp, các nhà nghiên cứu đo lường 4 chỉ số lipid như tổng số cholesterol, LDL cholesterol, HDL cholesterol, và triglycerides trong hai nhóm đối tượng nam và nữ (nhóm cao huyết áp và nhóm bình thường) tuổi từ 40 đến 70 tuổi. Họ chia các đối tượng thành 3 nhóm tuổi theo giới, cộng với hai nhóm đối tượng, các nhà nghiên cứu có đến 12 nhóm nhỏ khác nhau. Với 12 nhóm nhỏ, các nhà nghiên cứu có thể làm 66 phân tích so sánh. Và, mỗi so sánh, họ có thể lặp lại 4 lần (cho 4 chỉ số lipid). Sau khi phân tích nhiều như thế, các nhà nghiên cứu phát hiện rằng chỉ có triglycerides là khác biệt giữa nam và nữ, và sự khác biệt này chỉ tìm thấy trong nhóm đối tượng tuổi từ 40 đến 49 và chỉ trong nữ giới thuộc nhóm bình thường. Nói cách khác, các nhà nghiên cứu đã đi ra ngoài mục đích ban đầu của nghiên cứu, và phát hiện được một khác biệt mà câu hỏi “tại sao” vẫn chưa thể trả lời bằng lí giải sinh học.
Để cho máy tính làm việc. Ngày nay, rất nhiều phần mềm cho phân tích thống kê được phát triển, giúp cho nhà nghiên cứu có thể tiến hành những phân tích phức tạp một cách nhanh gọn và hữu hiệu. Nhiều mô hình phân tích mà chỉ vài thập niên trước đây không ai dám mơ đến (vì có thể tốn đến hàng tháng, hay thậm chí bất khả thi) nay có thể thực hiện trong vòng vài phút. Nhưng các phần mềm này là những con dao hai lưỡi: một mặt, chúng giúp cho nhà nghiên cứu giải quyết vấn đề tính toán; mặt khác, chúng có thể bị lạm dụng để tiến hành những phân tích sai, vô duyên, vô ý thức và vô nguyên tắc. Người ta có thể sử dụng các phần mềm này để tính số trung bình của hàng triệu số điện thoại, nhưng tất nhiên kết quả đó vẫn chỉ là một con số ngẫu nhiên, chẳng có ý nghĩa gì trong thực tế.
Tiêu biểu tình trạng này là để cho các phần mềm phân tích thống kê làm cái việc mà đáng lẽ nhà nghiên cứu phải làm: phân tích và suy nghĩ. Trong một nghiên cứu về mối liên hệ giữa homocysteine và chứng nhồi máu não, các nhà nghiên cứu viết: “Phương trình hồi qui bội log được xây dựng nhồi máu não như biến phụ thuộc, homocysteine và các yếu tố nguy cơ như biến độc lập. Bằng phương pháp loại dần, kết quả các biến dự đoán quan trọng nguy cơ nhồi máu não gồm: homocysteine, cao huyết áp, và hút thuốc lá”. Nhưng khi xem kĩ bảng kết quả phân tích dưới đây thì người đọc sẽ có một “bức tranh” rất khác với nhận xét đó:
Yếu tố | Hệ sốb | Hệ số tương quan | Sai số | P |
Homocysteine>15 mmol/L | 1,66 | -0,19 | 0,40 | <0,001 |
Cao huyết áp | -1,84 | -0,42 | 0,22 | <0,001 |
Hút thuốc | -1,11 | -0,92 | 0,43 | 0,01 |
Nhồi máu não | 1,92 | 1,00 | 0,46 | <0,001 |
Theo bảng kết quả này (dù tác giả không giải thích “hệ số b” là gì, nhưng tôi có thể biết được ý nghĩa của nó), thì quả là cá nhân với độ homocysteine cao có nguy cơ bị chứng nhồi máu não gia tăng, nhưng điều lạ lùng là kết quả trên còn cho thấy người với cao huyết áp và hút thuốc lá có nguy cơ nhồi máu não thấp! (Bảng số liệu này còn có một vấn đề khác: đó là cột “Hệ số tương quan”, không rõ tác giả ước tính hệ số tương quan giữa cao huyết áp và nhồi máu não bằng cách nào, bởi vì nhồi máu não là một biến thể loại, làm sao ước tính tương quan với một biến liên tục như cao huyết áp? Ngay cả việc trình bày trong một bảng số cũng gây ra không ít lẫn lộn!)
Thật ra, đây là một sai sót rất phổ biến trong phân tích thống kê đa biến mà nếu người phân tích không chịu khó suy nghĩ rất dễ bị sai lầm. Trong trường hợp mà các biến độc lập có tương quan (correlation) với nhau, và khi các biến này được phân tích trong một mô hình, tình trạng đa tương quan (multicollinearity) sẽ xảy ra, và các thông số từ mô hình này có thể không còn ý nghĩa thực tế nữa.
Trong nhiều nghiên cứu với mục đích tiên đoán khả năng mắc bệnh, việc xây dựng một mô hình tiên đoán bằng thống kê rất phức tạp. Trong hàng chục, thậm chí hàng trăm, yếu tố lâm sàng, vấn đề đặt ra là yếu tố nào có liên quan đến khả năng mắc bệnh. Để trả lời câu hỏi này nhà nghiên cứu phải xây dựng một mô hình tiên đoán (predictive model) đơn giản nhưng chính xác dựa vào các yếu tố nguy cơ. Vì có nhiều yếu tố nguy cơ, cho nên con số mô hình tiên đoán có thể lên đến hàng ngàn, thậm chí hàng triệu mô hình, và chọn mô hình nào tối ưu nhất là một việc làm không đơn giản chút nào. Khoa học thống kê cung cấp nhiều mô hình để giải quyết vấn đề, nhưng nó đòi hỏi nhà nghiên cứu phải am hiểu mô hình, chứ không phải để cho máy tính quyết định mô hình.
Có thể nói rằng không có một nghiên cứu nào mà người viết đọc qua ứng dụng các mô hình phân tích đa biến đúng cả. Các nhà nghiên cứu Việt Nam vẫn còn quá tùy thuộc vào phần mềm phân tích thống kê và để cho các phần mềm này “chỉ thị”. Đó là một điều rất đáng tiếc, vì rất dễ dẫn đến sai lầm nghiêm trọng trong kết quả nghiên cứu. Chẳng hạn như một nghiên cứu nhằm tìm các yếu tố nguy cơ (risk factors) để dự đoán khả năng phù não tử vong ở các bệnh nhân nhồi máu não, và tác giả viết như sau: “Các biến có liên quan với tử vong do thần kinh trong phân tích đơn biến với mức ý nghĩa p<0,05 sẽ được đưa vào phân tích hồi qui đa biến logistic”. Nói cách khác, các tác giả tiến hành phân tích hai giai đoạn: giai đoạn 1 họ phân tích từng biến một và chỉ lưu lại các biến nào có ý nghĩa thống kê (p<0,05); trong giai đoạn 2, tất cả các biến có ý nghĩa thống kê trong giai đoạn 1 được đưa vào phân tích đa biến. Đây cũng là một sai lầm khá phổ biến, không những trong các nghiên cứu ở Việt Nam mà còn ở nước ngoài, vì cách phân tích như thế sẽ loại bỏ các biến có thể có liên quan đến phù não tử vong tuy không có ý nghĩa thống kê trong giai đoạn 1 nhưng lại có ý nghĩa thống kê trong giai đoạn 2 khi mà các biến được xem xét cùng một lúc trong một mô hình. Sai lầm này có lẽ phản ánh sự thiếu am hiểu về mô hình hồi qui logistic và phương pháp xây dựng mô hình trong thống kê học.
Hiểu sai khái niệm. Trong một nghiên cứu khác, tác giả tỏ ra chưa am hiểu các khái niệm về đo lường trong chẩn đoán y khoa nên viết: “Kết quả siêu âm được đối chiếu với kết quả phẫu thuật và rút ra 4 khả năng có thể xảy ra của từng dấu hiệu trên siêu âm: dương tính thật, dương tính giả, âm tính thật, âm tính giả. Từ đó tính các giá trị: độ nhạy, độ đặc hiệu, giá trị dự báo dương tính, giá trị dự báo âm tính.” Thật ra, không có chuyện tính toán độ nhạy, độ đặc hiệu từ các giá trị dương tính thật hay âm tính thật, bởi vì độ nhạy (sensitivity) chính là dương tính thật, và độ đặc hiệu (specificity) chính là âm tính thật! Còn các giá trị dự báo dương tính và giá trị dự báo âm tính cũng sai, vì thiết kế nghiên cứu không cho phép tác giả ước tính các chỉ số này.
Một nghiên cứu về mối tương quan giữa tế bào lymphocyte và CD4 ở các bệnh nhân AIDS kết luận rằng “môi tương quan giữa tế bào lympho T CD4+ và tế bào lympho toàn phần ở 517 bệnh nhân ngoại trú cho thấy mối tương quan này theo tỉ lệ thuận với hệ số tương quan r=0.66 (p<0,001). Tương quan này yếu đi khi phân tầng theo tế bào lympho”. Phát biểu trên khá khó hiểu, nhưng thật ra bảng thống kê số 5 của bài báo cho thấy kết quả rõ hơn:
Lymphocyte | N | Hệ số tương quan lympho CD4 | P |
Tất cả bệnh nhân | 517 | 0,66 | <0,001 |
<1000 | 60 | 0,36 | 0,005 |
1000 – 2000 | 208 | 0,49 | <0,001 |
>5000 | 249 | 0,35 | <0,001 |
(Một lần nữa, tác giả không giải thích “N” là gì, và trị số P đề cập đến cái gì! Tuy nhiên những ai có kinh nghiệm nghiên cứu có thể đoán biết N là số đối tượng và trị số P đề cập đến ý nghĩa thống kê của hệ số tương quan.) Vấn đề đặt ra là tại sao hệ số tương quan của cả nhóm (517 bệnh nhân) là 0,66, nhưng khi phân từng nhóm nhỏ thì các hệ số tương quan chỉ dao động từ 0,35 đến 0,49 ? Tác giả không giải thích, mà còn xem đó là một phát hiện y học! Thật ra, đây là một sai lầm khá phổ biến trong các phân tích tương quan khi một biến số bị chia cắt thành từng mảnh nhỏ. Bởi vì khi một biến được chia thành từng nhóm thì toàn cự của dãy số (range) trong từng nhóm nhỏ bị hạn chế, và phương sai (variance) trở nên thấp, và hệ quả của phương sai thấp là hệ số tương quan trong các nhóm nhỏ này cũng giảm. Hệ số tương quan tính toán trong từng nhóm nhỏ như thế không phản ánh chính xác độ tương quan của một quần thể. Đây là một hiện tượng số học, chứ chẳng phải làm một phát hiện có ý nghĩa sinh học gì cả.
Báo cáo: quá sơ sài và nhiều thiếu sót
Báo cáo khoa học (hay bài báo khoa học – papers) là một “sản phẩm” của nghiên cứu khoa học, một loại “tiền tệ” trong hoạt động khoa học, bởi vì báo cáo khoa học không chỉ là một bản báo cáo về một công trình nghiên cứu, mà còn là một đóng góp cho kho tàng tri thức của thế giới. Y học tiến bộ cũng nhờ một phần lớn vào thông tin từ những bài báo khoa học, bởi vì qua chúng mà các nhà khoa học có dịp trao đổi, chia sẻ và học hỏi kinh nghiệm lẫn nhau. Chính vì tính trao đổi thông tin này, các báo cáo khoa học phải tuân theo một cấu trúc đặc thù và được viết bằng một văn phong ngắn gọn nhưng phải đầy đủ. Cấu trúc một bài báo khoa học thường là cấu trúc IMRAD (Introduction – Dẫn nhập, Methods – Phương pháp, Results – Kết quả, và Discussion – Thảo luận.
Một báo cáo khoa học hay có thể thu hút người đọc “nhập cuộc”. Do đó, tác giả phải suy nghĩ rất cẩn thận (và có khi khá lâu – một bài báo khoa học có khi viết đi viết lại đến 3 tháng trời). Nếu không tiếp cận vấn đề một cách có việc hệ thống, tất cả những nỗ lực cho một bài báo khoa học có thể trở nên vô dụng, thậm chí đem lại ảnh hưởng xấu vì một công trình nghiên cứu sẽ không có cơ hội xuất hiện trên các tập san chuyên môn. Mặc dù ở các nước phương Tây, người ta đã có nhiều bài viết chỉ dẫn – thậm chí cả sách dạy – cách viết một bài báo khoa học, nhưng ở nước ta, hình như vẫn chưa có một tài liệu chỉ dẫn như thế. Có lẽ vì lí do này mà rất nhiều bài báo khoa học tôi đọc qua đều có quá nhiều vấn đề về cách trình bày cũng như văn phong rất khó hiểu (giống như thách đố người đọc!) Không thể nêu tất cả các vấn đề ở đây, vì 100% những bài tôi đọc qua thành thật mà nói, đều cần phải viết lại. Ở đây, tôi chỉ nêu các vấn đề nổi cộm mà thôi:
Dẫn nhập: lí do mù mờ. Thông thường trong phần này, tác giả phải trả lời cho được câu hỏi “Tại sao làm nghiên cứu này?” và để trả lời câu hỏi đó, tác giả phải điểm qua các nghiên cứu liên quan trong quá khứ ở Việt Nam và trên thế giới, chỉ ra những thiếu sót hay khía cạnh chưa giải quyết, và nêu lên mục đích cụ thể của nghiên cứu của tác giả. Ngoài ra, tác giả còn phải thuyết phục người đọc vấn đề mà tác giả quan tâm là một vấn đề lớn, có ý nghĩa xã hội, có liên quan đến việc nâng cao chất lượng chăm sóc bệnh nhân hay quần chúng. Nhưng rất tiếc, không có một bài báo nào tôi đọc qua đáp ứng được các yêu cầu căn bản trên. Các tác giả Việt Nam thường viết phần dẫn nhập rất ngắn (không đầy 1 phần tư trang giấy), ngắn đến nổi người đọc không hiểu tác giả muốn làm gì, và công trình nghiên cứu có xứng đáng hay không. Các tác giả có cố gắng điểm qua các nghiên cứu trước, nhưng quá hạn chế (trung bình chỉ có 2 tài liệu tham khảo). Thậm chí, có nhiều bài báo, tác giả chẳng điểm qua các nghiên cứu trước!
Đối tượng nghiên cứu: mô tả quá sơ sài. Kết quả nghiên cứu có thể khái quát hóa hay không tùy thuộc một phần lớn vào thành phần đối tượng nghiên cứu. Chẳng hạn một nghiên cứu mà đối tượng là bệnh nhân nội trú trong bệnh viện khó mà áp dụng cho các quần thể lớn hơn trong dân số. Do đó, mô tả đặc tính các đối tượng nghiên cứu rất quan trọng để người đọc có thể lượng xét giá trị khoa học của kết quả và kết luận. Rất tiếc là trong các bài báo về nghiên cứu y khoa ở Việt Nam, các tác giả có vẻ không coi trọng khía cạnh này. Phần lớn đối tượng nghiên cứu chỉ được mô tả bằng một đoạn văn ngắn. Chẳng hạn như nghiên cứu về tình hình suy dinh dưỡng, các tác giả viết vỏn vẹn một câu văn như sau: “Đối tượng nghiên cứu là trẻ em dưới 5 tuổi sinh từ ngày 1/1/1996 đến 31/12/2000 tại hai huyện Đông Sơn và Nga Sơn tỉnh Thanh Hóa”. Đáng lẽ ở đây, tác giả nên cho người đọc và đồng nghiệp biết tại sao chọn hai huyện này, cách tuyển chọn đối tượng ra sao, ai là người liên lạc, có kế hoạch lấy mẫu hay không, v.v… nhưng rất tiếc các thông tin này không có, nên khó mà đánh giá giá trị khoa học của nghiên cứu này.
Cở mẫu: thiếu lí do. Một nghiên cứu có hệ thống phải là một nghiên cứu có kế hoạch và được tiến hành đúng với qui trình khoa học từ khâu phát triển giả thiết, chọn phương án nghiên cứu, ước tính cỡ mẫu, đến phân tích và diễn dịch. Trong các khâu này, ước tính cỡ mẫu (tức ước tính số đối tượng cần thiết cho nghiên cứu) đóng vai trò rất quan trọng. Nếu số lượng đối tượng quá ít, kết quả nghiên cứu sẽ không có giá trị gì và không thể đi đến kết luận; ngược lại, nếu nghiên cứu có quá nhiều đối tượng hơn cần thiết thì vi phạm y đức. Do đó, một báo cáo khoa học có giá trị phải giải thích rõ tại sao nghiên cứu được tiến hành trên số đối tượng đã ấn định. Nhưng tất cả các bài báo y học từ Việt Nam mà tôi xem qua hoàn toàn không có một lời giải thích gì về cỡ mẫu. Do đó, rất khó mà hiểu các nghiên cứu này có quả thật được lên kế hoạch và thiết kế nghiêm chỉnh, hay chỉ là những nghiên cứu cho có bằng cách sử dụng bệnh nhân sẵn có trong bệnh viện.
Phương pháp đo lường: quá tiết kiệm chữ nghĩa. Trong giới nghiên cứu khoa học, người ta có câu “rác vào, ra rác” (garbage in, garbage out), tức là nếu một nghiên cứu mà phương pháp đo lường thiếu chính xác, không có độ tin cậy cao, thì kết quả của nghiên cứu đó cũng chỉ là một khối rác con số. Do đó, kết quả của nghiên cứu tùy thuộc rất nhiều vào phương pháp đo lường, và tác giả phải có trách nhiệm mô tả chi tiết về các phương pháp thu thập số liệu, phân tích sinh hóa, đo lường các chỉ số lâm sàng, v.v… trong một bài báo khoa học.
Điểm qua các nghiên cứu y học từ Việt Nam, tôi có thể nói đây là một phần yếu nhất, mù mờ nhất. Không như các bài báo khoa học trên các tập san y học quốc tế mà phần phương pháp chiếm một phần lớn của nội dung bài báo, các bài báo y học từ Việt Nam rất “tiết kiệm” về phần này. Hầu như nghiên cứu nào cũng mô tả phần phương pháp cực kì sơ sài, chỉ trong vòng nửa trang giấy A4. Một số nghiên cứu mà các tác giả chỉ mô tả chi tiết đo lường không đầy 50 chữ! Thậm chí còn có một số nghiên cứu về huyết học, lipid mà các tác giả không có đến một chữ để mô tả phương pháp đo lường cholesterol ra sao, hay không một chữ về các chi tiết phân tích hồng cầu, bạch cầu và hematocrit!
Kết quả nghiên cứu: không theo sát mục đích. Thông thường trong phần báo cáo kết quả, tác giả phải đi thẳng vào vấn đề nêu ra trong phần dẫn nhập, tức phải trả lời cho được câu hỏi “Đã phát hiện cái gì?” Nhưng các bài báo y học ở Việt Nam thường mang tính “vòng vo tam quốc” về đối tượng nghiên cứu (mà đáng lẽ phải trình bày trong phần phương pháp) rồi mới đi vào kết quả chính. Ngay cả báo cáo các kết quả chính, tác giả không chịu theo sát mục đích đặt ra lúc ban đầu hay trong phần dẫn nhập. Tiêu biểu cho tình trạng này là thay vì báo cáo kết quả toàn bộ đối tượng nghiên cứu, tác giả lại nhấn mạnh đến các nhóm nhỏ mà kết quả có khi chẳng có ý nghĩa gì đáng kể (nếu không muốn nói là kết quả ngẫu nhiên)!
Một xu hướng đáng chú ý khác là có rất nhiều tác giả thay vì chỉ trình bày kết quả thì họ lại diễn dịch luôn kết quả (đáng lẽ phải dành cho phần thảo luận). Có nhiều khi tác giả lặp lại những con số trong bảng số liệu và biểu đồ, tức là một cách phí phạm chữ nghĩa. Cũng như phần dẫn nhập, nội dung phần kết quả thường rất ngắn (trung bình là 2,5 đoạn văn, khoảng 1/4 trang giấy A4).
Trình bày số liệu: chính xác đến độ không cần thiết. Một trong những xu hướng khá phổ biến trong các bài báo y học ở trong nước là các chỉ số thống kê thường được trình bày với sự chính xác một cách … thừa thải. Chẳng hạn như một báo cáo mô tả về các đối tượng tham gia vào công trình nghiên cứu, các tác giả viết: “Tuổi trung bình của 194 bệnh nhân là 47,89 tuổi (17,95). Số bệnh nhân nữ là 132 bệnh nhân (68,04%), số bệnh nhân nam là 62 bệnh nhân (31,96%).” Chú ý con số trong ngoặc (17,95) không rõ đó là con số gì? Có thể tác giả muốn đề cập đến độ lệch chuẩn (standard deviation), nhưng cũng có thể là sai số chuẩn (standard error), nhưng dù sao đi nữa, một cách viết như thế không thể chấp nhận trong một bài báo khoa học.
Biểu đồ: nghèo nàn ý nghĩa. Yếu tố thị giác rất quan trọng. Người Trung Hoa từng nói “Một biểu đồ có giá trị bằng một vạn chữ viết.” Mục đích của biểu đồ là cung cấp một ấn tượng về phát hiện chính của công trình nghiên cứu. Biểu đồ có khi được dùng làm tài liệu giảng dạy. Vì thế biểu đồ là một phương tiện hữu hiệu nhất để nhấn mạnh thông điệp của bài báo. Biểu đồ thường được sử dụng để thể hiện xu hướng và kết quả cho từng nhóm, nhưng cũng có thể dùng để trình bày dữ kiện một cách gọn gàng. Các biểu đồ dễ hiểu, nội dung phong phú là những phương tiện vô giá. Do đó, nhà nghiên cứu cần phải suy nghĩ một cách sáng tạo cách thể hiện số liệu quan trọng bằng biểu đồ.
Rất nhiều biểu đồ trong các bài báo y học ở Việt Nam chỉ xoay quanh các biểu đồ mô tả như histogram, biều đồ pie, biểu đồ tần số. Rất hiếm thấy các biểu đồ mang tính phân tích. Các biểu đồ mô tả cũng rất nghèo nàn về ý nghĩa, đơn sơ trong trình bày chẳng khác gì cách vẽ biểu đồ trong các bài tập dành cho sinh viên. Có nhiều biểu đồ lặp lại những gì trình bày trong các bảng số liệu, tức là chẳng cung cấp thêm thông tin gì cho người đọc, chẳng gây một ấn tượng gì đáng nhớ. Cách làm việc như thế cho người đọc ấn tượng rằng tác giả hình như chưa đầu tư suy nghĩ về việc trình bày kết quả sao cho có ý nghĩa và dễ hiểu.
Bảng số: khô khan và thiếu ý nghĩa. Trong một bài báo khoa học, các bảng thống kê số liệu thường được dùng để trình bày những số liệu mang tính trang trọng, tính chính xác cao, tính chính thức. Các bảng thống kê có thể dùng để (a) mô tả bằng con số những đặc điểm chính của các đối tượng nghiên cứu; (b) trình bày kết quả phân tích mối liên hệ giữa các yếu tố trong nghiên cứu; và (c) so sánh giữa các nhóm bệnh và đối chứng. Thiết kế một bảng thống kê có ý nghĩa không phải là việc làm đơn giản, mà đòi hỏi kinh nghiệm và một chút “nghệ thuật” trong việc trình bày.
Rất tiếc là những bảng số liệu trong các bài báo khoa học từ Việt Nam chẳng những không hấp dẫn mà còn chứa rất nhiều thiếu sót. Phần lớn các bảng số này chỉ dừng lại ở tính mô tả, một phần nhỏ là những bảng trình bày hệ số tương quan, thông số từ các phân tích hồi quy nhưng vì chẳng có ghi chú cẩn thận, cho nên chẳng ai có thể hiểu nổi ý nghĩa của những bảng số liệu này.
Điều đáng nói là có một số bài báo thậm chí chẳng có một bảng số liệu và biểu đồ nào! Còn phần mô tả kết quả bằng chữ thì cũng rất khó theo dõi.
Thảo luận: quá chủ quan. Đối với phần lớn nhà nghiên cứu, đây là phần khó viết nhất vì nó không có một cấu trúc cố định nào cả. Nói một cách ngắn gọn, trong phần này, tác giả phải trả lời câu hỏi “Những kết quả này có nghĩa gì?”. Tuy không phải theo cấu trúc cố định nào, tác giả có kinh nghiệm thường viết thảo luận theo một cấu trúc như sau: (a) giải thích những dữ kiện trong phần kết quả; (b) so sánh những kết quả này với các nghiên cứu trước; (c) bàn về ý nghĩa của những kết quả; (d) chỉ ra những ưu điểm và khuyết điểm của cuộc nghiên cứu; (e) và sau cùng là một kết luận sao cho người đọc có thể lĩnh hội được một cách dễ dàng. Không một bài báo y khoa từ Việt Nam mà tôi đọc qua viết theo cấu trúc như vừa mô tả.
Tính trung bình, phần thảo luận của các bài báo y khoa mà tôi đọc qua hàm chứa rất ít ý kiến. Tính trung bình phần này dài khoảng 1,5 trang, so với [trung bình] 4 trang trong các bài báo ở nước ngoài. Tuy nhiên, vấn đề dài ngắn không phải là điều thiết yếu, quan trọng là nội dung, và có thể nói rằng nội dung thảo luận rất nghèo nàn. Có rất nhiều bài báo mà phần thảo luận không thể xem là “thảo luận” bởi vì tác giả chỉ lặp lại những con số và thay đổi vài câu chữ trong phần kết quả, hoàn toàn không có một giải thích và phát kiến gì cả!
Có tác giả cũng cố gắng giải thích, hay đề nghị một mô hình giải thích, kết quả nghiên cứu của họ, nhưng lại không kèm theo những chứng cớ khoa học, nên rất khó mà nói cách giải thích đó thuyết phục hay không. Rất ít khi nào các tác giả Việt Nam so sánh kết quả của họ với kết quả của những nghiên cứu trước và giải thích tại sao chúng (những kết quả) khác nhau, hay tại sao chúng lại giống nhau, và ý nghĩa của chúng là gì. Một điều đáng nói khác là phần lớn các tác giả Việt Nam không chịu vạch ra những thiếu sót, những trắc trở, khó khăn trong nghiên cứu, hay nêu được những ưu điểm của cuộc nghiên cứu, cũng như đưa ra các giải pháp khắc phục hay những đề xuất hướng nghiên cứu trong tương lai. Cách viết phẩn thảo luận của các tác giả Việt Nam cho người đọc một ấn tượng về một nghiên cứu hoàn hảo, không có vấn đề gì cả.
Tiếng Anh: quá nhiều sai sót. Trên thế giới ngày nay, tiếng Anh là một ngôn ngữ quốc tế trong hoạt động khoa học. Vào thập niên 1980s, trên 60% các tập san khoa học trên thế giới sử dụng tiếng Anh. Hai mươi năm sau, con số này là trên 80% [2]. Trong lĩnh vực y khoa và sinh học, hiện nay hơn 90% các tập san sử dụng tiếng Anh. Ngay cả tập san khoa học tại các nước không nói tiếng Anh như các nước Bắc Âu, Nhật, Thái Lan, Trung Quốc cũng hoặc là sử dụng tiếng Anh làm phương tiện thông tin, hoặc có phần tóm lược viết bằng tiếng Anh.
Các tạp chí y học Việt Nam trong mấy năm qua cũng cố gắng cung cấp phần tóm lược bài báo khoa học bằng tiếng Anh. Nhưng rất tiếc là hầu như bài báo nào (nếu không muốn nói là 100%) đều cũng có sai sót về tiếng Anh, từ cú pháp, thuật ngữ, đến cách diễn đạt. Không thể kể hết tất cả các sai sót ở đây, vì hầu như câu văn nào cũng có sai sót. Chẳng hạn như trong một nghiên cứu về các chỉ số sinh hóa trong nhóm bệnh nhân tai biến mạch máu não, tác giả viết trong phần kết quả: “There has no differency in blood cell count, platelet count, hematocrit rate between cerebral infarction and cerebral hemorrhage. However there is a little different in some patients”. Một câu văn có quá nhiều sai sót về đánh vần, văn phạm, và khái niệm. Một nghiên cứu khác về ứng dụng CT scan trong việc chẩn đoán thuyên tắc phổi, tác giả kết luận bằng một câu văn với chữ “efficacy” thành “efficacity”: “Chest helical CT scan is a useful tool in pulmonary embolism diagnosis in Vietnam condition with good feasibility, efficacity and some small disadvantages that could be resolved in the near future.” Thật ra, chữ efficacy mà tác giả muốn nói đến trong kết luận không thể dùng trong nghiên cứu này vì không thích hợp. Đây là một sai sót mang tính học thuật, chứ không đơn giản là từ ngữ.
Có khi sai sót rất căn bản về khái niệm và thuật ngữ mà đáng lẽ không nên có mặt trên mặt báo, như “Lipidemia is common in hypertensive patients and their presentation increases cardiovascular risk”. Đáng lẽ là hyperlipidemia (chứ không phải lipidemia) và cụm từ “cardiovascular risk” đáng lẽ phải là “the risk of cardiovascular diseases”.
Vấn đề y đức. Một nguyên tắc số 1 (và bất di bất dịch) của y khoa là không làm tổn hại đến bệnh nhân. Nghiên cứu y học cũng phải tuân thủ theo nguyên tắc này. Trong nhiều nghiên cứu, nhất là nghiên cứu can thiệp mà đối tượng nghiên cứu có khi phải kinh qua một thuật điều trị mới hay một loại thuốc mới còn trong vòng thử nghiệm. Trong các trường hợp này, bệnh nhân có thể hưởng lợi từ thuật điều trị, nhưng cũng có thể bệnh nhân cũng chịu đựng một số biến chứng có khi nguy hiểm. Ngay cả trong các nghiên cứu không can thiệp, đối tượng nghiên cứu có khi phải phơi nhiễm những phương pháp đo lường (như X quang, hay lấy mẫu máu chẳng hạn). Ngoài ra, các thông tin lâm sàng thu thập từ cá nhân đối tượng nghiên cứu cần phải được giữ kín tuyệt đối, và danh tính bệnh nhân dứt khoát không được tiết lộ trên bất cứ phương tiện truyền thông nào nếu không có sự đồng ý của bệnh nhân. Đây là những khía cạnh mang tính đạo đức khoa học, mà cụ thể trong y khoa là khía cạnh y đức (medical ethics).
Ở các nước Tây phương, bất cứ trường đại học hay bệnh viện nào đều có một ủy ban y đức (Ethics Committee hay Institutional Review Board) có chức năng kiểm tra khía cạnh y đức trong tất cả các công trình nghiên cứu y học. Ủy ban này gồm có đại diện từ giới nghiên cứu khoa học, bác sĩ, thống kê, luật sư, tôn giáo, và quần chúng hay bệnh nhân. Ủy ban có nhiệm vụ cụ thể là duyệt xét xem công trình nghiên cứu có đáp ứng các yêu cầu y đức hay không, bảo đảm an toàn cho tình nguyện viên, kiểm tra tính bảo mật, v.v… của dự án nghiên cứu. Chỉ khi nào các khía cạnh này được giải quyết thỏa đáng, dự án mới được cho phép tiến hành.
Các tập san y học quốc tế có uy tín dứt khoát sẽ không công bố một công trình nghiên cứu, bất kể công trình đó có giá trị khoa học cỡ nào, nếu công trình đó chưa được sự phê chuẩn của ủy ban y đức địa phương. Do đó, ban biên tập các tập san y học quốc tế thường yêu cầu tác giả phải kèm theo một tuyên bố như “Công trình nghiên cứu này đã được ủy ban y đức thuộc trường đại học ABC thông qua, và bệnh nhân đã đồng ý tham gia vào nghiên cứu.” Không có tuyên bố này cũng có nghĩa là bài báo sẽ không được bình duyệt (chứ chưa nói đến việc được chấp nhận cho xuất bản hay không!)
Tuy nhiên, tất cả những bài báo y học mà tôi đọc qua trong các tập san y học ở trong nước không có một giòng chữ nào nói đến y đức. Không một bài báo nào cho biết bệnh nhân đã thỏa thuận tham gia vào nghiên cứu và cho phép cung cấp thông tin! Có thể các công trình nghiên cứu đã được thông qua, nhưng tác giả “quên” không cung cấp thông tin này?
Tài liệu tham khảo: lạc hậu và văn hóa Bắc-Nam. Tài liệu tham khảo là phần cuối của một bài báo khoa học, nơi mà tác giả liệt kê tất cả các tài liệu đã được tham khảo để phát triển và thực hiện công trình nghiên cứu. Liệt kê chính xác tài liệu tham khảo không phải là một việc làm cho lấy có, mà phải được suy nghĩ cẩn thận, nghiêm chỉnh, bởi vì đây cũng là hình thức mà tác giả trực tiếp ghi nhận đóng góp của các nhà nghiên cứu khác cho nghiên cứu của mình. Trong hoạt động khoa học, số lần trích dẫn là một loại “tiền tệ” và là một chỉ tiêu quan trọng để đo lường ảnh hưởng của một công trình nghiên cứu. Một trong những yêu cầu của phân tham khảo tài liệu là trích dẫn phải chính xác (theo một công thức như tên tác giả, tựa đề bài báo, tên tập san, năm xuất bản, số bộ và số trang), phải liên quan đến văn cảnh, và nhất là tác giả đã đọc qua tài liệu mà mình trích dẫn (chứ không phải trích dẫn gián tiếp qua đọc các bài báo khác – một hành vi thiếu thành thật tri thức).
Nhưng rất tiếc các trích dẫn và cách tham khảo tài liệu trong các bài báo y học từ Việt Nam có thể nói là “trăm hoa đua nở”, chẳng theo một thể thức, một hệ thống nào thống nhất cả, hết sức tùy tiện. Một số tài liệu trích dẫn mà tôi có khả năng chuyên môn để có thể khẳng định là chẳng phù hợp với phát biểu của tác giả!
Trung bình, mỗi bài báo y học từ Việt Nam có khoảng 9 tài liệu tham khảo (ở phía Bắc) đến 17 ở phía Nam. Không rõ tại sao lại có sự khác biệt khá lớn về con số tài liệu tham khảo giữa hai miền như thế, nhưng thói quen và “văn hóa” trích dẫn có lẽ là một yếu tố quan trọng.
Điều đáng nói là một phần lớn các tài liệu tham khảo không phải là các bài báo khoa học nguyên thủy (original article) mà chỉ là những bài báo trong các kỉ yếu hội nghị, hay thậm chí tờ bướm quảng cáo của các công ti dược, hay có khi là một bài báo trên các báo đại chúng như Tuổi trẻ!
Ngoài ra, nhiều tài liệu trích dẫn (dù cũng chẳng phải là bài báo khoa học) khá “lạc hậu”, hơn 20 năm, tức khoảng thập niên 1980s. Trong khi đó, một “luật” bất thành văn trong nghiên cứu y học là nên sử dụng và trích dẫn những nghiên cứu mới công bố trong vòng 5-10 năm.
Vấn đề tác giả. Đứng tên tác giả một bài báo khoa học đồng nghĩa với viẹc chịu trách nhiệm về những gì mình viết và phát biểu. Năm 1985, Ủy ban tổng biên tập các tập san y học (International Committee of Medical Journal Editors – ICMJE, còn gọi là Vancouver Group) đề ra 3 tiêu chuẩn cho một tác giả bài báo khoa học. Năm 2000, 3 tiêu chuẩn này được hiệu đính lại, và được giới khoa học quốc tế công nhận là những tiêu chuẩn vàng để qui quyền tác giả. Theo định nghĩa của ICMJE, một thành viên nghiên cứu có tư cách đứng tên tác giả phải hội đủ tất cả 3 tiêu chuẩn sau đây: (a) Một là đã có đóng góp quan trọng trong việc hình thành ý tưởng và phương pháp nghiên cứu, hay thu thập dữ kiện, hay phân tích và diễn dịch dữ kiện; (b) hai là đã soạn thảo bài báo hay kiểm tra nội dung tri thức của bài báo một cách nghiêm túc; và (c) ba là phê chuẩn bản thảo sau cùng để gửi cho tập san.
Tính trung bình mỗi bài báo y khoa ở Việt Nam chỉ có 2 tác giả (cao nhất là 4 tác giả). Không có sự khác biệt giữa phía Nam và Bắc về số lượng tác giả bài báo y khoa. Con số này tương đối thấp so với các bài báo y khoa ở ngoại quốc, với trung bình 6 tác giả trên một bài báo.
Tuy nhiên, có dấu hiệu cho thấy vấn đề tác giả bài báo y khoa ở Việt Nam còn khá tùy tiện. Chẳng hạn như có bài báo mà tác giả chỉ đề tên họ một tác giả và kèm theo dòng chữ “và cộng sự”! Đây là một việc làm (hay thói quen) không thể chấp nhận trong hoạt động khoa học.
Vài đề nghị cải thiện tình hình
Sai sót và nhầm lẫn trong nghiên cứu y khoa không phải chỉ xảy ra ở nước ta, mà còn khá phổ biến ngay cả tại các nước đã phát triển. Theo một thống kê gần đây, gần 40% các bài báo trong các tập san y học quốc tế có ít nhất là một sai sót. Tuy nhiên, đại đa số những sai sót này là nhỏ, không ảnh hưởng đến kết luận của bài báo. Còn những sai sót mà tôi chỉ ra trong bài viết này là những sai sót nghiêm trọng, có ảnh hưởng trực tiếp đến kết luận của công trình nghiên cứu. Tôi có thể nói rằng tất cả nhửng bài báo mà tôi đọc qua, nếu gửi cho các tập san y học quốc tế, chắc chắn sẽ không qua khỏi vòng đầu bình duyệt, chứ chưa nói đến việc có được chấp nhận công bố hay không.
Nhưng tình hình và điều kiện y tế ở nước ta đặt ra rất nhiều vấn đề thú vị, và y học Việt Nam hoàn toàn có thể đóng góp làm phong phú tri thức y học thế giới. Để có mặt trên trường quốc tế, chúng ta cần phải tự mình khắc phục những vấn đề mà tôi vừa nêu. Tôi đề nghị một vài biện pháp cụ thể sau đây:
Huấn luyện về nghiên cứu khoa học. Phần lớn những vấn đề tôi nêu trong phần trên có nguồn gốc từ vấn đề đào tạo. Các sinh viên y khoa sau đại học chưa được huấn luyện về nghiên cứu khoa học, cho nên khi bắt tay vào nghiên cứu, họ không ý thức được những sai lầm, những cạm bẫy trong nghiên cứu khoa học, và việc phạm phải sai lầm, thiếu sót là hoàn toàn có thể hiểu được. Nhìn qua cách diễn đạt các kết quả nghiên cứu, có thể nói rằng đại đa số tác giả chưa am hiểu các ý nghĩa khoa học đằng sau những phương pháp mà họ áp dụng.
Do đó, đối với các nghiên cứu sinh, trước khi tiến hành nghiên cứu cần phải trải qua một khóa huấn luyện để nắm vững các nguyên lí, triết lí và phương pháp khoa học. Ngoài ra, cần phải tổ chức các khóa học bồi dưỡng (continuing education) về phương pháp khoa học cho các chuyên gia lâm sàng tham gia vào nghiên cứu khoa học.
Huấn luyện về thống kê sinh học. Phân tích thống kê là một khâu quan trọng không thể thiếu được trong các công trình nghiên cứu khoa học, nhất là khoa học thực nghiệm như nghiên cứu y khoa. Một công trình nghiên cứu y khoa, cho dù có tốn kém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ có cơ hội được xuất hiện trong các tập san khoa học. Các tạp san y học có uy tín càng cao yêu cầu về phân tích thống kê càng nặng. Không có phần phân tích thống kê, bài báo không thể xem là một “bài báo khoa học”. Không có phân tích thống kê, công trình nghiên cứu chưa được xem là hoàn tất.
Ở nước ta khoa học thống kê, nhất là thống kê sinh học, còn rất kém. Có thể nói không ngoa rằng sự “lạc hậu” về khoa học thống kê ở nước ta đã làm ảnh hưởng không nhỏ đến y học nước nhà. Vì nghiên cứu y học ở nước ta chưa được sự hỗ trợ từ khoa học thống kê, cho nên rất nhiều nghiên cứu y học ở nước ta chưa có chất lượng cao, và chưa thể công bố trên các tập san khoa học quốc tế. Người viết bài này biết rất nhiều trường hợp nhiều nghiên cứu từ Việt Nam chỉ vì không được thiết kế đúng phương pháp, hay việc phân tích dữ liệu chưa đúng tiêu chuẩn khoa học nên bị các tập san khoa học từ chối công bố.
Trong khi bất cứ đại học nào ở các nước tiên tiến đều có một bộ môn thống kê học, một bộ môn chuyên cung cấp tư vấn về thống kê học cho các nhà khoa học thực nghiệm, thì ở nước ta, các bộ môn khoa học vẫn còn giới hạn ở khoa toán, và chỉ xoay quanh một vài vấn đề căn bản thống kê. Do đó, một chiến lược quan trọng cần đặt ra là phát triển khoa học thống kê trong các trường đại học, nhất là thống kê sinh học.
Ủy ban y đức. Hiện nay, y đức là một vấn đề đáng quan tâm ở Việt Nam và trên thế giới. Trong nghiên cứu y khoa, nhà nghiên cứu có nghĩa vụ phải tuân hành theo một số qui định nghiêm ngặt để bảo đảm an toàn cho bệnh nhân và bảo mật thông tin cá nhân của bệnh nhân. Vi phạm những qui định này chẳng những được xem là thiếu y đức, mà còn là một gian lận (fraud) trong khoa học. Ở Mĩ đã có khá nhiều trung tâm nghiên cứu y học bị đóng cửa và nhiều nhà nghiên cứu bị tòa án phạt (thậm chí đi tù) chỉ vì vi phạm y đức trong nghiên cứu.
Tại các bệnh viện và đại học cần có một ủy ban y đức để xét duyệt các tiêu chuẩn y đức của một công trình nghiên cứu. Ủy ban này cần có sự đại diện của giới nghiên cứu khoa học, kể cả bác sĩ, luật, tôn giáo, và giới quản lí y tế. Bảy tiêu chuẩn y đức ủy ban cần xem xét là: giá trị xã hội và giá trị khoa học của công trình nghiên cứu; công trình nghiên cứu phải phù hợp với các chuẩn mực khoa học; tuyển chọn đối tượng nghiên cứu phải công bằng (nếu có thể, không nên thiên vị giới tính, hay độ tuổi, hay tôn giáo, hay dân tộc); nghiên cứu phải có ích cho bệnh nhân; đã được một hội đồng khoa học độc lập bình duyệt và chấp thuận; bệnh nhân có quyền từ chối tham gia hay ưng thuận; và bệnh nhân đã tham gia vào công trình có quyền rút ra bất cứ lúc nào [3].
Kiện toàn hệ thống bình duyệt. Bình duyệt (peer-review) là một hoạt động rất quan trọng trong nghiên cứu khoa học. Mục đích của việc bình duyệt là thẩm định và kiểm tra các bài báo khoa học trước khi chấp nhận cho công bố trên một tập san khoa học. Hệ thống này còn được ứng dụng trong việc duyệt những đơn xin tài trợ cho nghiên cứu tại các nước Tây phương.
Qua cơ chế này mà tập san có thể ngăn chận những cặn bã, rác rưởi khoa học, và giúp cho tập san hay các cơ quan cung cấp tài trợ đi đến một quyết định công bằng. Trên nguyên tắc, đây là một cơ chế hay và công bằng, bởi vì những người duyệt bài hay công trình nghiên cứu là những người có cùng chuyên môn, họ chính là những người có thẩm quyền và khả năng đánh giá chất lượng của công trình nghiên cứu. Nhưng nhà khoa học cũng chỉ là những người có tình cảm và thiên kiến, cũng là những người chịu sự chi phối của các nhu cầu tất yếu, cũng cạnh tranh, cho nên kết quả duyệt bài khoa học không phải lúc nào cũng hoàn toàn khách quan. Rất nhiều người từng trải qua cái cơ chế này cho rằng đó là một hệ thống không hoàn chỉnh và có khi thiếu công bằng. Tuy nhằm mục đích ngăn chận rác rưởi khoa học, nhưng cơ chế kiểm duyệt bài vở không thể (hay ít khi nào) phát hiện những lỗi lầm mang tính cố ý lường gạt (như giả tạo số liệu chẳng hạn), bởi vì chức năng của cơ chế này không làm việc đó. Nhưng vấn đề thực tế là ngoài cơ chế bình duyệt đó, chưa có cơ chế nào tốt hơn!
Sai sót trong các bài báo khoa học là một dấu hiệu cho thấy hệ thống bình duyệt trong các tạp chí y học ở trong nước hoặc là không có, hoặc là có nhưng hoạt động chưa hữu hiệu, hoặc chất lượng thẩm định có vấn đề. Nhưng vấn đề sai sót có thể xảy ra sớm hơn, ngay từ lúc công trình nghiên cứu mới bắt đầu hay trong lúc xin tài trợ. Do đó, bình duyệt một công trình nghiên cứu phải bắt đầu ngay từ lúc nhà nghiên cứu trình đề án, chứ không phải chờ đến khi báo cáo đã viết xong.
Tiếng Anh – huy động Việt kiều và đồng nghiệp ở nước ngoài. Những sai sót về tiếng Anh mà tôi nêu trong phần trên không phải là một vấn đề đặc thù ở nước ta, nhưng cũng hiện diện trong các báo cáo khoa học ở các nước như Thái Lan, Mã Lai, thậm chí Nhật Bản và Singapore. Nhưng khác ta, tần số sai sót ở các nước này không quá cao như thấy trong các bài báo y học ở nước ta. Nguyên nhân chính là tiếng Anh của các nhà khoa học trong nước còn nhiều hạn chế. Điều này cũng có thể hiểu được vì hơn một thế hệ nhà khoa học ở nước ta thạo tiếng Nga hơn là tiếng Anh trong thập niên 1960s và 1970s. Tôi từng biết khá nhiều trường hợp các đồng nghiệp trong nước có nghiên cứu, thảo xong một bài báo và gửi cho tập san khoa học, nhưng bị trả lại vì chất lượng tiếng Anh chưa đạt tiêu chuẩn.
Cần phải được xem tiếng Anh là một ngoại ngữ chính cho các hoạt động khoa học ở nước ta. Vì thế, các nghiên cứu sinh và nhà nghiên cứu cần phải được huấn luyện về tiếng Anh, cách soạn thảo một bài báo khoa học bằng tiếng Anh.
Ngoài ra, hiện nay có một đội ngũ nhà khoa học gốc Việt Nam khá hùng hậu đang làm việc tại các nước nói tiếng Anh hay sử dụng tiếng Anh trong khoa học như Mĩ, Anh, Úc, Canada, Pháp, Đức, Nhật, v.v… Có thể huy động các đồng nghiệp này trong việc giúp đỡ vấn đề tiếng Anh cho các bài báo khoa học ở trong nước.
Mở rộng và đầu tư vào công nghệ thông tin và internet. Đa số các tập san y học quốc tế hiện đang nhanh chóng chuyển sang xuất bản trực tuyến, và trong vòng 10 năm tới, tất cả các tập san y học ở các nước phát triển sẽ chuyển sang hình thức trực tuyến. Ngay cả hiện nay, rất nhiều thư viện đại học ở các nước Tây phương chỉ đặt mua (hay nói đúng hơn là truy nhập) các tạp chí y học qua mạng.
Như đề cập trong phần trên, các nhà nghiên cứu trong nước chưa được cập nhật hóa với các tài liệu y học quốc tế, mà một trong những nguyên nhân chính là truy nhập internet còn quá hạn chế, quá chậm. Vì thế, một trong những nhu cầu cơ sở vật chất cho nghiên cứu y học là phải tạo điều kiện cho các nhà nghiên cứu truy nhập internet để có thể truy cập các tài liệu nghiên cứu y học mới nhất, giúp cho việc phát triển ý tưởng và học hỏi phương pháp trong nghiên cứu.
***
Nghiên cứu y học là một lĩnh vực hoạt động then chốt của y khoa, vì chính nghiên cứu y học nâng cấp y khoa từ một nghề mang tính nghệ thuật thành một nghề mang tính khoa học. Có thể nói không ngoa rằng y học hiện đại không thể xem là là một khoa học nếu không có nghiên cứu khoa học. Nghiên cứu y học nhằm mục đích tối thượng là đem lại lợi ích sức khỏe cho cộng đồng, và nâng cao chất lượng chăm sóc bệnh nhân. Các báo cáo nghiên cứu là một hình thức hệ thống hóa tri thức y học. Sai sót trong nghiên cứu do đó có thể dẫn đến sai sót về tri thức, và ảnh hưởng đến chất lượng chăm sóc bệnh nhân.
Sai sót thường mang tính “truyền nhiễm”. Sai sót này dẫn đến sai sót khác, và cứ thế tiếp tục. Nhiều sai sót dẫn đến một tình trạng có thể làm tổn hại đến uy tín khoa học nước nhà và uy tín quốc gia. Một trong những giải thích mà tôi thường gặp khi tác giả nhận thức rằng họ đã phạm sai lầm là “Phương pháp chúng tôi sử dụng đã từng được áp dụng trước đây trên tạp chí … do tác giả nổi tiếng … làm.” Nhưng thiết tưởng đó là một lối … ngụy biện. Không có gì bảo đảm rằng một công trình nghiên cứu đã được công bố là chuẩn mực mà người đi sau phải làm theo, vì như đã đề cập trong phần trên, có thể bài báo có sai sót nhưng cơ chế bình duyệt của tạp chí không phát hiện được. Đã có khá nhiều nghiên cứu sai, mà trong đó tác giả ngụy tạo số liệu, sửa đổi số liệu (như trên tờ British Medical Journal gần đây) [4] mà vẫn “thoát khỏi” các vòng bình duyệt của tạp chí. Do đó, không nên biện minh bằng cách theo người khác, bất kể người đó nổi tiếng cỡ nào, là bảo kê cho nghiên cứu của mình. Cũng không nên nói “họ sai thì ta cũng có quyền sai” vì đó cũng là một loại ngụy biện không thể chấp nhận được trong khoa học.
Những bài báo y học còn là một phần, có khi là phần chính, của một luận án thạc sĩ và tiến sĩ. Do đó, sai sót trong các bài báo này có thể có ảnh hưởng đến chất lượng luận án nói riêng, và nền học thuật ở nước ta nói chung. Như trình bày trong phần trước, đại đa số các nghiên cứu y học ở nước ta còn quá nhiều sai sót và không tuân thủ theo các chuẩn mực quốc tế, và nếu những sai sót này còn tiếp tục thì chúng ta chỉ tự mình cô lập với trường khoa học quốc tế [5].
Nêu ra những sai sót trong các nghiên cứu y khoa ở Việt Nam là một việc làm chẳng có gì thú vị, nhưng cần thiết. Các tập san y học hàng đầu quốc tế như New England Journal of Medicine, JAMA, BMJ, Annals of Internal Medicine, Nature, Science, v.v… đều thường xuyên kiểm tra các sai sót trong các bài báo đã công bố. Có lẽ có người sẽ thắc mắc tại sao tôi không nêu cụ thể các bài báo khoa học có sai sót, nhưng tôi cho rằng việc làm đó không có ý nghĩa gì. Dù biết rằng sai sót trong nghiên cứu khoa học trước hết là sai sót của nhà nghiên cứu, và nhà nghiên cứu phải chịu một phần trách nhiệm, nhưng nguồn gốc của sai lầm quan trọng nhất không phải là cá nhân mà là hệ thống: hệ thống đào tạo, hệ thống bình duyệt. Nêu lên những sai sót không phải là nhằm mục đích đổ thừa cho bất cứ ai, hay để tự đề cao mình, mà là để sửa sai trong tương lai.
Khoa học là một qui trình đi tìm sự thật. Khoa học không phải là một tập hợp những “chân lí” tuyệt đối không thể bác bỏ. Sự thật hôm nay chỉ đơn thuần là một hiểu biết cho hôm nay; ngày mai có thể khác. Khoa học là một ngành nghề tự sửa sai, tự cải tiến theo thời gian. Và bất luận một hiểu biết dù có tính logic cỡ nào đi nữa, sự hiểu biết đó chỉ tồn tại cho đến khi một nghiên cứu mới chứng minh nó sai. Nhưng khi tri thức khoa học tích lũy dần dần, khả năng nhầm lẫn sẽ giảm thiểu theo.
Nhân vô thập toàn. Không có nhà khoa học nào dám nói mình hoàn hảo hay công trình nghiên cứu của mình không có sai sót. Vấn đề không phải là tránh sai sót, mà phải biết sai sót để tránh phạm phải trong tương lai. Cũng như khoa học không mấy quan tâm đến nhầm lẫn (những nhầm lẫn trong nghiên cứu đơn giản là những viên đá lót đường để các nhà khoa học tìm đến sự thật), thì những sai sót và thiếu sót được nêu trong bài viết này hi vọng sẽ là những bài học để hoạt động nghiên cứu y học ở nước ta cải tiến tốt hơn nữa trong tương lai.
Chú thích:
[1] Phạm Duy Hiển. Nghiên cứu khoa học tầm quốc tế ở các viện và trường đại học Việt Nam. Tạp chí Hoạt động Khoa học, số tháng 4, 2006.
[2] Large A. The foreign language barrier. Deutsch, London: 1983.
[3] Ezekiel JE, et al. What makes clinical research ethical? JAMA 2000; 283:2701-11.
[4] Gần đây, tập san y học danh tiếng British Medical Journal (BMJ) dính dáng vào một vụ tai tiếng về gian lận trong nghiên cứu. Năm 1992, BMJ công bố một công trình nghiên cứu của bác sĩ B. Singh (Ấn Độ) về ảnh hưởng tích cực của chế độ ăn uống ít chất béo đến các bệnh tim mạch (. Nhưng trong khi bình duyệt bài báo, các chuyên gia đã nghi ngờ rằng bác sĩ Singh đã giả tạo số liệu, bởi vì các số liệu trong bài báo có xu hướng quá hoàn hảo, quá tuyệt vời, quá lí tưởng. BMJ yêu cầu Singh gửi số liệu gốc (raw data) để một giáo sư thống kê thẩm định. Giáo sư S. Evans bỏ ra ba tháng để phân tích và xem xét lại số liệu của bác sĩ Singh và ông đi đến kết luận rằng Singh đã giả tạo số liệu (Al-Marzouki S, Evens S, Marshall T, Roberts I. Are these data real? Statistical methods for the detection of data fabrication in clinical trials. BMJ 2005;331:267-270.) Ban biên tập BMJ quyết định rút lại bài báo của Singh và công bố toàn bộ sự việc trong một số về vấn đề này vào năm 2005 (Smith R. Investigating the previous studies of a fraudulent author. BMJ 2005;331:288-291; White C. Suspected research fraud: difficulties of getting at the truth. BMJ 2005;331:281-288).
Leave a Comment