27 tháng 9, 2010

STUDY DESIGN

THIẾT KẾ NGHIÊN CỨU (STUDY DESIGN)
(Post lại bài của Gs. Nguyễn Văn Tuấn, đăng trên Ykhoa.net)

Nghiên cứu y học rất đa dạng về hình thức, đối tượng, phương pháp và phương án (cách thiết kế nghiên cứu). Người ta phải dùng nhiều thuật ngữ khoa học để phân biệt các nghiên cứu này, và qua đó mà người đọc có thể thẩm định giá trị khoa học của chúng. Có thể phân biệt các hình dạng nghiên cứu này dựa vào hai tiêu chí: thời gianđặc tính. Về thời gian, có thể phân biệt các nghiên cứu theo 3 phương án như sau:
  cross-sectional study là những nghiên cứu thu thập dữ liệu tại một thời điểm. Tôi tạm dịch là "nghiên cứu tiêu biểu một thời điểm" (thay vì cách dịch "nghiên cứu cắt ngang" như đồng nghiệp trong nước hay sử dụng);
  prospective study là những nghiên cứu có định hướng theo dõi tình trạng sức khỏe của đối tượng trong một thời gian. Nói cách khác, dữ liệu cho từng đối tượng được thu thập nhiều lần (hiện tại và tương lai). Vì thời gian tính, những nghiên cứu này có khi còn được gọi là longitudinal study, và vì thế tôi tạm dịch là "nghiên cứu theo thời gian" (thay vì cụm từ "tiền cứu" như đồng nghiệp trong nước hiện sử dụng);
  case-control study (tạm dịch "nghiên cứu đối chứng”) là những nghiên cứu được tiến hành hiện tại, mà trong đó nhà nghiên cứu đã có thông tin về bệnh trạng của đối tượng, nhưng muốn tìm hiểu các yếu tố nguy cơ trong quá khứ (past) của đối tượng. Vì định hướng tìm về quá khứ nên những nghiên cứu này còn được gọi là retrospective study (mà có người dịch là "hồi cứu").
Nếu phân biệt theo đặc tính tự nhiên, có thể chia thành hai nhóm:
  nghiên cứu can thiệp (interventional hay experimental study) là những nghiên cứu mà đối tượng được can thiệp. Cụm từ “can thiệp” ở đây phải được hiểu là sau khi đã tuyển được đối tượng vào nghiên cứu, họ sẽ được điều trị hay can thiệp trong tương lai. Can thiệp ở đây không có nghĩa là khi bệnh nhân đã được điều trị trong quá khứ và nhà nghiên cứu thu thập dữ liệu tại một thời điểm hiện tại. Các nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled clinical trial hay RCT) được xếp vào nhóm nghiên cứu can thiệp. Vì phải theo dõi đối tượng theo thời gian, nên các nghiên cứu RCT cũng chính là các nghiên cứu prospective (theo thời gian).
  nghiên cứu quan sát (observational study). Ngược lại, tất cả các nghiên cứu không can thiệp đều được xếp chung trong nhóm nghiên cứu quan sát. Các nghiên cứu quan sát có thể là prospectiveretrospective (xem biểu đồ dưới đây).
Phân biệt loại hình nghiên cứu theo thời gian
Phân biệt loại hình nghiên cứu theo đặc tính
Phương án cho từng loại nghiên cứu
Nghiên cứu tại một thời điểm hay cross-sectional study (được dịch theo nghĩa đen là "nghiên cứu cắt ngang"). Đây là một thiết kế mà các nhà nghiên cứu chọn một quần thể một cách ngẫu nhiên nhưng tiêu biểu cho một cộng đồng, tại một thời điểm nào đó. Nói cách khác, nhà nghiên cứu thu thập dữ liệu chỉ một lần duy nhất của các đối tượng ngay tại thời điểm đó (hiện tại). Mục đích chính của các nghiên cứu này là tìm hiểu tỉ lệ hiện hành (prevalence) của một bệnh nào đó, hay tìm hiểu mối tương quan giữa một yếu tố nguy cơ và một bệnh. Chẳng hạn như nếu chúng ta muốn tìm hiểu có bao nhiêu người trong độ tuổi 50 trở lên bị gãy xương ở dân số sống trong nông thôn và thành phố, chúng ta có thể tiến hành như sau:
  bước thứ nhất: chọn một thành phố và một vùng nông thôn (với các tiêu chuẩn phù hợp cho định nghĩa thế nào là thành phố và thế nào là nông thôn), tìm hiểu xem có bao nhiêu quận và huyện;
  bước thứ hai: lập danh sách đối tượng nghiên cứu, gồm những đàn ông và phụ nữ trên 50 tuổi;
  bước thứ ba: sử dụng máy tính soạn một chương trình chọn (chẳng hạn như) 5% tổng số đối tượng đó một cách ngẫu nhiên;
  bước thứ tư: thu thập dữ kiện các đối tượng được chọn tại một thời điểm. Vì nhà nghiên cứu không thể có thì giờ để thu thập dữ liệu của tất cả đối tượng tại một thời điểm cố định, nên các đối tượng được thu thập vào các thời điểm khác nhau. Nhưng dữ liệu chỉ được thu thập một lần duy nhất.
  bước thứ năm: xác định xem có bao nhiêu người bị gãy xương trong đời (bất kể gãy xương ở độ tuổi nào), và phân tích mối liên hệ giữa các yếu tố lâm sàng và nguy cơ gãy xương.
Nghiên cứu đối chứng hay case-control study. Trong các nghiên cứu này, mục đích chính là tìm hiểu mối liên hệ giữa một (hay nhiều) yếu tố nguy cơ (risk factors) và một bệnh rất cụ thể. Để tiến hành nghiên cứu này, nhà nghiên cúu bắt đầu bằng một nhóm bệnh nhân và một nhóm đối tượng không bệnh (đối chứng), và "đi ngược thời gian” tìm hiểu những yếu tố nguy cơ mà cả hai nhóm phơi nhiễm trong quá khứ. Có thể minh họa công trình nghiên cứu tìm hiểu mối liên hệ giữa việc sử dụng liệu pháp thay thế hormone (hormone replacement therapy hay HRT) và gãy xương (fracture) như sau:
  bước thứ nhất: chọn một nhóm bệnh nhân đã bị gãy xương (còn gọi là cases) mà nhà nghiên cứu muốn tìm hiểu;
  bước thứ hai: chọn nhóm đối chứng (gọi là controls) không bị gãy xương, nhưng mỗi người trong nhóm này phải có cùng độ tuổi, cùng giới tính, và các yếu tố lâm sàng khác với nhóm đối tượng;
  bước thứ ba: xem xét trong mỗi nhóm bệnh nhân và nhóm đối chứng có bao nhiêu người sử dụng HRT và bao nhiêu người không sử dụng HRT;
  bước thứ tư: phân tích mối liên hệ giữa yếu tố nguy cơ (trong trường hợp này là sử dụng HRT) và nguy cơ gãy xương.
Nghiên cứu theo thời gian (longitudinal study hay prospective study). Ngược lại với nghiên cứu đối chứng (trường hợp nhà nghiên cứu biết ai mắc bệnh và ai không mắc bệnh), với các nghiên cứu theo thời gian nhà nghiên cứu bắt đầu bằng một nhóm không mắc bệnh, và theo dõi một thời gian sau để quan sát ai mắc bệnh hay không mắc bệnh trong thời gian đó. Ngược lại với nghiên cứu đối chứng (trường hợp nhà nghiên cứu đi ngược về quá khứ để tìm hiểu ai bị phơi nhiễm yếu tố nguy cơ), với các nghiên cứu theo thời gian, nhà nghiên cứu biết ngay từ lúc ban đầu ai bị phơi nhiễm hay không phơi nhiễm yếu tố nguy cơ.
Mục đích của các nghiên cứu theo thời gian thường là ước tính tỉ lệ phát sinh (incidence) bệnh trong một thời gian (điều này khác với mục đích của nghiên cứu tại một thời điểm là ước tính tỉ lệ hiện hành – tức prevalence – của bệnh). Ngoài ra, các nghiên cứu theo thời gian còn cho phép nhà nghiên cứu tìm hiểu mối liên hệ giữa một hay nhiều yếu tố nguy cơ và nguy cơ phát sinh bệnh tật. Khác với nghiên cứu cross-section chỉ ghi nhận sự kiện tại một thời điểm, các nghiên cứu longitudinal phải theo dõi đối tượng trong một thời gian có thể là nhiều năm tháng. Do đó, các nghiên cứu theo thời gian thường tốn kém hơn và công phu hơn các nghiên cứu tại một thời điểm.
Chẳng hạn như nhà nghiên cứu muốn tìm hiểu mối liên hệ giữa tỉ trọng cơ thể (body mass index – BMI) và nguy cơ tử viong, nhà nghiên cứu có thể tiến hành nghiên cứu theo qui trình sau đây:
  bước thứ nhất: chọn một quần thể tiêu biểu gồm n người một cách ngẫu nhiên tại một địa phương (hay nhiều địa phương);
  bước thứ hai: thu thập dữ liệu về chiều cao và cân nặng (để tính BMI) và các yếu tố nguy cơ khác ngay từ thời điểm t0 khi các đối tượng tham gia vào công trình nghiên cứu;
  bước thứ ba: theo dõi quần thể trong một thời gian T và trong thời gian này, nhà nghiên cứu ghi nhận bao nhiêu người tử vong hay sống sót trong nhóm n đối tượng;
  bước thứ tư: phân tích mối liên hệ giữa BMI tại thời điểm t0 và tỉ lệ tử vong trong thời gian T.
Nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled clinical trial - RCT). Các nghiên cứu vừa nêu trên (nghiên cứu tại một thời điểm, nghiên cứu theo thời gian, và nghiên cứu đối chứng) là những nghiên cứu quan sát (observational study), vì nhà nghiên cứu không can thiệp vào đối tượng. Ngược lại với các nghiên cứu quan sát, thử nghiệm RCT là những nghiên cứu nhằm thử nghiệm mức độ ảnh hưởng, mức độ hiệu nghiệm của một sự can thiệp (intervention). Có khá nhiều cách thiết kế nghiên cứu RCT, nhưng tôi chỉ nói đến một dạng nghiên cứu thông thường nhất: đó là nghiên cứu gồm hai nhóm bệnh nhân (còn gọi là parallel design). Để minh họa cho khái niệm RCT, tôi sẽ lấy ví dụ của công trình nghiên cứu Women’s Health Initiatives làm ví dụ. Trong công trình nghiên cứu này, các nhà nghiên cứu muốn thử nghiệm xem mức độ hiệu nghiệm của calcium và vitamin D trong việc phòng chống gãy xương ở các phụ nữ sau thời mãn kinh như thế nào. Họ tiến hành những bước sau đây:
  bước thứ nhất: chọn một quần thể gồm 36.282 phụ nữ sau thời mãn kinh (tuổi từ 50 đến 79), thu thập tất cả các dữ liệu lâm sàng liên quan;
  bước thứ hai: dùng máy tính để phân chia quần thể đó thành hai nhóm một cách ngẫu nhiên: nhóm 1 gồm có 18.176 phụ nữ được điều trị bằng calcium và vitamin D hàng ngày (nhóm can thiệp); nhóm 2 gồm 18.106 phụ nữ cùng độ tuổi nhưng không được bổ sung calcium hay vitamin D (còn gọi là nhóm đối chứng hay placebo);
  bước thứ ba: theo dõi hai nhóm can thiệp và đối chưng trong thời gian 10 năm (tính trung bình là 7 năm, vì một số qua đời, một số mất liên lạc, và một số không muốn tiếp tục tham gia công trình nghiên cứu). Trong thời gian này, các nhà nghiên cứu tiếp tục thu thập dữ liệu lâm sàng và đo lương sinh hóa để theo dõi tình trạng của bệnh nhân, cũng như ghi nhận số phụ nữ bị gãy xương;
  bước thứ tư: sau khi hết thời hạn theo dõi, các nhà nghiên cứu lên kế hoạch phân tích dữ liệu xem xét hiệu quả của vitamin D và calcium đến việc giảm nguy cơ gãy xương.
Như trình bày trên, nghiên cứu lâm sàng đối chứng ngẫu nhiên chính là một nghiên cứu theo thời gian, tức là cũng theo dõi đối tượng trong một thời gian để ghi nhận biến cố mà nhà nghiên cứu quan tâm (như gãy xương hay tử vong chẳng hạn).
Những hiểu lầm
Sau khi điểm qua các thể loại nghiên cứu trên, chúng ta thử đọc qua bốn trường hợp trong Tập san Y học TPHCM như sau (chỉ là những trường hợp được chọn ngẫu nhiên trong một số báo):
Trường hợp 1. Tác giả điều trị bằng phẫu thuật nội soi cho 172 bệnh nhân với sỏi đường mật trong thời gian từ tháng 1/2001 đến tháng 5/2005. Số liệu từ các bệnh nhân được thu thập tại một thời điểm. Nghiên cứu không có nhóm đối chứng (control). Trong phần tóm lược, tác giả mô tả như sau: “Đối tượng và phương pháp nghiên cứu: Nghiên cứu tiền cứu những bệnh nhân mở ống mật chủ điều trị sỏi đường mật chính qua phẫu thuật …" và phần tiếng Anh: "Patients and Methods: A prospective study included 172 patients undergone laparoscopic CBD exploration for CBD stones treatment was conducted …"
Nhận xét: Đây không phải là một nghiên cứu theo thời gian (prospective study) như tác giả phát biểu, bởi vì dữ liệu của bệnh nhân chỉ được thu thập một lần. Mặc dù nghiên cứu được tiến hành trong thời gian tháng 1/2001 đến tháng 5/2005, nhưng đây không phải là thời gian theo dõi, mà là thời gian tuyển mộ bệnh nhân cho công trình nghiên cứu. Vì thế, thuật ngữ chính xác nhất để mô tả nghiên cứu này là "cross-sectional stuy" hay nghiên cứu tại một thời điểm.
Trường hợp 2. Trong một nghiên cứu về tỉ lệ lưu hành hội chứng chuyển hóa ở bệnh nhân động mạch vành, các tác giả thu thập dữ liệu ở 115 bệnh nhân động mạch vành, và dựa vào các tiêu chuẩn quốc tế để ước tính tỉ lệ bệnh nhân mắc chứng chuyển hóa (metabolic syndrome). Nghiên cứu này không có một nhóm đối chứng và các tác giả chỉ thu thập dữ liệu tại một thời điểm (nhưng không rõ vào năm nào). Trong phần Tóm tắt các tác giả mô tả nghiên cứu của họ như sau: "Phương pháp nghiên cứu: Mô tả, tiền cứu", và thêm phần tiếng Anh: "Methods: A prospective, descriptive study was conducted in 205 patients coronary artery stenosis …"
Nhận xét: Người viết bài này không hiểu (và cũng không đồng ý với cụm từ “tiền cứu”, vì đã nói "tiền" tức là nói đến quá khứ - như “tiền sử” chẳng hạn, trong khi đây không phải là nghiên cứu về quá khứ). Điều chắc chắn là đây không phải là một nghiên cứu "prospective" như tác giả viết, bởi vì tác giả không theo dõi bệnh nhân trong một thời gian. Thuật ngữ thích hợp nhất nhất để mô tả nghiên cứu này là "cross-sectional stuy" hay nghiên cứu tại một thời điểm.
Trường hợp 3. Một nghiên cứu khác đăng trong cùng số tạp chí đo mật độ chất khoáng trong xương (bone mineral density) ở 72 bệnh nhân dùng thuốc corticosteroid trên 3 tháng, để tìm hiểu tỉ lệ loãng xương là bao nhiêu. Nghiên cứu được mô tả bằng tiếng Việt là "Phương pháp: Thiết kế nghiên cứu cắt ngang mô tả", nhưng trong phần tiếng Anh thì phát biểu là "Method: A prospective, cross-sectional study was conducted 72 patients or longer corticosteroid …"
Nhận xét: Ở đây, tác giả tỏ ra mâu thuẫn khi viết là một nghiên cứu dạng "prospective, cross-sectional study", vì như trình bày trong phần trên, một nghiên cứu tại một thời điểm (cross-sectional study) thì không thể nào là một nghiên cứu theo thời gian (prospective study). (Tuy nhiên, trong một nghiên cứu prospective và nếu tác giả phân tích số liệu tại thời điểm lúc ban đầu – baseline – thì phân tích đó gọi là "cross-sectional analysis"). Một lần nữa, thuật ngữ thích hợp nhất nhất để mô tả nghiên cứu này là "cross-sectional stuy" hay nghiên cứu tại một thời điểm.
Trường hợp 4. Các tác giả điều trị bằng giải phẫu trên 46 bệnh nhân ung thư tâm vị trong thời gian từ tháng 1/1999 đến tháng 12/2005, và xem xét các chỉ tiêu an toàn sau khi giải phẫu. Nghiên cứu không có nhóm so sánh hay đối chứng, và số liệu chỉ được thu thập tại một thời điểm. Trong phần mô tả bằng tiếng Việt các tác giả cho biết “Phương pháp nghiên cứu: tiền cứu can thiệp, thống kê mô tả", nhưng trong phần tiếng Anh thì viết là "Patients and Methods: A prospective, cross-sectional study conducted from January 1999 to December 2005 in 46 patients …"
Nhận xét: Cũng giống như trường hợp 1, các tác giả tuyển bệnh nhân trong thời gian từ tháng 1/1999 đến tháng 12/2005, và chỉ xem xét các chỉ tiêu an toàn sau khi giải phẫu tại một thời điểm. Vì thế, đây cũng không phải là một "prospective study" như tác giả viết, mà chỉ đơn giản là một nghiên cứu "cross-sectional" hay nghiên cứu tại một thời điểm.

24 tháng 9, 2010

CÁCH VIẾT MỘT BÀI BÁO KHOA HỌC (Phần 5 - Bàn luận)

CÁCH VIẾT MỘT BÀI BÁO KHOA HỌC (Phần 5 - Bàn luận)
(Post lại bài của Gs.Nguyễn Văn Tuấn)

Phần Bàn luận (Discussion) là phần cuối của nội dung của một bài báo khoa học, và nó có chức năng giống như là một diễn giải kết quả nghiên cứu.  Chúng ta đã biết rằng phần Dẫn nhập trả lời câu hỏi “Tại sao làm nghiên cứu này”; phần Phương pháp trả lời câu hỏi “Đã làm gì và làm ra sao”; phần Kết quả là nhằm trả lời câu hỏi “Đã phát hiện những gì”; và phần Bàn luận tập trung vào trả lời cho được câu hỏi “Những phát hiện đó có ý nghĩa gì”?


Trong bài báo khoa học, phần Bàn luận là phần khó viết nhất.  Các nghiên cứu sinh khi mới bắt đầu viết thường lúng túng không biết bắt đầu như thế nào, mà đọc những bài báo trong y văn thì cũng không nắm được nội dung và cấu trúc ra sao.  Ngay cả nhiều giáo sư có kinh nghiệm cũng có khi cảm thấy khó khăn khi viết phần Bàn luận, vì họ không biết nhấn mạnh vào khía cạnh nào, và viết như thế nào cho thuyết phục.  Một trong những khó khăn lớn nhất là phần Bàn luận không có một cấu trúc cụ thể nào.  Thật vậy, trong khi phần Phương pháp và Kết quả còn có cấu trúc, còn phần Bàn luận thì tác giả có thể viết bất cứ gì mình thích (nhưng người đọc có thích hay không là chuyện khác!)
Tuy không có qui định cấu trúc cụ thể, nhưng chúng ta có thể học từ bài báo hay để đi đến một qui luật.  Kinh nghiệm của tôi cho thấy những bài báo hay thường viết phần bàn luận theo cấu trúc 6 điểm sau đây:
(a) tóm lược giả thuyết, mục tiêu, và phát hiện chính trong đoạn văn đầu tiên;
(b) so sánh những kết quả này với các nghiên cứu trước;
(c) giải thích kết quả bằng cách đề ra mô hình mới hay giả thuyết mới;
(d) khái quát hóa và ý nghĩa của kết quả;
(e) bàn qua những ưu điểm và khuyết điểm của công trình nghiên cứu; và
(f) và sau cùng là một kết luận sao cho người đọc có thể lĩnh hội được một cách dễ dàng.
Trong phần thảo luận, tác giả phải giải thích, hay đề nghị một mô hình giải thích, tại sao những dữ kiện thu thập được có xu hướng đã quan sát trong cuộc nghiên cứu.  Nếu không giải thích được thì nhà nghiên cứu phải thành thật nói y như thế: không biết.  Tác giả còn phải so sánh với kết quả của những nghiên cứu trước và giải thích tại sao chúng (những kết quả) khác nhau, hay tại sao chúng lại giống nhau, và ý nghĩa của chúng là gì.  Ngoài ra, nhà nghiên cứu còn phải có trách nhiệm tự mình vạch ra những thiếu sót, những trắc trở, khó khăn trong cuộc nghiên cứu, cùng những ưu điểm của cuộc nghiên cứu, cũng như đưa ra các giải pháp khắc phục hay những đề xuất hướng nghiên cứu trong tương lai.  Sơ đồ 2 sau đây có thể dùng để làm dàn bài để viết phần thảo luận.
Sơ đồ cho phần thảo luận
Câu hỏi cần phải trả lờiNội dung
Phát hiện chính là gì?Phát biểu những phát hiện chính; đặt những phát hiện này vào bối cảnh của các nghiên cứu trước đây.
Kết quả có nhất quán (consistent) với nghiên cứu trước?Giải thích tại sao không nhất quán.  Có phải do vấn đề địa phương, bệnh nhân, chẩn đoán, đo lường, phân tích, v.v… Phải suy nghĩ và giải thích.
Giải thích tại sao có kết quả như trong nghiên cứu, mối liên hệ đó có phù hợp với giả thuyết?Đây là đoạn văn khó nhất, vì tác giả phải suy nghĩ, vận dụng kiến thức hiện hành, và tìm mô hình để giải thích kết quả nghiên cứu của mình.  Nếu kết quả là một mối tương quan (như gien và bệnh), phải thuyết phục người đọc rằng mối tương quan này không phải ngẫu nhiên, mà có cơ chế sinh học.  Bàn về cơ chế của mối liên hệ một cách thuyết phục bằng cách sử dụng các nghiên cứu trước hay đề ra giả thuyết mới.
Ý nghĩa của kết quả nghiên cứu là gì?Đây là phần “generalization”, khái quát hóa.  Đặt kết quả của nghiên cứu vào bối cảnh lớn hơn, và so sánh với các nghiên cứu trước đây.  Suy luận về cơ chế (nhưng không nên quá lời hay quá xa xỉ trong khi suy luận, mà phải nằm trong khuôn khổ của dữ kiện thật).
Phát hiện đó có khả năng sai lầm không?  Điểm mạnh và khiếm khuyết của nghiên cứu là gì?Xem xét những yếu tố sau đây: thiếu khách quan trong đo lường và thu thập số liệu? Số lượng đối tượng ít? Cách chọn mẫu có vấn đề? Các yếu tố khác chưa xem xét đến? Phân tích chưa đầy đủ?  Chưa điều chỉnh cho các yếu tố phụ? V.v…
Kết luận có phù hợp với dữ kiện hay không?Kết luận phải rõ ràng, nhưng không nên đi ra ngoài khuôn khổ của dữ kiện.  Chẳng hạn như nếu kết quả cho thấy hút thuốc lá làm tăng ung thư phổi, tác giả không nên kết luận rằng ngưng hút thuốc lá sẽ giảm ung thư phổi.

1.  Mở đầu phần bàn luận bằng cách tóm tắt bối cảnh, giả thuyết, mục tiêu và phát hiện chính của nghiên cứu. Đây thực chất là một đoạn văn tóm tắt những ý chính trong phần dẫn nhập và kết quả để một lần nữa nhấn mạnh rằng giả thuyết của tác giả đã được “minh chứng”.  Người đọc cảm thấy dễ theo dõi khi những kết quả chính được tóm lược trong phần mở đầu của bàn luận.  Do đó, tác giả cần phải viết ra kết quả bằng con số (có thể lặp lại ở phần kết quả) để nhấn mạnh.  Chú ý rằng, một bài báo khoa học đôi khi cũng cần “điệp khúc” để nhấn mạnh, nhưng đừng có quá nhiều điệp khúc như nhạc vì sẽ gây phản cảm.
Ví dụ: Đoạn sau đây mở đầu bằng câu văn nói về lí do nghiên cứu, kế đến là câu văn mô tả kết quả chính, và nhấn mạnh đến cái mới của kết quả:  "There has been little doubt that BMD measured at various sites is one of the best measureable determinants of fracture risk [28-30].  BMD is, in turn, regulated by genetic, hormonal, dietary and mechanical factors.  The present study addressed a small part of this complex system by using the classical twin design.  It was found that (i) both lean mass and fat mass were associated with areal BMD; however, fat mass alone appeared to have an independent effect on BMD/height ratios and volumetric BMD; (ii) both lean mass and fat mass as well as BMD were under strong genetic influence and (iii) the association between fat mass (and lean mass) and BMD were mainly mediated through environmental influences."
2.  So sánh kết quả của nghiên cứu với các nghiên cứu trước. Trong đoạn văn này, ngoài so sánh, tác giả còn phải có trách nhiệm phải giải thích tại sao kết quả của nghiên cứu khác (hay không nhất quán) với nghiên cứu trước.  Khi bàn luận về kết quả nghiên cứu trước, nếu cần, tác giả có thể trích dẫn con số cụ thể và giải thích kết quả đó có thật sự nằm trong sự kì vọng chung của vấn đề.  Khi xem xét đến các yếu tố có thể giải thích sự khác biệt giữa các kết quả nghiên cứu, cần chú ý đến những khác biệt về quần thể nghiên cứu (tuổi, giới tính, đặc tính lâm sàng …), điều kiện địa phương, phương pháp đo lường, phương pháp phân tích, v.v… Nếu không thể giải thích tại sao có sự khác biệt, tác giả có thể thành thật nói như thế: không biết! 
Ví dụ: "This study confirms the familial influence on bone density with estimates of heritability for the lumbar spine, femoral neck and total body BMD of 78%, 76% and 79%, respectively, comparable with previous estimates [12-16]. However, the present study also indicates that a common source of genetic and ... ."
3.  Giải thích kết quả và cơ chế của những mối liên hệ phát hiện trong nghiên cứu.  Trong phần này, tác giải phải giải thích những kết quả có thể giải thích bằng kiến thức hiện hành.  Trong đoạn văn này, tác giả có thể trích dẫn các nghiên cứu khác và hệ thống hóa thông tin để giải thích kết quả của nghiên cứu mình.  Tác giả có thể đề ra giả thuyết mới để giải thích.  Chẳng hạn như nếu nghiên cứu phát hiện ảnh hưởng của thuốc bisphosphonates và ung thư vú, thì tác giả phải tìm những thông tin nghiên cứu trước về cơ chế của mối liên hệ.  Có thể nói rằng đây cũng là đoạn văn khó viết nhất, vì phải hệ thống hóa nhiều kiến thức hiện hành mà không đi ra ngoài phạm vi của nghiên cứu.
Ví dụ: Đoạn sau đây tôi trích từ một bài báo mới nhất từ tập san Archives of Internal Medicine về nghiên cứu so sánh tác hại của 2 thuốc rosiglitazone và pioglitazone đến bệnh tim mạch.  Các tác giả giải thích tại sao sao thuốc rosiglitazone gây tác hại cao hơn thuốc pioglitazone.  Thật ra, họ không giải thích được, nhưng họ đề nghị giả thuyết để giải thích: 
“The potential mechanism(s) for cardiovascular (CV) harm from rosiglitazone use (and the differences from pioglitazone use) remains to be elucidated, but there are several reasonable hypotheses. Rosiglitazone therapy increased low-density lipoprotein cholesterol (LDL-C) levels as much as 23% in trials, leading to approval.21 Current FDA guidelines consider a drug that lowers LDL-C levels by at least 15% “approvable” for presumed CV benefits. Although the FDA has not established a level of increase in LDL-C that is presumed to cause harm, a drug that increases LDL-C levels would reasonably be expected to increase CV adverse events. Interestingly, the lipid effects of the 2 marketed thiazolidinediones, pioglitazone and rosiglitazone, are markedly different.”
4.  Khái quát hóa kết quả nghiên cứu và giải thích ý nghĩa của kết quả.  Trong đoạn văn này, tác giả cần phải bàn về khả năng mà những phát hiện của nghiên cứu có thể áp dụng cho một quần thể khác hay không.  Nếu áp dụng cho quần thể khác, thì phải dựa vào giả định (assumptions) nào.  Nếu là nghiên cứu về tiên lượng và chẩn đoán, tác giả có thể bàn về giá trị kinh tế và lâm sàng của phương pháp chẩn đoán.
Ví dụ: Đoạn văn sau đây cố gắng thuyết phục tại sao mối liên hệ giữa vitamin D và TB là quan trọng và có ý nghĩa lâm sàng:  “The finding of high prevalence of vitamin D insufficiency in TB patients has a number of clinical implications.  Vitamin D in the form of cod liver oil and sunlight exposure was once a therapy for tuberculosis prior to the Robert Koch’s discovery of the etiology of this disease.  The association between vitamin D insufficiency and the risk of tuberculosis suggests that supplementation of vitamin D may help prevent and reduce the severity of tuberculosis.  Indeed, a recent randomized controlled trial has shown that the severity of TB at the end of treatment was less for patients with normal vitamin D status at baseline than for those with vitamin D insufficiency, without adverse effects.  However, the vitamin D dose used in the intervention (100,000 IU) is probably too low to warrant a clinical effect.   These results taken together suggest that low vitamin D status in TB patients, whether cause or effect, might be an important determinant of treatment outcome and comorbidities.”
5.  Bàn luận về điểm mạnh và điểm yếu của công trình nghiên cứu.  Trong nghiên cứu khoa học, bên cạnh thành công, lúc nào cũng có hạn chế.  Một trong những lí do mà người bình duyệt và chủ biên tập san từ chối bài báo là do tác giả không chịu bàn luận về những điểm mạnh và hạn chế của công trình nghiên cứu.  Do đó, trong đoạn văn này, tác giải cố gắng suy nghĩ ra những lợi điểm và khuyết điểm của nghiên cứu mình.  Những điểm này (cả mạnh và yếu) có thể là cách thiết kế, quần thể nghiên cứu, bệnh nhân, cách đo lường, phương pháp phần tích, v.v… Chẳng hạn như nếu nghiên cứu làm ở quần thể người Việt, thì “điểm yếu” có thể là kết quả này không thể khái quát hóa cho các quần thể người da trắng.  Cố nhiên, những kết quả không như dự đoán cũng bên được bàn luận đến nơi đến chốn.  Mở đầu đoạn văn này bằng một câu như "The present findings must be interpreted in the context of a number of potential limitations. The data were obtained from a Caucasian population in Sydney, among whom, cultural backgrounds and ... ." Chú ý là tác giả dùng chữ “potential limitations”!
Thỉnh thoảng, tác giả có thể dùng kĩ thuật tranh luận “người rơm” (straw man argument).  Kĩ thuật này có thể nôm nà mô tả như sau: dựng nên một hình nộm bằng rơm, rồi phê bình hình nộm đó để chứng minh rằng nghiên cứu mình không có vấn đề.  Ví dụ: trong đoạn văn sau đây, tác giả đặt ra một vấn đề (mà thật ra không quan trọng) để làm như quan trọng!  “A limitation of this study was that we could not measure vitamin D2 (ergocalciferol) and 1,25D in this study; however, the occurrence of this vitamin D (less than 10% of sera) seems not to be a major problem.”  Đoạn đầu, tác giả dựng nên “hình nộm” 1,25D, rồi ngay sau đó đánh đổ hình nộm đó bằng cách lí giải rằng không có vấn đề gì cả!  Cách bàn luận này chứng tỏ cho người đọc, người bình duyệt thấy rằng tác giả đã suy nghĩ trước mọi tình huống có thể xảy ra, đã xem xét hết những vấn đề có thể ảnh hưởng đến nghiên cứu, nhưng … chẳng có vấn đề nào cả.  Cách viết như thế cũng chứng tỏ tác giả suy nghĩ đến kết quả của mình một cách nghiêm chỉnh, và có tính toán đến cách diễn giải khác.  Chú ý, để có kĩ thuật này, tác giả phải cẩn thận, chứ nếu không thì dễ gây ra phản tác dụng.
6.  Sau cùng là một đoạn văn kết luận, gọi là "big" bottom line.  Đây cũng có thể là đoạn văn khó viết nhất vì nó phải mang tính cô động (chỉ vài mươi từ thôi), mà phải chuyển tải được kết quả và ý nghĩa của nghiên cứu.  Tôi thường hay nói đùa rằng phải viết làm sao mà khi người ta đọc xong đoạn văn này, ban đêm về ngủ nằm để tay lên trán, họ vẫn nhớ đến công trình nghiên cứu của mình!  Tiếng Anh gọi đây là "take home message," tức là thông điệp mà tác giả muốn chuyển tải đến người đọc.
Vì dụ về đoạn văn kết luận: "In conclusion, these data indicate that the clinically relevant association between volumetric BMD and body composition is mediated only through fat mass. Furthermore, lean mass and fat mass, as with .... These data also suggest that modulation of environmental factors could translate to clinically relevant changes in BMD and presumably fracture risk." Chú ý đoạn văn này có 2 câu: câu đầu (“in conclusion”) tóm lược kết quả, và câu hai (“these data suggest”) có nội dung diễn giải kết quả.
Trong đoạn văn quan trọng này, cố tránh cách viết vô duyên (nhưng rất phổ biến trong các tập san y khoa) như "Further research is needed", vì câu văn này chẳng những thừa, mà còn chẳng có ý nghĩa gì.  Đương nhiên là trong khoa học, một nghiên cứu sao khi hoàn tất đều mở ra một cánh cửa mới, một ý tưởng mới, cho nên chắc chắn sẽ có thêm nghiên cứu.  Câu văn như thế còn cho thấy tác giả chưa đầu tư thì giờ suy nghĩ đến nơi đến chốn mình muốn nói điều gì!
Một trong những cách viết cũng có thể làm người đọc “bực mình” là cách viết quá bất định trong phần kết luận, như    "This seems to suggest ..." (chú ý chữ “seem”) vì nó cho thấy tác giả không chắc chắn về ý nghĩa của nghiên cứu mình.  Nếu tác giả không chắc chắn thì tác giả đã làm phí thì giờ người đọc!  Một kết quả có nhiều cách diễn giải, và người đọc muốn biết theo quan điểm của tác giả, cách diễn giả là gì, chứ không phải “seem” (dường như là)!
Cảm tạ (Acknowledgments). Thông thường ngay sau phần bàn luận là phần nhỏ để tác giả viết vài dòng cảm tạ.  Cảm tạ những đồng nghiệp đã giúp đỡ cho công trình nghiên cứu, nhưng họ không đủ tiêu chuẩn để đứng tên tác giả.  Cảm tạ những cơ quan đã tài trợ cho nghiên cứu, hay nhà hảo tâm giúp đỡ tiền bạc cho tác giả trong quá trình làm việc.
Mấy năm gần đây, một số tập san yêu cầu tác giả phải có sự đồng ý của người được cảm tạ.  Sở dĩ có trường hợp này là vì trong quá khứ có tác giả lợi dụng phần này để trưng bày những cái tên lớn trong ngành nhằm tăng giá trị khoa học của bài báo (và một phần nhằm ngầm thuyết phục người bình duyệt rằng “bài báo của chúng tôi có sự ủng hộ của tổ sư”), nhưng các nhân vật được trưng bày không hế biết!
***
Nên nhớ rằng phần bàn luận là nơi thể hiện sự đóng góp tri thức của tác giả vào kho tàng tri thức hiện hành.  Đây là phần mà tác giả có thể đặt ra giả thuyết mới, hoặc mô hình mới, hoặc qui luật mới để giải thích hiện tượng qua kết quả nghiên cứu của mình.  Do đó, nếu phần bàn luận được viết tốt, giá trị bài báo sẽ tăng rất cao.
Riêng những chỉ dẫn trên đây là kinh nghiệm của cá nhân tôi đúc kết sau nhiều năm cọ sát, mà có lẽ các bạn không tìm thấy trong bất cứ sách nào hay bất cứ bài chỉ dẫn nào từ các chuyên gia phương Tây.   Tôi đã làm “thí nghiệm” với nhiều nghiên cứu sinh của tôi và đồng nghiệp của tôi về cấu trúc đó, và tôi có thể hãnh diện nói rằng rất có hiệu quả.  Khi nghiên cứu sinh tuân thủ theo những đoạn văn theo chỉ dẫn trên đây, họ đều được người bình duyệt khen là bài báo “well written”.  Lời khen mới nhất là cách đây 3 tuần!  Do đó, các bạn có thể làm thử bằng cách viết phần thảo luận theo cấu trúc trên và xác suất thành công có thể lên đến 95%, nếu sử tiếng Anh cho tốt.  Trong các bài tiếp theo, tôi sẽ chỉ các bạn cách sử dụng tiếng Anh trong từng phần của bài báo khoa học.
Chú thích:
Sau đây là phần bàn luận của một bài báo mới nhất trên tập san Archives of Internal Medicine mà tôi nghĩ tiêu biểu cho một bàn luận tốt.  Bài này thật ra là một phân tích tổng hợp (meta-analysis) về tác hại của rosiglitazone (một thuốc điều trị tiểu đường) đến các bệnh tim mạch.  Tôi sẽ trích và có vài ghi chú ngắn:
Mớ đầu phần bàn luận tác giả cung cấp bối cảnh của “câu chuyện”, và tóm lược kết quả chính:
The CV safety of rosiglitazone therapy has remained controversial after the publication of initial reports that suggested that the use of rosiglitazone increases the risk for MI and other ischemic myocardial events.1, 14, 20 Despite 11 years on the market, rosiglitazone has not been studied in any definitive randomized controlled CV outcomes trials. Accordingly, a meta-analysis of existing clinical trials represents the most robust available approach to determining the CV safety of this drug. The current study analyzed MI and CV mortality for 56 randomized trials involving 35 531 patients. Using a study-level meta-analysis, the OR for MI was significantly increased but without evidence of an increase in CV or all-cause mortality. An alternative analysis that included trials with no CV events found a similar hazard (Figure 3). Subgroups classified by study duration and comparator drug also showed elevated OR estimates (Figure 2). These findings are consistent with prior meta-analyses conducted by GSK, the FDA, and most independent investigators demonstrating an increased risk of MI in patients treated with rosiglitazone.1, 10, 14, 20 The FDA has announced that it will conduct an advisory committee meeting in July 2010 to consider whether to remove rosiglitazone from the market.
Đoạn dưới đây, tác giả bàn về ý nghĩa của nghiên cứu, như tuyên bố trong câu văn đầu.  Các câu văn kế tiếp nhằm chứng minh cho câu tuyên bố đó:
The public health implications of these results are considerable. There are more than 23 million persons with diabetes in the United States alone and nearly 300 million worldwide.30-31 Cardiovascular disease is the leading cause of death in patients with type 2 diabetes, representing approximately 68% of all causes of mortality.30 The estimated 28% to 39% increase in the risk for MI observed for rosiglitazone use in the current analysis and the NNH of 52 or 37 (with and without the RECORD trial) represent a significant potential health burden. The magnitude of the observed effect is larger than might be anticipated in a safety analysis using intent-to-treat (ITT) methods. In ITT efficacy studies, discontinuation of therapy or crossovers between treatment groups bias the study toward the null hypothesis, thereby favoring the control treatment. However, in safety studies, similar flaws in study conduct bias the investigation toward a relative risk of 1.0, providing the potential for a false declaration of safety. Accordingly, using standardized ITT methods, it is statistically much more difficult to conclude that a therapy is unsafe than to demonstrate efficacy. Because we did not have access to patient-level data, we were unable to perform a useful alternative analysis that is commonly used in drug-safety studies, a "per protocol" approach that includes events that occurred "on-treatment" or within 30 days after discontinuation of treatment.
Đoạn này giải thích tại sao tác giả sử dụng phương pháp phân tích, và chỉ ra rằng dùng phương pháp nào thì kết quả vẫn không khác nhau:
We elected to present analyses with and without the RECORD trial. Several of the concerns about the RECORD trial have been reported elsewhere.5-8 The study was an open-label, randomized noninferiority trial that compared rosiglitazone with metformin or sulfonlyurea. The primary efficacy parameter was unconventional, CV hospitalization or death. The study postulated an annual event rate of 11% but observed an event rate of only 2.6%, a large mismatch that substantially reduced statistical power. The MI rate for the control group in the RECORD trial was 0.52% per year compared with 1.38% for a similar population in the ACCORD trial, raising the concern that MIs may have been incompletely ascertained. By the end of the trial, 40% of patients randomized to rosiglitazone therapy were no longer taking the drug. Nonadherence to randomized therapy represents an important issue in a safety trial because, as noted above, dropouts and crossovers bias the result toward the null hypothesis. Finally, the company compromised data integrity by publishing an unplanned interim analysis32 and appears to have had access to ongoing study data at a time when the trial should have remained blinded.2, 6-7
Đoạn này tác giả bàn về những hạn chế của nghiên cứu:
The limitations of our meta-analysis are notable. We had access to study-level data that were diclosed as a result of a court settlement and subsequently posted on a company Web site. The unavailability of patient-level data precluded a more statistically powerful analysis using time-to-event methods. However, it should be noted that the original 2007 meta-analysis was subsequently replicated by the FDA using time-to-event data, resulting a nearly identical relative risk. There are important strengths to the study. The number of patients and studies included in the analysis is substantially larger than was available for our original meta-analysis, which was completed in 2007. Furthermore, because disclosure of all clinical trials by the maker of rosiglitazone was mandated by a court order, the common problem of publication bias did not confound our analyses. The original 2007 analysis was criticized by some authors because it did not include clinical trials in which there were no events.13 Therefore, in the current effort, we provided an alternative approach that includes all 56 trials, regardless of whether there were adverse events. With both methods, the OR was nearly identical.
A related issue involves the question of whether use of the other marketed thiazolidinedione, pioglitazone, carries similar risks. A large CV outcomes trial with pioglitazone, the PROACTIVE (Prospective Pioglitazone Clinical Trial in Macrovascular Events) trial, which was published in 2005, did not show statistically significant benefits.33 It showed a trend toward reduction in the primary efficacy parameter, a broad composite of CV events (HR, 0.90; 95% CI, 0.80-1.02; P = .10). However, a prespecified secondary end point of death, MI, and stroke showed a benefit (HR, 0.84; 95% CI, 0.72-0.98; P = .03). A patient-level meta-analysis of CV outcomes with pioglitazone analyzed 19 trials, with a total enrollment of 16 390 patients, and showed a statistically significant benefit on the composite of death, MI, and stroke (OR, 0.82; 95% CI, 0.72-0.94; P = .005). These findings effectively rule out a CV hazard for pioglitazone use and suggest the possibility of a CV benefit. However, it must be noted that the use of both rosiglitazone and pioglitazone has been associated with an increased risk of congestive heart failure.
Đoạn này tác giả bàn về cơ chế tại sao rosiglitazone có thể gây tác hại:
The potential mechanism(s) for CV harm from rosiglitazone use (and the differences from pioglitazone use) remains to be elucidated, but there are several reasonable hypotheses. Rosiglitazone therapy increased low-density lipoprotein cholesterol (LDL-C) levels as much as 23% in trials, leading to approval.21 Current FDA guidelines consider a drug that lowers LDL-C levels by at least 15% "approvable" for presumed CV benefits. Although the FDA has not established a level of increase in LDL-C that is presumed to cause harm, a drug that increases LDL-C levels would reasonably be expected to increase CV adverse events. Interestingly, the lipid effects of the 2 marketed thiazolidinediones, pioglitazone and rosiglitazone, are markedly different.34 In a comparative efficacy trial, rosiglitazone therapy produced greater increases in LDL-C levels and raised triglyceride levels, while pioglitazone therapy reduced triglyceride levels. Pioglitazone therapy also produced significantly greater increases in high-density lipoprotein cholesterol compared with rosiglitazone therapy. Thiazolidinediones are nuclear receptor agonists that modulate expression of a large number of genes. There are major differences in the pattern of gene modulation for pioglitazone vs rosiglitazone.35 Rosiglitazone activates a gene associated with production of matrix metalloproteinase 3, an enzyme linked to plaque rupture.36
Và quay lại phần ý nghĩa.  Tôi nghĩ tác giả muốn viết theo cách “điệp khúc”, tức là nhắc lại tầm quan trọng của nghiên cứu:
There are also implications of these findings on the traditional approach used by regulatory authorities to approve drugs that are used to treat diabetes. Historically, evidence of a glucose-lowering effect, with no evidence for obvious safety issues, was sufficient for approval. In the wake of the rosiglitazone controversy, the FDA has mandated that sponsors of all new diabetes drugs perform CV outcomes studies sufficient to rule out an HR with an upper 95% CI of 1.8 before approval and 1.3 after approval.37 Had such requirements been in place at the time rosiglitazone was developed, it seems likely that the drug would never have been approved.
Và đoạn kết luận.  Nhưng tôi thì nghĩ tác giả viết đoạn này dài quá.  Đáng lẽ ngắn hơn. Nhưng văn là người, nên có thể đây là phong cách của tác giả!
The results of the current meta-analysis suggest an unfavorable benefit to risk ratio for rosiglitazone use. The implications of this finding warrant further discussion. Even a modest increase in the risk of MI in a diabetic population would have serious consequences. Reviewers within the FDA Office of Surveillance and Epidemiology calculated the number of major CV events potentially attributable to rosiglitazone therapy from 1999 to 2006, reporting a range from 41 000 to 205 000.2 More recently, using lower estimates of the rate of drug use after the 2007 controversy, FDA reviewers have calculated the number of excess MIs (6000 annually) potentially attributable to rosiglitazone use relative to treatment with the alternative thiazolidinedione, pioglitazone.3 Although hyperglycemia has been associated with an increased risk of microvascular adverse events, there are now 12 classes of drugs that are approved to lower blood glucose levels, including insulin. Because no unique benefits of rosiglitazone use have been identified, administration of this agent solely to lower blood glucose levels is difficult to justify.”
Nguồn: Nissen SE, Wolski K.  Rosiglitazone Revisited. Arch Intern Med. 2010;170(14).

13 tháng 9, 2010

CÁCH VIẾT MỘT BÀI BÁO KHOA HỌC (Phần 4 - Kết quả)

CÁCH VIẾT MỘT BÀI BÁO KHOA HỌC (Phần 4 - Kết quả)
(Post lại bài của Gs. Nguyễn Văn Tuấn)

Tiếp theo phần phương pháp là phần trình bày kết quả nghiên cứu. Một khó khăn mà phần lớn nghiên cứu sinh mắc phải là không biết trình bày kết quả ra sao và như thế nào trong đống rừng dữ liệu thí nghiệm thu thập và phân tích. Vì thế, trong phần này, tôi sẽ chỉ cho các bạn một vài mẹo nhỏ và cách thức viết phần kết quả sao cho thuyết phục và nhất là phải ăn khớp với phần dẫn nhập.
Chỉ dẫn chung

Về nguyên tắc, trong phần kết quả, tác giả phải trả lời cho được câu hỏi “Đã phát hiện những gì?” (Tức là trả lời câu hỏi "What did you find?") Cần phải phân biệt rõ đâu là kết quả chính và đâu là kết quả phụ. Phần kết quả phải có biểu đồ và bảng số liệu, và những dữ liệu này phải được diễn giải một cách ngắn gọn trong văn bản. Những số liệu phải được trình bày để lần lượt trả lời các mục đích nghiên cứu (hay câu hỏi nghiên cứu) mà tác giả đã nêu ra trong phần dẫn nhập.

Phần kết quả phải được viết một cách ngắn gọn và đi thẳng vào vấn đề nêu ra trong phần dẫn nhập. Tất cả các bảng thống kê, biểu đồ, và hình ảnh phải được chú thích rõ ràng; tất cả những kí hiệu phải được đánh vần hay chú giải một cách cụ thể để người đọc có thể hiểu được ý nghĩa của những dữ kiện này. Trong phần kết quả, tác giả chỉ trình bày sự thật và chỉ sự thật (facts), kể cả những sự thật mà nhà nghiên cứu không tiên đoán trước được hay những kết quả “tiêu cực” (ngược lại với điều mình mong đợi). Tác giả không nên bình luận hay diễn dịch những kết quả này cao hay thấp, xấu hay tốt, v.v.. vì những nhận xét này sẽ được đề cập đến trong phần thảo luận (Discussion).

Chỉ dẫn cụ thể

Phần kết quả có thể ví von là “trái tim” của một bài báo khoa học. Cái khó khăn lớn nhất là làm sao trình bày rất nhiều dữ liệu và phân tích trong vòng vài trang giấy. Thông thường, tác giả có thể bắt đầu trình bày những dữ liệu đơn giản nhất, những dữ liệu dễ hiểu nhất, và dần dần cung cấp những dữ liệu phức tạp hơn. Sau đây là một số chỉ dẫn cụ thể để các bạn có thể trình bày phần kết quả một cách thuyết phục:

1. Trước hết, sắp xếp những kết quả quan trọng trong một loạt bảng số liệu và biểu đồ mà tác giả muốn đưa vào bài báo khoa học. Tác giả nên viết xuống giấy những kết quả được xem là thú vị, là quan trọng, nhưng chưa có cơ sở vững vàng. Những kết quả này sẽ là đầu đề để bàn luận sau này. Nếu kết quả nghiên cứu đơn giản (như bao nhiêu nam, bao nhiêu nữ, độ tuổi trung bình, v.v…), thì không cần phải trình bày trong bảng số liệu, mà chỉ cần mô tả trong bài báo là đủ. Nhưng những kết quả mang tính phức tạo thì cần phải cần đến bảng số liệu và biểu đồ.

Làm sao biết nên chọn cách trình bày bằng bảng số liệu hay biểu đồ? Kinh nghiệm của tôi cho thấy nếu số liệu chính xác là quan trọng cho bài báo, thì nên dùng bảng số liệu; nếu xu hướng (pattern) là quan trọng hơn là độ chính xác thì nên trình bày bằng biểu đồ. Dù là bảng số liệu hay biểu đồ, cần phải cẩn thận đặt tên và ghi chú cẩn thận, sao cho người đọc không cần đọc phần chi tiết trong bài báo vẫn có thể nắm được ý nghĩa của dữ liệu.

Ví dụ: bảng số liệu sau đây có tiêu đề rõ ràng, chỉ ra năm thu thập dữ liệu, địa điểm, và nội dung của dữ liệu:

Biểu đồ dưới đây, tác giả giải thích các kí hiệu trong biểu đồ một cách ngắn gọn mà người đọc có thể nắm lấy những nét chính của mô hình:

Cố nhiên, những bảng số liệu và biểu đồ bắt buộc phải đề cập trong phần kết quả. Dùng chữ số để đề cập đến biểu đồ hay bảng số liệu. Ví dụ, nên viết: "An exponential increase in egg production of Acartia tonsa was found for algal concentrations between 10 and 1,000 cells per ml r2 =0.779, p= 0.05 (Figure 1)", thay vì viết "Figure 1 shows an exponential increase in egg production of Acartia tonsa was found for algal concentrations between 10 and 1,000 cells per ml r2 =0.779, p= 0.05."


2. Phần kết quả nên trình bày những dữ liệu để “yểm trợ” cho các mục tiêu đề ra trong phần dẫn nhập. Phần kết quả chính là nơi để tác giả trình bày cái “ca” của mình. Do đó, sự khúc chiết ở đây rất quan trọng. Tác giả cần phải thuyết phục người đọc rằng lí giải của mình là logic. Nếu người đọc cảm thấy lẫn lộn do dữ liệu trình bày, hoặc không thể nào theo dõi những diễn giải của tác giả, họ có thể không chấp nhận kết luận của tác giả (và đó là một điều nguy hiểm).

Chẳng hạn như tác giả đặt câu hỏi “chiều cao của nam sinh viên bằng chiều cao của nữ sinh viên theo học ngành sinh học”, thì việc đầu tiên tác giả phải thu thập chiều cao từ một nhóm sinh viên được chọn ngẫu nhiên trong các khoa sinh học. Sau đó tác giả tính toán các chỉ số thống kê (trung bình, độ lệch chuẩn, v.v…) và thể hiện các dữ liệu này bằng biểu đồ. Giả dụ rằng sau khi phân tích tác giả phát hiện nam sinh viên cao hơn nữ sinh viên 12.5 cm, và đó chính là câu trả lời cho câu hỏi nghiên cứu.

Cần phải nhìn vào dữ liệu và suy nghĩ cẩn thận về ý nghĩa của chúng là gì. Nếu tác giả mà không biết dữ liệu mình nói gì, thì người đọc cũng khó có thể hiểu được ý nghĩa của dữ liệu. Một khi tác giả đã biết dữ liệu của mình nói lên ý gì, thì mới có thể thiết kế một cách trình bày cho thích hợp và rõ ràng.

3. Khi mô tả kết quả nghiên cứu, cần phải đề cập đến xu hướng khác biệt (directionality) và mức độ khác biệt (magnitude). Trong phần kết quả, tác giả nên cung cấp thông tin quan trọng về mối liên hệ, và khác biệt. Hai đặc điểm cần chú ý là xu hướng và mức độ khác biệt. Chẳng hạn như không nên viết "groups A and B were significantly different". Câu hỏi đặt ra là khác biệt như thế nào? Do đó, câu văn trên cần phải viết lại cho có thông tin hơn, ví dụ như: "Group A individuals were 23% larger than those in Group B", hay, "Group B patients gained weight at twice the rate of Group A patients."

4. Khi mô tả một bảng số liệu, tránh cách viết liệt kê. Một bảng số liệu có khi có rất nhiều số liệu phức tạp, mà tác giả có khi cảm thấy lúng túng không biết nên mô tả số liệu nào trước, và số liệu nào sau. Nguyên lí là chọn số liệu nào nổi trội, quan trọng, và có liên quan đến mục tiêu nghiên cứu để trình bày. Nói chung, khi trình bày bảng số liệu, cần (a) tối thiểu hóa lặp lại những con số trong bảng số liệu; (b) cung cấp cho độc giả những thông tin bổ sung cho bảng số liệu (nhưng không có trong bảng số liệu); và (c) cố gắng súc tích.

Ví dụ: "Data from 1194 women and 761 men, whose BMD measurements were available, were analysed. The average (and standard deviation, SD) of age for both sexes was 69.5 (6.5) years old (Table 1), with an above-average concentration of subjects in the younger age group of 60-69 years (58%), followed by 70-79 years (33%) and 80+ years (9%). The distribution of body mass index (BMI) in the sample was normally distributed for both sexes, with mean of 26 (3.6) kg/m2 for men, almost identical to that of in women (25.4 (4.6) kg/m2). Approximately one-third of women and 36% of men had BMI greater than 27 kg/cm2. Dietary calcium intake was skewed toward the lower level, with median for men (592 mg/day) was not significantly different from women (573 mg/day). In both sexes, approximately 75% of intakes was below 800 mg/day. Quadriceps strength in men (33 (13) kg) was significantly higher (p < 0.0001) than women (20 (8) kg). Physical activity index (PAI) in men was also higher (p < 0.001) in men (35 + 8.9) compared to women (30 (4.4)); 75% of men and women had PAI lower than 38 and 32, respectively."

Đối với những bảng số liệu phức tạp, tác giả cần phải viết vài dòng giải thích trước khi mô tả dữ liệu. Chẳng hạn như trong bảng số liệu sau đây trình bày về ảnh hưởng của genes và môi trường đến thành phần cơ thể (body composition) và khối lượng xương:

 
Trước hết, tác giả giải thích về mục tiêu một cách ngắn gọn: “To assess whether the observed relationships between BMD at various sites and body composition were attributable to genetic or environmental factors, multivariate genetic model-fitting analysis (as described in Figure 1) was performed.”

Sau đó là giải thích ý nghĩa của các kết quả trong bảng số liệu: “Squared standardised path coefficients (Table 2) can be interpreted as estimates of heritability of specific and decomposed in terms of the portion in common with and independent of other genetic factors. Off-diagonal elements of this analysis were small relative to diagonal elements, which indicate that the majority of heritability of each variable trait is due to specific genetic factors.”

Và sau cùng là mô tả dữ liệu trong bảng số liệu: “The heritability of fat mass in this sample was 0.65, and the portion of this due to shared genetic factors with lean mass was 0.02, whereas approximately a third of the environmental variance of FM was due to shared environment with lean mass. This is consistent with the non-significant genetic correlation between lean and fat mass (0.16; p = 0.24), and the significant environmental correlation (0.51; p < 0.001, Table 3)."

 
5. Tác giả nên báo cáo kết quả “âm tính” (negative results) – vì đây là những kết quả có khi rất quan trọng! Đôi khi kết quả thí nghiệm không xảy ra như tác giả tiên lượng lúc ban đầu, hoặc không phù hợp với giả thuyết nghiên cứu, và tác giả sợ khó công bố bài báo nên cố tình dấu! Nhưng đó là điều không chấp nhận được trong khoa học. Những kết quả như thế có thể nói lên rằng giả thuyết nghiên cứu không đúng và cần phải phát biểu lại, hoặc phương pháp đo lường có vấn đề, hoặc tác giả đang ngồi trên một khám phá rất quan trọng. Bất cứ lí do gì, tác giả cần phải thành thật trình bày những kết quả “âm tính”, và đừng bao giờ nghĩ rằng chỉ vì kết quả không như mình tiên lượng là những “kết quả xấu”. Nếu tác giả thiết kế công trình nghiên cứu tốt, thì những dữ liệu kết quả đó là thật, và cần phải được trình bày và diễn giải một cách thích hợp.

 
Những “không nên” trong phần kết quả

1. Không nên đưa vào bài báo những thông tin và dữ liệu “lặt vặt”. Những thông tin không quan trọng và nhỏ nhặt có thể làm người đọc lạc hướng vấn đề. Chẳng hạn như nếu trình bày kết quả về mối liên hệ giữa gene và bệnh tiểu đường, không cần phải trình bày thành phần kinh tế của đối tượng nghiên cứu trong bài báo. Nên nhớ rằng lúc nào cũng chú tâm đến dữ liệu nhằm yểm trợ cho mục đích đặt ra lúc ban đầu, chứ không nên tự đi ra ngoài mục tiêu của công trình nghiên cứu!

2. Tránh trình bày một loạt dữ liệu mà không có ý nghĩa gì lớn hay không diễn giải. Chẳng hạn như cách viết sau đây là phải tránh: "Hours in sunlight significantly affected growth (Table 1). Soil moisture significantly affected growth (Table 2). Soil nitrogen also had a significant effect on plant growth (Table 3)." Thay vì viết như thế, tác giả nên phát triển mỗi ý tưởng trong bài báo: mô tả ảnh hưởng hay hệ quả; mức độ ảnh hưởng ra sao; và những thông tin liên quan đến đơn vị so sánh. Một bài báo dài nên có những tiêu đề nhỏ trong phần kết quả để người đọc có thể theo dõi và đối chiếu với phần phương pháp.

3. Không nên dùng những tính từ mang tính áp đặt trong phần kết quả. Chẳng hạn như không nên viết "This difference was highly significant (p = 0.001)," mà chỉ cần đơn giản viết rằng "This difference was significant (p = 0.001)." Người đọc sẽ rất khó chịu khi tác giả dùng từ “highly” vì họ xem đó là cách đặt chữ vào miệng người đọc. Tác giả chỉ nền trình bày con số, dữ liệu; người đọc sẽ đánh giá dữ liệu đó cao hay thấp.

4. Không nên diễn giải dữ liệu trong phần kết quả. Những bình luận như "the data suggest that ...." chẳng có ý nghĩa gì cả, mà còn mang tiếng là nhét chữ vào miệng người đọc! Phần diễn giải dữ liệu nên để dành cho phần bàn luận (discussion); trong phần kết quả, tác giả chỉ trình bày sự thật.

5. Phân tích không chỉ dạy điều gì cả. Nhiều tác giả phạm phải những lỗi lầm sơ đẳng như câu "The ANOVA showed that.…" Phương pháp phân tích thống kê không “show”, không chỉ cái gì cả; tác giả mới chính là người “chỉ” ra kết quả đó có ý nghĩa gì!

Vài lới khuyên về văn phong trong phần kết quả

1. Về cách viết trong phần kết quả, nên dùng thì quá khứ và thể thụ động (passive voice). Phần lớn các tập san y khoa và khoa học nói chung yêu cầu tác giả dùng thì quá khứ để báo cáo những kết quả thí nghiệm. Tuy phần lớn các bài báo đều viết theo thể thụ động, nhưng cũng có một số ít tập san (như Lancet và New England Journal of Medicine) yêu cầu tác giả viết theo thể chủ động (active voice).

Ví dụ dưới đây nhấn mạnh đến xu hướng (trend) và sự khác biệt mà tác giả muốn người đọc tập trung vào:

“The duration of exposure to running water had a pronounced effect on cumulative seed germination percentages (Fig. 2). Seeds exposed to the 2-day treatment had the highest cumulative germination (84%), 1.25 times that of the 12-h or 5-day groups and 4 times that of controls.”

Ngược lại, trong ví dụ dưới đây, tác giả ngầm diễn giải số liệu và muốn “lôi kéo” người đọc tin vào mô hình / ý tưởng của tác giả.

“The results of the germination experiment (Fig. 2) suggest that the optimal time for running-water treatment is 2 days. This group showed the highest cumulative germination (84%), with longer (5 d) or shorter (12 h) exposures producing smaller gains in germination when compared to the control group.”

2. Khi trình bày các kết quả phân tích thống kê mang tính mô tả (như tên của test, trị số P) nên viết trong ngoặc cùng với kết quả chính mà các phương pháp test “yểm trợ”. Chẳng hạn như chiều cao của nam sinh viên cao hơn nữ sinh viên, tác giả có thể viết như sau:

"Men (180.5 ± 5.1 cm; n=34) averaged 12.5 cm taller than women (168 ± 7.6 cm; n=34) in the AY pool of Biology majors (two-sample t-test, t = 5.78, 33 d.f., p < 0.001)."

Nếu các số liệu thống kê được trình bày trong một biểu đồ, câu văn trên có thể viết lại như sau:

"Men averaged 12.5 cm taller than women in the AY 1995 pool of Biology majors (two-sample t-test, t = 5.78, 33 d.f., p < 0.001; Figure 1)."

Chú ý rằng các kết quả chính trình bày ngoài dấu ngoặc, còn kết quả phân tích thống kê thì trình bày trong dấu ngoặc.

3. Luôn luôn trình bày đơn vị đo lường (không có gì đáng “ghét” hơn là đọc một dữ liệu mà không biết đơn vị đo lường là gì!). Đối với giá trị đơn, tác giả có thể viết "the mean length was 10 m", or, "the maximum time was 140 min". Khi báo cáo các chỉ số về dao động và khác biệt, nên viết rõ dấu phía sau là SD hay SE: “10 ± 2.3 m (mean ± SD)". Tương tự, đặt đơn vị đo lường sau cùng trong dãy số liệu có cùng đơn vị đo lường, ví dụ như: "lengths of 5, 10, 15, and 20 m", or "no differences were observed after 2, 4, 6, or 8 min. of incubation".

Tuy đóng vai trò “trái tim” của một bài báo khoa học, phần kết quả cũng chỉ dài khoảng 2-3 trang. Do đó, việc chọn dữ liệu để trình bày cũng như kĩ thuật viết rất quan trọng trong việc viết phần kết quả cho đầy đủ và thuyết phục. Hi vọng rằng những hướng dẫn trên đây giúp cho các bạn soạn bài báo khoa học hay luận án tốt hơn. Cố nhiên, những hướng dẫn này thích hợp cho ngành y khoa và sinh học, có thể không hẳn thích hợp cho các ngành khác như kinh tế học chẳng hạn. Tuy nhiên, về nguyên tắc, tôi nghĩ cách viết cũng không khác nhau mấy giữa các ngành khoa học thực nghiệm.

                                                               Gs. Nguyễn Văn Tuấn.
(Xem tiếp phần 5 bàn về phần bàn luận)

12 tháng 9, 2010

CÁCH VIẾT BÀI BÁO KHOA HỌC (Phần 3 - Phương pháp)

 CÁCH VIẾT BÀI BÁO KHOA HỌC (Phần 3 - Phương pháp)
(Post lại bài của Gs. Nguyễn Văn Tuấn)
 
Có lẽ phần quan trọng nhất của một bài báo khoa học là phần phương pháp.  Kinh nghiệm làm biên tập của tôi cho thấy tập san tôi tham gia phụ trách trong ban biên tập (tập san Journal of Bone and Mineral Research) từ chối khoảng 75% những bài báo gửi đến; trong số bài báo bị từ chối, gần 70% là do khiếm khuyết trong phần phương pháp.  Tôi đã thấy và đọc rất nhiều bài báo gửi đến cho tập san mà kết quả rất thú vị, nhưng đành phải từ chối vì phần phương pháp được mô tả quá sơ sài, hay mô tả một cách xem thường người đọc.  Có thể tác giả không có ý xem thường ai, nhưng vì cách viết và trình bày chưa đạt chuẩn mực nên gây ra ấn tượng đó.  Trong phần 3 này, tôi sẽ chỉ các bạn viết phần phương pháp một cách chuẩn mực và chắc chắn sẽ không bị ai phê bình là … viết dở. :-)
Phương pháp (Methods)
Phần phương pháp nghiên cứu có lẽ là phần quan trọng nhất trong một bài báo khoa học.  Khoảng 70% bài báo khoa học bị từ chối chỉ vì phương pháp nghiên cứu không thích hợp hay sai lầm.  Nhiều người đọc có thói quen đọc phương pháp trước, rồi sau đó họ đọc các phần khác.  Nếu họ thấy phương pháp nghiên cứu có chất lượng, họ sẽ đọc tiếp; nếu không, họ sẽ bỏ qua một bên!  Do đó, đây là phần mà tác giả cần phải đầu tư nhiều thì giờ để viết cho “đạt”.
Trong phần phương pháp, tác giả phải trả lời cho được câu hỏi: "tác giả đã làm gì” (What did you do?)  Để trả lời câu hỏi này, tác giả phải cung cấp thông tin về thiết kế nghiên cứu, bệnh nhân (hay đối tượng nghiên cứu), phương pháp đo lường, độ tin cậy và chính xác của đo lường, phương pháp phân tích dữ liệu.  Do đó, phần phương pháp nghiên cứu có thể có những tiêu đề nhỏ như sau:
Thiết kế nghiên cứu (study design). Phát biểu ngằn gọn về mô hình nghiên cứu.  Đây là câu văn đơn giản, nhưng nói lên giá trị khoa học của công trình nghiên cứu.  Ví dụ: “The study was designed as a cross-sectional investigation, in which 210 women aged between 50 and 85 were randomly sampled by the cluster sampling scheme.
Đối tượng tham gia (Participants).  Thông tin về đặc điểm của đối tượng nghiên cứu đóng vai trò quan trọng để người đọc có thể đánh giá khả năng khái quát hóa của công trình nghiên cứu.  Khi mô tả đặc điểm đối tượng nghiên cứu, tiêu chuẩn tuyển chọn và tiêu chuẩn loại.  Đôi khi tác giả cần phải các biến số quan trọng như độ tuổi, giới tính, sắc tộc, trình độ học vấn, tình trạng sức khỏe.  Ví dụ:  "All women requesting an IUCD (intrauterine contraceptive device) at the Family Welfare Clinic, Kenyatta National Hospital, who were menstruating regularly and who were between 20 and 44 years of age, were candidates for inclusion in the study.  They were not admitted to the study if any of the following criteria were present: (1) a history of ectopic pregnancy, (2) pregnancy within the past 42 days, (3) leiomyomata of the uterus, (4) active PID (pelvic inflammatory disease), (5) a cervical or endometrial malignancy, (6) a known hypersensitivity to tetracyclines, (7) use of any antibiotics within the past 14 days or long-acting injectable penicillin, (8) an impaired response to infection, or (9) residence outside the city of Nairobi, insufficient address for follow-up, or unwillingness to return for follow-up."
Địa điểm và bối cảnh nghiên cứu (setting).  Cần phải cung cấp thông tin về địa điểm mà công trình nghiên cứu được thực hiện, hay nơi mà dữ liệu được thu thập, bởi vì địa điểm có thể ảnh hưởng đến tính hợp lí ngoại tại của kết quả nghiên cứu.  Chẳng hạn như khi chúng tôi làm nghiên cứu về vitamin D, chúng tôi phải cung cấp thông tin về thành phố mà mình thực hiện công trình nghiên cứu.  Ví dụ: “The study was designed as a cross-sectional investigation, in which the setting was Ho Chi Minh City (formerly Saigon).  The City is located at 10°45'N, 106°40'E in the southeastern region of Vietnam.  The City is in the tropic and close to the sea; therefore it has a tropical climate, with an average humidity of 75%.  There are only two distinct seasons: the rainy season, with an average rainfall of about 1,800 millimetres annually (about 150 rainy days per year), usually begins in May and ends in late November; the dry season lasts from December to April. The average temperature is 28°C (82°F), the highest temperature sometimes reaches 39°C (102°F) around noon in late April, while the lowest may fall below 16°C (61°F) in the early mornings of late December.
Qui trình nghiên cứu (Procedures).  Trong phần này, tác giả phải tóm lược từng bước nghiên cứu, kể cả những chỉ dẫn cho đối tượng nghiên cứu như thế nào.  Việc phân nhóm trong nghiên cứu, chi tiết về can thiệp hay điều trị (nếu có).  Nếu công trình có liên quan đến ngẫu nhiên hóa, tác giả cần phải mô tả cụ thể qui trình ngẫu nhiên hóa (randomization) như thế nào, kĩ thuật gì đã được sử dụng để đảm bảo các nhóm cân đối, v.v…
Ví dụ:  Patients with psoriatic arthritis were randomized to receive placebo or etanercept (Enbrel) at a dose of 25 mg twice weekly by subcutaneous administration for 12 weeks ... Etanercept was supplied as a sterile, lyophilized powder in vials containing 25 mg etanercept, 40 mg mannitol, 10 mg sucrose, and 1-2 mg tromethamine per vial.  Placebo was identically supplied and formulated except that it contained no etanercept.  Each vial was reconstituted with 1 mL bacteriostatic water for injection.
Ngoài ra, tác giả phải mô tả cẩn thận kĩ thuật đo lường được sử dụng trong nghiên cứu, như tên của máy, model gì, software phiên bản nào, và nơi sản xuất.  Cần phải mô tả điều kiện (nhiệt độ, ánh sáng) trong khi đo lường, cũng như các hệ số về độ tin cậy và độ chính xác của kĩ thuật đo lường.
Ví dụ:  Blood pressure (diastolic phase 5) while patient was sitting and had rested for at least five minutes was measured by a trained nurse with a Copal UA-251 or a Takeda UA-751 electronic ausculatory blood pressure reading machine (Andrew Stephens, Brighouse, West Yorkshire) or with a Hawksley random zero sphygmomanometer (Hawksley, Lancing, Sussex) in patients with atrial fibrillation.  The first reading was discarded and the mean of the next three consecutive readings with a coefficient of variation below 15% was used in the study, with additional readings if required.
Định nghĩa chỉ tiêu lâm sàng (measurements of endpoints).  Một công trình nghiên cứu lâm sàng phải có một endpoint hay outcome, mà tôi tạm dịch là “chỉ tiêu lâm sàng”, là cái làm thước đo của một thuật can thiệp.  Do đó, tác giả cẩn phải định nghĩa rõ ràng chỉ tiêu lâm sàng của công trình nghiên cứu là gì, và nhất là phương pháp đo lường (như vừa đề cập) ra sao.  Thông thường, một nghiên cứu có 2 chỉ tiêu lâm sàng mà tiếng Anh gọi là “primary endpoint” (chỉ tiêu chính) và “secondary endpoint” (chỉ tiêu phụ).
Ví dụ:  The primary endpoint with respect to efficacy in psoriasis was the proportion of patients achieving a 75% improvement in psoriasis activity from baseline to 12 weeks as measured by the PASI (psoriasis area and severity index).  Additional analyses were done on the percentage change in PASI scores and improvements in target psoriasis lesions.
Nên nhớ rằng ở phần này tác giả chỉ mô tả những biến có liên quan đến bài báo, chứ không phải mô tả tất cả những biến đã được thu thập trong công trình nghiên cứu.  Chẳng hạn như nếu bài báo chỉ nói về mật độ xương, thì tác giả không cần phải nói đến gãy xương (vì hai biến này rất khác nhau).  Nguyên tắc là: chỉ mô tả những gì có liên quan đến phần kết quả.
Cỡ mẫu (Sample Size).  Cỡ mẫu là một yếu tố rất quan trọng trong một nghiên cứu lâm sàng.  Thông thường, các nghiên cứu randomized controlled trial (RCT) phải có một câu văn mô tả cách tính cỡ mẫu.  Không phải là công thức tính (như tôi thấy nhiều bài báo ở Việt Nam), mà là những giả định đằng sau cách tính.  Điều này quan trọng, vì qua giả định, người đọc có thể đánh giá khả năng mà công trình nghiên cứu có thể giải quyết câu hỏi đặt ra trong phần dẫn nhập.
Ví dụ:  We consider that the incidence of symptomatic deep venous thrombosis or pulmonary embolism or death would be 4% in the placebo group and 1.5% in the ardeparin sodium group.  Based on 0.9 power to detect a significant difference (p  0.05, two-sided), 976 patients were required for each study group.  To compensate for nonevaluable patients, we planned to enroll 1000 patients in each group.
Ngẫu nhiên hóa (Randomization).  Trong các công trình nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled trial hay RCT), bệnh nhân thường được phân nhóm một cách ngẫu nhiên.  Có nhiều cách phân nhóm bằng máy tính và thuật toán, cho nên tác giả có trách nhiệm phải mô tả rõ phương pháp phân nhóm để người đọc có thế đánh giá chất lượng của nghiên cứu.  Nếu cách phân nhóm có hiệu quả thì kết quả thường cho thấy các nhóm rất tương đương về các đặc tính lâm sàng.  Một ví dụ về cách mô tả phương pháp phân nhóm có thể thấy trong đoạn văn sau đây: “Women had an equal probability of assignment to the groups.  The randomization code was developed using a computer random number generator to select random permuted blocks.  The block lengths were 4, 8, and 10 varied randomly.”
Mật hóa (còn gọi là Blinding).  Trong các công trình RCT, có khi cả bác sĩ điều trị và bệnh nhân đều không biết bệnh nhân mình (hay mình) nằm trong nhóm nào của nghiên cứu.  Đây là một biện pháp nhằm tăng tính khách quan khi đánh giá hiệu quả của can thiệp.  Cũng như ngẫu nhiên hóa có thể thực hiện bằng nhiều thuật toán, cách mật hóa cũng có thể thực hiện bằng nhiều “thủ thuật”.  Cách mô tả thủ thuật đó có thể tìm thấy trong đoạn văn sau đây::  “All study personnel and participants were blinded to treatment assignment for the duration of the study.  Only the study statisticians and the data monitoring committee saw unblinded data but none had any contact with study participants.”
Phân tích dữ liệu (Data Analysis). Thiết kế và phân tích các nghiên cứu lâm sàng đều cần đến các phương pháp thống kê.  Do đó, phần này tuy là phần cuối trong phần phương pháp của bài báo khoa học, nhưng nó đóng vai trò rất quan trọng.  Tôi từng phục vụ trong ban biên tập và thấy rất nhiều bài báo và công trình nghiên cứu rất tốt nhưng vì phân tích sai nên đành phải từ chối.  Con số bài báo bị từ chối vì phân tích sai có khi lên đến 50% (như với tập san JAMA chẳng hạn).  Do đó, trong phần phân tích, tác giả phải phát biểu cho được biến phụ thuộc (hay endpoints hoặc outcome) là gì, biến độc lập (hay risk factors hoặc covariates) là gì, và định nghĩa rõ ràng các biến này được xử lí ra sao.  Nếu số liệu đã qua hoán chuyển thì tác giả phải giải thích tại sao.  Vì có nhiều phương pháp phân tích số liệu và kiểm định giả thuyết, nên tác giả còn phải giải thích tại sao đã chọn phương pháp A mà không là phương pháp B.  Đôi khi tác giả cũng phải nói ra đã dùng software nào cho phân tích.  (Nhớ đừng “khoe” software phân tích mà cơ quan hay cá nhân đã “tậu” một cách bất hợp pháp!)
Ví dụ về  cách viết đoạn văn này như sau: “All data analysis was carried out according to a pre-established analysis plan. Proportions were compared by using Chi-squared tests with continuity correction or Fisher's exact test when appropriate.  Multivariate analyses were conducted with logistic regression.  The durations of episodes and signs of disease were compared by using proportional hazards regression.  Mean serum retinol concentrations were compared by t-test and analysis of covariance ...  Two-sided significance tests were used throughout. The analysis was performed with the SAS system (SAS Institute, Inc, Cary, NC, USA.”
Nói chung, phần Phương pháp thường dài gấp 2 hay 3 lần phần Dẫn nhập. Sẽ không có vấn đề gì nếu tác giả mô tả phần Phương pháp một cách chi tiết, vì nếu tập san thấy không cần thiết thì họ sẽ cắt bỏ hay đưa vào phần phụ chú (appendix).  Nhưng sẽ là vấn đề nếu tác giả cố tình mô tả phần Phương pháp một cách mù mờ và vắn tắt, bởi vì người duyệt bài sẽ nghĩ tác giả hoặc là muốn dấu diếm vấn đề hoặc là thiếu thành thật!  Xin nhắc lại rằng gần 70% bài báo khoa học bị từ chối là do phương pháp không đúng hay mô tả không đầy đủ.  Vì thế, tác giả cần phải hết sức thận trọng trong phần mô tả Phương pháp nghiên cứu, làm sao nói cho được là “what did you do” (bạn đã làm gì trong nghiên cứu này).

                                    Prof. Nguyễn Văn Tuấn. 

(Xem tiếp phần 4 - Kết quả)

11 tháng 9, 2010

CÁCH VIẾT MỘT BÀI BÁO KHOA HỌC (Phần 2 - Dẫn nhập)

CÁCH VIẾT MỘT BÀI BÁO KHOA HỌC (Phần 2 - Dẫn nhập)
(Post lại bài của Gs. Nguyễn Văn Tuấn)

Phần dẫn nhập (introduction hay background) là phần tương đối quan trọng, vì nó nói lên kiến thức của tác giả đến đâu trong chuyên ngành. Người kinh nghiệm chỉ cần đọc qua phần dẫn nhập có thể đánh giá sơ qua về khả năng của tác giả đến đâu, có cập nhật hóa kiến thức như thế nào, và kĩ năng viết lách ra sao (chỉ nhìn qua cách dùng thuật ngữ là có thể đoán được).


Do đó, tác giả cần phải nhân cơ hội viết phần dẫn nhập để thuyết phục người đọc và chứng minh cho họ thấy rằng mình cũng “biết câu chuyện”. Tôi sẽ lấy vài ví dụ để minh họa cho phần này, và để giữ khách quan, tôi sẽ không nêu tên tác giả.

Dẫn nhập (introduction)

Trong phần này, tác giả cẩn phải trả lời câu hỏi “Tại sao làm nghiên cứu này?” (Why did you do this study?) Phần dẫn nhập phải cung cấp những thông tin sau đây: (a) định nghĩa vấn đề; (b) những gì đã được làm để giải quyết vấn đề; (c) tóm lược những kết quả trước đã được công bố trong y văn; (d) và mục đích của nghiên cứu này là gì.

Đối với các tập san y khoa lớn và tổng quát (như New England Journal of Medicine, JAMA, Annals of Internal Medicine, v.v…) thì định nghĩa vấn đề rất quan trọng, bởi vì độc giả khác ngành có thể nắm được vấn đề và biết được tác giả đứng trên góc độ nào. Chẳng hạn như một nghiên cứu về gene và loãng xương, thì đoạn đầu tiên có thể nên (a) định nghĩa loãng xương là gì (vì nhiều người vẫn chưa rành), (b) tầm quan trọng của loãng xương ra sao (câu này để nhấn mạnh đây là vấn đề lớn, và vì lớn nên phải công bố trên các tập san lớn!) Chẳng hạn như, tác giả có thể viết “Osteoporosis is a disease characterized by low bone mass and deteriorated bone architecture which ultimately lead to increased susceptibility of fragility fracture.” Câu kế tiếp sẽ nói tầm quan trọng của gãy xương như thế nào, như tăng nguy cơ tử vong, tái gãy xương, giảm chất lượng cuộc sống, v.v… Nhưng đối với các tập san chuyên ngành loãng xương và nội tiết, thì câu định nghĩa trên có khi … khôi hài. Khôi hài là vì đại đa số độc giả các tập san đó đều biết loãng xương là gì, và họ sẽ thấy khó chịu nếu tác giả “lên lớp” họ về một định nghĩa sơ đẳng! Thông thường, những tác giả viết câu định nghĩa trong các tập san chuyên ngành là nghiên cứu sinh, chứ chuyên gia cấp cao hơn không ai viết như thế.

Trong phần dẫn nhập, tác giả cần phải nêu cho được tầm quan trọng của vấn đề nghiên cứu. Để nêu tầm quan trọng, tác giả có thể trình bày những thông tin như tần số của bệnh (prevalence) trong cộng đồng, hệ quả của bệnh đến nguy cơ tử vong, tăng nguy cơ mắc các bệnh khác (biến chứng), ảnh hưởng của bệnh đến nền kinh tế nước nhà, giảm chất lượng cuộc sống. Chẳng hạn như câu “In postmenopausal women, one in three women will sustain a fragility fracture during their remaining lifetime” là một cách nêu lên qui mô của vấn đề gãy xương; nhưng để nêu hệ quả thì có thể viết một câu khác như “Fragility fracture is associated with increased risk of pre-mature mortality” (câu này nhấn mạnh “pre-mature mortality”, tức là chết sớm!) nên sẽ gây chú ý.

Trong phần điểm qua y văn, tác giả cần phải trình bày những thông tin cơ bản để cho người đọc nắm được vấn đề, ý nghĩa và tầm quan trọng của vấn đề, và hiểu mục tiêu của công trình nghiên cứu. Chỉ nên trình bày những thông tin có liên quan trực tiếp đến vấn đề, chứ không nên điểm qua những thông tin gián tiếp.

Phần lớn những ý tưởng trong phần dẫn nhập xuất phát từ y văn, tức những công trình đã công bố trước đây. Khi điểm qua y văn, nên giới hạn trong những nghiên cứu đã công bố trong vòng 5 năm trở lại đây, tránh những nghiên cứu đã trên 20 năm hay tránh những thông tin trong sách giáo khoa vì có thể những thông tin như thế không còn hợp thời nữa. Tuy trình bày thông tin quá khứ, nhưng phải là những câu chữ của chính tác giả, chứ không phải trích dẫn quá nhiều hay lặp lại câu chữ của người đi trước. Tất cả những thông tin trong phần dẫn nhập phải ăn khớp với tài liệu tham khảo. Tác giả nên có những tài liệu tham khảo đó, chứ không nên trích dẫn theo những những bài báo trong y văn (secondary citation).

Cách viết

Về mặt cấu trúc, phần dẫn nhập bao gồm một số đoạn văn không cần tiêu đề (heading). Tuy nhiên, để viết tốt phần dẫn nhập, kinh nghiệm của tôi cho thấy cần phải chú ý đến một số điểm căn bản sau đây:

(a) Không nên viết quá dài. Viết quá dài rất dễ làm cho người đọc sao lãng vấn đề chính, và có khi làm mất thì giờ người đọc phải đọc những thông tin không cần thiết.

(b) Không nên điểm qua y văn theo kiểu viết sử. Phần lớn những người đọc bài báo là đồng nghiệp chúng ta, cho nên họ đã có một số kiến thức cơ bản. Do đó, tác giả không cần phải điểm qua y văn từ thời Hippocrate hay Khổng Tử, cũng không cần phải “lên lớp” [hay khoe với] người đọc về những khái niệm cơ bản mà người làm trong ngành phải biết. Một điều quan trọng là những thông tin trình bày trong phần dẫn nhập phải có liên quan đến vấn đề nghiên cứu.

(c) Phần dẫn nhập phải phát biểu mục đích nghiên cứu. Đoạn văn cuối của phần dẫn nhập là nơi để tác giả, sau khi điểm qua vấn đề và y văn, phát biểu mục đích của công trình nghiên cứu. Cố gắng duy trì nguyên tắc “từ tổng quan đến cụ thể”, tức là trong phần phát biểu vấn đề thì câu văn mang tính chung chung, nhưng phần mục đích thì phải cụ thể. Trong nhiều trường hợp, trước phần mục đích, tác giả nên phát biểu giả thuyết nghiên cứu. Chẳng hạn như “We hypothesize that blah blah blah”, rồi một câu kế tiếp “This study was designed to test the hypothesis by addressing the following specific aims: blah blah blah”.

(d) Về văn phạm, phần dẫn nhập nên viết bằng thì quá khứ, nhất là khi mô tả những kết quả trong quá khứ. Tuy nhiên, khi đề cập đến những thông tin mang tính cổ điển mà được cộng đồng chuyên ngành chấp nhận, tác giả có thể dùng thì hiện tại.

Một vài ví dụ

Trong bài báo sau đây, tác giả viết phần dẫn nhập một cách ngắn gọn, chỉ 1 đoạn văn, nhưng cung cấp đầy đủ thông tin cần thiết để bạn đọc biết vấn đề.

Fragility fracture is a serious public health problem, because it is prevalent in the elderly and is associated with increased risk of mortality [1]. Measurement of bone mineral density predicts subsequent risk of fractures among the elderly [2-4]. However, bone mineral density in later decades of life is a dynamic function of peak bone mass achieved during growth and its subsequent age-related rate of loss [5]. It has been estimated that over a lifetime, a typical woman loses about half of her trabecular bone and one third of her cortical bone [6], although some women experience greater loss than others.

It is not clear whether the rate of bone loss is an independent risk factor for osteoporotic fractures. We hypothesized that patients with excessive bone loss are at increased risk of fracture. The present study was designed to test the hypothesis by assessing the contribution of bone loss to the risk of osteoporotic fractures in elderly women


Câu đầu (Fragility fracture is a serious public health problem, because it is prevalent in the elderly and is associated with increased risk of mortality) tác giả định nghĩa vấn đề và cố gắng thuyết phục rằng gãy xương là vấn đề nghiêm trọng vì làm tăng nguy cơ tử vong.

Trong câu thứ hai (Measurement of bone mineral density predicts subsequent risk of fractures among the elderly) tác giả cho biết mật độ xương là một yếu tố tiên lượng gãy xương.

Hai câu kế tiếp (However, bone mineral density in later decades of life is a dynamic function of peak bone mass achieved during growth and its subsequent age-related rate of loss. It has been estimated that over a lifetime, a typical woman loses about half of her trabecular bone and one third of her cortical bone [4], although some women experience greater loss than others) tác giả cho biết mật độ xương thay đổi thay độ tuổi, và tùy thuộc vào hai thông số: mật độ xương tối đa trong thời “xuân thì”, và tỉ lệ mất xương sau thời kì mãn kinh.

Câu kế tiếp tác giả cung cấp thông tin cụ thể hơn, cho biết một phụ nữ trung bình mất khoảng 50% xương xốp và 1/3 xương đặc, và tỉ lệ mất xương dao động lớn giữa các phụ nữ. Câu văn thứ tư (It is not clear whether the rate of bone loss is an independent risk factor for osteoporotic fractures) cho chúng ta biết khoảng trống trong y văn: đó là chưa ai biết tỉ lệ mất xương có liên quan gì đến gãy xương hay không.

Sau khi đặt vấn đề, tác giả phát biểu giả thuyết nghiên cứu (We hypothesized that patients with excessive bone loss are at increased risk of fracture), và mục đích nghiên cứu (The present study was designed to assess the contribution of bone loss to the risk of osteoporotic fractures in elderly women.)

Đây là một dẫn nhập có thể nói là rất logic, vì ý tưởng nối kết nhau. Câu văn đầu cho đến câu văn cuối là một vòng tròn khép kín. Có lẽ cái hay của tác giả là chỉ tóm gọn phần dẫn nhập trong một đoạn văn duy nhất với 114 từ! Viết dẫn nhập ngắn gọn và súc tích như thế đòi hỏi kinh nghiệm chuyên môn tốt và cách dùng chữ một cách chiến lược.

Nhưng nếu chúng ta xem xét phần dẫn nhập sau đây:

It is well recognised that nonsocomial infection is associated with an increase in morbidity and mortality together with a significant economic cost [1]. Patients in Intensive Care units develops nonsocomial infections more frequently than other hospitalised patients [2]. This is a result of severity of illness, multiple exposure to invasive procedures and multiple therapies [3]. Patients in surgical and orthopaedic wards are also at a high risk of developing nonsocomial infections. These patients are exposed to various invasive procedures (including surgical wounds) which may be similar to those in ICU. Because of the expected differences in the nature of risk factors, patients' illnesses in the therapeutic and infection control measures in the above wards, it was necessary to conduct a study to assess the nonsocomial infection rates.


Cách viết này không tệ, nhưng khó có thể xem là tốt. Câu văn đầu tiên (It is well recognised that nonsocomial infection is associated with an increase in morbidity and mortality together with a significant economic cost [1]) tác giả cho biết vấn đề quan trọng vì liên quan đến tử vong và tốn kém. Những câu văn sau, tác giả cố gắng giải thích vấn đề nhiễm trùng ở bệnh nhân cấp cứu và bệnh nhân qua phẫu thuật chấn thương chỉnh hình, mà họ nghĩ rằng có cùng nguy cơ. Tuy nhiên, tác giả không cho biết vấn đề là gì, đã có ai nghiên cứu gì, và khoảng trống của tri thức là gì. Ấy thế mà đến câu văn kế tiếp, tác giả giải thích lí do cho nghiên cứu! (Because of the expected differences in the nature of risk factors, patients' illnesses in the therapeutic and infection control measures in the above wards, it was necessary to conduct a study to assess the nonsocomial infection rates). Thật ra, mục đích nghiên cứu cũng chưa rõ ràng, vì tác giả không phát biểu giả thuyết làm nền tảng cho nghiên cứu là gì. Sau khi đọc xong phần dẫn nhập, có lẽ người đọc không biết ý nghĩa và tầm quan trọng của nghiên cứu này ra sao. Thật vậy, tác giả chưa thuyết phục độc giả tại sao họ đã thực hiện công trình nghiên cứu! Nên tránh cách viết như thế này.

Đoạn văn dưới đây cũng là phần dẫn nhập của một bài báo trên một tập san toán ở Việt Nam. Bài báo này thật ra không phải là một công trình nghiên cứu toán, mà là một bài viết về lịch sử phát triển bộ môn toán có tên là “complex analysis” (chưa biết dịch sang tiếng Việt là gì) ở Việt Nam.

In the development of contemporary mathematics in Vietnam complex analysis occupies a special place. In this note we give a brief survey of the development of complex analysis in Vietnam. We describe how complex analysis in Vietnam developed under very special conditions: the anti-French resistance, the struggle for the reunification of the country, the American war, the economic crisis, and the change toward a market economy.


Đứng trên quan điểm viết báo khoa học, phần dẫn nhập này chưa đạt. Tạm bỏ qua những sai sót về tiếng Anh và văn phạm tiếng Anh (khá hiển nhiên), có thể thấy rằng các câu văn không mang tính nối tiếp và khúc chiếc. Trong câu văn đầu, tác giả không nêu vấn đề là gì, mà đi thẳng vào vị trí đặc biệt của complex analysis ở Việt Nam. Nhưng câu thứ hai thì không thấy tac giả nói “đặc biệt” như thế nào; thay vào đó, tác giả giới thiệu nội dung bài viết! Đến câu thứ 3 thì chúng ta mới biết “đặc biệt” là gì (là phát triển trong bối cảnh chiến tranh). Nói cách khác, phần dẫn nhập này chưa đạt, vì chưa nói lên được vấn đề, chưa trả lời câu hỏi tại sao phải có bài báo này. Cách trình bày ý tưởng cũng chưa mạch lạc. Nên tránh cách viết này.

Có người nghĩ rằng chỉ cần viết ngắn gọn, nhưng đối với “văn chương khoa học” thì tôi nghĩ quan điểm đó không đúng. Viết phần dẫn nhập quá ngắn làm cho người đọc cảm nhận rằng tác giả thiếu suy nghĩ sâu, thiếu ý tưởng, hay thiếu thông tin (nên chẳng biết viết/nói gì thêm). Viết dài quá thì độc giả lại nghĩ tác giả có lẽ do thiếu ý tưởng nên cố tình kéo dài câu chuyện! Do đó, cách viết dẫn nhập tốt nhất là vừa đủ, không qúa dài và cũng không quá ngắn. Theo kinh nghiệm của tôi, phần dẫn nhập của một bài báo y khoa chỉ nên giới hạn trong vòng 1 trang A4. Điều quan trọng nhất là sau khi đọc xong phần dẫn nhập, người đọc biết được tầm quan trọng của nghiên cứu, và tại sao tác giả làm nghiên cứu. Được như thế thì có thể xem như tác giả đã “đạt” được một mục tiêu của mình: đó là làm cho người đọc phải đọc phần kế tiếp (phần Phương pháp).

                                                                   Gs.Nguyễn Văn Tuấn.
Xem tiếp phần 3 bàn về phương pháp