Giải Nobel đã thuộc về các nhà kinh tế học, những người đã thay đổi cách chúng ta giúp đỡ người nghèo. Nhưng một số nhà phê bình phản đối ý tưởng lớn của họ.

Giải thích các thử nghiệm ngẫu nhiên có đối chứng và cuộc tranh luận về chúng.

THỤY ĐIỂN-NOBEL-2019-KINH TẾ

Những người được trao Giải thưởng The Sveriges Riksbank về Khoa học Kinh tế để tưởng nhớ Alfred Nobel (L-R) Michael Kremer, Esther Duflo và Abhijit Banerjee đặt ra sau Bài giảng Nobel của họ tại Đại học Stockholms ở Stockholm, Thụy Điển, vào ngày 8 tháng 12 năm 2019.





Ảnh của CHRISTINE OLSSON / TT News Agency / AFP qua Getty Images

Câu chuyện này là một phần của một nhóm các câu chuyện có tên là Tương lai hoàn hảo

Tìm những cách tốt nhất để làm điều tốt.

Giải Nobel Kinh tế được trao cho Esther Duflo, Abhijit Banerjee và Michael Kremer - chính thức được trao cho họ ngày hôm qua tại lễ trao giải Nobel ở Na Uy - là một chiến thắng lớn cho phương pháp tiếp cận khoa học mà họ đã vô địch: thử nghiệm ngẫu nhiên có đối chứng (RCT).

Thử nghiệm ngẫu nhiên có đối chứng là thử nghiệm áp dụng can thiệp chỉ cho một phần được chọn ngẫu nhiên của dân số mục tiêu, để bạn có thể so sánh tác động của sự can thiệp với một nhóm không nhận được sự can thiệp đó. Như ủy ban Nobel đã lưu ý, việc sử dụng chúng trong kinh tế học phát triển đã đã giúp viện trợ trực tiếp và chính sách công tốt hơn, thay đổi hàng triệu cuộc sống.



Sự ra đời của phương pháp tiếp cận dựa trên RCT không chỉ thay đổi cách các nhà kinh tế phát triển trả lời câu hỏi của họ; nó cũng thay đổi những câu hỏi mà họ đặt ra. Từ việc tập trung chủ yếu vào các vấn đề quy mô quốc gia mà không có câu trả lời rõ ràng (như tại sao các nước nghèo), lĩnh vực này đã chuyển sang tập trung chủ yếu vào các vấn đề nhỏ hơn có thể trả lời dứt khoát: Sách giáo khoa có cải thiện kết quả của học sinh không? Tẩy giun có hiệu quả không? Còn về tài chính vi mô? Các Ngẫu nhiên đang đặt ra và trả lời những câu hỏi mà trước đây chưa được xem xét.

Nhưng RCT có các nhà phê bình của họ. Một số lo lắng rằng RCT đang khử nhân tính, đối xử với mọi người như các thí nghiệm khoa học. Một số lo lắng rằng họ nói với chúng tôi ít hơn những gì người đề xuất tuyên bố và họ đã trở nên quá phổ biến chứ không phải là một công cụ tốt trong hộp công cụ. Những người khác đã chỉ trích những gì họ thấy khi RCT hướng các nhà kinh tế học hỏi những câu hỏi nhỏ thay vì những câu hỏi lớn, như nguyên nhân của năng suất hoặc nghèo đói.

Đây có vẻ như là một cuộc tranh luận không có nhiều hàm ý bên ngoài học thuật, nhưng nó thực sự quan trọng trong cuộc sống hàng ngày. Chúng tôi sử dụng khoa học để thiết lập chính sách công. Trong y học, các thử nghiệm lâm sàng (thường là RCT) xác định liệu thuốc có hợp pháp để kê đơn ở Mỹ hay không. Trong kinh tế học phát triển, hàng triệu đô la viện trợ được phân phối dựa trên kết quả của RCT.



Giải Nobel được trao cho Duflo, Banerjee và Kremer đã đưa những bất đồng này lên hàng đầu. Dưới đây là tất cả những gì cuộc tranh luận - và tại sao, xét trên khía cạnh cân bằng, chúng ta nên coi sự gia tăng của RCT là một bước tiến lớn đối với kinh tế học phát triển.

Sự gia tăng của thử nghiệm ngẫu nhiên

Trả lời các câu hỏi nghiên cứu thậm chí đơn giản trong y học hoặc chính sách công có thể là một thách thức đáng ngạc nhiên. Để biết lý do tại sao, hãy tưởng tượng cố gắng trả lời một câu hỏi như, Uống nước ngọt có khiến con người kém khỏe mạnh không?

Một cách để trả lời đó là hỏi mọi người xem họ uống bao nhiêu soda và đo mức độ khỏe mạnh của họ.



Nhưng cách tiếp cận này không mang lại cho bạn câu trả lời hài lòng. Có thể ngay từ đầu những người uống soda đã không tốt cho sức khỏe. Hoặc có thể soda giúp giảm các triệu chứng của một số vấn đề sức khỏe thông thường (như mệt mỏi và ít năng lượng), vì vậy những người có các vấn đề sức khỏe đó sẽ tiêu thụ nhiều soda hơn. Có thể những người có lương tâm, có ý thức về sức khỏe đã đọc rằng soda có hại cho họ và vì vậy họ tránh nó - và dù soda có hại cho họ hay không, thì việc tận tâm và có ý thức về sức khỏe sẽ tốt cho họ và có khả năng sẽ tạo ra kết quả tốt cho sức khỏe.

Vấn đề là: Chỉ hỏi mọi người xem họ uống bao nhiêu soda rồi đo sức khỏe của họ sẽ không cho bạn biết nhiều về mối quan hệ nhân quả giữa việc uống soda và việc khỏe mạnh.



Nhiều các loại nghiên cứu tồn tại để cố gắng vượt qua thách thức cơ bản này. Bạn có thể nhìn vào một khu phố nơi một cửa hàng tiện lợi mới mở gần đây, giả định rằng mọi người hiện đang uống nhiều nước ngọt hơn và đo lường những thay đổi trong sức khỏe của họ. Bạn có thể xem liệu các phiếu mua hàng soda có tăng mua hàng hay không và liệu điều đó có ảnh hưởng đến kết quả sức khỏe hay không.

Nhưng một trong những giải pháp hữu ích nhất, nếu bạn có thể làm được, là ngẫu nhiên tiếp xúc với biến mà bạn quan tâm (trong trường hợp này là nước ngọt). Đây là ý nghĩa của điều đó: Bạn tìm thấy một số những người quan tâm đến việc tham gia vào nghiên cứu của bạn. Một nửa trong số họ vẫn tiếp tục cuộc sống hàng ngày của họ như trước đây. Nửa còn lại, bạn cố gắng thuyết phục uống ít soda hơn. Sau đó, bạn đo lường nếu họ làm điều đó, và nếu có lợi ích cho sức khỏe. Nếu bạn nhận được kết quả, bạn có thể tự tin hơn nhiều rằng kết quả của bạn là gây ra bằng cách uống soda, thay vì chỉ liên quan đến chúng.

Đó là khái niệm về RCT. Chúng là chìa khóa cho sự hiểu biết của chúng ta về khoa học trong các lĩnh vực như y học. Trên thực tế, trong khi con số ấn tượng là 22 triệu người đã đăng ký vào RCT khoa học xã hội từ năm 2007 đến năm 2017 (trong các lĩnh vực từ tâm lý học đến kinh tế học), thì con số đó lại bị hạn chế bởi 360 triệu đăng ký tham gia RCT y tế .

Trong trường hợp kinh tế học phát triển - lĩnh vực của Duflo, Banerjee và Kremer - RCT đã xuất hiện vào cuối những năm 1990. Có rất nhiều can thiệp viện trợ nước ngoài đã được thực hiện, nhưng chúng hầu như chỉ được đề xuất và thực hiện mà không có ý kiến ​​rõ ràng về can thiệp nào là hữu ích nhất. Để cải thiện kết quả ở một trường học kém, bạn có nên gửi sách giáo khoa không? Máy tính? Tiền thưởng cho giáo viên? Học bổng cho sinh viên?

Nhập RCT. Trong một Bài báo năm 2005 , Banerjee mô tả tình trạng của các vấn đề trong kinh tế học phát triển mà ông và những người khác đang cố gắng thay đổi. Ông đã thảo luận về một ấn phẩm của Ngân hàng Thế giới:

Các Sách nguồn Nó có nghĩa là một danh mục về những gì, theo ngân hàng, là những chiến lược đúng đắn để xóa đói giảm nghèo. Đây cũng là những chiến lược mà ngân hàng chuẩn bị đưa tiền vào. Nó cung cấp một danh sách rất dài các dự án được đề xuất, bao gồm: các ki-ốt máy tính ở các làng; cho thuê điện thoại di động ở nông thôn; học bổng dành cho trẻ em gái đi học trung học: chương trình phiếu đi học cho trẻ em nghèo; các chương trình quản lý rừng chung; nhóm người sử dụng nước: phiếu báo công dân đối với các dịch vụ công cộng; đánh giá nghèo đói có sự tham gia của người dân; truy cập internet cho các công ty nhỏ; tiêu đề đất đai; cải cách luật pháp; tín dụng vi mô dựa trên cho vay theo nhóm; và nhiều, nhiều, những người khác.

Trong khi nhiều ý tưởng trong số này chắc chắn là những ý tưởng hay, cuốn sách không cho chúng ta biết cách chúng ta biết rằng chúng hoạt động như thế nào. Quả thực [...] đây không phải là mối quan tâm hàng đầu của các tác giả.

Bây giờ chúng ta biết rằng một số trong những chương trình này hoạt động tốt hơn đáng kể so với những chương trình khác. Cách chúng ta biết điều đó là do các nhà nghiên cứu kinh tế học phát triển đã tiến hành các cuộc nghiên cứu. Họ thấy rằng tài chính vi mô có tác dụng khiêm tốn , nhưng không phải là những cái chuyển đổi được quảng cáo ban đầu; rằng các ki-ốt máy tính có rất nhiều vấn đề về triển khai; rằng học bổng có thể thúc đẩy sinh viên ở lại trường nếu được nhắm mục tiêu phù hợp, và nhiều hơn nữa. Và chúng tôi phát hiện ra vì các nhà khoa học xã hội bắt đầu sử dụng RCT để kiểm tra hiệu quả của các biện pháp can thiệp này.

Hoàn trả khoản vay tài chính vi mô ở Bắc Togo.

Hoàn trả khoản vay tài chính vi mô ở Bắc Togo.

Ảnh của: Godong / Universal Images Group qua Getty Images

Những người chỉ trích các thử nghiệm ngẫu nhiên

Không có nhiều hoài niệm về những ngày mà chúng ta không biết những biện pháp can thiệp phát triển nào thực sự hiệu quả. Nhưng có những nhà nghiên cứu tỏ ra dè dặt về vai trò của RCT đối với sự phát triển. Nhiều người trong số họ đã nêu lên những lo ngại đó trong các bài báo và cuộc nói chuyện trong vài năm qua, và nhiều người khác đã nêu lên khi giải Nobel được công bố.

Có bốn loại khiếu nại lớn:

Giá trị bên ngoài

Một điều phàn nàn là RCT thường không khái quát hóa tốt như bạn nghĩ. Một nghiên cứu về sách giáo khoa ở một khu vực ở Kenya sẽ cho bạn biết nhiều điều về khả năng tư vấn của việc cung cấp những sách giáo khoa đó ở khu vực đó ở Kenya, nhưng có thể cho bạn biết khá ít về những gì sách giáo khoa sẽ đạt được ở Bangladesh. Mối quan tâm này được gọi là giá trị bên ngoài.

Nhà kinh tế học Peter Dorman viết :

Có hai khía cạnh cụ thể của chủ nghĩa thực nghiệm đặt ra câu hỏi ở khía cạnh này, xu hướng thí nghiệm nhỏ, cục bộ và có giới hạn thời gian (giống như một tập hợp các trường học ở một bang ở Ấn Độ vào giữa những năm 00) và tác động của việc kiểm soát thực nghiệm. bản thân nó, khi một loại giả tạo xâm nhập. Ví dụ: tôi quen thuộc với tài liệu về chuyển thu nhập có điều kiện được thiết kế thử nghiệm, trong đó mọi nghiên cứu mới, với vị trí quốc gia mới, khoảng thời gian hoặc tập hợp các chỉnh sửa thiết kế dường như thay đổi phần dưới dòng của những gì hoạt động và như thế nào.

Angus Deaton của Đại học Princeton đã xuất bản về những vấn đề này, lập luận rằng thật sai lầm khi mong đợi giá trị bên ngoài từ RCT (và có những hạn chế quan trọng về những gì họ có thể dạy chúng ta).

Khiếu nại này về cơ bản là chính xác và công bằng - nhưng điều quan trọng cần lưu ý là nó không phải là vấn đề riêng đối với RCT. Nhà kinh tế học Eva Vivalt nói với tôi, Rất nhiều lời chỉ trích về RCT có chút sai lầm, trong đó có nhiều lời phàn nàn giống nhau về các RCT không phải là RCT. Giá trị bên ngoài nói chung là khá thấp và điều đó thực sự đáng thất vọng - nhưng về mặt RCT so với các loại nghiên cứu khác, chúng thực sự có cùng mối quan tâm về hiệu lực bên ngoài.

Không phải RCT có giá trị bên ngoài duy nhất không tốt - mà chỉ là việc tổng hợp hóa từ bất kỳ nghiên cứu nào để đoán ý nghĩa của các chương trình khác nhau ở những nơi khác trên hành tinh là một công việc khó khăn. Nhìn chung, sự chuyển dịch của phong trào kinh tế học phát triển sang việc tiến hành nhiều nghiên cứu thực nghiệm là rất tốt cho khả năng của chúng ta trong việc khái quát về tác động của các vấn đề - ngay cả khi một số người khái quát hóa quá mức và cho rằng sai RCT có giá trị bên ngoài nhiều hơn chúng.

Trả lời những câu hỏi nhỏ

Luồng chỉ trích thứ hai là sự thành công của RCT đã khiến các nhà nghiên cứu chỉ trả lời những câu hỏi đơn giản và đơn giản, có lợi cho RCT.

Stefan Dercon tóm tắt cách tiếp cận theo chủ nghĩa ngẫu nhiên theo cách này: Mọi thứ phải quy nạp, thử nghiệm. Rất nhiều giải pháp nhỏ sẽ giúp chúng ta tiến lên phía trước. Họ không có lý thuyết lớn về nguyên nhân gây ra tăng trưởng thấp, không có câu hỏi lớn, chỉ là 'một chương trình nghị sự kỹ thuật để sửa chữa những thất bại nhỏ của thị trường.'

Hoặc, như Dorman nói:

Chiến lược thiết kế thử nghiệm hầu như đòi hỏi một phương pháp tiếp cận nhỏ gọn đối với sự thay đổi xã hội. Một cách tiếp cận sâu rộng hơn, mang tính cấu trúc hơn đối với nghèo đói và bất bình đẳng đưa ra quá nhiều biến số và đánh bại sự kiểm soát thực nghiệm. Do đó, nếu không có bất kỳ sự biện minh rõ ràng nào về ý thức hệ, chúng ta sẽ kết thúc với chủ nghĩa cải cách gia tăng khi toàn bộ cấu trúc xã hội có thể là thủ phạm thực sự.

Một cách để suy nghĩ về lời chỉ trích này là: Hãy tưởng tượng chúng tôi đã cử một số nhà kinh tế phát triển đến Ý thế kỷ 17 để xem tại sao nước này lại nghèo như vậy. Họ đã tiến hành RCT của những nỗ lực điều trị bệnh sốt rét, thử cho mọi người vay những khoản tiền nhỏ và kiểm tra xem liệu vòng đeo tay nhắc nhở có thể cải thiện tỷ lệ tiêm chủng .

Những can thiệp đó có thể cải thiện vấn đề! Nhưng về cơ bản, các nhà sử học nghĩ rằng Ý ở thế kỷ 17 nghèo vì những thứ to lớn, có cấu trúc - thực tế là hiện đại hóa đang diễn ra ở những nơi khác nhưng không phải ở Ý, Giáo hội Công giáo đã khẳng định lại quyền lực của nó, gia tăng bất bình đẳng, v.v.

Và về cơ bản, ở một khía cạnh nào đó, Ý ở thế kỷ 17 rất nghèo vì các cách làm giàu vẫn chưa được phát minh. Các kỹ thuật nông nghiệp hiện đại năng suất cao vẫn chưa được phát minh, cũng như chưa có điện hay internet và tất cả các ngành công nghiệp có thể thực hiện được. Bạn chắc chắn có thể cải thiện điều kiện bằng các cuộc thử nghiệm quy mô nhỏ, nhưng gần như tất cả sự khác biệt giữa Ý thế kỷ 17 và Ý hiện đại là sự khác biệt đáng kể về toàn bộ đặc điểm và cấu trúc của xã hội cũng như các ngành công nghiệp và công nghệ của nó.

Vì vậy, nó là lý do để giải thích rằng nghèo đói hiện đại cũng có thể giống như vậy. Mặc dù chúng ta có thể làm tốt với các giải pháp quy mô nhỏ, nhưng động lực tổng thể thúc đẩy nghèo đói và thịnh vượng sẽ là những động lực lớn về thể chế và văn hóa.

Những người bảo vệ RCT có xu hướng trả lời rằng, vâng, những câu hỏi lớn rất quan trọng. Nhưng chúng tôi không biết làm thế nào để trả lời chúng. Chúng tôi biết cách cứu mạng sống, cải thiện trường học, tăng thu nhập và cho phép mọi người kiểm soát nhiều hơn đối với tương lai của họ; chúng ta không biết làm thế nào để biến đổi cơ bản quỹ đạo của các quốc gia. Và có những vấn đề đạo đức nghiêm trọng khi cố gắng thay đổi toàn bộ xã hội một cách ngẫu nhiên; bạn không thể chạy RCT để xem liệu chủ nghĩa xã hội có tốt hơn chủ nghĩa tư bản hay không. Nói cách khác, chính sự hiện diện của RCT không thực sự cản trở chúng ta nghiên cứu những câu hỏi lớn - đó là thiếu những cách đầy hứa hẹn và có ý nghĩa để nghiên cứu chúng.

Lo ngại về sự đồng ý của người tham gia và cơ quan

Hầu hết các thành viên của công chúng cảm thấy không thoải mái về RCTs, với một thiểu số đáng kể đánh giá chúng là vô đạo đức. Thông thường, mọi người sẽ nói rằng có thể làm điều gì đó - ví dụ như phát lưới chống sốt rét - cho toàn dân hoặc bán lưới chống sốt rét với giá thấp cũng được. Nhưng họ chia rẽ nhiều hơn về việc liệu phát lưới ở một số vùng nhưng không hợp lý ở những vùng khác để kiểm tra việc sử dụng lưới cao hơn (và do đó tỷ lệ sốt rét thấp hơn).

Mọi người không thích thử nghiệm trên người khác cũng có ý nghĩa, đặc biệt là thử nghiệm trên nhiều người nghèo nhất thế giới. Nhưng trên thực tế, giải pháp thay thế cho thử nghiệm có kiểm soát thường là một thử nghiệm không được kiểm soát - các biện pháp can thiệp được thực hiện một cách ngẫu nhiên ở những nơi có các nguồn lực dành cho chúng, mà không có ai kiểm tra xem chúng có hiệu quả hay không. Và viện trợ được phân phối mà không kiểm tra xem nó có hoạt động hay không thường kết thúc là một thảm họa cho những người mà nó đang cố gắng giúp đỡ.

Thực hiện một nghiên cứu là một cách không hoàn hảo để thực hiện các nỗ lực viện trợ có trách nhiệm với những người mà họ được cho là giúp đỡ, nhưng nó chắc chắn không có nỗ lực nào để khiến viện trợ có trách nhiệm với những người mà họ phải giúp đỡ.

Tập hợp các giải quyết vấn đề khác

Lời chỉ trích chính cuối cùng? RCT rất đắt. Chúng được coi là một cách nghiên cứu có giá trị và chất lượng cao. Một số nhà nghiên cứu phàn nàn rằng kết quả là lĩnh vực này đã xoay trục để tập trung quá ám ảnh vào RCT, với chi phí là nghiên cứu sử dụng các phương pháp khác để trả lời các câu hỏi khác hoặc nghiên cứu rẻ hơn có thể có được nhiều câu trả lời giống nhau một cách hiệu quả.

Có một vấn đề với khiếu nại này - RCT thực sự không ảnh hưởng nhiều đến kinh tế học phát triển, ít nhất là gần như không nhiều như các cuộc thảo luận về chúng sẽ đề xuất. Một năm 2016 phân tích của David McKenzie của Ngân hàng Thế giới nhận thấy rằng RCT vẫn là một thiểu số trong các nghiên cứu kinh tế học phát triển đã được công bố. Họ chiếm tỷ lệ nghiên cứu không tương xứng trên các tạp chí hàng đầu trong lĩnh vực này, nhưng thậm chí ở đó, họ chỉ chiếm khoảng 30% số bài báo trong năm 2015.

Một công cụ trong hộp công cụ?

Tổng hợp những phàn nàn này, một số nhà phân tích nói rằng RCT nên được xem như một công cụ trong hộp công cụ - rằng vấn đề không nằm ở bản thân cách tiếp cận, điều này chắc chắn đã làm được rất nhiều điều tốt, và hơn thế nữa những người tuyên bố rằng đó là tiêu chuẩn vàng để nghiên cứu và một cách đặc biệt tốt để nâng cao kiến ​​thức.

Có vẻ như có những người đã phóng đại sức mạnh của RCTs, hoặc bác bỏ một cách không công bằng các nghiên cứu được thực hiện theo cách khác. Và chắc chắn là tốt khi phản hồi với sắc thái về giải Nobel, hãy ghi nhớ những hạn chế của nghiên cứu đoạt giải ngay cả khi nhận ra tầm quan trọng của nó.

Nhưng một công cụ trong hộp công cụ là một công cụ sửa chữa quá mức. Sự chuyển đổi trong kinh tế học phát triển sang tập trung vào các câu hỏi có thể trả lời được và đảm bảo rằng lời khuyên phát triển tập trung vào những gì hiệu quả là một sự thay đổi to lớn và có lợi. Khác với việc làm cho viện trợ trở nên tùy tiện hơn, nó làm cho nó ít tùy tiện hơn và có trách nhiệm hơn.

RCT chắc chắn sẽ không cho chúng ta biết tất cả mọi thứ nhưng chúng không chỉ là một công cụ khác trong hộp công cụ - chúng là một cách khá cần thiết để trả lời một cách chặt chẽ những câu hỏi mà nếu không thì không thể trả lời và kết quả là chúng đã cải thiện nhiều cuộc sống .

Đăng ký nhận bản tin Future Perfect. Hai lần một tuần, bạn sẽ nhận được một loạt các ý tưởng và giải pháp để giải quyết những thách thức lớn nhất của chúng tôi: cải thiện sức khỏe cộng đồng, giảm đau khổ cho con người và động vật, giảm thiểu rủi ro thảm họa và - nói một cách đơn giản - làm việc tốt hơn