Thế tiến thoái lưỡng nan của người tù lặp lại (Iterated Prisoner's Dilemma) là gì?
Hình minh họa (Nguồn: ytimg.com)
Thế tiến thoái lưỡng nan của người tù lặp lại (Iterated Prisoner's Dilemma)
Khái niệm
Thế tiến thoái lưỡng nan của người tù lặp lại hay tình huống khó xử của người tù lặp lại hay song đề tù nhân lặp lại trong tiếng Anh là Iterated Prisoner's Dilemma.
Thế tiến thoái lưỡng nan của người tù lặp lại là phần mở rộng của trò chơi Thế tiến thoái lưỡng nan của người tù trong đó trò chơi được lặp đi lặp lại bởi cùng những người tham gia. Thế tiến thoái lưỡng nan của người tù lặp lại khác với trò chơi ban đầu ở điểm là những người tham gia có thể tìm hiểu về xu hướng hành vi của nhau. Đôi khi nó còn được gọi là "trò chơi chiến tranh và hòa bình" (Peace-War game).
Ý nghĩa của trò chơi
Vì trò chơi được lặp lại nên một cá nhân có thể xây dựng một chiến lược không tuân theo qui ước logic thông thường của một vòng chơi rời rạc. Ăn miếng trả miếng là một chiến lược tiến thoái lưỡng nan của người tù phổ biến.
Trò chơi thế tiến thoái lưỡng nan của người tù là nền tảng của nhiều lí thuyết về sự hợp tác và lòng tin tưởng của con người. Dựa trên giả định rằng trò chơi có thể mô hình hóa các giao dịch giữa hai người đòi hỏi sự tin tưởng, hành vi hợp tác trong tập thể có thể được mô hình hóa bởi một phiên bản có nhiều người chơi, có sự lặp đi lặp lại của trò chơi.
Lí thuyết đằng sau trò chơi này đã làm siêu lòng rất nhiều học giả trong những năm qua. Gần đây, các nhà nghiên cứu thiết kế tổ chức đã sử dụng trò chơi để mô hình hóa các chiến lược của công ty.
Thế tiến thoái lưỡng nan của người tù thường có trong các lí thuyết trò chơi hiện nay thì đã trở nên phổ biến hơn với các chiến lược gia đầu tư. Toàn cầu hóa và hội nhập thương mại đã thúc đẩy hơn nữa nhu cầu về các mô hình tài chính và mô hình hoạt động có thể diễn tả các vấn đề địa chính trị.
Ví dụ về trò chơi Thế tiến thoái lưỡng nan của người tù lặp lại
Ví dụ, bạn và đồng sự đang ở trong nhà giam và bị nghi ngờ là có tội. Hai bạn bị cô lập nhau và không biết người kia sẽ trả lời câu hỏi như thế nào. Cảnh sát yêu cầu cả hai bạn phải khai người kia có dính líu đến tội ác (tức là phản bội người kia). Điều gì xảy ra phụ thuộc vào những gì các bạn làm, nhưng cả hai bạn đều không biết người kia sẽ trả lời như thế nào.
Nếu đồng sự của bạn phản bội bạn (đầu hàng trước sức cám dỗ phản bội) trong khi bạn giữ im lặng thì bạn sẽ nhận mức án tù dài nhất trong khi đồng sự của bạn sẽ được thả tự do (và ngược lại).
Nếu cả hai bạn chọn hợp tác với nhau (mà không phải cảnh sát) bằng cách giữ im lặng, bởi không có đủ bằng chứng để kết tội cả hai bạn nên cả hai bạn đều bị kết án nhẹ cho một tội nhẹ hơn. Nếu cả hai bạn quyết định phản bội lại người kia thì bạn đã lên án nhau để giảm nhẹ tội lỗi của mình nhưng cuối cùng vẫn bị kết án tội nặng.
Phần thưởng trong trò chơi này là các mức giảm án tù rất tốt, khá tốt, khá tệ hoặc rất tệ, chúng được chuyển thành một hệ thống tính điểm như sau:
Trò chơi được lặp đi lặp lại trong một số vòng cho đến khi nó kết thúc (như thể bạn bị thẩm vấn nhiều lần cho các tội danh riêng biệt). Điểm số từ mỗi vòng được tích lũy, vì vậy mục tiêu là tối ưu hóa điểm số trước khi trò chơi kết thúc. Trò chơi kết thúc tại vòng nào đó ngẫu nhiên trong khoảng từ 1 đến 100 vòng. Vào cuối trò chơi, điểm số được chuyển thành tỉ lệ phần trăm của điểm số tốt nhất có thể.
(Tài liệu tham khảo: investopedia.com)