فرض کنید سارقی هستید که بهتازگی یک سرقت مسلحانه انجام دادهاید. یک شریک جرم هم همراه با خود دارید. اما قبل از آنکه پلیس شما را دستگیر کند، اسلحههای خود را نابود میکنید و به عبارتی دیگر مدرک جرمی از شما باقی نخواهد ماند. پلیس شما را به کلانتری میبرد و از شما میخواهد یکی از موارد زیر را انتخاب کنید:
اگر شما و دوستتان به داشتن اسلحه، اعتراف نکنید، به دو سال حبس برای سرقت محکوم خواهید شد
اگر یک نفر از شما به داشتن اسلحه اعتراف کند، اعتراف کننده آزاد و دیگری ۱۰ سال حبس خواهد کشید
اگر دو نفرتان به داشتن اسلحه اعتراف کنید، مدت حبس هر دوی شما به ۵ سال کاهش خواهد یافت.
چه خواهید کرد؟
در اینجا وضعیتی را داریم که رضایتمندی و سود شما، تنها به شما وابسته نیست و دیگران نیز در کسبکردن یا نکردن سود شما تأثیر دارند. این وضعیت، با نام «نظریه بازیها» شناخته میشود. نظریه بازیها وضعیتی است که در آن، دستاورد یک عامل تنها به خودش وابسته نیست و دیگران نیز در وضعیتش تأثیرگذار خواهند بود.
بازیها با حرکت همزمان
بیایید به صحنه جرم و مثالی که در ابتدا زدیم بازگردیم. اما پیش از هر چیز لازم است سه عنصر کلیدی در هر بازی را بدانید:
- بازیگران
- راهبردها
- دستاوردها
در این بازی، بازیگران، شما و همکارتان جوسی هستید، راهبردهایی که دارید، اعتراف و یا مقاومت است و دستاوردهایتان نیز در جدول زیر، نشان داده شده است.
ماتریس دستاوردها، در واقع نشان میدهد که هر کنشی که انتخاب میکنید، چه دستاوردی را برای شما رقم خواهد زد. آنچه در جدول بالا، ترسیم شده است، یک سناریوی کلاسیک بوده که با عنوان تنگنای زندانیان، شناخته میشود. این سناریو هرچند ساده است، اما درسهای بزرگی را برای ما به دنبال دارد. این بازی، در واقع یک بازی با حرکت هم زمان است. یعنی شما در حالی دست به انتخاب میزنید که نمیدانید طرف مقابل چه چیزی را انتخاب کرده است و باید بدون اطلاع از تصمیم دیگری برای خود تصمیم بگیرید. حالا در این بازی، بهترین تصمیمی که میتوانید بگیرید چیست؟
در ابتدا باید خود را جای طرف مقابل بگذاریم. فرض کنید جوسی اعتراف کند، در این شرایط، مقاومت دیگر بیفایده است. چرا که شما مجبور خواهید بود با اعتراف او، ۱۰ سال حبس بکشید؛ بنابراین ستون مقاومت حذف خواهد شد و نتیجه جدول زیر است. بنابراین درصورتیکه جوسی اعتراف کند، بهترین راهبرد برای شما نیز اعتراف خواهد بود و در این شرایط هر دوی شما ۵ سال حبس خواهید گرفت.
بیایید یکبار سناریوها را دوباره بررسی کنیم: اگر شما اعتراف نکنید و جوسی اعتراف کند، ۱۰ سال حبس خواهید داشت و اگر هر دوی شما اعتراف نکنید دو سال. اما: اگر شما اعتراف کنید و جوسی نکند، شما آزاد میشوید و اگر جوسی اعتراف کند، شما هم اعتراف کنید، ۵ سال حبس؛ بنابراین در اینجا بهترین راهبرد برای شما اعتراف است. زیرا ممکن است با مقاومت شما، جوسی اعتراف کند و مشمول ۱۰ سال حبس شوید؛ بنابراین در اینجا بهترین واکنش در هر حالتی، اعتراف است.
راهبرد غالب
راهبرد غالب عبارت است از بهترین واکنش واحد در قبال همه راهبردهای ممکن بازیگران دیگر. در مثالی که زدیم، اعتراف یک راهبرد غالب است و برای جوسی نیز منطقی است که مانند شما اعترافکردن را انتخاب کند. راهبرد غالب، همیشه بهترین تصمیم نیست. چرا که در اینجا مقاومتکردن بهترین نتیجه را برای شما رقم میزد. اما تعادل راهبرد غالب برای شما اعتراف است. به این تنگنا، در فضای واقعی، تنگنای تصمیمگیری گفته میشود.
بازیهای بدون راهبرد غالب
بازی تنگنای زندانیان، یک راهبرد غالب برای هر بازیکن دارد. اما بازیهای زیادی نیز در دنیا وجود دارند که برایشان یک راهبرد غالب وجود ندارد. فرض کنید شما عاشق موجسواری هستید و یک مغازه برای ارائه خدمات موجسواری به نام هانگ تن، باز میکنید. رقیب اصلی شما مغازه دیگری به نام لاجولا است. در اینجا باید در مورد تبلیغات گرفتن یا نگرفتن تصمیم بگیرید. تحقیقات شما در مورد اینکه تبلیغات بگیرید یا نه در جدول زیر آورده شده است.
در این جدول، ردیفها راهبرد شما را نشان میدهد و ستونها نشاندهنده راهبرد رقیب شماست. ستون بالا سمت چپ، وضعیتی را نشان میدهد که هر دوی شما تصمیم بگیرید تبلیغات داشته باشید، در این شرایط، ۴۰۰ دلار سود عاید شما و رقیب شما خواهد شد. ستون پایین سمت راست نیز نشان میدهد که اگر هر دو تبلیغ نکنید، ۸۰۰ دلار سود به دست میآورید. در این بازار، مهمترین اثر تبلیغات برای شما آن است که مشتریان رقیب را بدزدید. نه اینکه مشتری جدید به دست بیاورید. دو ستون باقیمانده شرایطی را شرح میدهد که یکی تبلیغات داشته باشد و دیگری تبلیغات نداشته باشد. در این شرایط، وضعیت برای مغازهای که تبلیغ کند، بهتر از مغازه دیگر است. چرا که میتواند برخی مشتریان مغازه رقیب را به خود جذب کند.
شما باید در این شرایط چه کاری انجام دهید؟
جدول اول برای شما وضعیت را تشریح میکند. اگر رقیب شما تبلیغ کند، بهترین واکنش برای شما هم این است که تبلیغات را انجام دهید.
جدول دوم اما شرایطی را نشان میدهد که رقیب شما تبلیغ نکند. در اینجا برای شما نیز تبلیغات نکردن بهتر است.
آیا در این بازی یک راهبرد غالب دارید؟ خیر. علت آن است که راهبرد بهینه وابسته به تصمیم مغازه موجسواری رقیب است.
تعادل نش
مفهوم تعادل در بازارها زمانی به کار میرود که تمام افراد در این بازارها در حال بهینهیابی باشند. به عبارت بهتر، در این تعادل کسی نمیتواند با تغییر راهبرد وضعیت خودش را بهتر کند. این مفهوم، اساس تعادلی است که توسط جان نش مطرح شد. براساس نظریه او، در حالت تعادل هیچ بازیکنی در یک بازی نمیتواند با تغییر راهبرد، دستاورد خود را ارتقا بخشد؛ بنا براین مفهوم زمانی که هر یک از بازیکنان، راهبردی را انتخاب کنند که در واکنش به راهبردهای دیگران بهترین باشد، ترکیب راهبردی، تعادل نش محسوب میشود. یعنی همه بازیکنان تعادلهایی را انتخاب میکنند که بهترین هستند.
این مفهوم از تعادل به دو عامل کلیدی وابسته است.
اول اینکه تمامی بازیکنان، بازی و دستاوردهای مربوط به هر راهبرد را بفهمند.
دوم اینکه تمامی بازیگران بفهمند دیگر بازیکنان نیز درک درستی از بازی دارند.
در بستر یک تعادل نش، ما انتظار داریم که فرد انتظارات درستی در مورد مقاصد بازیکنان دیگر داشته باشد.
یافتن یک تعادل نش
در بازیهای با حرکت هم زمان، کلید یافتن تعادل نش، پیروی از منطق پیداکردن بهترین واکنشهاست. بیایید به تصمیمگیری در مورد تبلیغات موجسواری برگردیم. اگر رقیب شما تبلیغ کند، بهترین راهبرد برای شما تبلیغکردن است. اگر هم او تبلیغ نکند، بازهم بهترین راهبرد برای شما تبلیغنکردن است.
برایناساس، ما در بازی دو تعادل نش داریم:
- مغازه شما تبلیغ کند، مغازه رقیب هم تبلیغ بکند
- مغازه شما تبلیغ نکند، مغازه رقیب هم تبلیغ نکند
شاید در ابتدا عجیب باشد که در این بازی دو تعادل نش وجود دارد؛ اما در واقع، این موضوع، امری کاملا طبیعی است.
کاربردهای تعادل نش
حالا دانستن تعادل نش چه فوایدی برای ما دارد و کاربردهای تعادل نش چیست؟
نگاهی دوباره به تراژدی مشاعات
نظریه بازیها زمانی مورداستفاده قرار میگیرد که چند بازیکن تصمیماتی میگیرند که دستاوردهای حاصله برای یکدیگر را تحتتأثیر قرار میدهد. همان موضوعی که در تنگنای زندانیان وجود داشت، در اینجا نیز وجود دارد. تراژدی مشاعات زمانی رخ میدهد که از منابع مشترک استفاده زیادی میشود؛ بنابراین وقتی دیگران به میزان زیادی از منابع استفاده میکنند برای شما هم منطقی است که استفاده خود از منابع را افزایش دهید.
بازی با حاصلجمع صفر
فرض کنید وظیفه زدن پنالتی در بازی فوتبال بر عهده شماست. شما دو انتخاب دارید. به سمت چپ تور بروید و یا به سمت راست آن. در چنین شرایطی چه خواهید کرد؟ مانند بسیاری از وضعیتها در نظریه بازیها در اینجا نیز میتوان با فکر کردن به انگیزههای رقیب، دریافت که تصمیم درست کدام است. دروازهبان تلاش میکند تا رفتار شما را پیشبینی و سپس به سمت چپ یا راست دروازه برود. اگر او درست حدس بزند، شانس خوبی در پیشبینی رفتار شما داشته است و اگر خیر، احتمالاً شما گل میزنید. این بازی، یک بازی با حاصلجمع صفر است. در بازی با حاصلجمع صفر، باخت یک بازیکن، برد دیگری است؛ لذا مجموع نتایج صفر است.
بازیهای بسط یافته
آنچه تا به اینجا در موردش صحبت کردیم، همگی بر دو بازیکن، استوار بودند. دو بازیکنی که بهصورت همزمان یک کنش را انتخاب میکنند. اما نوع دیگری از بازی وجود دارد که ابتدا یک بازیکن حرکت و سپس دیگری بر اساس نحوه حرکت او، انتخاب میکند که باید چه کاری انجام دهد. این بازی یک بازی بسط یافته است. در بازیهای بسط یافته، راهبردها کمی غنیتر از بازیهای هم زمان است. شطرنج مثالی برای این ماجراست. در شطرنج، بازیکنان بهصورت همزمان دست به انتخاب نمیزنند. بلکه یکی اول حرکت میکند و دومی بر اساس حرکات نفر اول، حرکت خود را انتخاب میکند.
بازگشت به عقب
آسانترین رویکرد در یک بازی بسط یافته، استفاده از بازگشت به عقب است. بازگشت به عقب، یعنی فرایند حل یک بازی بسط یافته که در آن در مرحله نخست، تصمیم آخرین حرکتکننده در نظر گرفته میشود. باتوجهبه تصمیم آخرین حرکتکننده، ما سپس دومین حرکتکننده را از آخر مدنظر قرار میدهیم. این نام برگرفته از این واقعیت است که این روند از انتهای بازی شروع شده و به سمت عقب به حل مسئله میپردازد.
مزیت بازیگر اول، اقدام تعهدآور و تلافیجویی
در بازی اگر نخستین بازیکن، منفعتی بیشتر از بازیکن اول به دست آورد، میگوییم این بازی متوالی، دارای ویژگی مزیت بازیگر نخست است؛ بنابراین زمانی میگوییم کی بازی دارای مزیت بازیگر نخست است که اولین بازیکنی که در یک بازی متوالی، کنشی انجام دهد، از این کار سود ببرد.