Oyun Teorisi (Game Theory)

Sedat Onat
10 Ara 2025
27 dakikada okunur

Güncelleme tarihi: 31 Ara 2025

“Stratejik düşünmek, sadece hamleyi değil; hamlenin yaratacağı dünyayı da görmektir.”

Oyun Teorisi (Game Theory) Nedir?

Günlük hayatta verdiğimiz kararların büyük bölümü sadece bize bağlı değildir; çoğu zaman karşımızdakinin ne yapacağı, bizim ne yapmamız gerektiğini belirler. Bu durum; müzakerelerden fiyat savaşlarına, diplomatik ilişkilerden tedarik zinciri yönetimine kadar uzanan geniş bir alanda görünür. Oyun Teorisi (Game Theory) tam da bu “Karşılıklı Bağımlılık” içinde işleyen karar süreçlerini anlamaya yarayan matematiksel–davranışsal çerçevedir.

“Oyun” kelimesi kulağa çocukça gelebilir. Ama “Oyun Teorisi”, hayatın her alanında kararlarımızı etkileyen ciddi bir stratejik düşünme çerçevesidir.

Bu yazıda Oyun Teorisi (Game Theory) kavramını iki oyunculu etkileşimler üzerinden ele alıyoruz. Bunun nedeni, karmaşık çok-taraflı sistemlerde bile stratejik davranışların temelinde iki taraf arasındaki karşılıklılık dinamiklerinin bulunmasıdır. İkili modeller, iş birliği–ihanet döngülerini en sade ve en öğretici biçimde ortaya koyduğu için Oyun Teorisi (Game Theory) literatüründe standart bir soyutlama düzeyidir.

Oyun Teorisi (Game Theory)’nin temeli, 1944’te John von Neumann ve Oskar Morgenstern’in Theory of Games and Economic Behavior eseriyle atılmıştır. 1950'lerde John Nash’in geliştirdiği Nash Dengesi [1] kavramı, stratejik davranışın matematiğini kalıcı olarak değiştirdi. 1970’lerden itibaren biyoloji (Maynard Smith), 1990’lardan sonra bilgisayar bilimi ve yapay zekâ alanıyla genişledi.

Bu dinamiği en çarpıcı biçimde ortaya koyan model ise Tutsak İkilemi (PD: Prisoner’s Dilemma)'dir; modern Oyun Teorisi (Game Theory) uygulamalarının omurgasını oluşturan temel düşünce deneyidir.

İçindekiler: Bu Yazıda Neler Var?

Bu yazı, farklı başlıklardan oluşan kapsamlı bir rehber niteliğindedir. İlgilendiğiniz bölüme hızlıca ulaşmak için aşağıdaki içindekiler bölümünü kullanabilirsiniz:

Tutsak İkilemi (PD: Prisoner’s Dilemma)
Tekrarlanan Oyunlar ve Strateji Ailesi
Ön Kabuller
Stratejiler
Axelrod Turnuvaları ve Başarının 4 Kuralı
Öngörülebilir Olmak Kötü mü?
Stratejiler Stabil mi Dinamik mi Olmalı?
Doğru İlişkiye Doğru Strateji: Pratik Karar Matrisi
Oyun Teorisi'nin Amacı Nedir?
Angajman Kurallarını Baştan Belirlemek
Oyun Teorisi’ni Bilmek Bize Ne Kazandırır?
En İyi Strateji Nedir?
Oyun Teorisi'ni Deneyimleyin
Oyun Teorisi’nin Kullanım Alanları
Tedarik Zinciri’nde Örnek Uygulamalar
Özet / Kapanış
Anket
İlgili Makaleler
Kaynaklar ve İleri Okuma

Tutsak İkilemi (PD: Prisoner’s Dilemma): Tüm Stratejilerin Temel Modeli

“Bazen herkes kaybeder, çünkü kimse ilk adımı atmaya cesaret etmez.”

Oyun teorisinin en bilinen modeli Tutsak İkilemi (PD: Prisoner’s Dilemma)’dir. İki oyuncu, birbirinden bağımsız şekilde “İş Birliği (C: Cooperation)” veya “İhanet (D: Defect)” seçer. Aşağıdaki senaryolar, iki oyuncunun farklı karar kombinasyonlarında karşılaşacağı cezaları gösterir (Düşük rakam daha iyi):

İkisi de birbirine sadık kalırsa (C) : 1 + 1 yıl = Karşılıklı kazanç
Biri diğerine ihanet ederse (C+D): İhanet eden (D: Defect) yalnızca 6 ay alır (T: Temptation), sadık kalan (C: Cooperation) ise 5 yıl alarak en kötü sonuca düşer (S: Sucker's Payoff).
İkisi de birbirine ihanet ederse (D+D): 3 + 3 yıl = Düşük ama güvenli getiri

Tutsak İkilemi’nin özü şudur: Oyuncular için ortaya çıkan sonuçların bir sıralaması vardır:

T > R > P > S

(Temptation > Reward > Punishment > Sucker’s payoff)

Bu 4 değer, Tutsak İkilemi'nin (Mahkûm İkilemi / PD: Prisoner’s Dilemma) tüm paradokslarını yaratır:

T (Temptation): Rakip işbirliği yaparken ihanet ederek elde edilen kısa vadeli büyük kazanç
R (Reward): Karşılıklı işbirliğinin uzun vadede sağladığı ortak fayda
P (Punishment): Karşılıklı ihanette elde edilen düşük ama güvenli sonuç
S (Sucker’s payoff): Sen işbirliği yaparken rakibin sana ihanet etmesiyle aldığın en kötü sonuç

Tutsak İkilemi’nin özünde şu vardır: Kişi kendi çıkarı için ihanet etmeyi (T: Temptation) seçmek ister, ama herkes iş birliği yapsa (R: Reward) toplamda çok daha iyi bir sonuç ortaya çıkar.

Bu 4 olası karar kombinasyonu aşağıdaki tabloda gösterilmektedir:

**Oyun Teorisi (Game Theory) Prisoner’s Dilemma Payoff Tablosu**

Not: Daha kısa hapis süresi, oyuncu için daha yüksek ödül anlamına gelir (T > R > P > S).

Kısa vadede bireysel çıkar (D), uzun vadede herkesin kaybına yol açabilir:

Silahlanma yarışı,
Fiyat kırma savaşları,
Yönetim–çalışan çatışmaları,
Diplomatik misillemeler,
ve benzeri durumlar.

Yukarıdakilerin hepsi Tutsak İkilemi (PD: Prisoner’s Dilemma)’nin gerçek hayattaki izdüşümüdür.

İlginçtir ki bu oyunda her iki oyuncunun da ihanet ettiği (D+D) sonuç Nash Dengesi [1] ’dir; çünkü hiç kimse, tek başına kararını değiştirerek daha iyi bir sonuç elde edemez. Ancak bu denge, toplam faydayı en aza indirdiği için stratejik etkileşimlerde ortaya çıkan “Kolektif İrrasyonalite”nin en çarpıcı örneklerinden biridir.

Aslında herkes kendi tarafında… İşte bu yüzden bireysel akıl çoğu zaman ortak akıl üretmez.

Bu sebeple Tutsak İkilemi (PD: Prisoner’s Dilemma), farklı stratejilerin gerçekte nasıl davrandığını görmek için mükemmel bir test ortamıdır.

Not: "Tutsak İkilemi" tanımı, bazı kaynaklarda "Mahkûm İkilemi" olarak geçmektedir.

Tekrarlanan Oyunlar ve Strateji Ailesi

“Geleceği olan ilişkilerde her hamle, bir borç senedi gibi geri döner.”

Tekrarlanan PD (Iterated PD), tek seferlik oyuna göre çok daha derin ve dinamik bir yapıya sahiptir. Çünkü bugün yaptığın etki, yarın alacağın tepkiyi şekillendirir. Buna oyun teorisinde, gelecekteki etkileşimlerin bugünkü davranışı şekillendirmesini anlatan “Geleceğin İzdüşümü (Shadow of the Future)” denir

Bu bağlamda 7 ana strateji özellikle öne çıkar (genel kabul):

TFT – Tit for Tat (The Mirror)
TFTT – Tit for Two Tats (The Tolerant Judge)
GTFT – Generous Tit for Tat (The Forgiver)
WS-LS – Win–Stay, Lose–Shift (The Learner)
Joss – (The Schemer)
Friedman / Grim Trigger (The Executioner)
TLW – The Lone Wolf / Always Defect (The Predator)

Bu stratejiler arasında, literatürdeki klasik yaklaşımlardan hareketle yazar tarafından kavramsallaştırılan ve ilişkiye doğrudan güvenle değil temkinle başlayan bir yaklaşım da yer almaktadır: STFT – Sticky Tit for Tat (The Anchor).

STFT – Sticky Tit for Tat (The Anchor), ilk hamlede iş birliği (C) ile başlar; hatta rakibin ilk hatasında bile ilişkiyi hemen sertleştirmek yerine iş birliğini korumayı tercih eder. Ancak tekrar eden davranışlarda “çıtayı” devreye alır: Sertleştiğinde (D’ye geçtiğinde), yeniden iş birliğine (C) dönmek için acele etmez; bunun için rakibin üst üste iki kez iş birliği (C) göstermesini şart koşar. Bu yönüyle STFT, “hemen kopan” sert stratejiler ile “her şeyi tolere eden” yumuşak stratejiler arasında dengeyi sabitleyen bir çıpa görevi görür.

Aşağıda bu stratejileri eksiksiz ve homojen bir yapı içinde, karşılaştırmalı olarak analiz ediyoruz:

Ön Kabuller

Hayat, ne oyun teorisi kitaplarındaki gibi tam bilgiye dayalı laboratuvar ortamıdır, ne de her zaman adil ve pürüzsüz bir cennet senaryosu. Sonraki bölümde detaylandıracağımız stratejileri okurken, aşağıdaki ön kabulleri akılda tutmak faydalı olacaktır. Bu ön kabuller sayesinde stratejiler “gerçek hayata yakın” bir çerçevede yorumlanabilir.

İlişkiler pürüzsüz değildir.

Gerçek hayatta iletişim hataları, yanlış anlamalar, duygusal tepkiler ve dışsal şoklar vardır. Bu nedenle hiçbir strateji, “hiç hata olmayacakmış” gibi düşünülmemelidir.

Herkes kendi tarafındadır.

Oyuncular çoğu zaman kendi çıkarlarını maksimize etmeye çalışır; tamamen “melek” ya da tamamen “şeytan” değildir. Bu nedenle iş birliği de ihanet de potansiyel olarak her ilişkide vardır.

Bazen arada kaybederek kazanırsın.

Kısa vadede birkaç el kaybetmek (örneğin GTFT’nin affediciliği) uzun vadede daha güçlü bir iş birliği ve toplam kazanç üretebilir. Tek tur değil, tekrar eden oyunlar yani uzun vade önemlidir.

Tüm oyuncular tam rasyonel değildir.

İnsanlar sınırlı bilgiyle, duygularıyla ve alışkanlıklarıyla karar verir. Bu yüzden stratejiler yalnızca matematiksel değil, psikolojik gerçeklik içinde de değerlendirilmelidir.

Strateji bağlama bağlıdır.

Aile, iş, tedarikçi, rakip firma veya devletler arası ilişkiler aynı oyunu oynatmaz. Aynı strateji her yerde aynı sonucu vermez; bu yüzden strateji seçimi, ilişki türü ve risk düzeyiyle birlikte düşünülmelidir.

Güven her ilişkide başlangıç noktası değildir.

Bazı ilişkilerde güven, süreç içinde kazanılır. STFT – Sticky Tit for Tat (The Anchor) bu bakış açısını temsil eder: İlişkiye yumuşak değil, kontrollü başlanır. Karşı taraf iş birliği gösterdiğinde ise sistem anında yumuşar.

Stratejiler

TFT – Tit for Tat (The Mirror)

“Sen yaptın, ben de yaparım.”

Tit for Tat, oyun teorisinin en ünlü ve en etkili stratejilerindendir. İlk turda koşulsuz iş birliği yapar (çünkü rakibin geçmiş davranışı yoktur); sonraki her turda rakibin bir önceki hamlesini aynen kopyalar. Bu sadelik, stratejinin başarısının anahtarıdır.

Oyun teorisi literatüründe Tit for Tat, “Reciprocity (karşılıklılık) ilkesinin en rafine matematiksel temsili” olarak kabul edilir.

TFT – Tit for Tat (The Mirror)‘in 4 temel özelliği vardır:

Nazik (Nice): İlk hamlede asla saldırmaz.
Misillemeci (Retaliatory): İhaneti karşılıksız bırakmaz.
Affedici (Forgiving): Rakip tekrar C (Cooperation) oynarsa hemen barışır.
Anlaşılır (Clear): Basit ve şeffaf olduğu için rakip ne bekleyeceğini bilir; bu da güven oluşturur.

TFT’nin zayıf noktası ise Hata Toleransı’dır (Gürültü / Noise). Eğer oyuncu istemeden D (Defect) oynar veya rakip hamleyi yanlış algılarsa, iki taraf istemeden uzun bir misilleme döngüsüne sıkışabilir. Buna rağmen Axelrod turnuvalarında birinci olması, onun “Adil rekabetin altın standardı” olduğunu kanıtlar.

Gerçek hayatta TFT; diplomatik karşılıklılık, iş ilişkilerinde “Ben nasılsam, Sen de öylesin.” ilkesi, müzakerelerde güven tesis edilmesi gibi alanlarda karşılık bulur.

İş Hayatı Örneği: Ülkelerarası Diplomatik Misilleme

Türkiye bir Avrupa ülkesine vize kolaylığı getiriyor → Karşı ülke de aynı kolaylığı uyguluyor.
Sonra karşı ülke bir yaptırım koyuyor → Türkiye de benzer bir misilleme yapıyor.
Karşı taraf tekrar normalleşmeye gidiyor → Türkiye de iş birliğine dönüyor.

Bu tam bir TFT döngüsüdür: İlk hareket “nazik”, izleyen tüm hareketler ise “ayna” davranışıdır.

Kişisel Hayat Örneği: WhatsApp mesajlarına yanıt ritmi

Sen dakik cevap veriyorsun → Karşı taraf da öyle.
O geç yazmaya başlıyor → Sen de geciktirmeye başlıyorsun.
Karşı taraf tekrar hızlı cevap verdiğinde → Sen de hızlanıyorsun.

TFTT – Tit for Two Tats (The Tolerant Judge)

“Tek ihanet affedilir, tekrarında yaptırım.”

TFT'in daha sabırlı versiyonu olan TFTT, rakip 2 kez üst üste ihanet etmeden misilleme yapmaz. Bu özellik, iletişim hatalarının yaygın olduğu ortamlarda büyük avantaj sağlar; çünkü tek bir hata sistemi bozmaya yetmez.

Bu mantık, gerçek hayatta birçok ilişkide karşımıza çıkar. Örneğin tedarik zincirinde: Bir tedarikçinin gecikmesi ilk seferde “affedilebilir”, fakat ardışık 2 aksama yaptırım getirir.

TFTT’nin zayıf yönü, manipülatif rakiplere açık olmasıdır. Rakip C–D–C–D oynarsa TFTT asla misillemeye geçmez. Axelrod’un ikinci turnuvasında bu yüzden başarısız olmuştur; çünkü manipülatif stratejiler, bu aşırı sabrı sistematik şekilde istismar edebilmiştir.

Yine de güven temelli bir toplulukta, ilişkilerin kolay bozulmaması gereken yapılarda (aile, uzun vadeli ortaklıklar, diplomatik temaslar) TFTT güçlüdür.

İş Hayatı Örneği: Yöneticinin çalışan hatalarını yönetmesi

Bir çalışan bir defa raporu geç veriyor → Yönetici bunu görmezden geliyor.
Aradan bir ay geçiyor, yine gecikme oluyor → Yönetici artık uyarı veriyor.

“Bir hata affedilir, tekrarında tepki gelir.”

Kişisel Hayat Örneği: Aile/Arkadaş İlişkisi

Bir arkadaş buluşmaya bir kez geç geliyor → Problem yapılmıyor.
İkinci kez aynı olay yaşanınca → Artık tepki veriliyor.

GTFT – Generous Tit for Tat (The Forgiver)

“Küçük ihlaller büyütülmez; işbirliği korunur.”

GTFT, TFT’in gürültülü ortamlara (hata ve yanlış sinyaller) uyarlanmış, daha affedici bir versiyonudur. Rakip ihanet ettiğinde hemen misilleme yapmak yerine, belirli bir olasılıkla affeder (örneğin %10 gibi küçük bir ihtimal). Bu küçük “cömertlik” payı, yanlış anlaşılmanın tetiklediği misilleme döngülerini kırar. Bu nedenle GTFT, karmaşık veya yanlış sinyallerin yaygın olduğu ilişkilerde iş birliğini yeniden tesis etme kapasitesiyle öne çıkar.

GTFT özellikle teknik hataların, iletişim gecikmelerinin veya yanlış yorumlamaların çok olduğu sistemlerde zirvededir. Axelrod’un gürültülü turnuvalarında, tüm stratejiler içinde en yüksek başarıyı elde etmiştir.

Gerçek hayatta GTFT;

Diplomaside küçük ihlalleri tolere etmek,
Kurumsal ilişkilerde güveni yıkmadan uyarı vermek,
İş dünyasında tedarikçi hatalarını tek seferlik affetmek

gibi pek çok davranışı temsil eder.

GTFT’nin riski ise, aşırı affediciliğin kötü niyetli taraflarca istismar edilebilmesidir. Bu yüzden GTFT, kötü niyetin düşük olduğu ancak hataların kaçınılmaz olduğu ortamlarda en güçlü stratejidir.

İş Hayatı Örneği: Şirket–Tedarikçi İlişkisi

Tedarikçi yanlış fatura kesiyor → Şirket bunu “bir seferlik hata” deyip affediyor.
İkinci seferde bile ilişkiyi hemen bozmuyor → Alternatif çözüm öneriyor.
Ancak kötü niyet sezilirse, artık D’ye (sert davranışa) geçiyor.

Uluslararası Anlaşmalar

Bir ülke iklim protokolündeki küçük bir yükümlülüğü geciktiriyor.
Diğer ülkeler hemen yaptırım uygulamak yerine uyarı/ek süre tanıyor.

Bu davranış, ülkelerin küçük ihlalleri tolere ederek büyük iş birliği çerçevesini koruma isteğini yansıtır.

STFT – Sticky Tit for Tat (The Anchor)

“İlişki kopmaz; ama yön değiştirmek emek ister.”

STFT, yazar tarafından önerilen, Tit for Tat’in iş dünyasına uyarlanmış, istikrar odaklı bir versiyonudur. Strateji ilk hamlede iş birliği (C) ile başlar ve hatta rakibin ilk hatasında bile ilişkiyi hemen sertleştirmek yerine iş birliğini korumayı tercih eder. Ama bu yumuşaklık sınırsız değildir. STFT, tekrar eden davranışlarda “çıtayı” devreye alır ve ilişkiyi ani tepkilerle değil, eşiklerle yönetir.

STFT’nin ayırt edici özelliği şudur: Strateji sertleştiğinde (D’ye geçtiğinde), yeniden iş birliğine (C) dönmek için acele etmez; bunun için rakibin üst üste iki kez iş birliği (C) göstermesini şart koşar. Bu yapı, hem tek seferlik hataların sistemi bozmasını engeller hem de davranış değişikliğinin “tesadüf değil, niyet” olduğundan emin olunmasını sağlar.

Bu nedenle STFT, güvenin kolay bozulmaması ama kolay da geri verilmemesi gereken ilişkilerde öne çıkar. Strateji, ilişkiyi bir noktaya sabitleyen bir çıpa (anchor) gibi çalışır.

STFT (Sticky Tit for Tat) özellikle;

Davranışların dalgalı olduğu,
Tek seferlik hataların sık yaşandığı,
Ama sistematik suistimal riskinin de bulunduğu

ortamlarda etkilidir.

Gerçek hayatta STFT (Sticky Tit for Tat);

Yönetici–çalışan ilişkilerinde “bir hata affedilir ama alışkanlık olmaz” yaklaşımını,
Uzun vadeli iş ortaklıklarında güvenin kademeli olarak yeniden inşa edilmesini,
Kurumsal yapılarda “net ama koparmayan” disiplin anlayışını

temsil eder.

STFT’nin riski, aşırı katı uygulanması hâlinde ilişkiyi gereğinden fazla yavaşlatabilmesidir. Bu yüzden STFT, ne tamamen yumuşak ne de refleksif sertliğin doğru olduğu dengeli ama disiplinli ortamlarda en iyi sonucu verir.

İş Hayatı Örneği: Yönetici – Ekip Üyesi İlişkisi

Çalışan bir raporu ilk kez geç teslim ediyor → Yönetici bunu tolere ediyor (C).
Aynı durum tekrar edince → Yönetici uyarı veriyor ve süreci sertleştiriyor (D).
Çalışan sonraki iki raporu zamanında teslim ediyor → Yönetici tekrar iş birliği moduna dönüyor (C).

Mesaj nettir: “Hata yapabilirsin, ama güveni geri kazanmak tutarlılık ister.”

Kurumsal İlişki Örneği

Bir iş ortağı süreçten sapıyor → İlk seferde ilişki koparılmıyor.
Sapma tekrar edince → Şartlar sıkılaştırılıyor.
Karşı taraf iki dönem üst üste taahhütlerine uyuyor → Normal işleyişe geri dönülüyor.

Bu yaklaşım, STFT’nin sabırlı ama yapışkan (sticky) karakterini yansıtır.

WS-LS – Win–Stay, Lose–Shift (The Learner / Pavlov)

“Kazandıran yaklaşım korunur, kaybettiren revize edilir.”

WS-LS, rakibin davranışını değil, kendi aldığı sonucun kalitesini analiz eder.

Eğer aldığı payoff iyi (R ≥ 1; yani sonuç faydalı) ise aynı hamleyi sürdürür;
Eğer kötü sonuç (R=0) alırsa hamlesini değiştirir.

Psikolojideki ödül–ceza temelli öğrenme prensibi ile aynı mantıkta çalışır.

Tutsak İkilemi'nde (PD: Prisoner's Dilemma) WS-LS’nin işleyişi şöyledir:

C–C veya D–D → Kal (stay)
C–D → Değiş (shift)
D–C → Değiş (shift)

Bu mekanizma, WS-LS’i tam anlamıyla “öğrenen” bir strateji hâline getirir. Özellikle karmaşık rakipler karşısında veya gürültülü ortamlarda (hata ve yanlış sinyaller) çok dayanıklıdır çünkü hatadan hızla çıkar ve kazanan kalıba uyum sağlar.

Gerçek hayatta WS-LS:

Bir şirketin başarılı bir pazarlama kampanyasını sürdürmesi ama başarısız olanı hemen değiştirmesi,
İnsan ilişkilerinde verimli olan davranışları devam ettirip zararlı olanları bırakmak,
Tedarik zincirinde çalışan bir modeli sürdürmek ama problemli tedarikçiyi değiştirmek

gibi örneklerle görünür.

Bu davranış şekli, Pavlov’un koşullanma deneylerinde gözlenen “ödül → davranışı tekrar et, ceza → davranışı değiştir” modeline benzediği için bu stratejiye literatürde “Pavlov” adı da verilmiştir.

İş Hayatı Örneği: Pazarlama kampanyası

Firma yeni bir kampanya başlatıyor → Satışlar artıyor → Kal (stay)
Bir sonraki ay satışlar düşüyor → Kampanya değiştiriliyor → Değiş (shift)

Tam WS-LS mantığı: “Kazanıyorsan aynen devam et; kaybediyorsan stratejiyi değiştir.”

Kişisel Hayat Örneği: Sağlık / Spor

Bir sporcu bir beslenme planıyla iyi performans alıyor → Sürdürür.
Performans düşünce → Planı değiştirir.

Joss Strategy (The Schemer)

“İşbirliği sürdürülür, uygun anda küçük ihanet edilir.”

Joss Strategy (The Schemer) “Fırsatçı tedarikçi davranışı.” Joss, Tit for Tat’in manipülatif bir versiyonudur. TFT gibi başlar, fakat rakip C (Cooperation) yaptığı hâlde rastgele (%10 civarı) D (Defect) oynar. Bu küçük ihanet hamleleri kısa vadede ekstra kazanç yaratabilir; fakat uzun vadede güveni yok eder.

Joss’un mantığı kısaca şudur: “Genel olarak dostça görün, ama arada bir rakibi gafil avla.”

Problem şu: Joss’un bu davranışı, özellikle Tit for Tat (TFT) gibi misillemeci rakipler karşısında kendi kendine zarar veren sonsuz bir “Yankı Etkisi” (Echo Effect) yaratır. Joss’un durduk yere attığı rastgele bir kazık, TFT’yi misillemeye zorlar. Bu misilleme, bir sonraki turda Joss’un tekrar misilleme yapmasına neden olur ve böylece iki taraf da bir daha içinden çıkamayacakları bir intikam döngüsüne hapsolur. Sonuçta her iki taraf da düşük puana mahkûm olur.

Gerçek hayatta Joss;

Arada bir fırsatçılık yapan ortaklar,
Küçük manipülasyonlarla avantaj sağlamaya çalışan yöneticiler,
Kısa vadeli çıkar için güveni yıpratan aktörler,

olarak karşımıza çıkar.

Kısa vadede “kurnaz”, uzun vadede ise güveni yok ettiği için “zararlı” bir stratejidir.

Gerçek Hayat Örneği: Fırsatçı Tedarikçi

Tedarikçi genelde iyi fiyat veriyor (C davranışı).
Ancak ara sıra fırsat gördüğünde fiyatı gereğinden fazla artırıyor (rastgele D).
Şirket bunu fark ettiğinde artık güveni kırılıyor ve alternatif arıyor.

Joss’un yaptığı: “Ara sıra ihanet ederek küçük avantajlar çalmak.”

Kişisel Hayat Örneği:

Bir arkadaş genelde dürüst.
Ama bazen kendi çıkarına olacak şekilde seni “yolda bırakıyor”. Bu da Joss’un rastgele %10 D (Defect) davranışının günlük hayattaki karşılığıdır.

Friedman / Grim Trigger (The Executioner)

“Tek ihlal, daimi kopuş.”

Friedman / Grim Trigger, strateji dünyasının acımasız infazcısıdır. İlk turda iş birliği yapar; ancak rakip bir kez bile ihanet ederse şu kural devreye girer: “Bir kez ihanet edersen, ilişki biter. Sonsuza kadar D.”

Bu yaklaşım, nükleer caydırıcılık modeline benzer; çünkü tek bir saldırının geri dönüşü olmayan bir karşılık doğuracağını varsayar. Teorik olarak mükemmel iş birliği sağlayabilir; çünkü rakip, tek bir ihanetin geri dönüşü olmayan bir ceza doğuracağını bilir.

Ancak bu strateji inanılmaz kırılgandır; tek bir yanlış anlaşılma, teknik hata veya gecikmiş bir mesaj bile tüm ilişkiyi geri dönüşü olmayan bir çatışmaya dönüştürebilir.

Buna rağmen, ciddi disiplin gerektiren yapılarda (Örneğin: Uluslararası silah anlaşmaları, nükleer caydırıcılık, yüksek riskli sözleşmeler) Grim Trigger hâlâ çok değerli bir modeldir.

İş Hayatı Örneği: Sözleşmelerde "Bir İhlalde Sona Erme" Maddesi

Bir inşaat sözleşmesinde tedarikçi deadlines’a uymazsa → kontrat tamamen feshedilir.
Tek bir ihlalin cezayı geri dönüşsüz tetiklemesi = Grim Trigger.

Ülke Politikası Örneği

NATO’nun “Bir üyeye saldırı = Tümüne saldırı” prensibi. Bir kez ihlal olursa geri dönüşü olmayan bir karşılık mekanizması çalışır.

TLW – The Lone Wolf / Always Defect (The Predator)

“Her koşulda işbirliği reddedilir.”

The Lone Wolf, tüm stratejiler içinde en saldırgan ve en pesimist olanıdır: Her durumda D oynar. Rakip ne yaparsa yapsın asla iş birliği yapmaz.

Kısa vadede saf stratejileri sömürebilir; ancak uzun vadede herkes tarafından tanınır, izole edilir ve dışlanır. Tekrarlanan oyunlarda TLW’nin kaderi değişmez: düşük getiri, sıfır iş birliği, uzun vadeli başarısızlık.

TLW “Zero-Sum Mindset” yani “Ben kazanayım, Sen kaybet” felsefesinin matematiksel karşılığıdır.Ekonomide, diplomaside, şirket içi rekabetlerde sıklıkla karşımıza çıkan bu zihniyet sürdürülebilir değildir.

Kaybeden zihniyeti, sıfır-toplamlı oyun zihniyetidir. Satranç ve poker sıfır-toplamlı oyunlardır çünkü bir oyuncunun kazanması diğerinin kaybetmesine bağlıdır. Oysa ekonomi ve hayat sıfır-toplamlı bir oyun değildir.

Bu yüzden Lone Wolf tipi stratejiler kısa vadede güçlü görünse de, gerçek hayatın sıfır-toplamlı olmayan (non-zero-sum) yapısında uzun vadede kaybetmeye mahkûmdur.

Gerçek Hayat Örneği: Sürekli fiyat kıran agresif satıcı

Piyasadaki herkes makul marjlarla çalışırken,
Bir satıcı sürekli damping yapıyor → Herkesi D’ye zorlayarak pazarı bozuyor.
Kısa vadede müşteri çekiyor, uzun vadede kimse onunla çalışmak istemiyor.

Kişisel Hayat Örneği: Fedakârlık yapılan arkadaş

Hep senin fedakârlık yaptığın bir arkadaş var.
O ise asla katkı sağlamıyor, hep alıcı rolde.
Bir süre sonra herkes uzaklaşıyor.

Strateji Kıyaslaması

Yukarıda anlatılan stratejiler, tekrarlanan Tutsak İkilemi (PD: Prisoner’s Dilemma) çerçevesinde karşılaştırıldığında daha net anlaşılır. Her strateji; iş birliği üretme kapasitesi, hata/yanlış sinyallere dayanıklılık, sömürüye açıklık ve uzun vadeli tutarlılık açısından farklı sonuçlar verir.

Bu bölümde yer alan tablolar, stratejilerin aynı durumlara nasıl tepki verdiğini ve hangi koşullarda avantajlı veya dezavantajlı hâle geldiğini özetler.

Oyun Teorisi Strateji Davranış Matrisi ve Performans Özeti

**Oyun Teorisi (Game Theory) Strateji Davranış Matrisi ve Performans Özeti**

C: Cooperate (İş birliği)

D: Defect (İhanet / Sözden Dönmek)

2D: 2 Kez üst-üste Defect (İhanet)

2C: 2 Kez üst-üste Cooperate (İş birliği)

R≥1: Sonuçtan bağımsız, ödül yeterli

R=0: Sonuçtan bağımsız, ödül yetersiz

LT: Long Term / Uzun Vade

%: Spontane şekilde karar değişimi yüzdesi (yaklaşık)

Puanlama: 1: Başarısız Strateji — 10: En İdeal Strateji

Tedarik Zinciri Portalı Puanlaması

Puanlama tablosu, her stratejiyi 5 temel kriter üzerinden ölçerek hem mutlak hem de diğer stratejilere göre relatif bir karşılaştırma sunar.

Puanlama: 1: Başarısız Strateji — 10: En İdeal Strateji

Axelrod Turnuvaları ve Başarının 4 Kuralı

Bu noktaya kadar oyun teorisini, Tutsak İkilemi (PD: Prisoner’s Dilemma)’ni ve farklı stratejilerin nasıl çalıştığını kavramsal olarak ele aldık. Ancak bu stratejilerin gerçekten işe yarayıp yaramadığını anlamak için yalnızca teori yeterli değildir.

Asıl kritik soru şudur: Bu stratejiler, tamamen kendi çıkarını düşünen aktörlerin bulunduğu uzun vadeli ve gerçekçi etkileşimlerde nasıl sonuçlar üretir?

Siyaset bilimci Robert Axelrod tarafından 1980’lerin başında düzenlenen turnuvalar, tam da bu soruya cevap vermek için yapılmıştır. Axelrod’un çalışmaları, işbirliğinin (Cooperation) bencil bireyler arasında bile nasıl ortaya çıkabileceğini ve sürdürülebileceğini göstermesi açısından oyun teorisi tarihinde bir dönüm noktasıdır.

Bu turnuvalar, teorik varsayımların ötesine geçerek stratejilerin uzun vadeli performansını deneysel ve karşılaştırmalı biçimde test etmeyi amaçlamıştır.

1) Turnuvaların Amacı ve Yapısı

Axelrod’un temel sorusu şuydu: “Tamamen bencil aktörlerin olduğu bir ortamda, işbirliği nasıl doğar?”

Bu soruyu test etmek için Axelrod, dünyanın farklı yerlerinden oyun teorisyenlerini Tekrarlanan Tutsak İkilemi (Iterated Prisoner’s Dilemma) oynayacak bilgisayar programları (stratejiler) göndermeye davet etti.

Format:
Her strateji;
- diğer tüm stratejilerle,
- kendi kopyasıyla,
- rastgele hamle yapan bir programla (“Random”)

karşı karşıya geldi.

Puanlama:
- Karşılıklı işbirliği (C,C) → 3 puan
- Karşılıklı ihanet (D,D) → 1 puan
- Biri ihanet edip diğeri işbirliği yaparsa:
  - İhanet eden → 5 puan (Temptation)
  - İşbirliği yapan → 0 puan (Sucker’s Payoff)

Şekil 1: Axelrod Turnuvası Kazanç Matrisi (Payoff Matrix)

Süre:
İlk turnuvada her eşleşme 200 tur sürdü.

2) İlk Turnuva ve Kazanan: Tit for Tat (Kısasa Kısas)

İlk turnuvaya 14 farklı strateji katıldı;

1) Nydegger - (Rudy Nydegger)

"Stooge" olarak da bilinir. Geriye dönük son 3 hamleye bakarak karar veren, genellikle işbirlikçi ama gerektiğinde cezalandıran karmaşık bir strateji.

2) First by Downing - (Leslie Downing)

"Kral yapıcı" (Kingmaker) olarak bilinir. Rakibinin davranışlarını modellemeye çalışır ve rakibin tepki verip vermediğini ölçer. Başlangıçta agresiftir.

3) Tit for Tat - Kısasa Kısas (Anatol Rapoport) - ! [Kazanan Strateji] !

Çok basittir. İlk hamlede işbirliği yapar, sonraki hamlelerde rakip bir önceki turda ne yaptıysa aynısını yapar (iyilik yapana iyilik, kötülük yapana kötülük).

4) Stein & Rapoport - (William Stein & Amnon Rapoport)

Rakibin ortalama puanını hesaplar ve buna göre işbirliği yapar.

(Not: Bu, Tit for Tat'ı gönderen Anatol Rapoport değil, başka bir Rapoport'tur).

5) Davis - (Morton Davis)

"Kin güden" (Grudger) türevi. İlk 10 hamlede işbirliği yapar, eğer rakip ihanet ederse o da ihanet etmeye başlar.

6) Friedman - Friedman / Grim Trigger (James Friedman)

"Acımasız tetik" stratejisi. Sürekli işbirliği yapar. Ancak rakip tek bir kez bile ihanet ederse, oyunun geri kalanı boyunca sürekli ihanet eder (asla affetmez).

7) Shubik - (Martin Shubik)

Rakip ihanet ettikçe ceza süresini uzatan (önce 1 tur, sonra 2 tur...) bir misilleme stratejisi.

8) Feld - (Scott Feld)

Tit for Tat'a benzer ancak işbirliği yapma olasılığı zamanla yavaşça düşer.

9) Tideman & Chieruzzi - (Nicolaus Tideman & Paula Chieruzzi)

Rakibin ihanetine misilleme yapar ama aynı zamanda bir "bağışlama" mekanizması vardır; rakip tekrar işbirliğine dönerse o da döner.

10) Tullock - (Gordon Tullock)

Rakibinden %10 daha az işbirliği yapmayı hedefler. Rastgeleliğe dayalı bencil bir stratejidir.

11) Grofman - (Bernard Grofman)

Olasılıksal (bayesian) bir strateji. Rakibin bir sonraki hamlesini önceki son 7 hamleye bakarak tahmin etmeye çalışır.

12) Name Withheld - (Anonim bir yüksek lisans öğrencisi)

Karmaşık bir olasılık hesabı kullanan ancak pratikte "rastgele" stratejisine çok benzeyen başarısız bir kod (en ayrıntılı stretejiydi ve 77 satırdan oluşmaktaydı).

13) Graaskamp - (James Graaskamp)

Genellikle Tit for Tat oynar, ancak 50'nci hamlede rakibi test etmek için kasıtlı olarak ihanet eder (D: Defect).

14) Joss - Joss (Johann Joss)

Tit for Tat gibidir ancak "sinsi"dir. Rakibi kışkırtmak için %10 ihtimalle durduk yere (rastgele) ihanet eder.

Yukarıdaki 14 stratejiye ek olarak Axelrod bir de Rastgele (Random) stratejisini eklemiştir.

15) Random

Tamamen rastgele kararlar verir. %50 ihtimalle işbirliği, %50 ihtimalle ihanet eder.

Toplamda 15 strateji yarışmıştır.

Katılımcılar arasında oldukça karmaşık, fırsatçı ve saldırgan (“nasty”) stratejiler bulunmasına rağmen, turnuvayı kazanan strateji Anatol Rapoport tarafından geliştirilen son derece basit bir algoritma olan Tit for Tat (TFT) oldu.

Tit for Tat’in işleyişi son derece yalındır:

Oyuna her zaman işbirliğiyle başlar.
Sonraki her turda rakibin bir önceki hamlesini aynen tekrar eder.

Sadece birkaç satırlık koddan oluşan bu strateji, karmaşık algoritmaları geride bırakarak turnuvayı 1'inci tamamladı.

**Axelrod Oyun Teorisi (Game Theory) Turnuvası İlk Tur Sonuçları**

3) Tit for Tat’in Başarısının 4 Temel İlkesi

Axelrod, turnuva sonuçlarını analiz ettiğinde başarılı stratejilerin ortak 4 özelliğe sahip olduğunu tespit etti:

Nazik (Nice): Asla ilk ihanet eden taraf olmaz. Gereksiz çatışmaları başlatmaz.
Misillemeci (Provocable): Rakip ihanet ederse hemen karşılık verir. Bu sayede sömürülmeyi engeller.
Affedici (Forgiving): Rakip tekrar işbirliğine döndüğünde, o da işbirliğine döner. Kin tutmaz (bu noktada Friedman/Grim Trigger gibi stratejiler başarısız olmuştur).
Net (Clear): Davranış kalıbı son derece anlaşılırdır. Rakip, uzun vadede işbirliğinin daha kârlı olduğunu kolayca fark eder.

4) İkinci Turnuva: Daha Zor Koşullar

İlk turnuvanın sonuçları yayımlandıktan sonra Axelrod ikinci bir turnuva düzenledi. Bu kez 62 strateji katıldı.

Katılımcılar 2 ana gruba ayrıldı:
1. İşbirliğine dayalı “nazik” stratejiler
2. Nazik stratejileri sömürmeye çalışan “kötü” (nasty) stratejiler
Oyunun bitişi rastgele yapıldı. Böylece “son turda ihanet” (end-game defect) davranışı engellendi.

Sonuç:Tüm bu daha zor ve bilinçli sömürü girişimlerine rağmen, Tit for Tat yine en başarılı strateji oldu.

5) Ekolojik (Evrimsel) Simülasyonlar

Axelrod, turnuvalardan sonra bir de ekolojik simülasyon çalıştırdı. Bu simülasyonda:

Başarılı stratejiler popülasyonda çoğaldı,
Başarısız olanlar zamanla elendi.

Başlangıçta sömürücü stratejiler hızlı yükseldi; ancak:

Söndürebilecekleri saf stratejiler kalmadığında,
Birbirleriyle karşılaştıklarında,

tamamı çöktü.

Uzun vadede işbirliğine dayalı “nazik” stratejiler popülasyonu domine etti.

6) Gürültü (Noise) ve Generous Tit for Tat

Gerçek dünyada iletişim hataları ve yanlış sinyaller kaçınılmazdır. Standart Tit for Tat, bu tür hatalarda karşılıklı misilleme döngüsüne girebilir. Bu problemi çözmek için Generous Tit for Tat (GTFT) geliştirilmiştir.

GTFT, rakibin ihanetine karşı belirli bir olasılıkla (%10) affedici davranarak:

Misilleme döngüsünü kırar,
İşbirliğini yeniden başlatır,
Gürültülü ortamlarda (hata ve yanlış sinyaller) daha istikrarlı sonuçlar üretir.

Bu Çalışmadan Çıkan Temel Katkılar

Axelrod turnuvaları yalnızca “hangi strateji kazandı?” sorusuna değil, neden kazandığı sorusuna da güçlü cevaplar verir:

Uzun vadeli başarı, kısa vadeli kazançtan daha değerlidir.
Aşırı sertlik (Grim Trigger) kadar aşırı yumuşaklık da başarısızdır.
Netlik ve tutarlılık, karmaşıklıktan üstündür.
İşbirliği, zayıflık değil; doğru tasarlandığında bir güçtür.
Gerçek hayata yaklaştıkça (gürültü, hata, belirsizlik), affedicilik kritik hâle gelir.

Bu nedenle Axelrod’un çalışmaları, yalnızca oyun teorisi literatüründe değil; iş dünyası, diplomasi, tedarik zinciri ve organizasyon davranışı alanlarında da bugün hâlâ referans kabul edilmektedir.

Axelrod Turnuvası Detaylı incelemesi için: [YouTube] Veritasium - This game theory problem will change the way you see the world

Öngörülebilir Olmak Kötü mü?

“Bir stratejinin değeri, onun tahmin edilmesinde değil; yanlış tahmin edilmesinin sonuçlarında yatar.” - John Nash

Oyun teorisinde dikkat çekici bir paradoks vardır: Bir stratejinin uzun vadede başarılı olabilmesi için hem öngörülebilir hem de belirli ölçüde öngörülemez yönler taşıması gerekir. Bu ikili yapı, sürdürülebilir iş birliğinin temel dinamiklerini anlamak açısından kritik önemdedir.

Stratejik davranış 2 temel boyutta değerlendirilir:

İş birliği arayan aktörler için öngörülebilirlik bir avantajdır.
- Stratejinin açık ve anlaşılır olması güven yaratır. Axelrod’un turnuvalarında Tit for Tat’ın karmaşık stratejilere karşı başarılı olması bunun kanıtıdır. Bir aktör, karşı tarafın tepkisini tahmin edebiliyorsa iş birliğini sürdürmek daha kolay hâle gelir. “Cooperate’a karşı Cooperate, Defect’e karşı Defect” mantığı şeffaf ve istikrarlı bir etkileşim zemini oluşturur.

Sömürü amaçlı aktörler için öngörülebilirlik bir zafiyettir.
- Kötü niyetli bir aktör, rakibin davranışını tam olarak öngörebiliyorsa bunu manipülasyon için bir fırsata dönüştürebilir. Bu nedenle Tit for Tat başarılı olsa da daha yumuşak varyantları (TFTT, GTFT) veya sonuç odaklı öğrenen stratejiler (WS-LS) zaman zaman istismar edilebilir. Aynı şekilde, her zaman iş birliği yapan stratejiler tamamen öngörülebilir yapıları nedeniyle kolayca sömürülür.

Bu çerçevede temel soru şudur: İdeal strateji öngörülebilir mi? Oyun teorisi bu soruya net bir yanıt verir: Strateji öngörülebilir olmalı, ancak istismar edilebilir olmamalıdır.

Dengeyi kurmaya çalışan stratejiler:

TFT: Yüksek öngörülebilirlik + düşük istismar riski
TTFT: Yüksek öngörülebilirlik + yüksek hata toleransı + gecikmeli caydırıcılık
GTFT: Öngörülebilirlik + hata toleransı + sınırlı affedicilik
STFT: Öngörülebilir + disiplinli + geç yumuşayan caydırıcılık
WS-LS: Sonuçlara göre adapte olan dengeli yapı

Dengeyi bozan veya tek uca savrulan stratejiler:

Joss: Öngörülemezlik yaratmaya çalışır ancak güveni zayıflatır
Friedman: Tamamen öngörülebilir fakat aşırı kırılgandır
TLW: Öngörülebilir, ancak uzun vadede başarısız ve sürdürülemez

Bu değerlendirme, iki genel ilkeyi açık biçimde ortaya koyar:

Tamamen öngörülemez olmak strateji değildir; kaotik bir davranış biçimidir.
Tamamen öngörülebilir olmak da strateji değildir; sömürüye açık ve savunmasız bir yapı oluşturur.

Etkin strateji, şeffaflık ile caydırıcılık arasında kurulan dengeli bir yapıyı gerektirir: Güven oluşturan öngörülebilirlik + istismara izin vermeyen misilleme kapasitesi.

Kurumsal hayatta zaman zaman “üst düzey yöneticilerin öngörülemez olması güç göstergesidir” şeklinde bir algı görülür. Bu yaklaşım kısa vadede caydırıcı bir etki yaratabilir; çünkü belirsizlik, karşı tarafın davranışlarını kontrol altında tutabilir. Ancak oyun teorisi ve organizasyon araştırmaları, bu tür bir liderlik biçiminin uzun vadede sürdürülebilir olmadığını göstermektedir. Öngörülemez liderlik, güveni azaltır, iş birliği ortamını zayıflatır ve çalışanlarda savunmacı davranışları artırır. Oyun teorisinin ortaya koyduğu sonuçlarla uyumlu biçimde, kurumsal yapılarda kalıcı başarı öngörülebilir fakat istismar edilemez davranış biçimleriyle sağlanır.

Stratejiler Stabil mi Dinamik mi Olmalı?

Gerçek hayatta her ilişki aynı kurallarla işlemez; insanların birbirine verdiği tolerans, bağlamdan bağlama büyük farklılık gösterir. Aile içi ilişkilerde, duygusal yakınlık ve geçmiş bağların etkisiyle bir kişinin sana birkaç kez zarar vermesine (Defect) göz yumabilirsin. Ancak aynı davranışı bir iş arkadaşından, bir tedarikçiden veya bir rakipten gördüğünde aynı toleransı göstermek çoğu zaman mümkün değildir, bazen gerekli de değildir. Bu durum, davranışın bağlama göre şekillenmesi gerektiğini gösterir.

Aile gibi güvenin yüksek olduğu alanlarda TFT veya GTFT doğal başlar. Ancak iş dünyasında, özellikle ilk temaslarda STFT daha gerçekçidir. Güven zamanla inşa edilir; baştan varsayılmaz.

Aslında mesele şudur:

Ailene davrandığın gibi dışarıya davranırsan sömürülürsün.
Dışarıya davrandığın gibi ailene davranırsan aileni dağıtırsın.

Bu nedenle tek bir “mükemmel strateji” yoktur; doğru strateji, ilişkinin niteliğine, taraflar arasındaki güven düzeyine ve etkileşimin riskine göre değişir.

Doğru İlişkiye Doğru Strateji: Pratik Karar Matrisi

“Strateji, sadece verdiğin tepki değildir; o tepkinin başlatacağı olaylar zinciridir.”

Her ilişki aynı oyunu oynamaz. Aynı insan; eşine, çocuğuna, yöneticisine, ekip arkadaşına veya tedarikçisine karşı aynı stratejiyle davrandığında, sonuçları öngöremeyeceği ve çoğu zaman önünü alamayacağı tepkilerle karşılaşabilir. Oyun Teorisi’nin en kritik katkısı da tam burada ortaya çıkar: Stratejiyi kişiye değil, ilişki türüne göre seçmek.

Aşağıdaki basitleştirilmiş ilişki–strateji matrisi, “iyi niyetli olmak” ile “sınır koymak” arasındaki dengeyi, bağlama göre nasıl kurmamız gerektiğini tek bakışta göstermeyi amaçlar.

**Doğru İlişkiye Doğru Strateji: Pratik Karar Matrisi**

Bu matrise yönetici ve üst yönetim ile ilişkiler bilinçli olarak dahil edilmemiştir. Bunun temel nedeni, bu seviyelerde hata (gürültü / noise) oranının olağan ilişkilere kıyasla çok daha yüksek olmasıdır. Öncelik karmaşası, zaman baskısı, dolaylı iletişim ve eksik bilgi nedeniyle yöneticiden gelen birçok davranış “niyetli ihanet” değil, sistemsel sapma niteliği taşır. Bu bağlamda matrise dayalı bir tepki üretmek, beklenenden çok daha sert ve asimetrik bir karşı tepkiyi tetikleyebilir. Dahası, güç dengesizliği nedeniyle bu tür tepkilerin yumuşaması, alt pozisyondaki aktöre kıyasla çok daha geç ve maliyetli olur. Bu nedenle yönetici ilişkileri, basit karar matrisleriyle değil; yüksek tolerans, süreç odaklı netlik ve gecikmeli sınır mekanizmalarıyla ele alınması gereken ayrı bir kategori olarak değerlendirilmelidir.

Bu matrisin iddiası, herkese tek bir “doğru strateji” önermek değildir. Aksine, doğru stratejinin ancak doğru ilişki bağlamında anlamlı olduğunu göstermektir. Aynı davranış bir ilişkide olgunluk göstergesi iken, başka bir ilişkide zafiyet ya da gereksiz sertlik olarak algılanabilir. Oyun Teorisi’nin asıl gücü de burada ortaya çıkar: reflekslerle değil, bağlamı okuyarak hareket etmeyi öğretir. İlişki türünü doğru tanımlayan, gürültüyü niyetten ayırabilen ve sınırlarını aceleyle değil zamanlamayla koyabilen aktörler, uzun vadede hem iş birliğini hem de itibarı sürdürülebilir biçimde inşa eder. Gerçek stratejik ustalık, hamlede değil; hangi oyunu oynadığını bilmekte yatar.

Oyun Teorisi'nin Amacı Nedir?

Oyun teorisinin amacı manipüle etmek değil; davranışların uzun vadede hangi sonuçları doğuracağını görmek ve bunu daha bilinçli kararlar almak için kullanmaktır. Yani sadece “insanlar neden böyle davranıyor?” sorusuna değil, “şimdi bunu yaparsam, ileride ne olur?” sorusuna da cevap arar.

Bu sayede hangi durumun iş birliğini güçlendirdiğini, hangi davranışın ilişkiyi bozduğunu ve hangi adımların uzun vadede seni avantajlı ya da dezavantajlı duruma getirdiğini daha net görmeyi sağlar.

Angajman Kurallarını Baştan Belirlemek

Gerçek hayatta her ilişki aynı değildir; her aktör aynı şekilde davranmaz. Bu nedenle, oyun teorisinde tek bir strateji seçip herkese aynı şekilde uygulamak çoğu zaman verimsizdir. Asıl önemli olan, kiminle nasıl bir oyuna girdiğini daha en baştan doğru tanımlamak ve angajman kurallarını buna göre belirlemektir.

Bazı aktörler güvenilir ve iş birliğine yatkındır; onlarla TFT gibi karşılıklılığa dayalı bir strateji uzun vadede yüksek getiri sağlar.

Bazıları hata yapabilir ama kötü niyetli değildir; bu durumda GTFT gibi affedici bir strateji ilişkiyi korur.

Bazıları agresiftir veya fırsatçıdır; burada Friedman veya TLW’ye karşı caydırıcı bir duruş gerekebilir.

Bazıları ise tamamen sonuç odaklıdır; WS-LS gibi öğrenen bir strateji bu tür aktörlere karşı daha uyumludur.

Kısacası: Strateji kişiyle, grupla, kültürle ve bağlamla birlikte seçilir. Herkese aynı strateji uygulamak, sahaya tek bir hamleyle çıkmak gibidir; bazı rakiplerde işe yarar, bazılarında ise sizi doğrudan kaybettirir.

Oyun teorisinin asıl gücü, “en iyi strateji”yi aramak değil, kime karşı hangi stratejinin en uygun olduğunu belirleyebilmektir. Bu yaklaşım, iş dünyasından diplomasıya, müzakereden tedarik zincirine kadar her alanda angajmanın kalitesini ve sürdürülebilirliğini belirleyen temel ilkedir.

Oyun Teorisi’ni Bilmek Bize Ne Kazandırır?

Oyun Teorisi (Game Theory) bilinmese bile birçok stratejik davranış günlük hayatta içgüdüsel olarak ortaya çıkar. Ancak içgüdüsel tepkilerin tutarsız ve hatalı sonuçlar üretmesi kuvvetle muhtemeldir. Oyun teorisinin temel katkısı, bu doğal eğilimlerin sistematik, bilinçli ve tekrar edilebilir stratejilere dönüştürülmesini sağlamasıdır.

Oyun Teorisi, etkileşimlerin belirli modeller üzerinden analiz edilmesine imkân tanır. İş birliğinin hangi koşullarda sürdürülebileceği, hangi hataların tolere edilebileceği, hangi davranışların kötü niyet göstergesi sayılabileceği ve hangi durumların sömürü riskini artırdığı bu çerçevede daha açık biçimde görülebilir. Böylece sosyal ve kurumsal ilişkilerde tekrar eden sorunların kök sebepleri daha net biçimde ortaya konabilir.

En İyi Strateji Nedir?

Tek bir “en iyi strateji” yoktur; bağlama göre en iyi strateji değişir.

Oyun Teorisi bu karşılıklılığın matematiğini ve psikolojisini aynı anda görebildiğimiz ender çerçevelerden biridir.

Ama tüm araştırmaların ortak sonucu şudur:

Hem nazik, hem misillemeci, hem affedici, hem anlaşılır olan stratejiler en sürdürülebilir stratejilerdir.

Bu dengeyi bağlama göre tamamlayan stratejiler:

Yeni, belirsiz veya zamanla gevşemiş ilişkilerde: STFT
- (İlişkiyi koparmadan, sınırları yeniden sabitleyen; test davranışlarına karşı disiplin kuran strateji.)
Oturmuş, güven seviyesi yüksek ilişkilerde: TFTT / GTFT
- (Tekil hatalar tolere edilir; alışkanlığa dönüşen davranışlar karşılıksız bırakılmaz.)
Karmaşık ve değişken ortamlarda: WS-LS
- (Davranıştan çok sonuçlara adapte olur; öğrenerek ilerler.)

İş birliği, sadece iyi niyetle değil; doğru tasarlanmış stratejik karşılıklılıkla mümkündür. Ve Oyun Teorisi, bu karşılıklılığın nasıl tasarlanacağını anlamak için elimizdeki en güçlü rehberdir.

Oyun Teorisi'ni Deneyimleyin

Oyun Teorisi'nin nasıl işlediğini yalnızca okumak değil, deneyimlemek çok daha öğreticidir. Aşağıdaki simülasyonlar, iş birliği–ihanet dinamiklerini ve farklı stratejilerin birbirine nasıl tepki verdiğini doğrudan görmenizi sağlar:

Alternatif Oyun Teorisi (Game Theory) Simülatörleri:

Prisoner’s Dilemma / Tit for Tat Simülatörü:
- https://www.taumoda.com/web/PD/TFT/TFTApplet.htm

The Evolution of Trust (Nicky Case):
- https://ncase.me/trust/

Bu oyunlar, stratejilerin zaman içinde nasıl evrildiğini ve güvenin hangi koşullarda ortaya çıktığını sezgisel bir şekilde anlamayı kolaylaştırır.

Oyun Teorisi’nin Kullanım Alanları

Oyun teorisi, birden fazla tarafın birbirini etkilediği her alanda kullanılır:

Tedarik zincirinde: Pazarlıklar ve fiyatlama kararları,
Diplomasi ve uluslararası ilişkilerde: Yaptırımlar ve ittifaklar,
İş dünyasında: Rekabet stratejileri,

oyun teorisinin en bilinen uygulamalarıdır.

Yapay zekâ, finans piyasaları ve şirket içi davranış modelleri de aktörlerin tepkilerini anlamak için oyun teorisinden yararlanır. Kısacası, kararların karşılıklı etkileşim içinde olduğu her ortamda oyun teorisi daha iyi sonuçlar görmek için güçlü bir rehberdir.

Tedarik Zinciri’nde Örnek Uygulamalar

Oyun Teorisi, sadece laboratuvar ortamında geliştirilmiş matematiksel modellerden ibaret değildir. Aksine; bir satın alma yöneticisinin masasında, bir deponun mal kabul kapısında veya bir yöneticinin personel ile yaptığı geri bildirim görüşmesinde her an yaşayan bir dinamiktir. Tedarik zinciri gibi kararların birbirine sıkı sıkıya bağlı olduğu bir ekosistemde, verdiğiniz her karar karşı tarafta bir tepki doğurur ve bu tepki zincirleme olarak sizin gelekteki seçeneklerinizi şekillendirir.

Aşağıda, günlük operasyonlarda sıkça karşılaşılan ikilemleri ve bu düğümleri Oyun Teorisi stratejileriyle nasıl çözebileceğinizi inceleyelim:

1) Kraljic Matrisi "Kaldıraç" (Leverage) Ürünlerde Teslimat Gecikmesi

Kaldıraç ürünlerde (yüksek harcama, düşük risk) güç satın almacıdadır. Ancak tedarikçinin teslimatı geciktirmesi bir "İhanet (D)" hamlesidir.

İkilem: Tedarikçiyi her gecikmede sert cezalandırırsan (Friedman / Grim Trigger), o da sana karşı savunmacı bir tavır takınır veya kapasitesini başka müşteriye kaydırır. Ancak her hatayı affedersen, gecikmeyi "alışkanlık" haline getirir ve siz "Sucker's Payoff" (Enayi Bedeli) durumuna düşersiniz.

Stratejik Hamle (TFTT - Tit for Two Tats): İlk gecikmede "Seni anlıyorum ama sistemimiz bunu not etti" diyerek tolerans gösterilir (C). Ancak gecikme üst üste ikinci kez tekrarlanırsa, bir sonraki ihalede hacmi düşürerek misilleme (D) yapılır. Bu, hem ilişkinin sürekliliğini sağlar hem de sistemik suistimali engeller.

2) Hata Yapan Personel: "Güven Zehirlenmesi vs. Motivasyon"

Yöneticinin personel hatasına verdiği tepki, bir "Tekrarlanan Oyun"dur.

İkilem: Sürekli cezalandıran yönetici (The Lone Wolf / The Predator), personelin risk almasını engeller ve yaratıcılığı öldürür. Hiç cezalandırmayan yönetici ise personelde "nasılsa bir şey olmuyor" algısı yaratarak bir "güven zehirlenmesi" oluşturur ve sistemin gevşemesine neden olur.

Stratejik Hamle (GTFT - Generous Tit for Tat): Personelin hatası "iyi niyetli bir deneme" veya "kazara" ise yönetici affedicidir. Ancak aynı hata dikkatsizlikten tekrarlanırsa, yönetici anında şeffaf bir yaptırım (D) uygular. Buradaki sır "Clear (Netlik)" ilkesidir; personel hangi hatanın tolerans göreceğini önceden bilmelidir.

3) Kraljic Matrisi "Darboğaz" (Bottleneck) Ürünlerde Stok Riski ve İlişki Yönetimi

Kraljic matrisinde riskin en yüksek olduğu yer darboğaz ürünlerdir (düşük harcama, yüksek tedarik riski). Burada tedarikçi, sistemin zayıf karnını bildiği için "Joss Stratejisi" (rastgele fırsatçılık) uygulama eğilimindedir.

İkilem: Tedarikçi, elindeki sınırlı kapasiteyi başka bir müşteriye kaydıracağını söyleyerek fiyatı aniden artırabilir (T: Temptation/İhanet). Eğer hemen kabul ederseniz sömürülürsünüz; reddederseniz üretim hattınız durur (S: Sucker’s Payoff).

Stratejik Hamle (Friedman / Grim Trigger - Şartlı Caydırıcılık): Tedarikçiye, "Bu kritik parçada alternatif bir teknolojiye geçiş Ar-Ge sürecimizi başlattık, eğer bu kritik dönemde taahhüt dışı bir fiyat artışı gelirse, teknoloji dönüşümü tamamlandığında sizinle tüm ticari ilişkimiz sonsuza dek kesilecektir" mesajı verilir. Bu "Acımasız Tetik" tehdidi, tedarikçinin kısa vadeli kâr için uzun vadeli (R: Reward) kazancını riske atmasını engeller.

4) Yeni Tedarikçi: Referans Yok, Risk Yüksek

İlk siparişte esnek davranırsan sömürülme riski vardır; aşırı sert davranırsan potansiyel iyi tedarikçiyi kaybedebilirsin.

İkilem: İlk siparişte veya test davranışının başladığı anda fazla yumuşak davranırsanız, karşı taraf bunu “alan açıldı” sinyali olarak algılayabilir ve esnekliği alışkanlığa dönüştürebilir. Buna karşılık ilk sapmada sertleşirseniz, aslında iyi niyetli olabilecek bir tedarikçiyi ya da yıllardır çalışan bir ilişkiyi gereksiz yere riske atarsınız. Bir yanda sömürülme riski, diğer yanda potansiyel değeri erken kaybetme tehlikesi vardır.

Stratejik Hamle (STFT – Sticky Tit for Tat / The Anchor): İlk adımda iş birliği korunur (C); hatta ilk sapmada ilişki hemen sertleştirilmez. Ancak tekrar eden test davranışlarında “çıpa” devreye alınır: şartlar netleştirilir, tolerans alanı daraltılır ve ilişki geçici olarak sertleştirilir (D). Bu noktadan sonra STFT aceleyle yumuşamaz; normal işleyişe dönmek için tedarikçinin üst üste iki kez tutarlı ve sözleşmeye uygun davranış (C) sergilemesini şart koşar. Böylece hem tekil hatalar sistemi bozmaz hem de sınırların gerçekten ciddiye alınıp alınmadığı net biçimde test edilmiş olur.

Bu örnekler, tedarik zincirindeki sorunların çoğunun teknik değil, karşılıklı davranışlardan kaynaklandığını gösterir. Teslimat, kalite veya fiyat gibi başlıklar çoğu zaman tarafların verdiği tepkilerle büyür ya da kontrol altına alınır. Oyun teorisi, hangi durumda affedileceğini ve hangi noktada sınır konulacağını sistematik hâle getirir.

Bu nedenle tek turu kazanmaya odaklanan bir Lone Wolf yaklaşımı kısa vadede cazip görünse de sürdürülebilir değildir. Gerçek başarı, net ve öngörülebilir bir karşılıklılık kurabilmektedir. Karar verirken sorulması gereken soru basittir: “Bu hamle bugünü mü kurtarıyor, yoksa yarını mı inşa ediyor?”

Ezcümle...

Gerçek Zafer İlk Hamlede Değil, Son Hamlede Belli Olur!

Buraya kadar sabırla okuduğunuz için gönülden teşekkür ederiz. Yaklaşık iki haftalık yoğun çalışmanın ürünü olan bu yazıda amacımız, Oyun Teorisi’nin uzak bir akademik kavram değil; hepimizin gündelik davranışlarının içinde zaten var olan bir düşünme biçimi olduğunu göstermekti.

Gördük ki stratejilerin özü basit: Kısa vadeli hamlelerden çok, uzun vadeli ilişkilere odaklanan yaklaşımlar kazandırıyor. Birçok strateji arasındaki tüm farklara rağmen hepsi aynı noktayı işaret ediyor: Uzun vadeli davranış, en güçlü stratejidir.

Hayatın içinde de bu böyle. İster iş ilişkilerinde ister kişisel ilişkilerde olsun; güven, karşılıklılık, hatayı tolere edebilmek ve gerektiğinde sınır koymak uzun vadede en çok değer üreten davranışlar oluyor.

Dileriz ki bu yazı, hem kendinizi hem de çevrenizde olup biteni biraz daha net görmenize katkı sağlar. Ve belki de bundan sonra vereceğiniz birçok kararda şu soru aklınıza gelir: “Bu hamle bana bugün ne kazandırır değil, yarın ne getirir?”

Uzun vadeyi önceleyen herkes için, sonuçlar daima daha bereketlidir!

Hem iş hem de hayat yolculuğunuzda Oyun Teorisi’nin size güçlü bir ışık olmasını dileriz!

Anketimize Katılın!

Bu yazıdaki stratejilerden hangisinin sizi daha iyi anlattığını merak ediyorsanız, aşağıdaki ankete katılabilir, ve okuyucuların genel olarak hangi stratejiye daha yakın olduğunu da birlikte görebilirsiniz.

Bu yazıyı okuduktan sonra, tekrarlanan ilişkilerde kendinizi hangi stratejiye daha yakın görüyorsunuz?

TFT – Tit for Tat
TFTT – Tit for Two Tats
GTFT – Generous Tit for Tat
WS-LS – Win–Stay, Lose–Shift

Not: Oylama anonimdir, kişisel bilgileri kaydedilmez.

Dipnotlar...

[1] Nash Dengesi, bir oyunda hiçbir oyuncunun tek başına strateji değiştirerek daha iyi bir sonuç elde edemediği durumdur. Yani herkes, diğerlerinin yaptığını dikkate alarak kendisi için en iyi cevabı seçmiştir. Bu nedenle Nash dengesi: “Kimsenin tek taraflı olarak pişman olmadığı strateji profili” olarak tanımlanır.

Son olarak...

Bu makalenin fikri için, Volkan (Oktar) Ağabey'e gönülden teşekkürler!

Mustafa Çapan'a da, özellikle Puanlama Tablosu ve Simülasyon konusundaki katkıları için teşekkürler!

İlgili Makaleler

Daha fazla içerik için Tedarik Zinciri Portalı’nı ziyaret edebilirsiniz.

Kaynaklar ve İleri Okuma

Fotoğraflar

Kapak fotoğrafı: Adobe Express

Yazarlar

Sedat Onat (SedatOnat.com)

!!! DUYURU !!!

ERP Nasıl Alınır? Kitabımız Google Play Book'da yayınlanmıştır.

https://www.sedatonat.com/erpnasilalinir Linki üzerinden ücretsiz olarak indirip okuyabilirsiniz.

Geri bildirimleriniz olursa bizleri mutlu edersiniz.

Şimdiden iyi okumalar dileriz.

Teşekkürler!

Değerli zamanınızı ayırdığınız için teşekkür ederiz.

Sorularınızı ve/veya tavsiyelerinizi yorumlara yazarsanız, hızlıca dönüş yaparız.

Bu makale ilk olarak TedarikZinciriPortali.com adresinde yayınlanmıştır.

Her gün yeni bir Tedarik Zinciri Makalesi için, Tedarik Zinciri Makaleleri Linkedin Newsletter 'a üye olabilirsiniz.

Her hafta yeni bir Tedarik Zinciri Analizi için, Tedarik Zinciri Analizleri Linkedin Newsletter 'a üye olabilirsiniz.

TedarikZinciriPortali.com 'u ziyaret ederek, daha fazla Tedarik Zinciri Haberleri ve Makaleleri 'ne ulaşabilirsiniz.

Tedarik Zinciri Sözlüğü 'ne www.TedarikZinciriSozlugu.com adresinden ulaşabilirsiniz.

Tedarik Zinciri Portalı Linkedin Grubu 'muza üye olarak bilgi ve tecrübelerinizi paylaşabilirsiniz.

Şimdiden teşekkür eder, iyi günler dileriz!