Kapak Güzeli Laneti

Önce “Kapak Güzeli” başlığını görüp de yazıya bikini içinde poz vermiş güzel kadın fotoğrafları görürüm diye gelenlere kötü haberi vereyim: Bu yazıda hiç bir bikinili kadın fotoğrafı yok :). Yazımız “Regresyon Yanılgısı”, yani olayların ortalamaya dönüş eğilimi göstermesinden kaynaklanan bir yanılgı ile ilgili.

Özellikle Amerikan spor camiasında yer alan bir çok insan Sports Illustrated (SI) dergisinin kapağına çıkmanın sporculara “kötü şans” getirdiğine inanır. Nitekim Wikipedia’nın konu ile ilgili sayfasında SI’da kapak olmuş sporcuların başlarına gelen olmadık şeylerin detaylı bir listesi vardır. Bu listeden hemen bizim de tanıyabileceğimiz bir iki isme bakalım[1]:

  • New York Knicks’te oynayan Jeremy Lin 17 Şubat 2012’de SI dergisinin kapağına ilk kez çıktıktan sonra Lin’in takımı 7 maçlık galibiyet serisini kendi evinde New Orleans Hornets takımına kaybederek sona erdirdi.
  • Jeremy Lin’in şanssızlığı bir maçla sona ermedi. Ertesi hafta tekrar SI’da kapak olan Jeremy Lin’in takımı Miami Heats’e karşı kaybediyor ve ardından Mart ayında sol dizinde menisküsü yırtılan Lin sezonu kapatıyor.
  • Bir tane de bokstan örnek verelim (spor olarak görülmesini anlayamasam da). 20 Haziran 1988’de Mike Tyson’la yapacağı karşılaşma öncesi SI’da kapak olan Michael Spinks için karşılaşma hiç iç acıcı geçmemiş. Tyson rakibini 91 saniyede knock-out ederek Spinks’in erken emekliliğine yol açmış.

Sizin de Wikipedia listesinden göreceğiniz gibi örneklerin sayısı çok. Ancak “Sports Illustrated Laneti” gerçek mi yoksa yoksa istatistik bilgilerimizdeki noksanlığın, verileri yorumlamaktaki yetersizliğimizin yol açtığı bir şehir efsanesi mi?

Sports Illustrated Laneti Regresyon Yanılgısı’na iyi bir örnektir. Thomas Gilovich başucu referans kitabı olması gereken “How We Know What Isn’t So” isimli kitabında lanetin bir regresyon yanılgısından ibaret olduğunu görmek için istatistiki bir dahi olmaya gerek olmadığını belirtiyor[2]. Ortalamaya Regresyon kavramına bakalım.

Ortalamaya Regresyon: bir değişkenin 2 ölçümden birinde ortalamadan çok farklı bir değere sahip olması durumunda diğerinde ortalamaya daha yakın olacağını ifade eden istatistiksel bir kavramdır. Farklı bir açıklaması ise şu şekildedir: Tamamen rastlantısal bir olay serisi içerisinde sıradışı bir olaydan sonra büyük olasılıkla (sadece rastlantısal olarak) daha sıradan bir olay gerçekleşir.[3]

Örnekle açıklayayım*. Diyelim ki oğlunuza araba kullanmayı öğretiyorsunuz. Düzgün otomobil kullanmayı öğrenmek zaman ve antreman gerektirecek bir iştir. Oğlunuzun otomobil kullanma becerilerindeki gelişmeyi bir günden diğerine görmek zordur. Oğlunuzla dolaşırken aracı çok iyi kullandığı (o an ki seviyesinden çok daha iyi) bir günün ardından normal seviyesinde kullanacağını tahmin edebilirsiniz. Aynı şekilde çalıştığınız bir gün normalde yolda seyredebilecek kadar otomobil kullanan oğlunuzun değerli aracınızı tarlaya sürdüğünde ertesi gün tekrar tarlaya sürmeyeceğini, normal sürüş becerilerine geri dönerek (regresyon) yolda kalabileceğini varsayabilirsiniz. Peki Sports Illustrated Laneti’nin bununla alakası ne demeden önce yanılgı kısmına bir gelelim. Şimdi oğlunuz aracı tarlaya sürdüğünde oğlunuza bağırdığınızı varsayalım. Oğlunuz ertesi gün aracı normal olarak kullanacağından “bağırmak” işe yaramış gibi görünecektir. Aracı çok iyi kullanıdığı gün ise övmüşseniz ertesi gün normal (bir öncekine göre kötü) kullanacağından övgünün işe yaramadığı fikri kafanızda oluşacaktır. Bu kalıpsal düşünce -örneğimizdeki “bağırmak işe yaradı, övgü işe yaramadı” – Regresyon Yanılgısı‘na bir örnektir.

Regresyon etkisini göz önüne alarak oğlunuza bu sevimli oyuncakla otomobil kullanmayı öğretmeyi deneyebilirsiniz. 🙂

Regresyon Yanılgısı’nın Sports Illustrated Lanet’i ile ilgisine gelebiliriz artık. Sports Illustrated dergisinin kapağına çıkabilmek için bir sporcunun son haftalarda adının duyulması, başarılı olması gereklidir şüphesiz. Sporcunun haber değerinin olduğu zamanlarda ancak dergiye kapak olması mümkündür. Bir sporcunun haber değeri ise sıradışı başarılara imza attığında vardır. Sürekli kazanan, rekorlar kıran sporcu ara sıra kaybeden, kötü oynayan sporcudan daha kıymetlidir ne de olsa. Dolayısı ile SI’da kapak olmuş bir sporcu normal performansının üzerinde bir performans göstermiştir. Kapakta fotoğrafının çıkmasının ardından performansının normal seyrine dönmesi beklenmedik, lanetli ya da şanssız bir şey değildir. Kısaca Sports Illustrated dergisine kapak olmak lanetli değildir, sporcunun sıradışı bir performans sergilediğinin göstergesidir.

Hayatımızdaki raslantısallıkların sıklığını okumak isteyenler için yazının kaynak kısmındaki 2 kitabı hararetle tavsiye ederim. Okuma fırsatı olmayacak okuyucular için “Regresyon Yanılgısı” ile ilgili diğer örnekleri sonraki bir yazıda daha detaylı anlatacağım.


  1. Wikipedia
  2. Thomas Gilovich “How We Know What Isn’t So” Ch. 2 “Cognitive Determinants of Questionable Beliefs”
  3. Leonard Mlodinow “The Drunkard’s Walk – How Randomness Rules Our Lives”

*: Buradaki örnek Daniel Kahneman’ın yanılgıyı ilk kez farkettiği ve sonrasında raslantısallığın hayatımızdaki etkileri üzerine çalışmalar yapmasına sebep olan pilot eğitim merkezindeki olayın günlük hayatımıza uyarlanmış şeklidir.

About Bahadır Ürkmez

İzmir Fen Lisesi ve Boğaziçi Üniversitesi Makina Mühendisliği bölümü mezunuyum. Evli ve 2 süper keyifli (herkesinki kendine öyledir zaten :)) çocuk babasıyım. Mühendislik yapıyorum.

4 Yanıt to “Kapak Güzeli Laneti”

  1. Uğur Ali Kaplan 08 Ağustos 2012 02:28

    Sanırım “nazar” kavramı da buradan geliyor değil mi? Çok ünlüdür, “Çok sevdiler ya ondan düştü.” ve benzeri cümleler. Halbuki diğer zamanlarda da çok sevilmesine rağmen hiçbir şey olmuyor. Ancak çok sevildikten sonra düşünce niyeyse nazar oluyor. Ya da rutin yaşamda düşünce de nazar olmuyor, normal bir olay olarak yorumlanıyor. Bu da bir örnek mi bilmiyorum ancak birkaç aydır bu şekilde düşünüyordum, bu yazı da tam oldu. Kısa ve öz bir yazı olmuş, teşekkürler 🙂

    Beğen

    • Nazar “ortalamaya regresyon” kavramına örnek olmayabilir ama başka bir önyargı ve sezgiye iyi bir örnek. Eksik, saklı ya da rastlantısal verileri genel olarak yanlış değerlendiririz. Şöyle açıklayayım:

      Çocuğun düşmesi önemli bir olay olmasına rağmen çocuğun düşmemesi sıradan bir olay. Çocuk her düştüğünde bu olay etrafındaki faktörleri kayıt altına alıyoruz. Normal yürüdüğü ve düşmediği zamanlarda ise normali kayıt altına almıyoruz. Dolayısı ile biri çocuğu çok sevdiğinde arkasından çocuk düşmezse bu olay bizim için önemsiz. Zaten hep olan şey. Ama düşerse kafamızın içindeki verilere kaydediyoruz. Zamanla geri baktığımızda elimizde hep “çok sevildikten sonra düşen çocuk” verileri kalırken “çok sevilip de hiçbirşey olmayan çocuk” verileri uçup gidiyor. Bu eldeki verilerle de hemen çok sevdiler – düştü bağlantısını hatalı olarak kurup “Nazar” adını veriyoruz. Çok güzel bir örnek vermişsiniz bunu yazı haline getirmeliyim. Bu arada ben nazar boncuklarını çok severim. İnanmasam da nazar boncuklarım vardır ofisimde, çantamda, evimde 🙂

      Beğen

  2. Yazida gecen (ve Leonard Mlodinow’a atfedilen) ortalamaya regresyon taniminin ikinci kismi tam olarak dogru degil. Tanimin ikinci kismi soyle: “Farklı bir açıklaması ise şu şekildedir: Tamamen rastlantısal bir olay serisi içerisinde sıradışı bir olaydan sonra büyük olasılıkla (sadece rastlantısal olarak) daha sıradan bir olay gerçekleşir.” Problem ‘buyuk olasilikla’ kisminda. ‘Ortalamada’ diye degistirilmesi gerekiyor. Ortalamaya regresyon bir sonraki istatistiksel deneyin outcomelarinin oratalamasi ile ilgili bir statement yapar, olasiligiyla ilgili degil. Ortalama sadece bazi dagilimlarda buyuk olasilikla olur. Zannedersem cumle basinda ‘Tamamen rastantisal’ ile kastedilen Bernoulli distribution. Bu durumda ortalama en buyuk olasiliga sahip olacagi icin tanim dogru oluyor. Ancak, bircok dagilimda ortalama kucuk bir olasiliga sahiptir (mesela Geometrik distribution) bu dagilimlarda tanim yanlis oluyor. Bir de ek olarak, ortalamaya regresyonun ‘skill’den cok ‘chance’ in on planda oldugu durumlarda ciddi bir sorun oldugunu vurgulamakta fayda var. Yazida verilen Sports Illustrated ornegi meshur bir ornek. Ancak ‘ortalamaya regresyondan dolayi boyle oluyor aciklamasi’ yerine
    ‘ortalamaya regresyondan dolayi boyle olabilir’ aciklamasi daha dogru olacaktir, chance in ne kadar rol oynadigini tam olarak bilmemiz mumkun degil.

    Beğen

    • Bildirim için teşekkürler. O cümle Leonard Mlodinow’un Türkçe’ye de “Ayyaş Yürüyüşü” adı ile yeni çevrilen “Drunkard’s Walk” isimli kitabından tercüme edildi.

      “….. in any series of random events an extraordinary event is most likely to be followed, due purely to chance, by a more ordinary one. ”

      Çeviride anlam kaymasına yol açan bir hata yapmış olabilirim. İstatistik bilmeyenler için kavramın daha kolay anlaşılır olması açısından yazıya ekledim. Çünkü sizin de takdir edeceğiniz gibi uzun ve teknik açıklamalar konuya uzak olan bir çok okuyucu için sıkıcı olacak ve okuyucuları yazıdan uzaklaştıracaktır. “most likely” kısmı “büyük olasılıkla” diye çevirdim gödüğünüz gibi. Alternatif bir çeviri öneriniz varsa o kısmı seve seve değiştiririm.

      “Olabilir” ve “oluyor” arasındaki fark içinse “chance”‘in rolunu tam bilemesek de yazıda görüleceği gibi sporcuların SI’da sıradışı performans zamanlarında kapak olduğunu belirtiliyor. O nedenle izleyen haftalarda normale dönmelerinin sebebini bu kavramla açıklayabiliriz. Aslında yazıya Michael Jordan’ı eklemek sizin belirttiğiniz “chance”‘in rolunu iyice ortaya koyacaktır. Michael Jordan 49 kere kapak olmasına rağmen “lanet’ten” etkilenmemiştir. Yani Jordan “skilled” bir oyuncu olarak performansı devam ettirirken, “lanet”‘ten etkilenenler için SI’da kapak olmak için “chance”‘in daha etkili olduğunu varsayabiliriz. O zaman “ortalamaya regresyondan dolayi boyle oluyor” kulağa daha az iddialı gelecektir sanırım.

      Bu arada İstatistik üzerine çalışan bilr biliminsanından yorum gelmiş olması da ayrıca keyifli.

      Beğen