Siz uzunsanız babanız sizden kısa, babanız uzunsa siz ondan kısasınız.

Siz uzunsanız babanız sizden kısa, babanız uzunsa siz ondan kısasınız.

Cuma akşamları çok değerlidir. Ben üniversitedeyken cuma günlerini evde geçirmek olabilecek en kötü izlenim yaratan şeylerden biriydi. Bilkent'in Ankara'da barların onların olduğu yere giden servisleri cuma günleri tıklım tıklım güzel giyinmekle uğraşmış yüzleri boyalı yüze yakın kişi uzunca sıra oluştururdu. Milyon çeşit pahalı parfüm kokusu birbirine karışır ve eşsiz bir görüntü ve koku olurdu.

Cuma günleri güzel giyinip bir şeyler yapmayı seven başka bir grup daha var. Bilkent Masaüstü Oyunları Klübü, şaka şaka Birleşik Krallık Kraliyet Enstitüsü. Bu adamlar 1825 yılından beri cumaları toplanıp "abi ben bunu buldum, bence çok ilginç" muhabbeti yapıyorlar. Konuşmalar bir saat ile sınırlı. Faraday fotoğraf makinesinin çalışma prensibini ilk burada tanıtmış, Thomson elektronu ilk burada tanıtılmış vs vs... Düşünün bir yere gidip bir şeyler dinliyorsunuz ve  o dinlediğiniz şeyin çığır açıcı bir buluş olma ihtimali çok yüksek. Bulan adam da karşınızda ilk kez size anlatıyor. Baya güzel bir ortam.

Galton Bernoilli triallarla normal dağılım elde ettiği Galton oyuncağını Cuma muhabbetlerinde sunarken resmedilmiş.

Bizim hikayemiz istatistikçi Galton hakkında. Kimyacı ve lise müfredatından bildiğimiz Dalton değil, bu Galton. Darwin'in kuzeni, parmak izlerini istiksel çalışması var. Parmak izlerinin suçlu yakalamakta kullanılabileceğini göstermiş ve false pozitif oranını 1/64 milyar olan bir metot bulmuş. Muhtemelen Apple beycimiz bunu kullanmıyor ki Touch ID'nin false pozitif oranı 1/50 bin.

Ama Galton'un asıl meraklandıran ve bulmak istediği şey zekanın miras mekanizması. Belki de kendi kuzeninin Darwin olmasındandır bilinmez, Galton içten içe bazı ailelerin daha zeki olduğunu düşünüyor. Kraliyet Enstitüsü'ne bakıyor herkes abi, kardeş, kuzen vs. Galton 605 tane zeki bulduğu İngiliz'i incelemeye koyuluyor.  Bakıyor ki zeki bildiğimiz insanların oğulları, kardeşleri hep bu zeki bulduğumuz insanlara göre daha az zeki.

Ama tabi zekayı ölçmek zor o yüzden Galton'da daha ölçülebilir bir konu üzerinde çalışmak istiyor. Boy da aynı zeka gibi genetik parçası güçlü olan ama aynı zamanda su götürmez bir gerçeklikte ölçülebilen bir şey. Bu sefer insan boylarını toplayıp bir çalışma yapıyor. Onun iki yüzyıl önce topladığı veriye Harvard'ın database'inden ulaşabilirsiniz.

galton[, c('father', 'mother', 'height')] <- 2.54 * x[, c('father', 'mother', 'height')]
# Ploting 1

male <-  galton %>% filter(male == 1)

ggplot(male) + aes(x=father, y=height) +
geom_point() +
geom_smooth(method=lm, se=FALSE) +
xlim(150, 210) +
ylim(150, 210) +
geom_abline(intercept = 1, linetype="dashed") +
  ylab('Son Height') +
  xlab('Father Height')
  
lm(father~height, male)
 

Yukarıdaki grafikte baba ve erkek çocukların boylarını görüyoruz. Arada bir korelasyon var o aşikar, bunu mavi çizginin eğrisi anlatıyor. Regresyon eğrisi bir değişkenden diğerini tahmin etmemizi sağlayan şey. Örneğin 0.5 olan bir eğri bize babadaki her 2 cm lik uzunluğun çocuğun boy tahmini 1 cm etkileyeceği anlamına geliyor.

Bu eğimin 0 ile 1 arasında olmasını bekliyoruz. Çünkü eğim şayet 1'den büyük olsaydı sadece üç dört jenerasyon sonra çok çok uzunlar ve çok çok kısalar görmeye başlardık. Çünkü ortalamadan X daha uzun olan bir babanın çocuğu X*slope uzunluğunda olmasını bekliyoruz. Şayet slope 1'den büyük ise bu bir kaç jenerasyonda çok çok uzunlara ve çok çok kısalara neden olur.

Doğada çoğu şeyin dağılımı normaldir. Yani bir şeyin çok olması aza doğru yönelmesinin ihtimalini artırır, az olması ise çoğa doğru. Ortalamaya yönelim diyebiliriz. Eğer babanız zekiyse muhtemelen siz de topluma göre zekisiniz ama babanız kadar değil.

Success = talent + luck
Great Success = a little more talent + a lot of luck

Daniel Kahneman Galtonun çalışmasını bu iki cümle ile özetliyor. Boyu etkileyen bir çok etken var. Eğer babanız çok daha uzunsa muhtemelen şans olarak özetlediğimiz bir çok başka etken de onun yararına çalışmış. Ama bu şans sizde de geçerli olmak zorunda değil. O yüzden sizden boy ortalaması beklentimiz babanız kadar değil.

Galton bunu fark ettiğinde etkilendi ama biraz da üzüldü. Çünkü bulmak istediğin şeyin tam tersini buldu. Ebeveyniniz ortalamadan zeki ise muhtemelen siz onlardan daha az zeki, ebeveyniniz ortalamadan daha az zeki ise ise muhtemelen siz onlardan daha zekisiniz.

Ek: Burada size bir kaç dakikadır linear regresyon anlattığımı düşünüyor olabilirsiniz. Ama gerçekte autoregressive modellere giriş yaptınız. Birbirini izleyen kendi kendine bağımlı birer time serileri aslında bir AR(1). Auto korelasyon katsayısı 1'den büyük time serilerine sonsuza kaçan time serileri diyoruz, 1 olanlara ise random walk.

Burada iki farklı state space modeli. Birinde observationlar randomize edilmiş diğerinde stateler. Birinci model Galton'a ait.