İyi bir okulda okumak beni iyi yapar mı?

İyi bir okulda okumak beni iyi yapar mı?

Geçenlerde mektepli ve özellikle kadın arkadaşlarımın Instagram hikayelerinde rastladığım bir podcastçiyi dinledim. Kullanılan başlık ilgi çekici ama içeriği başka bir konu hakkında. Şöyle diyim; konu başlıkta yazdığım soru ama içerik Metoo gibi bir şey. Podcast özellikle Robert Lisesi'nde yapılan bir olaydan bahsediyor.

Ben de podcastçinin sorduğu soru hakkında bir şeyler yazayım dedim ama bu konuyu incelemenin çok zor olduğunu düşündüğüm için soruyu şuna çeviriyorum: Birinin iyi okulda okulda okumuş olduğunu bilmem ondan beklediğim toplam yeteneği değiştirmeli mi? Bu sorunun şöyle bir ortamda sorulduğunu düşünün; bir kişiyi işe alacaksınız, elinizde bu kişinin lisesi hariç bir bilginiz yok, lise bilgisi bu kişinin işinizde göstereceği başarının tahmini için kullanışlı mıdır?

Başlıktaki soru ve benim sorduğum bu soru birbirinden çok farklı, kelimeleri bilerek seçtiğimi belirteyim:

  • Yetenek, iyiye göre çok daha kolay tanımlanabilen bir vasıf ve direkt kendisini ölçemesek bile, yeteneği gizli değişken kabul edip etkisini ölçebiliriz.
  • Daha da önemlisi bu bir nedensellik değil korelasyon sorusu.  

Burada iyice somutlaştırmak için toplam yetenekten kastımın da genel olarak iş performansını artıran tüm karakteristik özellikler olduğunu tanımlayacağım. Yani toplam yeteneğin tanımı işe göre değişecek. Örneğin aşçı iseniz koku duyunuzun iyi olması toplam yeteneğinizi artırırken bu etkiyi bilgisayar mühendisleri için görmeyeceğiz. Burada çoğu iş için paylaşılan zeka, çalışkanlık, planlılık gibi özellikleri genel yetenek altında kümelerken biraz önceki koku duyusunu gibi iş ile alakalı şeyleri işe özel beceriler(konusal yetenek) olarak özetleyeceğim. O zaman toplam yetenek hem genel yeteneğinizden hem de konusal yeteneğinizden etkilediğini söyleyebiliriz.

Önceki blog postlarında bahsettiğimiz bayesian networklerdeki collider effect burada da var. Yani eğer toplam yeteneği sabit tutarsak konusal yetenek ile genel yetenek arasında negatif korelasyon görebiliriz. Bunu somutlaştırırsak için bir danışmanlık şirketini düşünelim. İçinde hem istatistik bilen veri bilimcileri hem de her konudan anlayan kişi olarak düşünülen iş analistlerini çalışsın. Burada çalışan kişilerin toplam iş yeteneğini birbirine yakın olduğunu kabul edersek, iş analistlerin genel yeteneklerinin veri bilimcilere göre daha yüksek olacağı tahmin edebiliriz. Çünkü istatistik bilgisi konusal yetenek olarak kabul edilebilirken iş analistlerinin çalışmaları daha çok genel yetenek kümesine dahil edilebilir.

Şimdi figürümüze daha çok değişken ekledik. İş başvurusu sırasında mülakatlara girilir. Mülakatlar iş veren için bir tahmin aracıdır. Bir iş yeri ne kadar maaş veriyorsa ve ne kadar prestijli ise o kadar fazla etaplı mülakat yapar. Ama dünyada neredeyse en iyi doktora maaşları veren İsviçre'nin en iyi üniversitelerine başvurusu yapmış olsaydınız muhtemelen ya mülakatsız kabul edilirsiniz ya da reddedilirsiniz. Neden binlerce kişinin başvurduğu EPFL mülakat yapmaz? Çünkü doktora işindeki yeteneğiniz ile üniversite GPA'niz hem genel yetenek üzerinden hem de işe özel yetenek üzerinden korelasyonludur. O yüzden üniversiteler rahatça GPA'inizi olası mülakat başarınızın tahmininde kullanabilir. Bu üniversite ortamından çok farklı işlerde çalışanlar için geçerli değildir. Bir bilgisayar mühendisi tiyatrocu olmak için başvuru yaptığında mülakatlara çok daha fazla önem verilmesi gerekir.

Kırmızı düğümler işveren tarafından gözlemlenemeyen değişkenler. Maviler ise CV'de gözlemlenebilir

Bir insanın genel yeteneğini ya da konusal yeteneğini gözlemleyemezseniz ama onları gözlemlediğiniz değişkenler üzerinden tahmin edebilirsiniz. Örneğin genel yetenek olarak özetlediğimiz değişken hayatımızın her yerinde işe yarar. Zeki, çalışkan ve planlı olmanız üniversite giriş ya da lise giriş sınavlarında yüksek puan almanızı sağlar. Bu sınavlar bize genel yetenek hakkında bilgi verir.

Burada işleri ilginçleştirmek için parasal durum düğümünü ekledim. İyi üniversiteye giden biri belki de ailesinin parasal durumu sayesinde o üniversiteye giriş yaptı. Burada yine collider effecti üniversite giriş sınavı ve parasal durum arasında yakalayabilirsiniz. Örneğin normalde parasal durum ile üniversite sınav sonucu arasında bağ olmasa bile Koç Üniversitesi'ne bakarsanız zengin öğrencilerin üniversite giriş sınavı sonucunun daha düşük olduğunu göreceksiniz. Tekrara düşmek istemiyorum ama kimseyi üzmemek için tekrarlayayım; Koç Üniversitesinde olup ailesi zengin ve aynı zamanda iyi bir üniversite sınavı sonucuna sahip olmak imkansız değil, hatta çok da güzel bir şeydir.

Peki soruya geri dönelim. Birinin iyi okulda okumuş olduğunu bilmek ondan beklenen toplam yeteneği değiştirmeli mi? Yaptığımız tanımlamalara göre evet. İyi bir okulda okuyan öğrenci daha yetenekli hale gelmese bile iyi okul mezunlarından yetenek beklentimizin yüksek olması doğal. Fakat bir kişi iyi liseden ve ya iyi üniversiteden mezun diye yetenekli olacak diye bir şey yok, ama ona dair yetenek beklentimiz hiç bilgi bilmediğimiz birine göre daha yüksek olmalıdır.

Buraya simule edilmiş örnek dağılımlar dağılımları koydum. Köşegen üzerinde iyi lise mezunlarının ve normal lise mezunlarının çeşitli konularda dağılımları görülüyor, genel yetenek ve işe özel beceriler mutually exclusive şeklinde tanımladım. Mülakatta 20 soru sorulduğu ve her soruya bernoilli dağılımına uygun şekilde cevap verildiği düşündüm. Genel yetenek ve işe özel becerilerin dağılımını binomun conjugate i olan Beta olarak kabul ettim. 
İş tanımının genel yeteneğe oranı 0.7 oranında(yüksek) uyumluluk gösterdiği durumda sonuçlar bunlar. Amerikanın ÖSS'si olan SAT'nin IQ ile korelasyonu 0.71 olduğu iddia edildiği için aynı korelasyonu burada da lise giriş sınavı ile üniversite giriş sınavının genel yetenek ile olan ilişkisinde kullandım. İş tanımının genel yeteneğe oranının yüksek olduğu meslek gruplarında iyi lise mezunlarının ortalama başarısının yüksek olmasını beklemek doğal. Örnek meslekler iş analistliği, hukukçuluk, akademisyenlik

Tüm bunları test edebileceğiniz bir notebook hazırladım. Bu notebookta üniversite sınavı ile genel yeteneğin korelasyonunu, lise sınavı ile genel yeteneğin korelasyonunu, popülasyondaki zengin aile oranını, işe özel yetenek ve genel yeteneğin toplam yeteneğe etkilerini değiştirerek grafiklerin nasıl etkileneceğini inceleyebilirsiniz.

İş tanımının genel yeteneğe oranı 0.2 oranında(düşük) uyumluluk gösterdiği durumda sonuçlar. Bu durumda iyi lise mezunları ile diğer kişiler arasında fark söz konusu değil. Mülakatın yetenek belirlemedeki etkisi daha yüksek. İş verenin CV'deki okul üniversite gibi değişkenler yerine deneyimlere ve mülakatlara önem vermesi beklenebilir. Örneğin burada toplam yetenek ile işe özel becerilerin çok fazla korele olmasının nedeni genel yeteneğin görece olarak toplam yetenekteki paynının az olması. Örnek meslekler: sporculuk, teknisyenlik, bazen mühendislik.

Peki sonuçlar başlıktaki soru hakkında ne söylüyor? Başlıkta nedensellik içeren bir soru var; "İyi bir okulda okumak beni iyi yapar mı?". Podcast'de Robert Liseli olduğunu söyledikten ve lisesini biraz övdükten sonra bir taciz geleneğinden bahsedip başlıkta sorduğu soruya şöyle cevap vermiş; korkularıyla yüzleşmeyenler istediği okulda okursa okusun iyi insan olamaz. Kendisi terapi gibi podcastler hedeflediği için bana çok yanlı bir iddia gibi geldi; sanki benim istatistik öğrenmeden iyi bir insan olunamaz demem gibi.

Başlıktaki soruda ise nedensellilik var. Okulun bir insanı daha iyi yapmadığı sadece korelasyonlarla açıklanamaz. Sorudaki iyi insan nedir onu tanımlamamız lazım, ben burada yetenek deyip kolaya kaçtım. Bunu tanımladıktan sonra yapmamız gereken şey, rastgele çocuklar seçip bu rastgele çocukları iyi okullarda ve kontrol dediğimiz standart okullarda okutup mezuniyetten sonra iyilik değişkeninin bu öğrenciler arasında hala rastgele olup olmadığını kontrol etmek.

Bunun yanında kesinlikle şundan eminiz; ben mektepte okumuş bir çok kötü insan tanıyorum o zaman mektep insanı iyi yapmıyor bir cevap değil. İki dağılım arasında yeterli miktarda bir fark oluşması bir değişiklik olduğunu iddia etmek için yeterli.

Burada paylaşılan analizi R ve Python'da gerekli kütüphaneleri önceden yüklenmiş docker containerı içinde çalıştırabilirsiniz.Binder