TEXAS_SHARPSHOOTERhigh Severity

Teksas Keskin Nişancısı (Texas Sharpshooter)

"Texas Sharpshooter"

Özet

Büyük bir veri setinden sadece işine yarayan (kümelenen) verileri seçip, rastgeleliği bir 'düzen' veya 'başarı' gibi gösterme hatası.

Akademik Tanım

İsmini bir fıkradan alır: Teksaslı bir adam ahırın duvarına rastgele ateş eder, sonra gidip mermi deliklerinin en yoğun olduğu yerin etrafına bir hedef tahtası çizer ve kendini 'keskin nişancı' ilan eder. İstatistiksel analizde bu, hipotezi veriye göre uydurmak (p-hacking) veya rastgele kümeleri (clusters) anlamlı sanmak (Clustering Illusion) olarak bilinir.

Mantıksal Form
1.Büyük bir veri yığını vardır (Rastgele dağılmış).
2.A Kişisi, verilerin yoğunlaştığı küçük bir alanı seçer.
3.A Kişisi, dışarıda kalan (uymayan) verileri görmezden gelir.
4.Sonuç: 'Bakın, burada mükemmel bir düzen/ilişki var!'
Vaka Analizleri
Hatalı Argüman
"Bu gazlı içecek fabrikasının yakınındaki mahallede kanser oranı %10 arttı. Demek ki fabrika kanser yapıyor."
Analiz:Ülke genelinde rastgele kanser kümeleri oluşabilir. Fabrikanın olmadığı başka yerlerde de artış var mı? Sadece uyan veriyi mi seçiyorsunuz?
Hatalı Argüman
"Dün seni düşündüm ve aradın. Aramızda telepatik bağ var."
Analiz:Seni düşünüp aramadığın binlerce anı (uymayan veriyi) göz ardı ediyorsun. Sadece tutan tek örneğe odaklanıyorsun.

Varyasyonlar

P-Hacking

Bilimsel araştırmalarda, istenen sonucu verene kadar veriyi farklı şekillerde filtrelemek.

Nostradamus Etkisi

Binlerce rastgele kehanetten sadece tutan 3 tanesini gösterip 'Geleceği bildi' demek.

İstisnalar

Hipotez Testi

Eğer hedef tahtasını (hipotezi) ateş etmeden ÖNCE çizdiyseniz (a priori), vuruşlarınız anlamlıdır. Veriyi gördükten sonra çizdiyseniz (post hoc) safsatadır.