Ekolojik yanlışlık - Ecological fallacy

Bir ekolojik yanılgı (aynı zamanda ekolojik çıkarım yanılgı veya nüfus safsata ) bir olan biçimsel yanılgı yorumlanmasında istatistiki oluşur verilerin çıkarımlar bireylerin doğası hakkında bireyler ait oldukları grup hakkında çıkarımları saptanır. 'Ekolojik yanılgı', bazen istatistiksel bir yanılgı olmayan bölünme yanılgısını tanımlamak için kullanılan bir terimdir . Dört yaygın istatistiksel ekolojik yanılgı şunlardır: ekolojik korelasyonlar ve bireysel korelasyonlar arasındaki karışıklık, grup ortalaması ile toplam ortalama arasındaki karışıklık, Simpson'ın paradoksu ve daha yüksek ortalama ile daha yüksek olasılık arasındaki karışıklık.

Örnekler

ortalama ve medyan

Ekolojik yanılgıya bir örnek, bir birey için olasılıkları değerlendirirken popülasyon ortalamasının basit bir yoruma sahip olduğu varsayımıdır.

Örneğin, bir grubun ortalama puanı sıfırdan büyükse, bu, o gruptaki rastgele bir bireyin negatif bir puana göre pozitif puan alma olasılığının daha yüksek olduğu anlamına gelmez (olumlu puanlardan daha fazla negatif puan olduğu sürece). bir bireyin negatif puan alması daha olasıdır). Benzer şekilde, belirli bir grup insanın genel popülasyondan daha düşük bir ortalama IQ'ya sahip olduğu ölçülürse, grubun rastgele seçilen bir üyesinin ortalama IQ'dan daha düşük bir IQ'ya sahip olmama ihtimalinden daha yüksek olduğu sonucuna varmak bir hatadır. genel nüfusun; ayrıca grubun rastgele seçilmiş bir üyesinin genel popülasyonun rastgele seçilmiş bir üyesinden daha düşük bir IQ'ya sahip olmama ihtimalinden daha fazla olması zorunlu değildir. Matematiksel olarak bu, bir dağılımın pozitif bir ortalamaya, ancak negatif bir medyana sahip olabileceği gerçeğinden kaynaklanmaktadır. Bu özellik, dağılımın çarpıklığı ile bağlantılıdır .

Aşağıdaki sayısal örneği göz önünde bulundurun:

  • A Grubu: İnsanların %80'i 40 puan ve %20'si 95 puan aldı. Ortalama puan 51 puandır.
  • B Grubu: İnsanların %50'si 45 puan ve %50'si 55 puan aldı. Ortalama puan 50 puandır.
  • A ve B'den rastgele iki kişi seçersek 4 olası sonuç vardır:
    • A – 40, B – 45 (B kazanır, %40 olasılık – 0,8 × 0,5)
    • A – 40, B – 55 (B kazanır, %40 olasılık – 0,8 × 0,5)
    • A – 95, B – 45 (A kazanır, %10 olasılık – 0,2 × 0,5)
    • A – 95, B – 55 (A kazanır, %10 olasılık – 0,2 × 0,5)
  • A Grubunun daha yüksek bir ortalama puanı olmasına rağmen, zamanın %80'i rastgele bir A bireyi, B'nin rastgele bir bireyinden daha düşük puan alacaktır.

Bireysel ve toplu korelasyonlar

Émile Durkheim'a kadar uzanan araştırmalar, ağırlıklı olarak Protestan yerleşim yerlerinin, ağırlıklı olarak Katolik yerleşim yerlerine göre daha yüksek intihar oranlarına sahip olduğunu göstermektedir. Freedman'a göre, Durkheim'ın bulgularının bireysel düzeyde bir kişinin dinini intihar riskine bağladığı fikri, ekolojik yanılgıya bir örnektir. Grup düzeyindeki bir ilişki, birey düzeyindeki ilişkiyi otomatik olarak karakterize etmez.

Benzer şekilde, bireysel düzeyde zenginlik, Cumhuriyetçilere oy verme eğilimiyle pozitif ilişkili olsa bile, daha zengin devletlerin Demokratlara oy verme eğiliminde olduğunu gözlemliyoruz. Örneğin, 2004'te Cumhuriyetçi aday George W. Bush en fakir on beş eyaleti, Demokrat aday John Kerry ise en zengin 11 eyaletten 9'unu kazandı. Yine de, yıllık geliri 200.000 doların üzerinde olan seçmenlerin %62'si Bush'a oy verdi, ancak yıllık geliri 15.000 dolar veya daha az olan seçmenlerin yalnızca %36'sı Bush'a oy verdi. Bireysel servet kontrol edildikten sonra bile oylama tercihleri ​​devletin toplam servetinden etkileniyorsa, toplam seviye korelasyon bireysel seviye korelasyondan farklı olacaktır. Oy tercihinde gerçek itici faktör, kişinin kendi algıladığı göreli zenginlik olabilir; belki de kendilerini komşularından daha iyi görenlerin Cumhuriyetçilere oy verme olasılığı daha yüksek. Bu durumda, bir birey daha zengin olursa Cumhuriyetçilere oy verme olasılığı daha yüksek olacaktır, ancak komşusunun serveti artarsa ​​(daha zengin bir devletle sonuçlanır) bir Demokrat'a oy verme olasılığı daha yüksek olacaktır.

Bununla birlikte, devlet düzeyinde ve bireysel düzeyde zenginliğe dayalı olarak oy verme alışkanlıklarında gözlemlenen farklılık, yukarıda tartışıldığı gibi daha yüksek ortalamalar ve daha yüksek olasılıklar arasındaki ortak kafa karışıklığıyla da açıklanabilir. Devletler, daha zengin insanları (yani, yıllık geliri 200.000 doların üzerinde olan daha fazla insanı) barındırdıkları için değil, daha çok az sayıda süper zengin birey içerdiği için daha zengin olabilir; bu durumda ekolojik yanılgı, daha zengin ülkelerdeki bireylerin daha zengin olma olasılığının yanlış varsayılmasından kaynaklanır.

Ekolojik yanılgılara ilişkin birçok örnek, genellikle farklı düzeylerdeki analizleri ve çıkarımları birleştiren sosyal ağ araştırmalarında bulunabilir. Bu, Sumatra'daki çiftçi ağları üzerine bir akademik makalede gösterilmiştir.

Robinson paradoksu

William S. Robinson'ın 1950 tarihli bir makalesi, 1930 nüfus sayımına göre her eyalet ve Columbia Bölgesi için okuma yazma bilmeyenlerin oranını ve ABD dışında doğan nüfusun oranını hesapladı . Bu iki rakamın -0,53'lük bir negatif korelasyonla ilişkili olduğunu gösterdi; başka bir deyişle, bir eyaletteki göçmenlerin oranı ne kadar büyükse, ortalama okuma yazma bilmeme durumu da o kadar düşük olur. Bununla birlikte, bireyler dikkate alındığında, korelasyon +0.12 idi (göçmenler, yerli vatandaşlardan ortalama olarak daha fazla okuma yazma bilmiyordu). Robinson, eyalet nüfusları düzeyindeki negatif korelasyonun, göçmenlerin yerli nüfusun daha okuryazar olduğu eyaletlere yerleşme eğiliminde olmasından kaynaklandığını gösterdi. Nüfus düzeyi veya "ekolojik" veriler temelinde bireyler hakkında sonuçlar çıkarmaya karşı uyarıda bulundu. 2011 yılında Robinson'ın ekolojik korelasyon hesaplamalarının yanlış durum düzeyi verilerine dayandığı tespit edildi. Yukarıda bahsedilen -0,53'ün korelasyonu aslında -0,46'dır. Robinson'ın makalesi ufuk açıcıydı, ancak 'ekolojik safsata' terimi 1958'e kadar Selvin tarafından icat edilmedi.

resmi sorun

Toplam niceliklerin bağıntısı (veya ekolojik bağıntı ), bireysel niceliklerin bağıntısına eşit değildir. X iY i ile bireysel düzeyde iki niceliği belirtin . N büyüklüğündeki gruplardaki toplam miktarların kovaryansı formülü şöyledir:

Birleştirilmiş iki değişkenin kovaryansı, yalnızca aynı bireyler içindeki iki değişkenin kovaryansına değil, aynı zamanda farklı bireyler arasındaki değişkenlerin kovaryanslarına da bağlıdır. Başka bir deyişle, toplu değişkenlerin korelasyonu, bireysel düzeyde ilgili olmayan yatay kesit etkilerini hesaba katar.

Korelasyonlar için problem, doğal olarak, toplam değişkenler üzerindeki regresyonlar için bir problem gerektirir: bu nedenle korelasyon yanılgısı, nedensel etkileri ölçmek isteyen bir araştırmacı için önemli bir konudur. Sonucun şunlardan etkilendiği bir regresyon modeliyle başlayın .

Toplam düzeyde regresyon modeli, bireysel denklemlerin toplanmasıyla elde edilir:

Hiçbir şey, regresörlerin ve hataların toplam düzeyde ilişkilendirilmesini engellemez. Bu nedenle, genel olarak, toplu veriler üzerinde bir regresyon çalıştırmak, bireysel verilerle bir regresyon çalıştırmakla aynı modeli tahmin etmez.

Toplam model, ancak ve ancak şu durumlarda doğrudur:

İçin kontrol Bu araçlar , belirlemez .

Toplama ve bireysel çıkarım arasında seçim yapma

Toplam modelle ilgileniyorsanız, toplu veriler üzerinde regresyon çalıştırmanın yanlış bir tarafı yoktur. Örneğin, bir eyalet valisi için, polis gücündeki bir artışın politika sonuçlarıyla ilgileniyorsa, eyalet düzeyinde polis gücü arasında suç oranı üzerinde gerilemeler yapmak doğrudur. Bununla birlikte, bir belediye meclisi, polis gücündeki bir artışın şehir düzeyindeki suç oranındaki etkisini eyalet düzeyindeki korelasyondan çıkarırsa, ekolojik bir yanılgı olur.

Bazı politikalar üzerindeki toplu etkileri anlamak için toplu veya bireysel regresyonları çalıştırmayı seçmek, aşağıdaki dengeye bağlıdır: toplu regresyonlar bireysel düzeydeki verileri kaybeder, ancak bireysel regresyonlar güçlü modelleme varsayımları ekler. Bazı araştırmacılar, ekolojik korelasyonun kamu politikası eylemlerinin sonucunun daha iyi bir resmini verdiğini öne sürüyorlar, bu nedenle bu amaç için bireysel düzeydeki korelasyon yerine ekolojik korelasyonu tavsiye ediyorlar (Lubinski & Humphreys, 1996). Diğer araştırmacılar, özellikle düzeyler arasındaki ilişkiler açıkça modellenmediğinde, aynı fikirde değildir. Ekolojik yanılgıyı önlemek için, hiçbir bireysel veriye sahip olmayan araştırmacılar, önce bireysel düzeyde neler olup bittiğini modelleyebilir, ardından birey ve grup düzeylerinin nasıl ilişkili olduğunu modelleyebilir ve son olarak grup düzeyinde meydana gelen herhangi bir şeyin ilişkinin anlaşılmasına katkıda bulunup bulunmadığını inceleyebilir. Örneğin, devlet politikalarının etkisini değerlendirirken, politika etkilerinin devletler arasında politikaların kendisinden daha az değiştiğini bilmek yardımcı olur, bu da politika farklılıklarının yüksek ekolojik korelasyonlara rağmen sonuçlara iyi çevrilmediğini gösterir (Rose, 1973). ).

Grup ve toplam ortalamalar

Ekolojik yanılgı, aşağıdaki yanılgıya da işaret edebilir: bir grubun ortalaması, toplam nüfusun ortalamanın grup büyüklüğüne bölünmesiyle yaklaşık olarak hesaplanır. Diyelim ki ABD'deki Protestanların sayısı ve intihar oranı biliniyor ama din ile intiharı bireysel düzeyde ilişkilendiren bir veri yok. Protestanların intihar oranıyla ilgileniyorsanız, bunu toplam intihar oranının Protestan sayısına bölünmesiyle tahmin etmek yanlış olur. Resmi olarak, grubun ortalamasını belirtin , genellikle şunları elde ederiz:

Bununla birlikte, toplam olasılık yasası şunları verir:

0 ile 1 arasında olduğunu bildiğimiz gibi , bu denklem için bir sınır verir .

Simpson'ın paradoksu

Çarpıcı bir ekolojik yanılgı, Simpson'ın paradoksu : gruplara ayrılmış iki popülasyonu karşılaştırırken, ilk popülasyondaki bazı değişkenlerin ortalamasının her grupta daha yüksek, ancak toplam popülasyonda daha düşük olabileceği gerçeği. Biçimsel olarak, Z'nin her bir değeri farklı bir gruba ve X bir tedaviye atıfta bulunduğunda, şöyle olabilir:

Zaman bağımlı değildir , Simpson paradoksu tam olarak ihmal değişken eğilim regresyonu için Y ile X geri çekici bir olan bir kukla değişken ve ihmal değişken a, kategorik değişken bu alır her değer için gruplar oluşturan. Uygulama dikkat çekicidir çünkü yanlılık, parametrelerin zıt işaretlere sahip olması için yeterince yüksektir.

Yasal uygulamalar

Ekolojik yanılgı, seçimden sonra bir dizi yasadışı seçmenin tespit edildiği 2004 Washington valilik seçimlerine yapılan bir mahkeme itirazında tartışıldı ; oyları bilinmiyordu, çünkü oylama gizli oydu . Karşı çıkanlar, seçimde kullanılan yasa dışı oyların, kullanılmış oldukları bölgelerin oy verme modellerini takip edeceğini ve bu nedenle düzenlemelerin buna göre yapılması gerektiğini savundu. Bir uzman tanık, bu yaklaşımın, tüm Seattle Mariners takımının vuruş ortalamasına bakarak Ichiro Suzuki'nin vuruş ortalamasını bulmaya çalışmak gibi olduğunu söyledi , çünkü yasadışı oylar her bir bölgenin seçmenlerinin temsili olmayan bir örneği tarafından yapıldı ve şöyle olabilir: Ichiro, ekibinin geri kalanından olduğu için bölgedeki ortalama seçmenlerden farklıydı. Hakim, meydan okuyanların argümanının ekolojik bir yanlışlık olduğuna karar verdi ve reddetti.

Ayrıca bakınız

Referanslar

daha fazla okuma