Dış geçerlilik - External validity

Dış geçerlilik , bilimsel bir çalışmanın sonuçlarını o çalışmanın bağlamı dışında uygulamanın geçerliliğidir. Başka bir deyişle, bir çalışmanın sonuçlarının diğer durumlar, insanlar, uyaranlar ve zamanlar için ve bunlar arasında genelleştirilebilme derecesidir. Buna karşılık, iç geçerlilik çıkarılan sonuçların geçerliliği olan içinde belli bir çalışma bağlamında. Genel sonuçlar araştırmalarda neredeyse her zaman bir amaç olduğundan, dış geçerlilik herhangi bir çalışmanın önemli bir özelliğidir. Dış geçerliliğin matematiksel analizi, heterojen popülasyonlar arasında genellemenin mümkün olup olmadığının belirlenmesi ve geçerli genellemeler üreten istatistiksel ve hesaplama yöntemlerinin tasarlanması ile ilgilidir.

tehditler

"Dış geçerliliğe yönelik bir tehdit, belirli bir çalışmanın bulgularından bir genelleme yaparken nasıl yanılabileceğinizin bir açıklamasıdır." Çoğu durumda, bir faktörün (yani bağımsız değişkenin ) etkisi diğer faktörlere bağlı olduğunda genellenebilirlik sınırlıdır . Bu nedenle, dış geçerliliğe yönelik tüm tehditler istatistiksel etkileşimler olarak tanımlanabilir . Bazı örnekler şunları içerir:

  • İşleme göre yetenek Etkileşim: Örnek, bağımsız değişkenle etkileşime giren ve genellenebilirliği sınırlayan belirli özelliklere sahip olabilir. Örneğin, karşılaştırmalı psikoterapi çalışmaları genellikle belirli örnekler kullanır (örn. gönüllüler, yüksek düzeyde depresyonda, komorbidite yok). Psikoterapi bu örnek hastalarda etkili bulunursa, gönüllü olmayanlar veya hafif depresyonda olanlar veya eşzamanlı başka bozuklukları olan hastalar için de etkili olacak mı? Aksi takdirde, çalışmanın dış geçerliliği sınırlı olacaktır.
  • Tedavi etkileşimlerine göre durum: Bir çalışmanın tüm durumsal özellikleri (örn. tedavi koşulları, zaman, yer, aydınlatma, gürültü, tedavi uygulaması, araştırmacı, zamanlama, ölçüm kapsamı ve kapsamı, vb.) genellenebilirliği potansiyel olarak sınırlandırır.
  • Tedavi etkileşimleriyle ön test: Neden-sonuç ilişkileri ancak ön testler yapıldığında bulunabiliyorsa, bu da bulguların genelliğini sınırlar. Bu bazen "duyarlılık" olarak adlandırılır, çünkü ön test insanları tedavinin manipülasyonuna karşı daha duyarlı hale getirir.

Bir çalışmanın dış geçerliliğinin geçerliliği ile sınırlı olduğunu unutmayın . Bir çalışma içinde yapılan bir nedensel çıkarım geçersizse, o çıkarımın diğer bağlamlara genellemeleri de geçersiz olacaktır.

Cook ve Campbell genelleme arasındaki önemli bir ayrım yapılmış için bazı nüfus ve genelleme genelinde bazı arka plan faktörünün farklı düzeylerde tanımlanan alt popülasyonlar. Lynch genelleme yapmak mümkün neredeyse hiç olduğunu ileri sürmüştür için tarihin bir anlık haricinde anlamlı popülasyonları, ancak derecesini test etmek mümkün olduğu için bazı bağımlı değişken genelleştirir bazı nedene etkisi karşısında bazı arka plan faktörü değişir alt popülasyonlar. Bu, araştırılan tedavi etkisinin bir veya daha fazla arka plan faktörü ile etkileşimler tarafından yönetilip yönetilmediğinin test edilmesini gerektirir.

Tehditleri silahsızlandırmak

Geçerliliğe yönelik tehditleri sıralamak, araştırmacıların yersiz genellemelerden kaçınmasına yardımcı olabilirken, geçerli bir genelleme sağlamak için bu tehditlerin çoğu etkisiz hale getirilebilir veya sistematik bir şekilde etkisiz hale getirilebilir. Spesifik olarak, bir popülasyondan elde edilen deneysel bulgular, popülasyon farklılıklarını aşmak ve deneylerin gerçekleştirilemediği ikinci bir popülasyonda geçerli genellemeler üretmek için "yeniden işlenebilir" veya "yeniden kalibre edilebilir". Pearl ve Bareinboim, genelleme problemlerini iki kategoriye ayırdılar: (1) kendilerini geçerli yeniden kalibrasyona uygun olanlar ve (2) dış geçerliliğin teorik olarak imkansız olduğu olanlar. Graf tabanlı hesabı kullanarak, geçerli bir genelleme sağlamak için bir sorun örneği için gerekli ve yeterli bir koşul elde ettiler ve ne zaman varsa, gerekli yeniden kalibrasyonu otomatik olarak üreten algoritmalar geliştirdiler. Bu, dış geçerlilik problemini bir çizge teorisi alıştırmasına indirger ve bazı filozofların problemin artık çözüldüğü sonucuna varmalarına yol açmıştır.

Dış geçerlilik sorununun önemli bir varyantı, örnekleme yanlılığı olarak da bilinen seçim yanlılığı ile ilgilidir ; yani, amaçlanan popülasyonun temsili olmayan örnekleri üzerinde çalışmalar yürütüldüğünde ortaya çıkan yanlılık. Örneğin, üniversite öğrencileri üzerinde bir klinik araştırma yapılırsa, araştırmacı sonuçların yaş, eğitim ve gelir gibi özelliklerin tipik bir öğrencininkinden önemli ölçüde farklı olduğu tüm popülasyona genellenip genellenmediğini bilmek isteyebilir. Bareinboim ve Pearl'ün grafiğe dayalı yöntemi, örnek seçim yanlılığının ortadan kaldırılabileceği koşulları tanımlar ve bu koşullar karşılandığında yöntem, tüm popülasyondaki ortalama nedensel etkinin yansız bir tahmin edicisini oluşturur. Yanlış örneklenmiş çalışmalardan genelleme ile farklı popülasyonlar arasında genelleme arasındaki temel fark, popülasyonlar arasındaki farklılıkların genellikle yaş veya etnik köken gibi önceden var olan faktörlerden kaynaklanması gerçeğinde yatmaktadır, oysa seçim yanlılığı genellikle tedavi sonrası koşullardan kaynaklanmaktadır, örneğin, çalışmayı bırakan hastalar veya yaralanmanın ciddiyetine göre seçilen hastalar. Seçim, işlem sonrası faktörler tarafından yönetildiğinde, sapmasız tahmin sağlamak için geleneksel olmayan yeniden kalibrasyon yöntemleri gerekir ve bu yöntemler problemin grafiğinden kolayca elde edilir.

Örnekler

Yaşın, tedavi etkisinin bireyden bireye değişmesine neden olan önemli bir faktör olduğuna karar verilirse, örneklenen öğrenciler ile genel popülasyon arasındaki yaş farklılıkları, o popülasyondaki ortalama tedavi etkisinin önyargılı bir tahminine yol açacaktır. Bu tür bir önyargı, basit bir yeniden tartma prosedürü ile düzeltilebilir: Öğrenci alt popülasyonundaki yaşa özel etkiyi alıyoruz ve genel popülasyondaki yaş dağılımını kullanarak ortalamasını hesaplıyoruz. Bu bize popülasyondaki ortalama tedavi etkisinin tarafsız bir tahminini verecektir. Öte yandan, çalışma örneğini genel popülasyondan ayıran ilgili faktörün kendisi tedaviden etkileniyorsa, farklı bir yeniden tartma şemasının başlatılması gerekir. Bu faktöre Z adını vererek , deneysel örnekte X'in Y üzerindeki z'ye özgü etkisinin tekrar ortalamasını alırız , ancak şimdi bunu X'in Z üzerindeki "nedensel etkisi" ile tartarız . Başka bir deyişle, yeni ağırlık, tüm popülasyona X=x tedavisi uygulanmış Z=z düzeyine ulaşan birimlerin oranıdır . Genellikle yazılı olan bu girişimsel olasılık, bazen genel popülasyondaki gözlemsel çalışmalardan tahmin edilebilir.

Bu yapının tipik bir örneği, Z tedavi ile sonuç arasında bir aracı olduğunda ortaya çıkar. Örneğin, tedavi kolesterol düşürücü bir ilaç olabilir , Z kolesterol düzeyi ve Y yaşam beklentisi olabilir. Burada, Z, tedavisi ve sonucunu belirleyen önemli bir faktör tarafından etkilenen hem de Y . Deneysel çalışma için seçilen deneklerin, genel popülasyonda tipik olandan daha yüksek kolesterol düzeylerine sahip olma eğiliminde olduğunu varsayalım. İlacın tüm popülasyonda hayatta kalma üzerindeki ortalama etkisini tahmin etmek için önce deneysel çalışmada z'ye özgü tedavi etkisini hesaplıyoruz ve ardından bir ağırlık fonksiyonu olarak kullanarak ortalamasını alıyoruz . Tahmin eğilim içermeyen bile olur elde Z ve Y'nin her ikisi de etkileyen, ölçülmemiş ortak faktör olduğunda, eleştirilmiştir yani edilir olduğu Z ve Y .

Bu ve diğer ağırlıklandırma şemalarının geçerliliğini sağlayan kesin koşullar, Bareinboim ve Pearl, 2016 ve Bareinboim ve diğerleri, 2014'te formüle edilmiştir.

Dış, iç ve ekolojik geçerlilik

Pek çok çalışma ve araştırma tasarımında, iç geçerlik ile dış geçerlilik arasında bir değiş tokuş olabilir : İç geçerliliği artırma girişimleri, bulguların genellenebilirliğini de sınırlayabilir ve bunun tersi de geçerlidir. Bu durum birçok araştırmacının "ekolojik olarak geçerli" deneyler çağrısı yapmasına neden olmuştur. Bununla deneysel prosedürlerin "gerçek dünya" koşullarına benzemesi gerektiği anlamına gelir. Yapay olarak kontrol edilen ve daraltılmış ortamlara odaklanan birçok laboratuvar temelli çalışmada ekolojik geçerliliğin eksikliğini eleştiriyorlar . Bazı araştırmacılar, dış geçerlilik ve ekolojik geçerliliğin, ekolojik olarak geçerli araştırma tasarımlarına dayanan nedensel çıkarımların genellikle yapay olarak üretilmiş bir laboratuvar ortamında elde edilenlerden daha yüksek derecelerde genellenebilirliğe izin vermesi anlamında yakından ilişkili olduğunu düşünüyor. Bununla birlikte, bu yine bazı popülasyonlara genelleme (ekolojik geçerlilikle ilgili endişelerle yakından ilişkilidir) ve bazı arka plan faktörlerinde farklılık gösteren alt popülasyonlar arasında genelleme arasındaki farkla ilgilidir. Ekolojik olarak geçerli araştırma ortamlarında üretilen bazı bulgular pek genellenebilir olmayabilir ve oldukça kontrollü ortamlarda üretilen bazı bulgular neredeyse evrensel dış geçerlilik iddiasında bulunabilir. Bu nedenle, dış ve ekolojik geçerlilik bağımsızdır - bir çalışma dış geçerliliğe sahip olabilir ancak ekolojik geçerliliğe sahip olmayabilir ve bunun tersi de geçerlidir.

Nitel araştırma

İçinde nitel araştırma paradigması, dış geçerlik aktarılabilirlik kavramı ile değiştirilir. Aktarılabilirlik, araştırma sonuçlarının benzer parametrelere, popülasyonlara ve özelliklere sahip durumlara aktarılabilmesidir.

deneylerde

Araştırmacıların, deneylerin doğası gereği dış geçerliliği düşük olduğunu iddia etmeleri yaygındır. Bazıları, deneysel yöntemi takip ederken birçok dezavantajın ortaya çıkabileceğini iddia ediyor. İnsanları koşullara rastgele atamak ve yabancı değişkenlerin etkilerini ekarte etmek için durum üzerinde yeterince kontrol kazanma sayesinde, durum biraz yapay hale gelebilir ve gerçek hayattan uzaklaşabilir.

İki tür genellenebilirlik söz konusudur:

  1. Biz durumdan genelleme hangi ölçüde gerçek hayattan bir deneyci tarafından (inşa durumlar karşısında genelleştirilebilirliğini ) ve
  2. Deneye katılan insanlardan genel olarak insanlara ne ölçüde genelleyebileceğimiz (insanlar arasında genellenebilirlik )

Ancak, genelleme yaparken Cook ve Campbell'ın kavramına ilgilendirmeyen bu iki faktörü de karşı bazı hedef nüfusun ziyade deneyden bulguların genellenebilirliğini değerlendirilmesi tartışmalı daha merkezi bir görev karşısında çalışılan özel durumu farklı alt popülasyonlar ve insanların Katılımcıların farklı kim anlamlı bir şekilde incelenmiştir.

Deney eleştirmenleri, dış geçerliliğin saha ayarlarının (veya en azından gerçekçi laboratuvar ayarlarının) kullanılmasıyla ve yanıt verenlerin gerçek olasılık örneklerinin kullanılmasıyla geliştirilebileceğini öne sürer. Kişinin hedefi genelleştirilebilirliğini anlamaktır Ancak, karşıdan karşıya durumsal ya da kişisel arka plan faktörleri bakımından farklılık alt popülasyonlar, bu ilaçlar yaygın kendilerine atfedilen harici geçerliliğini artırmadaki etkinliği yok. Araştırmacının farkında olmadığı (muhtemelen göründüğü gibi) arka plan faktör X tedavi etkileşimleri varsa, bu araştırma uygulamaları önemli bir dış geçerlilik eksikliğini maskeleyebilir. Endüstriyel ve örgütsel psikoloji hakkında yazan Dipboye ve Flanagan, kanıtların, bir alan ortamından ve bir laboratuvar ortamından elde edilen bulguların ikinci bir alan ortamına genellenmesinin eşit derecede olası olmadığına dikkat çekiyor . Bu nedenle, saha çalışmaları doğası gereği dış geçerlilik açısından yüksek, laboratuvar çalışmaları da doğası gereği dış geçerlilik açısından düşük değildir. Her iki durumda da, çalışılan belirli tedavi etkisinin, o çalışmada sabit tutulan arka plan faktörlerindeki değişikliklerle değişip değişmeyeceğine bağlıdır. Bir kişinin çalışması, tedavilerle etkileşime girmeyen bazı arka plan faktörleri düzeyinde "gerçekçi değilse", dış geçerlilik üzerinde hiçbir etkisi yoktur. Yalnızca bir deney bazı arka plan faktörlerini gerçekçi olmayan bir düzeyde sabit tutarsa ​​ve bu arka plan faktörünü değiştirmek güçlü bir Tedavi x Arka Plan faktör etkileşimi ortaya çıkarırsa, dış geçerlilik tehdit altındadır.

durumlar arasında genellenebilirlik

Üniversitelerde denenen psikoloji deneylerinde yapılan araştırmalar genellikle yapay durumlarda yapıldığı ve gerçek hayata genellenemeyeceği için eleştirilir. Bu sorunu çözmek için sosyal psikologlar, çalışmalarını olabildiğince gerçekçi hale getirerek sonuçlarının genellenebilirliğini artırmaya çalışırlar. Yukarıda belirtildiği gibi, bu, belirli bir popülasyona genelleme umuduyla. Gerçekçilik, ortam bir şekilde daha gerçekçi olsaydı veya çalışma katılımcıları farklı bir gerçekçi ortama yerleştirilseydi, sonuçların değişip değişmeyeceği hakkında açıklamalarda bulunmaya yardımcı olmaz. Yalnızca bir ayar test edilirse, ayarlar arasında genellenebilirlik hakkında açıklamalar yapmak mümkün değildir.

Bununla birlikte, birçok yazar dış geçerliliği ve gerçekçiliği birleştirir. Bir deneyin gerçekçi olabilmesinin birden fazla yolu vardır:

  1. Deneysel bir durumun günlük yaşamda sıklıkla meydana gelen olaylarla benzerliği - pek çok deneyin kesinlikle gerçek dışı olduğu açıktır.
  2. Birçok deneyde, insanlar günlük yaşamda nadiren karşılaşacakları durumlara yerleştirilir.

Bu, bir deneyin gerçek yaşam durumlarına ne ölçüde benzediğiyle, deneyin sıradan gerçekçiliği olarak anılır .

Bir çalışmanın psikolojik gerçekçilikte yüksek olmasını sağlamak daha önemlidir - bir deneyde tetiklenen psikolojik süreçler, günlük yaşamda meydana gelen psikolojik süreçlere ne kadar benzer.

İnsanlar kendilerini gerçek bir olaya dalmış bulurlarsa, psikolojik gerçekçilik yükselir. Bunu başarmak için, araştırmacılar bazen katılımcılara bir kapak hikayesi - çalışmanın amacının yanlış bir açıklaması - anlatırlar . Bununla birlikte, deneyciler katılımcılara deneyin amacını söyleseydi, o zaman böyle bir prosedür psikolojik gerçekçilikte düşük olurdu. Günlük yaşamda, hiç kimse acil durumların ne zaman ortaya çıkacağını bilemez ve insanların bunlara yanıt planlamak için zamanları yoktur. Bu, tetiklenen psikolojik süreçlerin türlerinin gerçek bir acil durumdan büyük ölçüde farklı olacağı ve çalışmanın psikolojik gerçekçiliğini azaltacağı anlamına gelir.

İnsanlar her zaman neyi neden yaptıklarını veya ne yaptıklarını, gerçekleşene kadar bilmezler. Bu nedenle, katılımcılara deneysel bir durumu anlatmak ve daha sonra onlardan normal yanıt vermelerini istemek, aslında aynı durumda olan kişilerin davranışlarıyla eşleşmeyebilecek yanıtlar üretecektir. İnsanların varsayımsal bir durumda ne yapacaklarına dair tahminlerine güvenemeyiz; İnsanların gerçekte ne yapacaklarını ancak gerçek dünyada meydana gelen aynı psikolojik süreçleri tetikleyen bir durum oluşturduğumuzda öğrenebiliriz.

İnsanlar arasında genellenebilirlik

Sosyal psikologlar, genel olarak insanların sosyal etkilere nasıl duyarlı olduklarını inceler. Birkaç deney, ilginç, beklenmedik bir sosyal etki örneğini belgeledi; bu sayede, başkalarının orada olduğu bilgisi, insanların yardım etme olasılığını azalttı.

Bir deneyin sonuçlarının belirli bir popülasyonun davranışını temsil ettiğinden emin olmanın tek yolu, katılımcıların bu popülasyondan rastgele seçilmesini sağlamaktır. Sosyal psikoloji deneyleri için rastgele örneklerin seçilmesi pratik olmadığı ve pahalı olduğu için deneylerdeki örnekler anketlerde olduğu gibi rastgele seçilemez. Siyasi bir anketin parçası olarak rastgele bir insan örneğini telefonda birkaç soruyu yanıtlamaya ikna etmek yeterince zordur ve bu tür anketlerin yapılması binlerce dolara mal olabilir. Ayrıca, bir şekilde gerçekten rastgele bir örnek alınabilmiş olsa bile, deneysel tedavilerin etkilerinde gözlemlenmeyen heterojenlik olabilir... Bir tedavi bazı alt gruplar üzerinde olumlu bir etkiye sahip olabilir, ancak diğerleri üzerinde olumsuz bir etkiye sahip olabilir. Tedavi ortalamalarında gösterilen etkiler herhangi bir alt gruba genellenemez.

Birçok araştırmacı, bu süreçlerin evrensel olarak paylaşılacak kadar temel olduğunu varsayarak, insanları sosyal etkiye duyarlı hale getiren temel psikolojik süreçleri inceleyerek bu sorunu ele almaktadır. Bazı sosyal psikolog süreçleri farklı kültürlerde farklılık gösterir ve bu durumlarda farklı insan örnekleri üzerinde çalışılması gerekir.

çoğaltmalar

Bir deneyin dış geçerliliğinin nihai testi, tekrarlamadır - genellikle farklı denek popülasyonlarıyla veya farklı ortamlarda çalışmayı yeniden yürütmek. Araştırmacılar, hala aynı sonuçları alıp almadıklarını görmek için genellikle farklı yöntemler kullanacaklardır.

Bir problemle ilgili birçok çalışma yapıldığında sonuçlar değişebilir. Birkaç çalışma, seyirci sayısının yardım etme davranışı üzerindeki etkisini bulabilirken, birkaçı bulamıyor. Bundan bir anlam çıkarmak için, bağımsız bir değişkenin etkisinin güvenilir olup olmadığını görmek için iki veya daha fazla çalışmanın sonuçlarının ortalamasını alan meta-analiz adı verilen istatistiksel bir teknik vardır . Bir meta analiz esasen bize birçok çalışmanın sonuçlarındaki bulguların şansa veya bağımsız değişkene atfedilebilir olma olasılığını söyler. 20 çalışmadan sadece birinde bağımsız bir değişkenin etkisi bulunursa, meta-analiz size bir çalışmanın istisna olduğunu ve ortalama olarak bağımsız değişkenin bağımlı değişkeni etkilemediğini söyleyecektir. Çalışmaların çoğunda bağımsız bir değişken bir etkiye sahipse, meta-analizin bize ortalama olarak bağımlı değişkeni etkilediğini söylemesi muhtemeldir.

Laboratuvarla sınırlı olmayan güvenilir fenomenler olabilir. Örneğin, seyircilerin sayısının artmasının, çocuklar, üniversite öğrencileri ve geleceğin bakanları dahil olmak üzere pek çok türde insana yardım etme davranışını engellediği bulunmuştur; İsrail'de; ABD'deki küçük kasabalarda ve büyük şehirlerde; psikoloji laboratuvarları, şehir sokakları ve metro trenleri gibi çeşitli ortamlarda; ve nöbetler, olası yangınlar, kavgalar ve kazalar gibi çeşitli acil durumların yanı sıra lastiğin patlaması gibi daha az ciddi olaylarla. Bu çoğaltmaların çoğu, insanların bir deneyin yürütülmekte olduğunu bilmelerinin mümkün olmadığı gerçek yaşam ortamlarında gerçekleştirilmiştir.

Sosyal psikoloğun temel ikilemi

Psikolojide deneyler yaparken, bazıları iç ve dış geçerlilik arasında her zaman bir değiş tokuş olduğuna inanırlar.

  1. Hiçbir yabancı değişkenin sonuçları etkilememesini sağlamak ve insanları koşullara rastgele atamak için durum üzerinde yeterli kontrole sahip olmak ve
  2. sonuçların günlük hayata genellenebilmesini sağlamak.

Bazı araştırmacılar, dış geçerliliği artırmanın iyi bir yolunun saha deneyleri yapmak olduğuna inanmaktadır . Bir saha deneyinde, insanların davranışları laboratuvarın dışında, doğal ortamında incelenir. Bir saha deneyi, gerçek yaşam ortamında yapılması dışında, tasarım olarak bir laboratuvar deneyi ile aynıdır. Bir alan deneyine katılanlar, yaşadıkları olayların aslında bir deney olduğunun farkında değildirler. Bazıları, tipik bir üniversite öğrencisi örneğinden daha çeşitli gerçek insanlarla gerçek dünyada gerçekleştiği için böyle bir deneyin dış geçerliliğinin yüksek olduğunu iddia ediyor. Bununla birlikte, gerçek dünya ortamları önemli ölçüde farklılık gösterdiğinden, bir gerçek dünya ortamındaki bulgular başka bir gerçek dünya ortamına genellenebilir veya genelleştirilmeyebilir.

Tek bir deneyde ne iç ne de dış geçerlilik yakalanır. Sosyal psikologlar, insanların rastgele olarak farklı koşullara atandığı ve tüm dış değişkenlerin kontrol edildiği laboratuvar deneyleri yürüterek ilk önce içsel geçerliliği seçerler. Diğer sosyal psikologlar, araştırmalarının çoğunu saha araştırmalarında yürüterek kontrol etmek yerine dış geçerliliği tercih eder ve birçoğu her ikisini de yapar. Birlikte ele alındığında, her iki tür çalışma da mükemmel deneyin gereksinimlerini karşılar. Tekrarlama yoluyla, araştırmacılar belirli bir araştırma sorusunu maksimum iç ve dış geçerlilikle çalışabilirler.

Ayrıca bakınız

Notlar

  1. ^ Mitchell, M. & Jolley, J. (2001). Araştırma Tasarımı Açıklaması (4. Baskı) New York:Harcourt.
  2. ^ a b c d Aronson, E., Wilson, TD, Akert, RM, & Fehr, B. (2007). Sosyal Psikoloji. (4 baskı). Toronto, ON: Pearson Education.
  3. ^ a b Pearl, Judea; Bareinboim, Elias (2014). "Dış geçerlilik: Do- hesabından popülasyonlar arasında taşınabilirliğe". İstatistik Bilimi . 29 (4): 579-595. arXiv : 1503.01603 . doi : 10.1214/14-sts486 . S2CID  5586184 .
  4. ^ Trochim, William M. The Research Methods Knowledge Base, 2. Baskı.
  5. ^ a b c d e Lynch, John (1982). "Tüketici Araştırmalarında Deneylerin Dış Geçerliliği Üzerine". Tüketici Araştırmaları Dergisi . 9 (3): 225–239. doi : 10.1086/208919 . JSTOR  2488619 .
  6. ^ a b Cook, Thomas D.; Campbell, Donald T. (1979). Yarı Deney: Saha Ayarları için Tasarım ve Analiz Sorunları . Chicago: Rand McNally Koleji Yayıncılık Şirketi. ISBN'si 978-0395307908.
  7. ^ a b Lynch, John (1999). "Teori ve Dış Geçerlilik". Pazarlama Bilimleri Akademisi Dergisi . 27 (3): 367-76. CiteSeerX  10.1.1.417.8073 . doi : 10.1177/0092070399273007 . S2CID  145357923 .
  8. ^ İnci, Yahudiye (1995). "Ampirik araştırma için nedensel diyagramlar" . Biyometrik . 82 (4): 669-710. doi : 10.1093/biomet/82.4.669 .
  9. ^ Bareinboim, Elias; İnci, Yahudiye (2013). "Deneysel sonuçların taşınabilirliğine karar vermek için genel bir algoritma". Nedensel Çıkarım Dergisi . 1 (1): 107–134. arXiv : 1312.7485 . doi : 10.1515/jci-2012-0004 . S2CID  13325846 .
  10. ^ Marcellesi, Alexandre (Aralık 2015). "Dış geçerlilik: Hala bir sorun var mı?". Bilim Felsefesi . 82 (5): 1308-1317. doi : 10.1086/684084 . S2CID  125072255 .
  11. ^ İnci, Yahudiye (2015). Deneysel bulguların genelleştirilmesi . Nedensel Çıkarım Dergisi . 3 (2). s. 259–266.
  12. ^ a b Bareinboim, Elias; Tian, ​​Jin; İnci, Yahudiye (2014). Brodley, Carla E .; Taş, Peter (ed.). "Nedensel ve İstatistiksel Çıkarımda Seçim Önyargısından Kurtulma". Yirmi sekizinci AAAI Yapay Zeka Konferansı Tutanakları : 2410–2416.
  13. ^ Pearl, Yahudiye; Glymour, Madelyn; Jewell, Nicholas P. (2016). İstatistikte Nedensel Çıkarım: Bir Primer . New York: Wiley.
  14. ^ a b Bareinboim, Elias; İnci, Yahudiye (2016). "Nedensel çıkarım ve veri birleştirme sorunu" . Ulusal Bilimler Akademisi Bildirileri . 113 (27): 7345-7352. doi : 10.1073/pnas.1510507113 . PMC  4941504 . PMID  27382148 .
  15. ^ Campbell, Donald T. (1957). "Sosyal ortamlarda deneylerin geçerliliği ile ilgili faktörler" . Psikolojik Bülten . 54 (4): 297–312. doi : 10.1037/h0040950 . ISSN  1939-1455 . PMID  13465924 .
  16. ^ Lin, Hause; Werner, Kaitlyn M.; Inzlicht, Michael (2021-02-16). "Deneyin Vaatleri ve Tehlikeleri: Karşılıklı-İç-Geçerlilik Sorunu" . Psikoloji Bilimi Üzerine Perspektifler . 16 (4): 854-863. doi : 10.1177/1745691620974773 . ISSN  1745-6916 . PMID  33593177 . S2CID  231877717 .
  17. ^ Schram, Arthur (2005-06-01). "Yapaylık: Ekonomik deneylerde iç ve dış geçerlilik arasındaki gerilim" . Ekonomik Metodoloji Dergisi . 12 (2): 225–237. doi : 10.1080/13501780500086081 . ISSN  1350-178X . S2CID  145588503 .
  18. ^ Lincoln, YS; Guba, EG (1986). "Ama titiz mi? Natüralist değerlendirmede güvenilirlik ve özgünlük". Williams, DD (ed.). Doğal Değerlendirme . Program Değerlendirmesi için Yeni Yönergeler. 30 . San Francisco: Jossey-Bas. s. 73–84. ISBN'si 0-87589-728-2.
  19. ^ a b Dipboye, Robert L.; Flanagan, Michael F. (1979). "Endüstriyel ve Örgüt Psikolojisinde Araştırma Ortamları: Alandaki Bulgular Laboratuvardan Daha Genellenebilir mi". Amerikalı Psikolog . 34 (2): 141–150. doi : 10.1037/0003-066x.34.2.141 .
  20. ^ a b Aronson, E., & Carlsmith, JM (1968). Sosyal psikolojide deney. G. Lindzey ve E. Aronson(Ed.), The Handbook of sosyal psikolojide. (Cilt 2, pp. 1-79.) Reading, MA: Addison-Wesley.
  21. ^ Yarkoni, Tal (2020-12-21). "Genellenebilirlik krizi" . Davranış ve Beyin Bilimleri : 1–37. doi : 10.1017/S0140525X20001685 . ISSN  0140-525X . PMID  33342451 .
  22. ^ Aronson, E., Wilson, TD ve Brewer, m. (1998). Deneysel yöntemler. D. Gilbert, S. Fiske ve G. Lindzey (Eds.), The handbook of sosyal psikoloji içinde. (4. baskı, Cilt 1, s. 99-142.) New York: Random House.
  23. ^ Hutchinson, J. Wesley; Kamakura, Wagner A.; Lynch, John G. (2000). "Davranışsal Araştırmada "Ters" Etkiler İçin Alternatif Bir Açıklama Olarak Gözlemlenmemiş Heterojenlik". Tüketici Araştırmaları Dergisi . 27 (3): 324–344. doi : 10.1086/317588 . JSTOR  10.1086/317588 . S2CID  16353123 .
  24. ^ a b Darley, JM; Batson, CD (1973). "Kudüs'ten Eriha'ya: Yardım etme davranışında durumsal ve eğilimsel değişkenler üzerine bir çalışma". Kişilik ve Sosyal Psikoloji Dergisi . 27 : 100–108. doi : 10.1037/h0034449 .
  25. ^ Schwartz, SH; Gottlieb, A. (1976). "Şiddetli bir hırsızlığa seyirci tepkileri: Kudüs'te Suç". Kişilik ve Sosyal Psikoloji Dergisi . 34 (6): 1188–1199. doi : 10.1037/0022-3514.34.6.1188 . PMID  1003323 .
  26. ^ Latane, B.; Dabbs, JM (1975). "Üç şehirde seks, grup büyüklüğü ve yardım". Sosyometri . 38 (2): 108–194. doi : 10.2307/2786599 . JSTOR  2786599 .
  27. ^ Harrison, JA; Wells, RB (1991). "Erkek yardım davranışı üzerinde seyirci etkileri: Sosyal karşılaştırma ve sorumluluk dağılımı". Sosyal Psikolojide Temsili Araştırma . 96 : 187–192.
  28. ^ Latane, B.; Darley, JM (1968). "İzleyici müdahalesinin grup inhibisyonu". Kişilik ve Sosyal Psikoloji Dergisi . 10 (3): 215–221. doi : 10.1037/h0026570 . PMID  5704479 .
  29. ^ Hurley, D.; Allen, BP (1974). "Acil olmayan bir durumda bulunan insan sayısının etkisi". Sosyal Psikoloji Dergisi . 92 : 27-29. doi : 10.1080/00224545.1974.9923068 .
  30. ^ Latane, B. ve Darley, JM (1970). Tepki vermeyen seyirci: Neden yardım etmiyor? Englewood Kayalıkları, NJ: Prentice Salonu