Üstel aile rastgele grafik modelleri - Exponential family random graph models

Üstel aile rastgele grafik modelleri (ERGM'ler), sosyal ve diğer ağlardan gelen verileri analiz etmek için bir istatistiksel modeller ailesidir . ERGM kullanılarak incelenen ağlara örnek olarak bilgi ağları, organizasyon ağları, meslektaş ağları, sosyal medya ağları, bilimsel gelişim ağları ve diğerleri dahildir.

Arka fon

Yoğunluk, merkezilik veya çeşitlilik gibi gözlenen bir ağın yapısal özelliklerini tanımlamak için birçok ölçüm mevcuttur. Bununla birlikte, bu metrikler, çok sayıda olası alternatif ağın yalnızca bir örneği olan gözlemlenen ağı tanımlar. Bu alternatif ağlar kümesi benzer veya farklı yapısal özelliklere sahip olabilir. Ağ yapısının oluşumunu etkileyen süreçler hakkında istatistiksel çıkarımı desteklemek için , istatistiksel bir model , gözlemlenen bir ağa benzerliklerine göre ağırlıklandırılmış tüm olası alternatif ağların kümesini dikkate almalıdır. Ancak ağ verileri doğası gereği ilişkisel olduğundan, doğrusal regresyon gibi standart istatistiksel modellerin bağımsızlık ve özdeş dağılım varsayımlarını ihlal eder . Alternatif istatistiksel modeller, belirli bir gözlemle ilişkili belirsizliği yansıtmalı, teorik ilginin ağ altyapıları hakkında göreceli frekans hakkında çıkarımlara izin vermeli, kafa karıştırıcı süreçlerin etkisinin belirsizliğini ortadan kaldırmalı, karmaşık yapıları verimli bir şekilde temsil etmeli ve yerel düzeydeki süreçleri küresel düzeydeki özelliklerle ilişkilendirmelidir. Örneğin, dereceyi koruyan rastgeleleştirme , gözlemlenen bir ağın birden çok alternatif ağ açısından değerlendirilebileceği özel bir yoldur.

Tanım

Üstel ailesi çeşitli veri tiplerini değil, sadece ağlar kaplamak için modellerinin geniş bir ailedir. ERGM, ağları tanımlayan bu aileden bir modeldir.

Resmen rastgele bir grafik , bir dizi düğüm ve ikiliden (kenarlar) oluşur, burada düğümler bağlıysa veya başka türlü.

Bu modellerin temel varsayımı, gözlemlenen bir grafikteki yapının , gözlenen ağın ve bazı durumlarda düğümsel niteliklerin bir fonksiyonu olan yeterli istatistiklerin belirli bir vektörü ile açıklanabilmesidir . Bu şekilde, bağımsız değişkenler arasındaki her türlü bağımlılığı tanımlamak mümkündür:

nerede model parametrelerinin bir vektörü ile ilişkili ve bir normalleştirme sabitidir.

Bu modeller, düğümlerdeki her olası ağda bir olasılık dağılımını temsil eder . Bununla birlikte, boyuttaki bir yönsüz ağ (basit grafik) için olası ağların kümesinin boyutu olan . Kümedeki olası ağların sayısı, modeli sınırlayabilecek parametrelerin sayısından çok daha fazla olduğundan, ideal olasılık dağılımı Gibbs entropisini maksimize edendir .

Referanslar

daha fazla okuma

  1. ^ Harris, Jenine K (2014). Üstel rastgele grafik modellemeye giriş . ISBN'si 9781452220802. OCLC  870698788 .