Olasılık yoğunluk fonksiyonu - Probability density function

Normal dağılımın kutu grafiği ve olasılık yoğunluk fonksiyonu N (0,  σ 2 ) .
Rastgele bir olasılık yoğunluk fonksiyonunun modunun , medyanının ve ortalamasının geometrik görselleştirmesi .

Olarak olasılık teorisi , bir olasılık yoğunluk fonksiyonu ( PDF ) ya da yoğunluk a sürekli rasgele değişken , a, fonksiyon , değeri herhangi bir örnekte (veya nokta) 'de örnek alanı (rastgele değişken tarafından alınan muhtemel değerler kümesinden) olabilir Rastgele değişkenin değerinin o örneğe yakın olacağına dair göreceli bir olasılık sağladığı şeklinde yorumlanmalıdır . Başka bir deyişle, mutlak olasılık Sürekli bir rastgele değişkenin herhangi bir belirli değeri alması için 0'dır (başlangıçta sonsuz sayıda olası değer olduğu için), iki farklı örnekteki PDF'nin değeri, rastgele herhangi bir belirli çizimde çıkarım yapmak için kullanılabilir. değişken, rastgele değişkenin diğer örneğe kıyasla bir örneğe yakın olma olasılığının ne kadar yüksek olduğunu.

Daha kesin bir anlamda, PDF, herhangi bir değeri almak yerine , rastgele değişkenin belirli bir değerler aralığına düşme olasılığını belirtmek için kullanılır . Bu olasılık, bu değişkenin PDF'sinin o aralık üzerindeki integrali tarafından verilir; yani, yoğunluk fonksiyonunun altındaki, ancak yatay eksenin üzerindeki ve aralığın en düşük ve en büyük değerleri arasındaki alan tarafından verilir. Olasılık yoğunluk fonksiyonu her yerde negatif değildir ve tüm uzay üzerindeki integrali 1'e eşittir.

" Olasılık dağılım fonksiyonu " ve " olasılık fonksiyonu " terimleri de bazen olasılık yoğunluk fonksiyonunu belirtmek için kullanılmıştır. Ancak, bu kullanım olasılıkçılar ve istatistikçiler arasında standart değildir. Diğer kaynaklarda, "olasılık dağılım fonksiyonu", olasılık dağılımı genel değer kümeleri üzerinden bir fonksiyon olarak tanımlandığında kullanılabilir veya kümülatif dağılım fonksiyonuna atıfta bulunabilir veya olasılık kütle fonksiyonu (PMF) olabilir. yoğunluk. "Yoğunluk fonksiyonunun" kendisi de olasılık kütle fonksiyonu için kullanılır ve bu da daha fazla karışıklığa yol açar. Genel olarak, PMF ayrık rasgele değişkenler (sayılabilir bir kümede değer alan rasgele değişkenler) bağlamında kullanılırken, PDF sürekli rasgele değişkenler bağlamında kullanılır.

Örnek

Belirli bir türün bakterilerinin tipik olarak 4 ila 6 saat yaşadığını varsayalım. Bir bakterinin tam olarak 5 saat yaşama olasılığı sıfıra eşittir. Pek çok bakteri yaklaşık 5 saat yaşar, ancak herhangi bir bakterinin tam olarak 5.00... saatte ölme şansı yoktur. Bununla birlikte, bakterinin 5 saat ile 5.01 saat arasında ölme olasılığı ölçülebilir. Cevabın 0,02 (yani %2) olduğunu varsayalım. O halde, bakterinin 5 saat ile 5.001 saat arasında ölme olasılığı yaklaşık 0.002 olmalıdır, çünkü bu zaman aralığı bir öncekinin onda biri kadardır. Bakterinin 5 saat ile 5.00001 saat arasında ölme olasılığı yaklaşık 0.0002 olmalıdır, vb.

Bu örnekte, (bir aralık sırasında ölme olasılığı) / (aralığın süresi) oranı yaklaşık olarak sabittir ve saatte 2'ye (veya 2 saat -1 ) eşittir . Örneğin, 5 ile 5.01 saat arasındaki 0,01 saatlik aralıkta ve (0,02 olasılık / 0,01 saat) = 2 saat -1'de ölme olasılığı 0,02'dir . Bu 2 saat -1 miktarına yaklaşık 5 saatte ölme olasılığı yoğunluğu denir. Bu nedenle bakterinin 5. saatte ölme olasılığı (2 saat -1 ) dt olarak yazılabilir . Bu, bakterinin 5 saat civarında sonsuz küçük bir zaman penceresi içinde ölme olasılığıdır, burada dt bu pencerenin süresidir. Örneğin, 5 saatten uzun ancak (5 saat + 1 nanosaniyeden) daha kısa yaşama olasılığı (2 saat -1 )×(1 nanosaniye) ≈6 × 10 −13 ( birim dönüştürme kullanılarak 3.6 × 10 12 nanosaniye = 1 saat).

f (5 saat) = 2 saat -1 olan bir olasılık yoğunluk fonksiyonu f vardır . Tamamlayıcı bir f süresi (sadece son derece küçük pencereler, aynı zamanda, büyük dönüş) arasında herhangi bir pencere üzerinde olasılığı o pencerede bakteri kalıplar bu.

Kesinlikle sürekli tek değişkenli dağılımlar

Bir olasılık yoğunluk fonksiyonu en yaygın olarak mutlak sürekli tek değişkenli dağılımlarla ilişkilendirilir . Bir rastgele değişken yoğunluğu , bir negatif olmayan Lebesgue integrali fonksiyonu ise,:

Bu nedenle, eğer bir kümülatif dağılım fonksiyonu arasında , daha sonra:

ve (eğer sürekli ise )

Sezgisel olarak , sonsuz küçük aralığa düşme olasılığı olarak düşünülebilir .

Resmi tanımlama

( Bu tanım, olasılığın ölçü-teorik tanımı kullanılarak herhangi bir olasılık dağılımına genişletilebilir . )

Bir rastgele değişkenin bir değerlerle ölçülebilir alanı (genellikle ile Borel setleri ölçülebilir alt kümeleri olarak) olarak bulunur olasılık dağılımı ölçmek X * P ile : yoğunluğu arasında bir referans ölçümüne göre ilgili olan Radon Nikodym türevi :

Diğer bir deyişle, f , şu özelliğe sahip herhangi bir ölçülebilir fonksiyondur:

herhangi bir ölçülebilir küme için

Tartışma

Gelen üzerine sürekli bir tek değişkenli bir durumda , referans ölçüsüdür Lebesgue ölçümü . Olasılık yoğunluk fonksiyonu a ayrık rasgele değişken göre yoğunluğu sayma ölçü numune alanı (genellikle grubu üzerinde tam sayılar ya da bunların bir alt kümesi).

Rastgele bir ölçüye referansla bir yoğunluk tanımlamak mümkün değildir (örneğin, sürekli bir rastgele değişken için bir referans olarak sayma ölçüsü seçilemez). Ayrıca, var olduğunda, yoğunluk hemen hemen her yerde benzersizdir.

Daha fazla detay

Bir olasılığın aksine, bir olasılık yoğunluğu işlevi birden büyük değerler alabilir; örneğin, [0, 1/2] aralığındaki düzgün dağılım , 0 ≤ x  ≤ 1/2 için f ( x ) = 2  ve başka bir yerde f ( x ) = 0 olasılık yoğunluğuna sahiptir .

Standart normal dağılım olasılık yoğunluğuna sahiptir

Rastgele değişken ise X verildi ve dağılımı bir olasılık yoğunluk fonksiyonu kabul edilir f , daha sonra beklenen değer arasında X gibi hesaplanabilir (beklenen değer varsa)

Her olasılık dağılımının bir yoğunluk fonksiyonu yoktur: kesikli rastgele değişkenlerin dağılımları yoktur; ne de yapar Cantor dağılımı o yani hiçbir ayrık bileşeni olan herkes noktaya atama pozitif olasılık yapmasa da,.

Bir dağılımın bir yoğunluk fonksiyonu vardır, ancak ve ancak kümülatif dağılım fonksiyonu F ( x ) mutlak surette sürekli ise . Bu durumda: F olan hemen hemen her yerde türevlenebilir ve onun türevi olasılık yoğunluk olarak kullanılabilir:

Bir olasılık dağılımı bir yoğunluğu kabul ediyorsa, her bir tek noktalı kümenin { a } olasılığı sıfırdır; aynısı sonlu ve sayılabilir kümeler için de geçerlidir.

İki olasılık yoğunluğu f ve g , yalnızca bir Lebesgue ölçüsü sıfır kümesinde farklılık gösteriyorlarsa, tam olarak aynı olasılık dağılımını temsil eder .

İstatistiksel fizik alanında , olasılık yoğunluk fonksiyonunun tanımı olarak genellikle kümülatif dağılım fonksiyonunun türevi ile olasılık yoğunluk fonksiyonu arasındaki ilişkinin formel olmayan bir yeniden formülasyonu kullanılır. Bu alternatif tanım aşağıdaki gibidir:

Eğer dt , sonsuz az sayıda olasılığıdır X aralığı (içerisinde yer almaktadır tt  +  dt ) eşittir f ( tdt , veya:

Ayrık ve sürekli dağılımlar arasındaki bağlantı

Dirac delta fonksiyonunu kullanarak, belirli kesikli rastgele değişkenlerin yanı sıra hem sürekli hem de ayrı bir parçayı içeren rastgele değişkenleri genelleştirilmiş bir olasılık yoğunluk fonksiyonu ile temsil etmek mümkündür . (Yukarıda tanımlanan anlamda bir olasılık yoğunluk fonksiyonu ile bu mümkün değildir, bir dağılım ile yapılabilir .) Örneğin , Rademacher dağılımına sahip, yani değerler için -1 veya 1 alan ikili ayrık bir rastgele değişken düşünün. her biri ½ olasılıkla. Bu değişkenle ilişkili olasılık yoğunluğu:

Daha genel olarak, eğer ayrık bir değişken gerçek sayılar arasında n farklı değer alabiliyorsa , o zaman ilişkili olasılık yoğunluk fonksiyonu şöyledir:

değişkenin erişebildiği ayrık değerler nerede ve bu değerlerle ilişkili olasılıklar.

Bu, ayrık ve sürekli olasılık dağılımlarının işlenmesini büyük ölçüde birleştirir. Örneğin, yukarıdaki ifade, sürekli bir olasılık dağılımı için verilen formüllerden başlayarak , böyle ayrık bir değişkenin ( ortalaması , varyansı ve basıklığı gibi ) istatistiksel özelliklerinin belirlenmesine izin verir ...

yoğunluk aileleri

Olasılık yoğunluk fonksiyonlarının (ve olasılık kütle fonksiyonlarının ) parametrelendirilmesi, yani belirtilmemiş parametrelerle karakterize edilmesi yaygındır . Örneğin, normal dağılım ortalama ve varyans açısından parametrelendirilir, sırasıyla ve ile gösterilir ve yoğunluk ailesini verir.

Bir yoğunluk ailesinin alanı ile ailenin parametreleri arasındaki farkı akılda tutmak önemlidir . Parametrelerin farklı değerleri , aynı örnek uzayda farklı rastgele değişkenlerin farklı dağılımlarını tanımlar ( değişkenin tüm olası değerlerinin aynı kümesi); bu örnek uzay, bu dağılım ailesinin tanımladığı rastgele değişkenler ailesinin alanıdır. Belirli bir parametre seti, yoğunluğun işlevsel biçimini paylaşan aile içindeki tek bir dağılımı tanımlar. Belirli bir dağılım perspektifinden, parametreler sabittir ve yalnızca parametreleri içeren ancak değişkenleri içermeyen bir yoğunluk fonksiyonundaki terimler , bir dağılımın normalleştirme faktörünün bir parçasıdır (yoğunluğun altındaki alanın - etki alanındaki bir şeyin meydana gelme olasılığı - 1'e eşittir. Bu normalleştirme faktörü, dağılımın çekirdeğinin dışındadır .

Parametreler sabit olduğundan, ailedeki farklı bir rastgele değişkenin karakterizasyonunu vermek için bir yoğunluğu farklı parametreler açısından yeniden parametrelendirmek, formülde eskilerin yerine yeni parametre değerlerini değiştirmek anlamına gelir. Ancak bir olasılık yoğunluğunun alanını değiştirmek daha zordur ve daha fazla çalışma gerektirir: değişkenlerin değişimiyle ilgili aşağıdaki bölüme bakın.

Birden çok değişkenle ilişkili yoğunluklar

Sürekli rasgele değişkenler X 1 , …, X n için, genellikle birleşik olasılık yoğunluk fonksiyonu olarak adlandırılan bir bütün olarak kümeyle ilişkili bir olasılık yoğunluk fonksiyonunu tanımlamak da mümkündür . Bu yoğunluk fonksiyonunun bir fonksiyonu olarak tanımlanmıştır , n herhangi bir etki alanı için, örneğin, bu değişkenler D içinde n değişkenlerin değerlerinin boyutlu uzayda x 1 , ..., x , n , olasılık grubu değişken bir gerçekleşme düşer etki alanı içinde D olan

Eğer F ( x 1 , ...,  x , n ) = P ( x 1  ≤  x 1 , ...,  x , n  ≤  X , n ) bir kümülatif dağılım fonksiyonu vektörü (arasında X 1 , ...,  x , n ), daha sonra ortak bir olasılık yoğunluk fonksiyonu kısmi türev olarak hesaplanabilir

marjinal yoğunluklar

İçin i 1, 2 =, ..., n , izin f X i ( x i ) değişken ile ilişkili olasılık yoğunluk fonksiyonu , X i , tek başına. Buna marjinal yoğunluk fonksiyonu denir ve X 1 , …, X n rasgele değişkenleriyle ilişkili olasılık yoğunluğundan diğer n  − 1 değişkenlerin tüm değerleri üzerinden integral alınarak çıkarılabilir :

Bağımsızlık

Bir eklem yoğunluğunu kabul eden sürekli rasgele değişkenler X 1 , …, X n , ancak ve ancak şu durumlarda birbirinden bağımsızdır :

sonucu

Eğer n rastgele değişkenli bir vektörün ortak olasılık yoğunluk fonksiyonu, bir değişkenli n fonksiyonun çarpımı olarak çarpanlarına ayrılabilirse

(burada her f i mutlaka bir yoğunluk değildir) o zaman kümedeki n değişkenin tümü birbirinden bağımsızdır ve her birinin marjinal olasılık yoğunluk fonksiyonu şu şekilde verilir:

Örnek

Bu temel örnek, iki değişkenli bir dizi fonksiyonun basit durumunda çok boyutlu olasılık yoğunluk fonksiyonlarının yukarıdaki tanımını gösterir. Bize diyelim koordinatların 2 boyutlu, rastgele vektörü ( X , Y ) elde etmek için bir olasılık pozitif çeyrek düzleminde x ve y olan

Olasılık yoğunluk fonksiyonunda rastgele değişkenlerin fonksiyonu ve değişkenlerin değişimi

Bir rasgele değişkenin (veya vektörün) X olasılık yoğunluk fonksiyonu f X ( x ) olarak verilirse, Y = g ( X ) bir değişkenin olasılık yoğunluk fonksiyonunu hesaplamak mümkündür (ancak genellikle gerekli değildir; aşağıya bakınız). . Buna "değişken değişikliği" de denir ve pratikte , bilinen (örneğin, tek biçimli) bir rasgele sayı üreteci kullanılarak f g ( X ) = f Y rasgele şekline sahip bir rasgele değişken oluşturmak için kullanılır .

Beklenen E ( g ( X ) ) değerini bulmak için önce yeni rastgele değişken Y = g ( X ) ' in olasılık yoğunluğu f g ( X ) bulunması gerektiğini düşünmek caziptir . Ancak, hesaplamak yerine

yerine birini bulabilir

İki integrallerin değerleri, her ikisi de tüm durumlarda aynı x ve g ( x ) gerçekten olasılık yoğunluk fonksiyonları vardır. g'nin bire bir fonksiyon olması gerekli değildir . Bazı durumlarda, ikinci integral, öncekinden çok daha kolay hesaplanır. Bkz . Bilinçsiz istatistikçinin yasası .

skalerden skalere

Izin bir olmak monoton fonksiyonu , daha sonra elde edilen yoğunluk fonksiyonu olduğunu

Burada g -1 ters fonksiyonu ifade eder .

Bu, bir diferansiyel alanda kapsanan olasılığın, değişkenlerin değişimi altında değişmez olması gerektiği gerçeğinden kaynaklanır. Yani,

veya

Monotonik olmadığı fonksiyonları için, olasılık yoğunluk fonksiyonu y olan

burada n, ( y ) 'de solüsyonlar sayısıdır x denklemi için ve bu çözümler vardır.

Vektörden vektöre

x'in eklem yoğunluğu f olan n -boyutlu bir rastgele değişken olduğunu varsayalım . Eğer y = H ( x ) ise , burada H bir ikili , türevlenebilir fonksiyondur , o zaman y'nin yoğunluğu g'dir :

olarak diferansiyel ile Jacobi tersinin H (⋅) olarak değerlendirildi, y .

Örneğin, 2 boyutlu durumda x  = ( x 1x 2 ), H dönüşümünün y 1  = H 1 ( x 1x 2 ), y 2  = H 2 ( x 1x 2 olarak verildiğini varsayalım ) ) tersleri ile x 1  = H 1 -1 ( y 1y 2 ), x 2  = H 2 -1 ( y 1y 2 ). y  = ( y 1 , y 2 ) için ortak dağılım yoğunluğa sahiptir

Vektörden skalere

Izin türevlenebilir fonksiyonu olabilir ve değerleri alan rastgele bir vektör olabilir , olasılık yoğunluk fonksiyonu olabilir ve olmak Dirac delta fonksiyonu. ile verilecek olasılık yoğunluk fonksiyonunu belirlemek için yukarıdaki formülleri kullanmak mümkündür.

Bu sonuç , bilinçsiz istatistikçinin yasasına yol açar :

Kanıt:

Olasılık yoğunluk fonksiyonu ile daraltılmış bir rastgele değişken olsun ( yani sıfıra eşit bir sabit). Rastgele vektör ve dönüşüm şu şekilde tanımlansın:

Bunun bijective haritalama olduğu açıktır ve Jacobian şu şekilde verilir:

Bu, ana köşegen üzerinde olanlar ile bir üst üçgen matristir, dolayısıyla determinantı 1'dir. Bir önceki bölümdeki değişken değişimi teoremini uygulayarak şunu elde ederiz:

marjinalleştirilirse , istenen olasılık yoğunluk fonksiyonuna yol açar.

Bağımsız rastgele değişkenlerin toplamları

Her biri bir olasılık yoğunluk fonksiyonuna sahip olan iki bağımsız rastgele değişken U ve V toplamının olasılık yoğunluk fonksiyonu, onların ayrı yoğunluk fonksiyonlarının evrişimidir :

Önceki ilişkiyi, yoğunlukları U 1 , …, U N olan N bağımsız rastgele değişkenin toplamına genellemek mümkündür :

Bu, bağımsız rastgele değişkenlerin bölümü için aşağıdaki örneğe benzer şekilde, Y=U+V ve Z=V içeren değişkenlerin iki yönlü değişiminden türetilebilir .

Bağımsız rastgele değişkenlerin çarpımları ve bölümleri

Her biri bir olasılık yoğunluk fonksiyonuna sahip olan iki bağımsız rasgele değişken U ve V verildiğinde , Y  =  UV ve bölüm Y = U / V ürününün yoğunluğu, bir değişken değişikliği ile hesaplanabilir.

Örnek: Bölüm dağılımı

İki bağımsız rastgele değişkenin Y  =  U / V bölümünü hesaplamak için U ve V , aşağıdaki dönüşümü tanımlayın:

Daha sonra, eklem yoğunluğu p ( y , z ) değişkenlerin bir değişiklik ile hesaplanabilmektedir U, V için Y, Z ve Y, ile elde edilebilir üzerinden marjinalleştiren Z ortak yoğunluktan.

Ters dönüşüm ise

Jakobiyen matris Bu dönüşümün olduğunu

Böylece:

Ve Y dağılımı, Z marjinalleştirilerek hesaplanabilir :

Bu yöntem, en önemlisi bu dönüşümün gerektirir U , V için Y , Z olarak örten . Yukarıdaki dönüşüm bunu karşılar çünkü Z doğrudan V'ye eşlenebilir ve belirli bir V için U / V bölümü monotondur . Bu, U  +  V toplamı , U  -  V farkı ve UV ürünü için de benzer şekilde geçerlidir .

Tam olarak aynı yöntem, çoklu bağımsız rastgele değişkenlerin diğer fonksiyonlarının dağılımını hesaplamak için kullanılabilir.

Örnek: İki standart normalin bölümü

İki standart normal değişken U ve V verildiğinde, bölüm aşağıdaki gibi hesaplanabilir. İlk olarak, değişkenler aşağıdaki yoğunluk fonksiyonlarına sahiptir:

Yukarıda açıklandığı gibi dönüştürüyoruz:

Bu şunlara yol açar:

Bu, standart bir Cauchy dağılımının yoğunluğudur .

Ayrıca bakınız

Referanslar

daha fazla okuma

Dış bağlantılar