LogSumExp - LogSumExp

LogSumExp (aynı zamanda (LSE) RealSoftMax veya çok değişkenli SOFTPLUS ) fonksiyonu a, düz maksimum bir - düz yaklaşım için maksimum işlevi, esas olarak kullanılan makine öğrenme algoritmaları. Argümanların üstellerinin toplamının logaritması olarak tanımlanır :

Özellikler

LogSumExp işlev alanı olan , gerçek alan koordinat ve onun değer kümesi olup , gerçek bir çizgi . Aşağıdaki sınırlarla maksimuma bir yaklaşımdır

İlk eşitsizlik katı olmadıkça katıdır . Tüm argümanlar eşit olmadığı sürece ikinci eşitsizlik katıdır. (Kanıt: Let . O zaman . Logaritmayı eşitsizliğe uygulamak sonucu verir.)

Ek olarak, sınırları daha sıkı hale getirmek için işlevi ölçekleyebiliriz. Fonksiyonu düşünün . Sonra

(Kanıt: Her değiştirin ile bazıları için yukarıdaki eşitsizlikler, vermek

dan beri

son olarak, bölme sonucu verir.)

Ayrıca, bunun yerine negatif bir sayı ile çarparsak, elbette fonksiyonla bir karşılaştırma buluruz :

LogSumExp işlevi dışbükeydir ve etki alanında her yerde kesin olarak artar (ancak her yerde kesinlikle dışbükey değildir).

Yazma kısmi türev bulunmaktadır:

bu , LogSumExp'in gradyanının softmax işlevi olduğu anlamına gelir .

Dışbükey konjugat LogSumExp ait negatif entropi .

log-domain hesaplamaları için log-sum-exp hilesi

LSE işlevi, genellikle , log olasılığında olduğu gibi , olağan aritmetik hesaplamalar logaritmik bir ölçekte gerçekleştirildiğinde karşılaşılır .

Doğrusal ölçekte çarpma işlemlerinin log ölçeğinde basit eklemelere dönüşmesine benzer şekilde, doğrusal ölçekte bir toplama işlemi log ölçeğinde LSE olur:

Günlük etki alanı hesaplamalarını kullanmanın yaygın bir amacı, çok küçük veya çok büyük sayılar doğrudan sınırlı kesinlikli kayan nokta sayıları kullanılarak (yani doğrusal bir alanda) temsil edildiğinde doğruluğu artırmak ve taşma ve taşma sorunlarından kaçınmaktır.

Ne yazık ki, LSE'nin bu durumda doğrudan kullanılması yine taşma/yetersiz akış sorunlarına neden olabilir. Bu nedenle, bunun yerine aşağıdaki eşdeğer kullanılmalıdır (özellikle yukarıdaki 'maks' yaklaşımının doğruluğu yeterli olmadığında). Bu nedenle, IT++ gibi birçok matematik kitaplığı varsayılan bir LSE rutini sağlar ve bu formülü dahili olarak kullanır.

nerede

Kesinlikle dışbükey bir log-sum-exp tipi işlev

LSE dışbükeydir ancak kesinlikle dışbükey değildir. Sıfıra fazladan bir argüman seti ekleyerek kesinlikle dışbükey log-sum-exp tipi bir fonksiyon tanımlayabiliriz:

Bu işlev, uygun bir Bregman üretecidir (kesinlikle dışbükey ve türevlenebilir ). Örneğin, çok terimli/binom ailesinin kümülatı olarak makine öğreniminde karşılaşılır.

Gelen tropikal analizde , bu toplamıdır günlük semiring .

Ayrıca bakınız

Referanslar