Optimum durdurma - Optimal stopping

In matematik , teorisi optimum durdurulması veya erken durdurma amacıyla, belirli bir eylemde bir zaman seçme sorunuyla ilgilidir maksimize beklenen ödül veya beklenen maliyeti en aza indirmek. Optimum durma problemleri istatistik , ekonomi ve matematiksel finans ( Amerikan opsiyonlarının fiyatlandırılmasıyla ilgili ) alanlarında bulunabilir. Optimal durma probleminin önemli bir örneği sekreter problemidir . Optimal durma problemleri genellikle bir Bellman denklemi şeklinde yazılabilir ve bu nedenle genellikle dinamik programlama kullanılarak çözülür .

Tanım

Ayrık zaman durumu

Durdurma kuralı sorunları iki nesneyle ilişkilendirilir:

  1. Ortak dağılımı bilindiği varsayılan bir rastgele değişkenler dizisi
  2. 1'de rastgele değişkenlerin gözlenen değerlerine bağlı olan bir dizi 'ödül' işlevi :

Bu nesneler göz önüne alındığında, sorun aşağıdaki gibidir:

  • Rastgele değişkenlerin sırasını gözlemliyorsunuz ve her adımda gözlemi durdurmayı veya devam etmeyi seçebilirsiniz.
  • Adımda gözlemlemeyi bırakırsanız, ödül alacaksınız.
  • Beklenen ödülünüzü en üst düzeye çıkarmak (veya eşdeğer olarak, beklenen kaybınızı en aza indirmek) için bir durdurma kuralı seçmek istiyorsunuz.

Sürekli zaman durumu

Bir kazanç sürecini göz önünde bir tanımlanmış , süzüldü olasılık alanı ve varsayalım edilir adapte filtrasyona. Optimum durma problemi, beklenen kazancı maksimize eden durma zamanını bulmaktır.

burada değer işlevi denir . Burada değer alabilir .

Daha spesifik bir formülasyon aşağıdaki gibidir. Bu uyarlanmış bir güçlü dikkate Markov işlemi bir filtre olasılık uzayında tanımlanan belirtmektedir olasılık ölçü burada stokastik süreç başlar en . Verilen sürekli fonksiyonlar ve optimal durma problemi

Buna bazen MLS (sırasıyla Mayer, Lagrange ve supremum anlamına gelir) formülasyonu denir.

Çözüm yöntemleri

Optimum durma problemlerini çözmek için genellikle iki yaklaşım vardır. Altta yatan süreç (veya kazanç süreci) koşulsuz sonlu boyutlu dağılımlarıyla tanımlandığında , uygun çözüm tekniği martingale yaklaşımıdır, çünkü martingale teorisini kullanır , en önemli kavram Snell zarfıdır . Ayrık zaman durumunda, eğer planlama ufku sonlu ise, problem dinamik programlama ile de kolaylıkla çözülebilir .

Altta yatan süreç, bir Markov geçiş olasılıkları ailesine yol açan bir (koşullu) geçiş fonksiyonları ailesi tarafından belirlendiğinde, Markov süreçleri teorisi tarafından sağlanan güçlü analitik araçlar sıklıkla kullanılabilir ve bu yaklaşım Markov yöntemi olarak adlandırılır. Çözüm genellikle ilgili serbest sınır problemleri ( Stefan problemleri ) çözülerek elde edilir .

Bir sıçrama difüzyon sonucu

SDE tarafından verilen bir Lévy difüzyonu olsun

nerede bir -boyutlu Brownian hareketi , bir -boyutlu kompanzasyonlu Poisson rasgele ölçüsüdür , , , ve benzersiz bir çözüm olacak şekilde fonksiyonlar verilir . Izin açık kümesi (ödeme gücü bölge) olmak ve

iflas zamanı olsun. Optimum durdurma problemi:

Bazı düzenlilik koşulları altında aşağıdaki doğrulama teoreminin geçerli olduğu ortaya çıktı:

Bir işlev tatmin ederse

  • devam bölgesi nerede ,
  • üzerinde ve
  • üzerinde nerede olduğunu sonsuzküçük jeneratör arasında

sonra hepsi için . Ayrıca, eğer

  • üzerinde

O zaman herkes için ve en uygun durma süresidir.

Bu koşullar, daha kompakt bir biçimde de yazılabilir ( bütünsel-değişim eşitsizliği ):

  • üzerinde

Örnekler

Madeni para atma

(Örnek nerede birleşir)

Adil bir madeni paranız var ve tekrar tekrar atıyorsunuz. Her seferinde, atılmadan önce, atmayı bırakıp gözlemlenen ortalama tura sayısı kadar ödeme (örneğin dolar olarak) almayı seçebilirsiniz.

Bir durdurma kuralı seçerek ödediğiniz tutarı en üst düzeye çıkarmak istiyorsunuz. Eğer X, i için ( i 1 '≥) bağımsız bir dizi oluşturur, aynı rastgele değişkenler dağıtılmış Bernoulli dağılımı

ve eğer

sonra diziler ve bu sorunla ilişkili nesnelerdir.

ev satışı

(Örnek , mutlaka yakınsak değildir)

Bir eviniz var ve onu satmak istiyorsunuz. Her gün eviniz için size teklif verilir ve reklamını yapmaya devam etmek için ödeme yaparsınız . Evinizi gününde satarsanız nerede kazanırsınız .

Bir durdurma kuralı seçerek kazandığınız miktarı en üst düzeye çıkarmak istiyorsunuz.

Bu örnekte, ( ) sırası, eviniz için tekliflerin sırasıdır ve ödül fonksiyonlarının sırası, ne kadar kazanacağınızdır.

Sekreter sorunu

(Örnek nerede sonlu bir dizidir)

En iyiden en kötüye doğru sıralanabilen bir dizi nesne gözlemliyorsunuz. En iyi nesneyi seçme şansınızı en üst düzeye çıkaran bir durdurma kuralı seçmek istiyorsunuz.

Burada, eğer ( n büyük bir sayıdır) nesnelerin sıralarıysa ve i. adımda nesneleri kasıtlı olarak reddetmeyi bırakırsanız en iyi nesneyi seçme şansınız ise ve bu sorunla ilişkili dizilerdir. Bu sorun 1960'ların başında birkaç kişi tarafından çözüldü. Sekreter sorununa zarif bir çözüm ve bu sorunun çeşitli modifikasyonları, daha yeni olan en iyi olasılık algoritması optimal durdurma (Bruss algoritması) tarafından sağlanır.

Arama teorisi

Ekonomistler, "sekreter problemi"ne benzer bir dizi optimal durdurma problemi üzerinde çalışmışlardır ve tipik olarak bu tip analizlere "arama teorisi" adını verirler. Arama teorisi, özellikle bir işçinin yüksek ücretli bir iş arayışına veya bir tüketicinin düşük fiyatlı bir mal arayışına odaklanmıştır.

Park sorunu

Arama teorisi uygulamasının özel bir örneği, operaya (tiyatro, alışveriş, vb.) giden bir sürücü tarafından en uygun park yeri seçimi görevidir. Hedefe yaklaşırken sürücü, park yerlerinin bulunduğu caddeden aşağı iner - genellikle park yerinde sadece bazı yerler ücretsizdir. Hedef açıkça görülebilir, bu nedenle hedefe olan mesafe kolayca değerlendirilir. Sürücünün görevi, bu yerden varış noktasına olan mesafenin en kısa olması için dönmeden hedefe mümkün olduğunca yakın ücretsiz bir park yeri seçmektir.

Opsiyon ticareti

Ticareti seçenekler üzerinde mali piyasalar , bir sahibinin Amerikan seçeneği önce veya son kullanma tarihi de herhangi bir zamanda önceden belirlenmiş bir fiyattan dayanak varlığı satın (veya satış) hakkını kullanma izin verilir. Bu nedenle, Amerikan seçeneklerinin değerlemesi esasen optimal bir durdurma problemidir. Klasik bir düşünün Black-Scholes set-up ve izin olmak risksiz faiz oranı ve ve temettü oranı ve hisse senedi oynaklığı olabilir. Hisse senedi fiyatı geometrik Brownian hareketini takip ediyor

risk nötr önlem kapsamında.

Seçenek sürekli olduğunda, optimal durma problemi

burada ödeme fonksiyonu bir alım opsiyonu ve bir satım opsiyonu içindir. Varyasyon eşitsizliği

herkes için egzersiz sınırı nerede . Çözüm biliniyor

  • (Sürekli arama) nerede ve
  • (Sürekli koymak) nerede ve

Öte yandan, son kullanma tarihi sonlu olduğunda, problem bilinen kapalı form çözümü olmayan 2 boyutlu serbest sınır problemi ile ilişkilidir. Bununla birlikte, çeşitli sayısal yöntemler kullanılabilir. Bkz Black-Scholes modeli # Amerikalı seçenekleri burada çeşitli değerleme yöntemleri için, hem de fugit bir ayrık için esaslı ağaca egzersiz optimal zamanın hesaplama.

Ayrıca bakınız

Referanslar