Matris üstel - Matrix exponential

Gelen matematik , matris üstel a, matris fonksiyonu ile ilgili kare matrisler sıradan benzer üstel fonksiyon . Lineer diferansiyel denklem sistemlerini çözmek için kullanılır. Lie grupları teorisinde, matris üstel, bir matris Lie cebiri ile karşılık gelen Lie grubu arasındaki bağlantıyı verir .

Let X, bir olması , n x n gerçek veya karmaşık matris . Üslü X ile gösterilen E , X veya exp ( X ) , bir n x n verilen matris güç seri

burada birim matris olarak tanımlanır aynı boyutlarda .

Yukarıdaki seri her zaman yakınsar, dolayısıyla X'in üstel değeri iyi tanımlanmıştır. Eğer X, 1 x 1 matrisi matris üstel X olan tek eleman sıradan bir 1 x 1 matris üslü tek elemanın X .

Özellikleri

Temel özellikler

Let X ve Y olmak n x n kompleks matrisleri ve izin bir ve b isteğe bağlı karmaşık sayılar. Bu ifade n x n kimlik matrisi ile I ve sıfır matris 0 matris üstel biri aşağıdaki özellikler ile.

Kuvvet serisi olarak tanımın doğrudan sonuçları olan özelliklerle başlıyoruz:

Bir sonraki önemli sonuç şudur:

  • Eğer öyleyse .

Bu özdeşliğin kanıtı, gerçek sayıların üstelleri için karşılık gelen özdeşliğe ilişkin standart güç serisi argümanıyla aynıdır. Yani, demek ki sürece ve gidip bu olmadığını tartışmaya hiç fark etmez ve sayılar veya matrisler bulunmaktadır. Bu kimlik genellikle eğer tutmaz o notta önemlidir ve gidip yok (bkz Altın-Thompson eşitsizliği altında).

Önceki özdeşliğin sonuçları şunlardır:

  • e aX e bX = e ( a + b ) X
  • e X e - X = ben

Yukarıdaki sonuçları kullanarak, aşağıdaki iddiaları kolayca doğrulayabiliriz. Eğer X, bir simetrik sonra e X, aynı zamanda simetrik ve eğer X, bir ters simetrik sonra e X, ise dik . Eğer X, bir Hermitsel sonra E X, aynı zamanda Hermitsel ise ve X, bir eğri-Hermitsel sonra E X bir üniter .

Son olarak, matris üstellerinin bir Laplace dönüşümü çözücüye eşittir ,

tüm yeterince büyük pozitif değerler için s .

Lineer diferansiyel denklem sistemleri

Üstel matrisin öneminin nedenlerinden biri, lineer adi diferansiyel denklem sistemlerini çözmek için kullanılabilmesidir . çözümü

burada bir sürekli matris, ile verilmektedir

Matris üstel, homojen olmayan denklemi çözmek için de kullanılabilir.

Örnekler için aşağıdaki uygulamalar bölümüne bakın .

Formun diferansiyel denklemleri için kapalı form çözümü yoktur

burada A sabit değildir, ancak Magnus serisi çözümü sonsuz bir toplam olarak verir.

matris üstel determinantı

Tarafından Jacobi formül , herhangi bir karmaşık kare matris aşağıdaki iz kimlik sahiptir:

Bu formül, bir hesaplama aracı sağlamanın yanı sıra, üstel bir matrisin her zaman tersine çevrilebilir bir matris olduğunu gösterir . Bu, yukarıdaki denklemin sağ tarafının her zaman sıfırdan farklı olması ve dolayısıyla det( e A ) ≠ 0 olması gerçeğinden kaynaklanır, bu da e A'nın ters çevrilebilir olması gerektiği anlamına gelir .

Gerçek değerli durumda, formül aynı zamanda haritayı da gösterir.

daha önce bahsedilen karmaşık durumun aksine, örtük olmamak . Bunun nedeni, reel değerli matrisler için formülün sağ tarafının her zaman pozitif olması ve negatif determinantı olan ters çevrilebilir matrisler olması gerçeğinden kaynaklanmaktadır.

Gerçek simetrik matrisler

Gerçek bir simetrik matrisin üstel matrisi pozitif tanımlıdır. Let bir olmak n x n gerçek simetrik matris ve bir sütun vektördür. Üstel matrisin ve simetrik matrislerin temel özelliklerini kullanarak şunları elde ederiz:

.

Beri ters çevrilebilir olup, eşitlik yalnızca tutan ve elimizdeki tüm sıfırdan için . Dolayısıyla pozitif tanımlıdır.

toplamların üstel

Herhangi bir gerçek sayılar (skalar) için x ve y bildiğimiz üstel fonksiyon tatmin e x + y = E x e y . Aynı durum matrisler için de geçerlidir. X ve Y matrisleri yer değiştirirse (yani XY = YX ), o zaman,

Ancak, yukarıdaki eşitliğin değişmediği matrisler için mutlaka geçerli değildir.

Yalan ürün formülü

X ve Y değişmese bile , üstel e X + Y , Lie çarpım formülü ile hesaplanabilir.

.

Baker-Campbell-Hausdorff formülü

Diğer yönde, eğer X ve Y yeterince küçük (ancak zorunlu olarak değişip değişmeyen) matrislerse,

burada Z, bir dizi olarak hesaplanabilir kollektör arasında X ve Y ile Baker-Campbell-Hausdorff formül :

,

burada kalan terimlerin tümü X ve Y'yi içeren yinelenen komütatörlerdir . Eğer X ve Y gidip, o zaman tüm kollektör sıfır ve biz sadece var Z = X + Y .

Hermit matrislerinin üstelleri için eşitsizlikler

İçin Hermitsel matrisleri ile ilgili kayda değer bir teoremi vardır iz matris üstel.

Eğer A ve B Hermit matrisleri sonra, vardır

Değişebilirlik şartı yoktur. Golden-Thompson eşitsizliğinin üç matrise genişletilemeyeceğini gösteren karşı örnekler vardır – ve her halükarda, tr(exp( A )exp( B )exp( C )) Hermitian A , B için gerçek olacağı garanti edilmez. , Ç . Bununla birlikte, Lieb , ifadeyi aşağıdaki gibi değiştirirsek, bunun üç matrise genelleştirilebileceğini kanıtladı.

üstel harita

Bir matrisin üstel değeri her zaman tersine çevrilebilir bir matristir . Ters matris e X ile verilmektedir e - X . Bu, karmaşık bir sayının üstel değerinin her zaman sıfır olmadığı gerçeğine benzer. Üstel matris daha sonra bize bir harita verir

Her uzaydan n x n matrisler genel lineer grubunun derecesi n yani grup tüm n x n tersi matrisler. Aslında, bu harita örtüktür , yani her tersine çevrilebilir matris, başka bir matrisin üstel olarak yazılabilir (bunun için, R değil, karmaşık sayıların C alanını dikkate almak önemlidir ).

X ve Y herhangi iki matrisi için ,

burada ‖ · ‖ keyfi bir matris normunu belirtir . Bundan, Mn ( C )' nin kompakt alt kümeleri üzerinde üstel haritanın sürekli ve Lipschitz'in sürekli olduğu sonucu çıkar .

Harita

t = 0'da kimlik elemanından geçen genel lineer grupta düzgün bir eğri tanımlar .

Aslında bu , genel lineer grubun tek parametreli bir alt grubunu verir, çünkü

Bir t noktasında bu eğrinin (veya teğet vektörün ) türevi şu şekilde verilir:

 

 

 

 

( 1 )

t = 0'daki türev sadece X matrisidir , yani X bu tek parametreli alt grubu üretir.

Daha genel olarak, genel bir t bağımlı üs için X ( t ) ,

Yukarıdaki e X ( t ) ifadesini integral işaretinin dışına alarak ve integrali Hadamard lemması yardımıyla genişleterek , matris üssünün türevi için aşağıdaki yararlı ifadeyi elde edebiliriz,

Yukarıdaki ifadedeki katsayılar, üstelde görünenden farklıdır. Kapalı bir form için, üstel haritanın türevine bakın .

Üstel matrisin hesaplanması

Üstel matrisi hesaplamak için güvenilir ve doğru yöntemler bulmak zordur ve bu hala matematik ve sayısal analizde önemli bir güncel araştırma konusudur. Matlab , GNU Octave ve SciPy , Padé yaklaşımını kullanır . Bu bölümde, prensipte herhangi bir matrise uygulanabilen ve küçük matrisler için açıkça uygulanabilen yöntemleri tartışıyoruz. Sonraki bölümlerde, büyük matrisler üzerinde sayısal değerlendirme için uygun yöntemler açıklanmaktadır.

köşegenleştirilebilir kasa

Bir matris köşegen ise :

,

daha sonra üstel değeri, ana köşegen üzerindeki her girişin üstelleştirilmesiyle elde edilebilir:

.

Bu sonuç aynı zamanda köşegenleştirilebilir matrislerin üstelleştirilmesine de izin verir . Eğer

A = UDU -1

ve D köşegendir, o zaman

e A = Ue D U -1 .

Uygulama Sylvester, formül aynı sonucu verir. (Bunu görmek için, köşegen matrislerin toplama ve çarpmasının, dolayısıyla üs almanın, eleman bazında toplama ve çarpmaya ve dolayısıyla üs almaya eşdeğer olduğuna dikkat edin; özellikle, "tek boyutlu" üs, köşegen için eleman bazında hissedilir. dava.)

Örnek: Köşegenleştirilebilir

Örneğin, matris

olarak köşegenleştirilebilir

Böylece,

Nilpotent vaka

Bir matris , N olan nilpotenttir ise , N q bir tamsayı için = 0 q . Bu durumda, seri sonlu sayıda terimden sonra sona erdiğinden , matris üstel e N doğrudan seri açılımından hesaplanabilir:

Seri, sonlu sayıda adıma sahip olduğundan, verimli bir şekilde hesaplanabilen bir matris polinomudur .

Genel dava

Jordan-Chevalley ayrıştırmasını kullanma

Tarafından Jordan Chevalley ayrışma , bir matris X, kompleks girişlerle olarak ifade edilebilir

nerede

  • A köşegenleştirilebilir
  • N sıfır güçlüdür
  • A , N ile işe gidip gelir

Bu , önceki iki duruma indirgeyerek X'in üstelini hesaplayabileceğimiz anlamına gelir :

Son adımın çalışması için A ve N'nin değişebilirliğine ihtiyacımız olduğuna dikkat edin .

Jordan kanonik formunu kullanma

Alan ise yakından ilişkili bir yöntem olup, cebirsel kapalı çalışmak için, Ürdün formu arasında X . Diyelim ki X = PJP  -1, burada J , X'in Ürdün biçimidir . Sonra

Ayrıca, beri

Bu nedenle, yalnızca bir Jordan bloğunun matris üstelini nasıl hesaplayacağımızı bilmemiz gerekir. Ama her Jordan bloğu şu şekildedir:

burada N özel bir nilpotent matristir. J'nin üstel matrisi şu şekilde verilir:

Projeksiyon çantası

Eğer P bir izdüşüm matrisiyse (yani idempotent : P 2 = P ), matrisi üsteldir:

e P = I + ( e - 1) P .

Üstel fonksiyon genişlemesi bu türetilmesi, her gücü P azaltır P toplamı ortak bir faktör haline gelir:

Rotasyon durumu

A ve b dik birim vektörlerinin bir düzlem belirttiği basit bir döndürme için , dönme matrisi R , bir G jeneratörü ve θ açısı içeren benzer bir üstel fonksiyon cinsinden ifade edilebilir .

Yetkilerini azaltarak üstel sonuçlar için, formül G serisi genişleme ve karşılık gelen dizi katsayıları tespit G 2 ve G ile -cos ( θ ) ve sin ( İçeride ISTV melerin RWMAIWi'nin ) , sırasıyla. Buradaki e için ikinci ifade , üretecin türevini içeren makaledeki R ( θ ) ifadesi ile aynıdır , R ( θ ) = e .

İki boyutları ise ve , daha sonra , ve

bir düzlem dönüşü için standart matrise indirger.

Matris P = - G 2 projeleri üzerinde bir vektör ab -plane ve rotasyon sadece vektörün bu kısmını etkiler. Bunu gösteren bir örnek , a ve b tarafından yayılan düzlemde 30° = π/6'lık bir dönüştür ,

Let N = I - P , yani N 2 = N ile ürünleri P ve G sıfırdır. Bu, R'nin güçlerini değerlendirmemize izin verecektir .

Laurent serisine göre değerlendirme

Sayesinde Cayley- Hamilton teoremi matris üstel eksprese dereceden bir polinom olarak n -1.

Eğer P ve Q, T , bir değişken sıfır olmayan polinomlar, öyle ki p ( A ) = 0 , ve eğer meromorfik işlevi

olan tüm o zaman

.

İki yukarıdaki eşitliğin çok kez, önce bu kanıtlamak için P ( z ) ve yerine z ile A .

Böyle bir polinom Q t ( z ) aşağıdaki gibi bulunabilir - Sylvester formülüne bakın . İzin vermek bir bir kök olabilir , P , Q , bir t ( z ) 'nin ürününden çözülür P ile ana parça arasında Laurent serisi arasında f de bir : İlgili orantılıdır Frobemino kovaryant . Daha sonra toplamın S T arasında Q bir t , bir köklerinin tüm çalışır P , özel bir şekilde alınabilir S t . Diğer tüm S T bir çoklu ilave edilmesiyle elde edilecek P için S t ( z ) . Özellikle, S t ( z ) , Lagrange-Sylvester polinom , sadece S t belirgin ve derecesi daha düşük olduğu daha P .

Örnek : Rastgele bir 2×2 matris durumunu ele alalım,

Cayley-Hamilton teoremi sayesinde üstel matris e tA şu şekilde olmalıdır:

.

(Herhangi bir karmaşık sayı z ve herhangi bir C- cebri B için , z'nin B birimiyle çarpımını tekrar z ile gösteririz .)

Let α ve p kökleri olmak karakteristik polinom arasında A ,

o zaman bizde

buradan

eğer αβ ; ise, eğer α = β ,

Böylece

tanımlama

sahibiz

burada sin( qt )/ q , t = 0 ise 0 ve q = 0 ise t .

Böylece,

Böylece, yukarıda belirtildiği gibi, A matrisi , izlenen parça ve izsiz parça olmak üzere karşılıklı olarak değişen iki parçanın toplamına ayrışmıştır,

matris üstel, ilgili iki parçanın üstellerinin düz bir ürününe indirgenir. Bu, fizikte sıklıkla kullanılan bir formüldür, çünkü Euler'in Pauli spin matrisleri için formülünün analogu , yani SU(2) grubunun ikili temsilinin dönüşleri anlamına gelir .

Polinom S t'ye aşağıdaki " interpolasyon " karakterizasyonu da verilebilir . Tanımlama e t ( z ≡) e z ve n ≡ ° p . Daha sonra S t ( Z ) benzersiz derecesi < n bir polinom karşılayan S t ( k ) ( a ) = E t ( k ) ( a ) her k, daha az sayıda daha bir kökü olarak P . Biz açıkça can, bu gibi, farz P ise minimal polinom ait A . Biz ayrıca varsayalım A bir olduğunu köşegenleştirilebilir matris . Özellikle, P'nin kökleri basittir ve " enterpolasyon " karakterizasyonu, S t'nin Lagrange interpolasyon formülü tarafından verildiğini gösterir , dolayısıyla bu Lagrange−Sylvester polinomudur .

Diğer uçta, eğer P = ( z - a ) n , o zaman

Yukarıdaki gözlemler tarafından kapsanmayan en basit durum , ab ile olduğu zamandır.

Sylvester formülünün uygulanmasıyla değerlendirme

Yukarıdakilerin pratik, hızlandırılmış bir hesaplaması, aşağıdaki hızlı adımlara indirgenir. Yukarıdan bir n×n matris exp( tA )' nin Cayley–Hamilton teoremi tarafından A'nın ilk n -1 kuvvetlerinin lineer bir kombinasyonuna denk geldiğini hatırlayın . İçin köşegenleştirilebilir matrisler, 2 × 2 durumunda, örneğin, yukarıda açıklandığı gibi, Sylvester formülü verimleri exp ( tA ) = B α exp ( ) + B β exp ( ) , B ler vardır Frobemino kovaryantlar arasında A .

Bununla birlikte, bu ifadeyi ve t = 0'daki birinci türevini A ve I cinsinden değerlendirerek bu B s'yi doğrudan çözmek , yukarıdakiyle aynı cevabı bulmak en kolayıdır .

Ancak bu basit prosedür , Buchheim'dan kaynaklanan bir genellemede kusurlu matrisler için de geçerlidir. Bu, burada köşegenleştirilemeyen bir matrisin 4x4 örneği için gösterilmektedir ve B s, izdüşüm matrisleri değildir.

Dikkate almak

özdeğerleri λ 1 = 3/4 ve λ 2 = 1 , her biri iki katı olan.

t , exp( λ i t ) ile çarpılan her bir özdeğerin üstelini düşünün . Her üslü özdeğeri karşılık gelen belirsiz katsayı matrisi B i ile çarpın . Özdeğerlerin cebirsel çokluğu 1'den büyükse, işlemi tekrarlayın, ancak şimdi doğrusal bağımsızlığı sağlamak için her tekrar için fazladan bir t faktörü ile çarparak .

(Bir özdeğerin çokluğu üç olsaydı, o zaman üç terim olurdu: . Buna karşılık, tüm özdeğerler farklı olduğunda, B s sadece Frobenius kovaryantlarıdır ve onlar için aşağıdaki gibi çözmek, yalnızca Bu 4 özdeğerin Vandermonde matrisi .)

Tüm bu terimleri toplayın, burada dört tür,

Bilinmeyen matrisler için tüm çözmek için B ilk üç güçleri açısından A üzerinde bir az bir adet bu tür sağlanması ve kimlik, bir ihtiyacı dört denklem t fazla = 0, ile ilgili olarak ayırt t ,

ve yeniden,

ve bir kez daha,

(Genel durumda, n -1 türevlerinin alınması gerekir.)

Ayar t bu dört denklemlerde = 0, dört katsayısı matrisler B ler artık için çözülebilir,

pes etmek

A değeriyle değiştirmek , katsayı matrislerini verir

yani son cevap

Prosedür, bazen bu gibi durumlarda kullanılan Putzer algoritmasından çok daha kısadır .

İllüstrasyonlar

Üstel değerini hesaplamak istediğimizi varsayalım.

Onun Ürdün formu olduğunu

burada P matrisi verilir

Önce exp( J ) değerini hesaplayalım . Sahibiz

1×1 matrisinin üstel değeri, matrisin bir girişinin sadece üstel değeridir, dolayısıyla exp( J 1 (4)) = [ e 4 ]. Üstel J 2 (16) formülü ile hesaplanabilir e I  +  N )E λ e K yukarıda bahsedilen; bu verim

Bu nedenle, orijinal matris B'nin üstel değeri ,

Uygulamalar

Lineer diferansiyel denklemler

Üstel matrisin lineer diferansiyel denklem sistemlerine uygulamaları vardır . (Ayrıca bkz . matris diferansiyel denklemi .) Bu makalenin önceki bölümlerinden, formun homojen diferansiyel denklemini hatırlayın.

Çözelti sahip e de y (0) .

vektörünü düşünürsek

homojen olmayan birleştirilmiş lineer diferansiyel denklemler sistemini şu şekilde ifade edebiliriz:

Bir yapma Ansatz bir entegre faktörünün kullanımı e - At , verimler ve boyunca çarpılması

İkinci adım, eğer AB = BA ise , o zaman e At B = Be At olması nedeniyle mümkündür . Dolayısıyla, e At'ı hesaplamak , t'ye göre üçüncü adımı basitçe entegre ederek sistemin çözümüne yol açar .

Örnek (homojen)

Sistemi düşünün

İlişkili bozuk matris olduğu

matris üstel

homojen sistemin genel çözümü

tutarındaki

Örnek (homojen olmayan)

Şimdi homojen olmayan sistemi düşünün

biz yine var

ve

Önceden, homojen denklemin genel çözümüne zaten sahibiz. Homojen ve özel çözümlerin toplamı homojen olmayan problemin genel çözümünü verdiğinden, şimdi sadece özel çözümü bulmamız gerekiyor.

Biz, yukarıda,

bu, parametrelerin değiştirilmesi yoluyla belirlenen gerekli özel çözümü elde etmek için daha da basitleştirilebilir. Not c = y p (0). Daha fazla titizlik için aşağıdaki genellemeye bakın.

Homojen olmayan durum genellemesi: parametrelerin değişimi

Homojen olmayan durum için, bütünleştirici faktörleri kullanabiliriz ( parametrelerin varyasyonuna benzer bir yöntem ). y p ( t ) = exp( tA )  z ( t ) biçiminde belirli bir çözüm arıyoruz ,

İçin y p bir çözüm olarak,

Böylece,

burada c , problemin başlangıç ​​koşulları tarafından belirlenir.

Daha doğrusu, denklemi düşünün

Y ( t 0 ) = Y 0 başlangıç ​​koşuluyla , burada

Bir bir olduğu , n ile n , kompleks matrise
F , bazı açık aralık I'denn'ye kadar sürekli bir fonksiyondur ,
I noktasıdır ve
n'nin bir vektörüdür .

Yukarıda gösterilen eşitliğin e −tA verimleri ile sola çarpılması

Denklemin çözümünün olduğunu iddia ediyoruz.

0 ≤ k < n için başlangıç ​​koşulları ile

notasyonu aşağıdaki gibidir:

derece n > 0 olan bir monik polinomdur ,
f , bazı açık aralık I üzerinde tanımlanan sürekli karmaşık değerli bir fonksiyondur ,
I noktasıdır ,
karmaşık bir sayıdır ve

s k ( t ) yukarıdaki Laurent tarafından Değerlendirme Alt Bölümündebelirtilen polinomun katsayısıdır.

Bu iddiayı doğrulamak için, n mertebeden skaler denklemimizi, birinci mertebeden bir sisteme olağan indirgeme ile bir mertebeden vektör denklemine dönüştürüyoruz . Vektör denklemimiz şu şekli alır

burada bir bir devrik tamamlayıcı matris arasında P . Bu denklemi yukarıda açıklandığı gibi çözüyoruz , yukarıdaki Sylvester formülünün uygulanmasıyla Alt Bölüm Değerlendirmesinde yapılan gözlemle matris üstellerini hesaplıyoruz .

n = 2 durumunda aşağıdaki ifadeyi alırız. çözüm

dır-dir

burada s 0 ve s 1 fonksiyonları , yukarıdaki Laurent serisine göre Değerlendirme Alt Bölümündeki gibidir.

Matris-matris üstelleri

Başka bir matrisin üstel matrisi (matris-matris üstel), şu şekilde tanımlanır:

herhangi bir normal ve tekil olmayan n × n matrisi X ve herhangi bir karmaşık n × n matrisi Y için .

Matris-matris üstelleri için, sol üstel Y X ile sağ üstel X Y arasında bir ayrım vardır , çünkü matristen matrise yönelik çarpma operatörü değişmeli değildir . Dahası,

  • X normal ve tekil değilse , X Y ve Y X aynı özdeğer kümesine sahiptir.
  • X normal ise ve tekil değilse , Y normaldir ve XY = YX , o zaman X Y = Y X .
  • X normalse ve tekil değilse ve X , Y , Z birbiriyle yer değiştiriyorsa, X Y+Z = X Y · X Z ve Y+Z X = Y X · Z X .

Ayrıca bakınız

Referanslar

Dış bağlantılar