Zincir kuralı - Chain rule

Olarak hesap , zincir kuralı a, formül ifade türevinin bir bileşimin iki türevlenebilir fonksiyonları f ve g türevleri açısından ön ve g . Daha doğrusu, eğer o fonksiyon şekildedir her için x , daha sonra zincir kuralı içinde olduğu Lagrange gösterimde ,

Veya eşdeğer olarak,

Zincir kuralı Leibniz'in notasyonunda da ifade edilebilir . Değişken ise Z değişkeni bağlıdır y kendisi değişken bağlıdır, x (olup, y ve z olan bağımlı değişkenler ), sonra Z bağlıdır x ara değişken ile, hem de y . Bu durumda zincir kuralı şu şekilde ifade edilir:

ve

türevlerin hangi noktalarda değerlendirilmesi gerektiğini belirtmek için.

In entegrasyonu , zincir kuralına muadili olan ikame kuralı .

Sezgisel açıklama

Sezgisel olarak, zincir kuralı, z'nin y'ye göre anlık değişim hızını ve y'nin x'e göre anlık değişim oranını bilmenin, kişinin iki değişim oranının ürünü olarak z'nin x'e göre anlık değişim oranını hesaplamasına izin verdiğini belirtir.

George F. Simmons'ın dediği gibi : "Eğer bir araba bisikletten iki kat daha hızlı gidiyorsa ve bisiklet yürüyen bir adamdan dört kat daha hızlıysa, o zaman araba adamdan 2 × 4 = 8 kat daha hızlı hareket eder."

Bu örnek ile zincir kuralı arasındaki ilişki aşağıdaki gibidir. Let Z , Y ve X sırasıyla araç, bisiklet ve yürüme insanın (değişken) konumların. Arabanın ve bisikletin göreli konumlarının değişim hızı Benzer şekilde, Yani, arabanın ve yürüyen adamın göreli konumlarının değişim hızı

Konumların değişim oranı, hızların oranıdır ve hız, konumun zamana göre türevidir; yani,

Veya eşdeğer olarak,

bu da zincir kuralının bir uygulamasıdır.

Tarih

Zincir kuralı ilk olarak Gottfried Wilhelm Leibniz tarafından kullanılmış gibi görünüyor . Karekök fonksiyonu ve fonksiyonun bileşimi olarak türevini hesaplamak için kullandı . İlk olarak 1676 tarihli bir hatırada (hesaplamada bir işaret hatasıyla) bahsetti. Zincir kuralının yaygın gösterimi Leibniz'den kaynaklanmaktadır. Guillaume de l'Hôpital , Analyze des infiniment petits'inde zincirleme kuralını örtük olarak kullandı . Zincir kuralı, Leibniz'in keşfinden yüz yıl sonra yazılmış olmalarına rağmen, Leonhard Euler'in analiz kitaplarının hiçbirinde geçmez .

Beyan

Zincir kuralının en basit şekli, bir gerçek değişkenin gerçek değerli fonksiyonları içindir . Eğer g , bir c noktasında türevlenebilir bir fonksiyon ise (yani, g ′( c ) türevi mevcutsa) ve f , g ( c ) noktasında türevlenebilir bir fonksiyon ise, bileşik fonksiyonun c noktasında türevlenebilir olduğunu ve türev

Kural bazen şu şekilde kısaltılır:

Eğer y = f ( u ) ve u = g ( x ) , o zaman bu kısaltmasıdır yazılır Leibniz'in gösterimi olarak:

Türevlerin değerlendirildiği noktalar da açıkça belirtilebilir:

Aynı akıl yürütmeyi daha da ileri götürerek , bileşik fonksiyonla verilen n fonksiyonlar , eğer her fonksiyon hemen girişinde türevlenebilirse, o zaman bileşik fonksiyon, türevin (Leibniz'in notasyonunda) olduğu Zincir Kuralının tekrarlanan uygulamasıyla da türevlenebilir:

Uygulamalar

İkiden fazla fonksiyonun birleşimi

Zincir kuralı, ikiden fazla fonksiyonun birleşimine uygulanabilir. İkiden fazla fonksiyonun bir bileşiminin türevini almak için, f , g ve h'nin (bu sırayla) bileşiminin f'nin gh ile bileşimi olduğuna dikkat edin . Zincir kuralı, fgh'nin türevini hesaplamak için f'nin türevini ve gh'nin türevini hesaplamanın yeterli olduğunu belirtir . f'nin türevi doğrudan hesaplanabilir ve gh'nin türevi tekrar zincir kuralı uygulanarak hesaplanabilir.

Somutluk için işlevi göz önünde bulundurun

Bu, üç işlevin bileşimi olarak ayrıştırılabilir:

Türevleri şunlardır:

Zincir kuralı, bileşiklerinin x = a noktasındaki türevinin şöyle olduğunu belirtir :

Leibniz gösteriminde, bu:

veya kısaca,

Bu nedenle türev fonksiyonu:

Bu türevi hesaplamanın başka bir yolu, fgh bileşik fonksiyonunu fg ve h'nin bileşiği olarak görmektir . Zincir kuralının bu şekilde uygulanması şunları sağlar:

Bu, yukarıda hesaplananla aynıdır. Bu beklenmelidir çünkü ( fg ) ∘ h = f ∘ ( gh ) .

Bazen, formun keyfi olarak uzun bir bileşimini ayırt etmek gerekir . Bu durumda tanımla

nerede ve ne zaman . Sonra zincir kuralı şeklini alır

veya, Lagrange notasyonunda,

Kota kuralı

Zincir kuralı, bazı iyi bilinen türev alma kurallarını türetmek için kullanılabilir. Örneğin, bölüm kuralı, zincir kuralının ve çarpım kuralının bir sonucudur . Bunu görmek için f ( x )/ g ( x ) fonksiyonunu f ( x ) · 1/ g ( x ) çarpımı olarak yazın . Önce ürün kuralını uygulayın:

Türevini hesaplamak için 1 / g ( x ) bu bileşik bir fark olduğu, g olan karşılıklı fonksiyon, gönderir fonksiyonu ile X için 1 / X . Karşılıklı fonksiyonun türevi . Zincir kuralı uygulandığında son ifade şu hale gelir:

hangi bölüm kuralı için olağan formüldür.

Ters fonksiyonların türevleri

y = g ( x ) 'in ters bir fonksiyonu olduğunu varsayalım . Onun ters fonksiyon Çağrı f Elimizdeki böylece X = f ( y ) . f'nin türevi için g'nin türevi cinsinden bir formül vardır . Bunu görmek için f ve g'nin formülü sağladığına dikkat edin.

Ve fonksiyonlar ve x eşit olduğundan, türevleri de eşit olmalıdır. x'in türevi 1 değerine sahip sabit fonksiyondur ve türevi zincir kuralı ile belirlenir. Bu nedenle, elimizde:

f' bağımsız değişken y'nin bir fonksiyonu olarak ifade etmek için, x'in göründüğü her yerde yerine koyarız . O zaman f' için çözebiliriz .

Örneğin, g ( x ) = e x fonksiyonunu düşünün . Ters f ( y ) = ln y'ye sahiptir . Çünkü gr '( x ) = E x , yukarıdaki formül söylüyor

Bu formül, g türevlenebilir olduğunda ve tersi f de türevlenebilir olduğunda doğrudur . Bu koşullardan biri doğru olmadığında bu formül başarısız olabilir. Örneğin, g ( x ) = x 3'ü düşünün . Tersi f ( y ) = y 1/3'tür ve sıfırda türevlenemez. f'nin sıfırdaki türevini hesaplamak için yukarıdaki formülü kullanmaya çalışırsak , o zaman 1/ g ′( f (0)) değerlendirmeliyiz . Yana f (0) = 0 ve g '(0) = 0 , biz tanımsız 1/0, değerlendirmelidir. Bu nedenle, formül bu durumda başarısız olur. Bu şaşırtıcı değildir çünkü f sıfırda türevlenebilir değildir.

Daha yüksek türevler

Faà di Bruno'nun formülü , zincir kuralını daha yüksek türevlere genelleştirir. y = f ( u ) ve u = g ( x ) olduğunu varsayarsak , ilk birkaç türev:

Kanıtlar

İlk kanıt

Zincir kuralının bir kanıtı, türevin tanımıyla başlar:

Bir an için a yakınındaki herhangi bir x için eşit olmadığını varsayın . O zaman önceki ifade iki faktörün çarpımına eşittir:

Eğer yakın salınır bir , o zaman ne kadar yakın bir olursa olsun alır ortaya çıkabilir bir , her zaman daha yakın bir var x öyle ki g ( x ) = g ( a ) . Örneğin, bu yakın olur bir = 0 için sürekli işlev g tanımlanan g ( x ) = 0 için x = 0 ve g ( x ) = x 2 sin (/ 1 x ) , aksi takdirde. Bu olduğunda, yukarıdaki ifade tanımsızdır çünkü sıfıra bölmeyi içerir . Bu soruna geçici bir çözüm bulmak için aşağıdaki gibi bir işlev tanıtın:

Biz göstereceğini fark bölüm için fg is her zaman eşit:

Her g ( x ) e eşit değildir g ( a ) faktörler nedeniyle, bu açık g ( x -) g ( a ) iptal. Tüm g ( x ) eşittir g ( a ) , daha sonra da bir fark bölüm fg sıfırdır, f ( g ( x )) eşittir f ( g ( a )) , ve yukarıdaki ürün bu eşittir sıfırdır, f ( ' g ( a )) çarpı sıfır. Yukarıdaki ürün farkı bölüm her zaman eşit olduğu ve göstermek için Böylece türevi fg de bir değerini belirlenmesi ve mevcut, sadece limit gösterir gereken x gider bir Yukarıdaki ürünün vardır ve tespit Değeri.

Bunu yapmak için, faktörlerinin sınırları varsa, bir ürünün sınırının da var olduğunu hatırlayın. Bu olduğunda, bu iki faktörün çarpımının limiti, faktörlerin limitlerinin çarpımına eşit olacaktır. İki faktör Q ( g ( x )) ve ( g ( x ) - g ( a )) / ( x - a ) . İkincisi için fark kesridir g de bir , çünkü g noktasında türevli bir varsayım olarak, kendi sınırı x eğilimi bir mevcut ve eşit g ( ' a ) .

Gelince Q ( g ( x )) , fark olduğu S yerde tanımlandığı f olup. Ayrıca f , varsayımla g ( a ) ' da türevlenebilirdir , dolayısıyla Q , türevin tanımına göre g ( a )' da süreklidir . Fonksiyon g süreklidir bir en türevlenebilir çünkü bir ve dolayısıyla Qg süreklidir bir . Olarak sınırı Yani x gider bir mevcut ve eşit Q ( g ( a )) olduğu, f '( g ( a )) .

Bu, her iki faktörün de limitlerinin var olduğunu ve bunların sırasıyla f ′( g ( a )) ve g ′( a ) 'ya eşit olduğunu gösterir . Bu nedenle, türevin fg de bir mevcut ve eşit f '( g ( a )) g ' ( a ) .

İkinci kanıt

Zincir kuralını kanıtlamanın bir başka yolu, türev tarafından belirlenen doğrusal yaklaşımdaki hatayı ölçmektir. Bu ispatın birçok değişkene genelleme yapma avantajı vardır. Bu noktada Diferensiyellenebilirliğin aşağıdaki eşdeğer tanımı kullanır: Bir fonksiyon g noktasında türevli bir reel sayı mevcutsa g '( a ) ve bir işlev £ değenni ( h olarak sıfır eğilimi) h sıfır eğilimi, ve bundan başka

Burada sol taraftaki değeri arasındaki gerçek farkı temsil g de bir ve en bir + h sağ taraf türevi artı bir hata terimi ile tespit yaklaşımı temsil ederken.

Zincir kuralı durumda, bu tür bir işlev ε çünkü mevcut gr noktasında türevli olduğu varsayılır bir . Yine varsayımı, benzer bir işlev de ihtiyaç vardır f en g ( a ). Bu fonksiyona η adını verdiğimizde,

Yukarıdaki tanım ile ilgili bir sınırlama getirdiği r | o varsayılır olsa bile (0) η ( k olarak) sıfır eğilimi k sıfır eğilimindedir. Biz ayarlanırsa r (0) = 0 , o η 0 ° C'de süreklidir.

Teoremi kanıtlanması fark eğitim gerektirir f ( g ( bir + H -)) f ( g ( a )) olarak saat sıfıra yaklaşma eğilimindedir. İlk adım için yerine olan g ( bir + h ) arasında Diferensiyellenebilirliğin tanımını kullanarak g de bir :

Bir sonraki aşama Diferensiyellenebilirliğin tanımı kullanmaktır f en g ( a ). Bu, bazı k için f ( g ( a )+ k ) biçiminde bir terim gerektirir . Yukarıdaki denklemde, doğru k h ile değişir . Takım k h = gr '( bir ) h + ε ( h ) H ve sağ taraftaki olur f ( g ( a ) + k h ) - f ( g ( a )) . Türev tanımının uygulanması şunları verir:

Bu ifadenin davranışını h sıfıra yaklaştıkça incelemek için k h'yi genişletin . Terimleri yeniden grupladıktan sonra sağ taraf şu hale gelir:

Çünkü ε ( h ) ve η ( k h gibi) sıfır eğilimi h sıfır eğilimi, ilk iki köşeli parantez içindeki terim sıfır eğilimi h sıfır eğilimindedir. Aynı teoremi birinci ispatta olduğu gibi limitlerin çarpımlarına uygulayarak, üçüncü parantez içindeki terim de sıfıra eğilimlidir. Yukarıda ifade farkı eşit olduğu için f ( g ( bir + H -)) f ( g ( a )) , türevin tanımının fg de isimli türevlenebilir bir ve türevi olan f "( g ( bir )) g ′( bir ).

İlk ispatta Q'nun rolü bu ispatta η tarafından oynanır . Aşağıdaki denklemle ilişkilidirler:

Tanımlamak için gerek Q en g ( a ) tanımlamak için ihtiyaç benzerdir η sıfır.

Üçüncü kanıt

Constantin Carathéodory'nin bir fonksiyonun türevlenebilirliğine ilişkin alternatif tanımı, zincir kuralının zarif bir kanıtını vermek için kullanılabilir.

Bu tanıma göre, bir fonksiyon f bir noktasında olarak ayırt edilebilirdir a bir işlevi yoktur, ancak ve ancak k sürekli, bir ve bu şekilde f ( x ) - f ( a ) = q ( X ) ( X - bir ) . Böyle en fazla bir fonksiyon vardır ve eğer f a noktasında türevlenebilirse, o zaman f ′( a ) = q ( a ) .

Zincir kuralı ve türevlenebilir fonksiyonları ve sürekli fonksiyonların bileşimleri sürekli olduğu gerçeği varsayımlar göz önüne alındığında, fonksiyonlar var olduğunu var q de, sürekli g ( a ) ve R de, sürekli bir olduğunu ve bu,

ve

Öyleyse,

ancak verilen fonksiyon h ( x ) = q ( g ( x )) r, ( x ) sürekli olan bir ve bunun için, elde a

Benzer bir yaklaşım, birçok değişkenin sürekli türevlenebilir (vektör-) fonksiyonları için çalışır. Bu çarpanlara ayırma yöntemi aynı zamanda türevin Lipschitz sürekli , Hölder sürekli vb. olması gerektiğinde daha güçlü türevlenebilirlik biçimlerine birleşik bir yaklaşım sağlar. Türev almanın kendisi polinom kalan teoremi (küçük Bézout teoremi veya faktör teoremi) olarak görülebilir. , uygun bir işlev sınıfına genelleştirilmiştir.

Sonsuz küçüklerle ispat

Eğer ve ardından son derece küçük seçerek biz tekabül hesaplamak tekabül sonra ve böylece,

ve elde ettiğimiz standart parçayı uygulayarak

zincir kuralı budur.

çok değişkenli durum

Zincir kuralının çok değişkenli fonksiyonlara genelleştirilmesi oldukça tekniktir. Ancak, formun işlevleri durumunda yazmak daha kolaydır.

Bu durum, tek bir değişkenin fonksiyonlarının incelenmesinde sıklıkla meydana geldiğinden, onu ayrı olarak tanımlamaya değer.

Örneği f ( g 1 ( x ), ..., g k ( x ))

Formun bir fonksiyonu için zincir kuralı yazmak için

f ( g 1 ( x ), ... , g k ( x ) ) ,

bir ihtiyacı kısmi türevler arasında f onun ile ilgili k bağımsız değişkenleri. Kısmi türevler için olağan gösterimler, fonksiyonun argümanlarının isimlerini içerir. Bu argümanlar yukarıdaki formülde isimlendirilmediği için, şu şekilde ifade edilmesi daha basit ve daha açıktır.

türev f onun ile ilgili i inci argüman tarafından

bu türevin değeri z .

Bu gösterimle, zincir kuralı

Örnek: aritmetik işlemler

f fonksiyonu toplama ise, yani

sonra ve . Böylece, zincir kuralı verir

çarpma için

kısmiler ve . Böylece,

üs alma durumu

olduğundan biraz daha karmaşıktır

ve benzeri

Bunu takip ediyor

Genel kural

Genel durumda zincir kuralını yazmanın en basit yolu , tüm yönlü türevleri tek bir formülde yakalayan doğrusal bir dönüşüm olan toplam türevi kullanmaktır . Türevlenebilir fonksiyonları göz önünde f  : R, m,R, k ve g  : R ' , nR m ve noktalı a içinde R , n . Let D bir g arasında anlamında olabildikleri toplam türevi g de bir ve D g ( a ) ön göstermektedirler toplam türevi f en g ( a ) . Bu iki türev , sırasıyla R nR m ve R mR k doğrusal dönüşümleridir , böylece oluşturulabilirler. Toplam türevleri zincir kuralı, bunları meydana getiren toplam türevi olmasıdır fg de bir :

veya kısaca,

Daha yüksek boyutlu zincir kuralı, yukarıda verilen ikinci kanıta benzer bir teknik kullanılarak kanıtlanabilir.

Toplam türev lineer bir dönüşüm olduğu için formülde görünen fonksiyonlar matris olarak yeniden yazılabilir. Toplam türevlere karşılık gelen matris , Jacobian matrisi olarak adlandırılır ve iki türevin bileşimi, Jacobian matrislerinin ürününe karşılık gelir. Bu açıdan zincir kuralı bu nedenle şöyle der:

veya kısaca,

Yani, bir bileşik fonksiyonun Jacobian'ı, oluşturulmuş fonksiyonların Jacobian'larının ürünüdür (uygun noktalarda değerlendirilir).

Yüksek boyutlu zincir kuralı, tek boyutlu zincir kuralının bir genellemesidir. Eğer k , m , ve n, böylece, 1 olduğu f  : RR ve g  : RR , daha sonra Jacobi matrisler f ve g olan 1 x 1 . Spesifik olarak, bunlar:

fg'nin Jacobian'ı bu 1 × 1 matrislerin çarpımıdır, dolayısıyla tek boyutlu zincir kuralından beklendiği gibi f ′( g ( a ))⋅ g ′( a ) ' dır . Doğrusal dönüşümler dilinde, D a ( g ) bir vektörü g ′( a ) faktörü ile ölçekleyen fonksiyondur ve D g ( a ) ( f ) bir vektörü f ′ faktörü ile ölçekleyen fonksiyondur ( g ( a )). Zincir kuralı, bu iki doğrusal dönüşümün bileşiminin doğrusal dönüşüm D a ( fg ) olduğunu ve bu nedenle bir vektörü f ′( g ( a ))⋅ g ′( a ) ile ölçekleyen fonksiyon olduğunu söyler .

Zincir kuralı yazmanın başka bir yolu, f ve g bileşenleri açısından y = f ( u ) = ( f 1 ( u ), …, f k ( u )) ve u = g ( x ) olarak ifade edildiğinde kullanılır. = ( g 1 ( x ), …, g m ( x ) ) . Bu durumda, Jacobian matrisleri için yukarıdaki kural genellikle şu şekilde yazılır:

Toplam türevler için zincir kuralı, kısmi türevler için bir zincir kuralı anlamına gelir. Toplam türev var olduğunda, kısmi türevi olduğu geri çağırma i koordine inci yönü ile Jakobyan matris çarpımı tarafından bulunan i inci baz vektörü. Bunu yukarıdaki formüle yaparak şunu buluruz:

Jacobian matrisinin girdileri kısmi türevler olduğundan, yukarıdaki formülü basitleştirerek şunu elde edebiliriz:

Daha kavramsal olarak, bu kural x i yönündeki bir değişikliğin g 1 'den g m 'ye kadar olan her şeyi değiştirebileceği ve bu değişikliklerden herhangi birinin f'yi etkileyebileceği gerçeğini ifade eder .

Özel Etriyeli k = 1 , böylece f gerçek değerli fonksiyon, daha sonra bu formül basitleştirir daha da geçerli:

Bu nokta çarpım olarak yeniden yazılabilir . u = ( g 1 , …, g m ) u / ∂ x i kısmi türevinin de bir vektör olduğunu hatırlayarak ve zincir kuralı şunu söyler:

Örnek

Verilen u ( x , y ) = x 2 + 2 y x ( r , t ) = R sin ( t ) ve y ( r , t ) = sin 2 ( t ) , değerini belirlemek U / ∂ r ve u / ∂ t zincir kuralını kullanarak.

ve

Çok değişkenli fonksiyonların daha yüksek türevleri

Faà di Bruno'nun tek değişkenli fonksiyonların yüksek dereceli türevleri için formülü çok değişkenli duruma genelleme yapar. Eğer y = f ( u ) bir fonksiyonudur u = g ( x ) olarak, daha sonra, ikinci bir türevi, yukarıda fg isimli:

Daha fazla genelleme

Kalkülüsün tüm uzantılarının bir zincir kuralı vardır. Bunların çoğunda formül aynı kalır, ancak bu formülün anlamı çok farklı olabilir.

Bir genelleme manifoldlar içindir . Bu durumda zincir kuralı, fg'nin türevinin, f'nin türevi ile g'nin türevinin bileşimi olduğu gerçeğini temsil eder . Bu teorem, yukarıda verilen yüksek boyutlu zincir kuralının doğrudan bir sonucudur ve tamamen aynı formüle sahiptir.

Zincir kural geçerlidir Frechet türevleri de Banach boşluklar . Aynı formül daha önce olduğu gibi tutar. Bu durum ve bir önceki durum Banach manifoldları için eşzamanlı bir genellemeyi kabul etmektedir .

Olarak diferansiyel cebir , türev modüllerinin bir morfizma yorumlanır Kähler farklılıkları . Bir halka homomorfizması arasında değişmeli halkalar f  : RG KÄHLER bir morfizmalar tespit diferansiyelli Df  : Ω R → Ω S bir eleman gönderir dr için d ( f ( r )), dış diferansiyel f ( r ). D ( fg ) = DfDg formülü bu bağlamda da geçerlidir.

Bu örneklerin ortak özelliği, türevin bir functor'un parçası olduğu fikrinin ifadeleridir . Bir işlev, boşluklar ve aralarındaki işlevler üzerinde bir işlemdir. Her mekana yeni bir boşluk ve iki boşluk arasındaki her fonksiyona, karşılık gelen yeni boşluklar arasında yeni bir fonksiyon bağlar. Yukarıdaki durumların her birinde, functor her uzayı kendi teğet demetine ve her fonksiyonu türevine gönderir. Örneğin, manifold durumunda türev , bir C r −1 -manifolduna (tanjant demeti) bir C r -manifoldu ve toplam türevine bir C r -fonksiyonu gönderir . Bunun bir fonksiyon olması için bir gereklilik vardır, yani bir kompozitin türevinin türevlerin kompoziti olması gerekir. Bu tam olarak D ( fg ) = DfDg formülüdür .

Stokastik hesapta da zincir kuralları vardır . Bunlardan biri, Itō'nin lemması , bir Itō işleminin (veya daha genel olarak bir semimartingale ) dX t'nin iki kez türevlenebilir bir f fonksiyonu ile bileşimini ifade eder . Ito Önsavı, kompozit fonksiyonun türevi de bağlıdır dx t ve türev f değil, aynı zamanda ikinci türevi f . İkinci türev bağımlılığı , stokastik sürecin sıfırdan farklı ikinci dereceden varyasyonunun bir sonucudur; bu , genel olarak, sürecin çok kaba bir şekilde yukarı ve aşağı hareket edebileceği anlamına gelir. Zincir kuralının bu varyantı, bir functor örneği değildir, çünkü oluşan iki fonksiyon farklı tiplerdedir.

Ayrıca bakınız

Referanslar

Dış bağlantılar