Dil arası makine çevirisi - Interlingual machine translation

Şekil 1. Bir köprü dili kullanarak çeviri sürecinde kullanılan dillerin gösterimi .

Dillerarası makine çevirisi klasik yaklaşımlardan biridir makine çevirisi . Bu yaklaşımda kaynak dil yani çevrilecek metin interlingua yani dilden bağımsız soyut bir temsile dönüştürülür. Hedef dil daha sonra interlingua'dan üretilir. Kural tabanlı makine çevirisi paradigması içinde, diller arası yaklaşım, doğrudan yaklaşıma ve aktarım yaklaşımına bir alternatiftir .

Doğrudan yaklaşımda, kelimeler ek bir temsilden geçmeden doğrudan çevrilir. Transfer yaklaşımında, kaynak dil soyut, daha az dile özgü bir temsile dönüştürülür. Dil çiftine özgü dil kuralları daha sonra kaynak dil temsilini soyut bir hedef dil temsiline dönüştürür ve bundan hedef cümle oluşturulur.

Makine çevirisine diller arası yaklaşımın avantajları ve dezavantajları vardır. Avantajları, her bir kaynak dili her hedef dil ile ilişkilendirmek için daha az bileşen gerektirmesi, yeni bir dil eklemek için daha az bileşen gerektirmesi, orijinal dildeki girdinin açıklamalarını desteklemesi, hem çözümleyicilerin hem de oluşturucuların tek dilli sistem geliştiricileri tarafından yazılmıştır ve birbirinden çok farklı dilleri (örneğin, İngilizce ve Arapça) işler. Bariz dezavantaj, bir interlingua tanımının daha geniş bir alan için zor ve hatta imkansız olmasıdır. Bu nedenle, diller arası makine çevirisi için ideal bağlam, çok özel bir alanda çok dilli makine çevirisidir.

Tarih

Dillerarası makine çevirisi ile ilgili ilk fikirler 17. yüzyılda, evrensel sayısal kodlar kullanarak sözlüklerin nasıl oluşturulacağına dair teoriler ortaya atan Descartes ve Leibniz ile ortaya çıktı . Cave Beck , Athanasius Kircher ve Johann Joachim Becher gibi diğerleri, mantık ve ikonografların ilkelerine dayanan açık ve net bir evrensel dil geliştirmek için çalıştı . 1668'de John Wilkins "Gerçek Bir Karakter ve Felsefi Dile Doğru Deneme" adlı kitabında interlingua'sını tanımladı. 18. ve 19. yüzyıllarda "evrensel" uluslararası diller için pek çok öneri geliştirildi, bunlardan en bilineni Esperanto'ydu .

Bununla birlikte, evrensel bir dil fikrinin makine çevirisine uygulanması ilk önemli yaklaşımların hiçbirinde görünmedi. Bunun yerine, dil çiftleri üzerinde çalışma başladı. Ancak, 1950 ve 60'larda, araştırmacılar Cambridge başkanlığındaki Margaret Masterman içinde, Leningrad başkanlığındaki Nikolay Andreev ve Milan tarafından Silvio Ceccato bu alanda çalışmaya başladı. Bu fikir, 1969'da İsrailli filozof Yehoshua Bar-Hillel tarafından kapsamlı bir şekilde tartışıldı .

1970'lerde, kayda değer bir araştırma yapıldı Grenoble fizik ve matematiksel metinleri tercüme edilmeye çalışıldığı araştırmacılar tarafından Rusça için Fransızca ve içinde Texas benzer bir proje (METAL) için Rus için, devam eden edildi İngilizce . Erken diller arası MT sistemleri de 1970'lerde Roger Schank ve Yorick Wilks tarafından Stanford'da inşa edildi ; Eski fonların transferi için ticari bir sisteminin temeli haline geldi ve en son kod ile korunur Bilgisayar Müzesi'nde de Boston ilk Dillerarası makine çevirisi sistemi olarak.

1980'lerde, genel olarak makine çevirisine yönelik interlingua temelli ve bilgi temelli yaklaşımlara yenilenmiş ilgi verildi ve bu alanda çok sayıda araştırma yapıldı. Bu araştırmadaki birleştirici faktör, yüksek kaliteli çevirinin, metnin tam olarak anlaşılmasını gerektirme fikrinden vazgeçilmesini gerektirmesiydi. Bunun yerine, çeviri dil bilgisine ve sistemin kullanılacağı belirli alana dayanmalıdır. Bu dönemin en önemli araştırması, Esperanto'nun değiştirilmiş bir sürümüyle çalışan Utrecht'teki dağıtılmış dil çevirisi (DLT) ve Japonya'daki Fujitsu sisteminde yapıldı.

Anahat

Şekil 2. a) Doğrudan veya aktarım tabanlı makine çevirisi için gerekli çeviri grafiği (12 sözlük gereklidir); b) Bir köprü dili kullanırken gerekli çeviri grafiği (yalnızca 8 çeviri modülü gereklidir).

Bu çeviri yönteminde interlingua, bir kaynak dilde yazılmış bir metnin analizini , morfolojik, sözdizimsel, anlambilimsel (ve hatta pragmatik) özelliklerini dönüştürmek mümkün olacak şekilde tanımlamanın bir yolu olarak düşünülebilir. anlamı " hedef dile . Bu interlingua, sadece bir dilden diğerine çeviri yapmak yerine, çevrilecek tüm dillerin tüm özelliklerini tanımlayabilir.

Şekil 3: İki dil dilini kullanan çeviri grafiği.

Bazen çeviride iki dil arası kullanılır. Bu ikisinden birinin kaynak dilin daha fazla özelliğini kapsaması, diğerinin ise hedef dilin daha fazla özelliğine sahip olması mümkündür. Tercüme daha sonra ilk dilden cümleleri iki aşamada hedef dile daha yakın cümlelere dönüştürerek ilerler. Sistem aynı zamanda ikinci interlingua'nın hedef dile daha yakın veya daha uyumlu olan daha spesifik bir kelime dağarcığı kullanacağı şekilde kurulabilir ve bu, çeviri kalitesini artırabilir.

Yukarıda bahsedilen sistem, bir orijinal dildeki bir metinden, yapısal olarak benzer birçok dile, tek bir orijinal analizden çeviri kalitesini iyileştirmek için dilsel yakınlığı kullanma fikrine dayanmaktadır. Bu ilke aynı zamanda kullanılan eksen makine çevirisi bir, doğal dil iki daha uzak dil arasında bir "köprü" olarak kullanılır. Örneğin, çevirme durumunda İngilizce den Ukraynaca kullanarak Russian bir ara dil olarak.

Çeviri süreci

: Dillerarası makine çevirisi sistemlerinde, iki tek dilli bileşen vardır analiz kaynak dil ve diller arası, ve nesilden Interlingua'nın ve hedef dile. Bununla birlikte, diller arası sistemleri yalnızca sözdizimsel yöntemleri kullanarak (örneğin 1970'lerde Grenoble ve Teksas üniversitelerinde geliştirilen sistemler) ve yapay zekaya dayalı olanları (Japonya'da 1987'den ve Güney Kaliforniya üniversitelerindeki araştırmalar) ayırmak gerekir. ve Carnegie Mellon). İlk sistem tipi, Şekil 1'de ana hatları çizilen sisteme karşılık gelirken, diğer tipler Şekil 4'teki diyagram ile yaklaşık olarak hesaplanacaktır.

Aşağıdaki kaynaklar, diller arası bir makine çevirisi sistemi için gereklidir:

Şekil 4. Bilgiye dayalı bir sistemde makine çevirisi.
  • Analiz ve üretim için sözlükler (veya sözlükler) (ilgili alana ve ilgili dillere özgü ).
  • Alanda bilinen olaylar ve varlıklar hakkında bilgi tabanı olan kavramsal bir sözlük (alana özgü) .
  • Bir dizi projeksiyon kuralı (etki alanına ve dillere özgü).
  • İlgili dillerin analizi ve oluşturulması için gramerler.

Bilgiye dayalı makine çeviri sistemlerinin sorunlarından biri, çok özel alanlardan daha geniş alanlar için veri tabanı oluşturmanın imkansız hale gelmesidir. Bir diğeri, bu veritabanlarının işlenmesinin hesaplama açısından çok pahalı olmasıdır.

Etki

Bu stratejinin temel avantajlarından biri, çok dilli çeviri sistemleri yapmak için ekonomik bir yol sağlamasıdır. Bir interlingua ile, sistemdeki her bir dil çifti arasında bir çeviri çifti oluşturmak gereksiz hale gelir. Bu nedenle , sistemdeki dillerin sayısı olan dil çiftleri oluşturmak yerine , sadece diller ve interlingua arasında çiftler yapmak gerekir .

Bu stratejinin temel dezavantajı, yeterli bir interlingua yaratmanın zorluğudur. Hem soyut olmalı hem de kaynak ve hedef dillerden bağımsız olmalıdır. Çeviri sistemine ne kadar çok dil eklenir ve bunlar ne kadar farklı olursa, interlingua tüm olası çeviri yönlerini ifade etmek için o kadar güçlü olmalıdır. Diğer bir sorun da, ara temsili oluşturmak için orijinal dillerdeki metinlerden anlam çıkarmanın zor olmasıdır.

Mevcut diller arası makine çeviri sistemleri

Ayrıca bakınız

Notlar

  1. ^ Abdel Monem, A., Shaalan, K., Rafea, A., Baraka, H., Generating Arabic Text in Multilingual Speech-to-Speech Machine Translation Framework , Machine Translation, Springer, Hollanda, 20 (4): 205– 258, Aralık 2008.
  2. ^ Bogdan Babych, Anthony Hartley ve Serge Sharoff (2007) "Kaynaklı olmayan dillerden çeviri: doğrudan aktarımı pivot çeviriyle karşılaştırmak ". MT Zirvesi XI Bildirileri, 10-14 Eylül 2007, Kopenhag, Danimarka . s.29—35

Dış bağlantılar