Google Çeviri - Google Translate

Google Çeviri
Google Çeviri logosu.svg
Google Translate.png'nin ekran görüntüsü
Google Çeviri ana sayfası
Site türü
Sinirsel makine çevirisi
Uygun 109 dil, aşağıya bakın
Sahip Google
URL tercüme .google .com
Reklam Evet
Kayıt İsteğe bağlı
Kullanıcılar Günde 500 milyondan fazla insan
başlatıldı 28 Nisan 2006 ; 15 yıl önce ( istatistiksel makine çevirisi olarak ) 15 Kasım 2016 ; 4 yıl önce ( sinirsel makine çevirisi olarak ) ( 2006-04-28 )
 ( 2016-11-15 )
Şu anki durum Aktif

Google Translate , metinleri, belgeleri ve web sitelerini bir dilden diğerine çevirmek için Google tarafından geliştirilmiş çok dilli bir sinirsel makine çevirisi hizmetidir . Bir web sitesi arayüzü , Android ve iOS için bir mobil uygulama ve geliştiricilerin tarayıcı uzantıları ve yazılım uygulamaları oluşturmasına yardımcı olan bir uygulama programlama arayüzü sunar . Ekim 2021 itibariyle, Google Çeviri çeşitli düzeylerde 109 dili desteklemektedir ve Nisan 2016 itibariyle, günlük 100 milyardan fazla kelime tercüme edilerek toplam 500 milyondan fazla kullanıcı talep etmiştir.

Nisan 2006'da istatistiksel bir makine çevirisi hizmeti olarak başlatılan bu hizmet, dilsel verileri toplamak için Birleşmiş Milletler ve Avrupa Parlamentosu belgelerini ve transkriptlerini kullandı. Dilleri doğrudan çevirmek yerine, önce metni İngilizce'ye çevirir ve ardından, Katalanca-İspanyolca dahil olmak üzere birkaç istisna dışında, kendi ızgarasına yerleştirdiği dil kombinasyonlarının çoğunda hedef dile döner. Bir çeviri sırasında, hangi sözcüklerin seçileceğine ve bunların hedef dilde nasıl düzenleneceğine karar vermek için milyonlarca belgedeki kalıpları arar. Çeşitli vesilelerle eleştirilmiş ve alay konusu olan doğruluğunun diller arasında büyük farklılıklar gösterdiği ölçülmüştür. Kasım 2016'da Google, Google Çeviri'nin "tüm cümleleri parça parça değil, bir seferde çeviren bir sinirsel makine çeviri motoru olan Google Neural Machine Translation'a (GNMT) geçeceğini duyurdu. Yardım etmek için bu daha geniş bağlamı kullanır. En alakalı çeviriyi bul, daha sonra uygun dilbilgisi ile konuşan bir insan gibi yeniden düzenler ve ayarlar". Başlangıçta 2016'da yalnızca birkaç dil için etkinleştirilen GNMT, İngilizce ve Latince arasında çeviri yapılması dışında, Ekim 2021 itibarıyla Google Çeviri listesindeki 109 dilin tamamında kullanılmaktadır .

Tarih

Google Translate, Google tarafından Nisan 2006'da geliştirilen tamamlayıcı bir çeviri hizmetidir. Kelimeler, ifadeler ve web sayfaları gibi birden çok metin ve medya biçimini çevirir.

Başlangıçta Google Translate, istatistiksel bir makine çevirisi hizmeti olarak piyasaya sürüldü . Girilen metnin seçilen dile çevrilmeden önce İngilizce'ye çevrilmesi gerekiyordu. SMT, metni çevirmek için tahmine dayalı algoritmalar kullandığından , dilbilgisel doğruluğu zayıftı. Buna rağmen, Google, dilin sürekli gelişen doğası nedeniyle bu sınırlamayı çözmek için başlangıçta uzmanlar tutmadı.

Ocak 2010'da Google, taşınabilir bir kişisel tercüman olarak hizmet vermek üzere Şubat 2011'de bir Android uygulaması ve iOS sürümünü tanıttı. Şubat 2010 itibariyle, Chrome gibi tarayıcılara entegre edildi ve çevrilen metni telaffuz edebildi, bir resimdeki kelimeleri otomatik olarak tanıyabildi ve yabancı metin ve dilleri tespit edebildi.

Mayıs 2014'te Google , görsel ve sesli çevirinin kalitesini artırmak için Word Lens'i satın aldı . Cihazı kullanarak metin veya resim tarayabilir ve anında tercüme ettirebilir. Ayrıca, sistem yabancı dilleri otomatik olarak tanımlar ve konuşma çevirisi gerektiğinde kişilerin mikrofon düğmesine dokunmasına gerek kalmadan konuşmayı çevirir.

Kasım 2016'da Google, çeviri yöntemini sinirsel makine çevirisi adı verilen bir sisteme geçirdi . İngilizce ve Fransızca, Almanca, İspanyolca ve Çince arasında daha doğru olduğu ölçülen tüm cümleleri bir seferde çevirmek için derin öğrenme tekniklerini kullanır . Google araştırmacıları tarafından GNMT için İngilizce'den diğer dillere, diğer dillerden İngilizce'ye veya İngilizce'yi içermeyen dil çiftleri arasında herhangi bir ölçüm sonucu sağlanmamıştır. 2018 itibariyle günde 100 milyardan fazla kelime çeviriyor.

Fonksiyonlar

Google Çeviri, metin, konuşma ve sabit veya hareketli görüntüler içindeki metinler dahil olmak üzere birden çok metin ve medya biçimini çevirebilir. Spesifik olarak, işlevleri şunları içerir:

  • Yazılı Sözcük Çevirisi: Yazılı sözcükleri veya metni yabancı bir dile çeviren bir işlev.
  • Web Sitesi Çevirisi: tüm bir web sayfasını seçilen dillere çeviren bir işlev
  • Belge Çevirisi: Kullanıcılar tarafından yüklenen bir belgeyi seçilen dillere çeviren bir işlev. Belgeler şu biçimde olmalıdır: .doc, .docx, .odf, .pdf, .ppt, .pptx, .ps, .rtf, .txt, .xls, .xlsx.
  • Konuşma Çevirisi: konuşulan dili anında seçilen yabancı dile çeviren bir işlev.
  • Mobil Uygulama Çevirisi: 2018'de Google Çeviri, herhangi bir uygulamadan çıkmadan veya değiştirmeden anında çeviriyi erişilebilir hale getiren "Tap to Translate" adlı yeni özelliğini kullanıma sundu.
  • Görüntü Çevirisi: Kullanıcılar tarafından çekilen bir resimdeki metni tanımlayan ve ekrandaki metni görüntülerle anında çeviren bir işlev.
  • El Yazısı Çevirisi: Bir klavye desteği olmadan telefon ekranında elle yazılmış veya sanal bir klavyede çizilmiş dilleri çeviren bir işlev.

Google Translate, özelliklerinin çoğu için telaffuz, sözlük ve çeviri dinleme sağlar. Ek olarak, Google Çeviri kendi Çeviri uygulamasını tanıttı, bu nedenle çeviri çevrimdışı modda bir cep telefonuyla kullanılabilir.

Özellikleri

Google Çeviri, metin, konuşma, web siteleri veya hareketsiz veya canlı video görüntülerinde görüntülenen metinler dahil olmak üzere birden çok metin ve medya biçiminin dilleri arasında yaklaşık değerler üretir. Bazı diller için, Google Çeviri metinden konuşma sentezleyebilir ve belirli çiftlerde kaynak ve hedef metin arasında karşılık gelen belirli kelimeleri ve kelime öbeklerini vurgulamak mümkündür. Sonuçlar bazen çeviri kutusunun altında sözlü bilgilerle gösterilir, ancak bu bir sözlük değildir ve tanımadığı kelimeler için tüm dillerde çeviriler icat ettiği gösterilmiştir. "Dili algıla" seçilirse, bilinmeyen bir dildeki metin otomatik olarak tanımlanabilir. Web arayüzünde kullanıcılar, teknik terimler veya hataları düzeltme gibi alternatif çeviriler önerebilir. Bu öneriler, çeviri sürecinin gelecekteki güncellemelerine dahil edilebilir. Bir kullanıcı kaynak metne bir URL girerse , Google Translate , web sitesinin makine çevirisine bir köprü oluşturur. Kullanıcılar, çeviri önerilerini daha sonra kullanmak üzere bir "ifade kitabına" kaydedebilir. Bazı dillerde metin, ekran klavyesi aracılığıyla, el yazısı tanıma veya konuşma tanıma yoluyla girilebilir . Kaynak dilde seçilen hedef dilden sonuçlara göz atılmasına ve yorumlanmasına izin veren bir hedef dile çevrilen bir kaynak dilde aramalar girmek mümkündür.

Yazılı Metinler Yunan , Devanagari , Kiril ve Arap komut yazılmış fonetik eşdeğeri otomatik harf çevirisi edilebilir Latin alfabesinin . Google Translate'in tarayıcı sürümü, Japonca'dan İngilizce'ye dönüştürme için fonetik okuma seçeneği sunar. Aynı seçenek ücretli API sürümünde mevcut değildir.

Her ülkenin Google Çeviri'nin "metinden konuşmaya" sesinin kullandığı İngilizce aksan:
  İngiliz (Alınan Telaffuz) (kadın)
  Genel Amerikan (kadın)
  Genel Avustralyalı (kadın)
  Hintli (kadın)
  Google çeviri hizmeti yok

Daha popüler dillerin çoğunda, o dildeki bir metni birkaç düzine kelimeye kadar okuyabilen bir "metin-konuşma" ses işlevi vardır. Çok merkezli diller söz konusu olduğunda , aksan bölgeye bağlıdır: İngilizce, Amerika Kıtası , Asya-Pasifik'in çoğu ve Batı Asya'da ses bir kadın Genel Amerikan aksanı kullanır , oysa Avrupa, Hong Kong , Malezya , Singapur'da , Guyana ve dünyanın diğer tüm bölgelerinde, Avustralya, Yeni Zelanda ve Norfolk Adası'nda kullanılan özel bir Genel Avustralya aksanı ve Hindistan'da kullanılan bir Hint İngiliz aksanı dışında , bir kadın İngiliz ( Alınan Telaffuz ) aksanı kullanılır ; İspanyolca için, içinde Amerika , bir Latin Amerika dünyanın diğer bölgelerinde, bir süre vurgu kullanılır Kastilyan vurgu kullanılır; için Portekizce , bir São Paulo vurgu Portekiz, dışında, dünya çapında kullanılan kendi ana vurgu yerine kullanılır; için Fransızca bir Quebecois dünyanın diğer bölgelerinde, bir süre vurgu, Kanada'da kullanılan standart Avrupa vurgu kullanılır; için Bengalce , bir erkek Bangladeşli vurgu özel dişi Hint Bengalce vurgu yerine kullanılır Hindistan'da dışında kullanılır. Daha az yaygın olarak konuşulan bazı diller , konuşmaları için açık kaynaklı eSpeak sentezleyiciyi kullanır; anlaşılması zor olabilecek robotik, garip bir ses çıkarmak.

Tarayıcı entegrasyonu

Google Çeviri, bazı web tarayıcılarında , çeviri hizmetine sağ tıklama komutu erişimine izin veren çeviri motorunu çalıştırabilen, isteğe bağlı indirilebilir bir uzantı olarak bulunur . Şubat 2010'da, Google Çeviri, isteğe bağlı otomatik web sayfası çevirisi için varsayılan olarak Google Chrome tarayıcısına entegre edildi .

Mobil uygulama

Google Çeviri
Google Çeviri logosu.svg
Ekran görüntüsü
Google Çeviri iOS uygulaması ekran görüntüsü.png
Google Translate'in iOS uygulamasının, "Kahve"nin Basitleştirilmiş Çince "咖啡" veya "Kāfēi"ye İngilizce çevirisini gösteren ekran görüntüsü
Geliştirici(ler) Google
İlk sürüm 1 Ocak 2010 ; 11 yıl önce (Android için) 8 Şubat 2011 ; 10 yıl önce (iOS için) ( 2010-01-01 )
 ( 2011-02-08 )
Kararlı sürüm(ler) [±]
Android 6.5.0.RC04.292618770 / 31 Ocak 2020 ; 20 ay önce ( 2020-01-31 )
iOS 6.3.0 / 3 Ekim 2019 ; 2 yıl önce ( 2019-10-03 )
Platformu
Boy 20,74 MB (Android)
70,9 MB (iOS)
Uygun 109 dil, aşağıya bakın
Tip İstatistiksel ve sinirsel makine çevirisi
İnternet sitesi m .translate .google .com

Android ve iOS için Google Çeviri uygulaması 109 dili destekler ve fotoğraf aracılığıyla 37 dile, "konuşma modunda" sesli olarak 32 ve "artırılmış gerçeklik modunda" canlı video görüntüleri aracılığıyla 27 dile çeviri önerebilir.

Android uygulaması Ocak 2010'da piyasaya sürüldü, Ağustos 2008'de iOS kullanıcıları için bir HTML5 web uygulaması yayınlandı ve ardından 8 Şubat 2011'de yerel bir uygulama yayınlandı.

Uygulama, 109 dili ve 45 dil için ses girişini destekler. Android 2.1 ve üzerini çalıştıran cihazlar için mevcuttur ve Google Play'de "Google Translate" aranarak indirilebilir .

Mevcut Google Çeviri uygulaması, iOS 7.0+ sürümüne güncellenen iPhone , iPad ve iPod Touch ile uyumludur . 15 dil için ses girişini kabul eder ve bir kelimenin veya ifadenin 50'den fazla dilden birine çevrilmesine izin verir. Çeviriler 23 farklı dilde yüksek sesle konuşulabilir.

Bir Ocak 2011 Android sürümü, kullanıcıların yakındaki bir kişiyle başka bir dilde akıcı bir şekilde iletişim kurmasını sağlamayı amaçlayan bir "Konuşma Modu" ile deney yaptı. Başlangıçta İngilizce ve İspanyolca ile sınırlı olan özellik, takip eden Ekim ayında hala test aşamasında olan 12 yeni dil için destek aldı.

'Kamera girişi' işlevi, kullanıcıların bir belgenin, tabelanın vb. fotoğrafını çekmesine olanak tanır. Google Translate, optik karakter tanıma (OCR) teknolojisini kullanarak görüntüdeki metni tanır ve çeviriyi verir. Kamera girişi tüm diller için mevcut değildir.

Ocak 2015'te uygulamalar, Google'ın Word Lens uygulamasını satın almasının bir sonucu olarak, cihazın kamerasını kullanarak fiziksel işaretlerin gerçek zamanlı çevirilerini önerme yeteneğini kazandı . Orijinal Ocak lansmanı yalnızca yedi dili destekledi, ancak bir Temmuz güncellemesi, evrişimli sinir ağlarını kullanan yeni bir uygulamanın piyasaya sürülmesiyle 20 yeni dil için destek ekledi ve ayrıca Konuşma Modu çevirilerinin ( artırılmış gerçeklik ) hızını ve kalitesini artırdı . Özelliğin adı daha sonra Anında Kamera olarak değiştirildi. Anında Kamera'nın altında yatan teknoloji, görüntü işleme ve optik karakter tanımayı birleştirir, ardından metin için algılandığı şekliyle standart Google Çeviri tahminlerini kullanarak diller arası eşdeğerler üretmeye çalışır.

11 Mayıs 2016'da Google, Android için Google Çeviri için Tap to Translate'i tanıttı . Yabancı dilde olan bir uygulamada metin vurgulandığında, Çeviri uygulamanın içinde açılır ve çeviriler sunar.

API

26 Mayıs 2011'de Google, yazılım geliştiriciler için Google Translate API'sinin kullanımdan kaldırıldığını ve çalışmayı durduracağını duyurdu. Çeviri API'si sayfası, nedeni 1 Aralık 2011 olarak belirlenmiş bir bitiş tarihi ile "kapsamlı kötüye kullanımın neden olduğu önemli ekonomik yük" olarak belirtti. Kamu baskısına yanıt olarak Google, Haziran 2011'de API'nin ücretli olarak sunulmaya devam edeceğini duyurdu. hizmet.

API, çok sayıda üçüncü taraf web sitesinde ve uygulamasında kullanıldığından, ilk kullanımdan kaldırma kararı, bazı geliştiricilerin Google'ı eleştirmesine ve ürünlerinde Google API'lerini kullanmanın uygulanabilirliğini sorgulamasına neden oldu.

Google Asistan

Google Çeviri ayrıca Google Asistan ve Google Asistan'ın Google Home ve Pixel Buds gibi üzerinde çalıştığı cihazlar için çeviriler sağlar .

Desteklenen diller

Ekim 2021 itibariyle, aşağıdaki 109 dil Google Çeviri tarafından desteklenmektedir.

Tarih
  1. 1. aşama
    1. İngilizce'den Fransızca'ya ve Fransızca'dan
    2. İngiliz ve gelen Almanca
    3. İngilizce'den İspanyolca'ya ve İspanyolca'dan
  2. 2. aşama
    1. İngilizce'den Portekizce'ye ve Portekizce'den
  3. 3. aşama
    1. İngilizceden İtalyancaya
  4. 4. aşama
    1. İngilizce'den Çince'ye ve Çince'den (Basitleştirilmiş)
    2. İngilizceden Japoncaya
    3. İngilizceden Koreceye
  5. 5. aşama (28 Nisan 2006'da başlatıldı)
    1. İngilizce'den Arapça'ya ve Arapça'dan
  6. 6. aşama (16 Aralık 2006'da başlatıldı)
    1. İngilizce'den Rusça'ya ve Rusça'dan
  7. 7. aşama (9 Şubat 2007'de başlatıldı)
    1. İngilizce'den Çince'ye ve Çince'den (Geleneksel)
    2. Çince (Gelenekselden Basitleştirilmiş)
  8. 8. aşama (25 dil çiftinin tamamı Google'ın makine çevirisi sistemini kullanır) (22 Ekim 2007'de başlatıldı)
    1. İngilizce'den Hollandaca'ya
    2. İngilizce'den Yunanca'ya ve Yunanca'dan
  9. 9. aşama
    1. Hintçe ve Hintçe İngilizce
  10. 10. aşama (bu aşamadan itibaren, gerekirse ara adım olarak İngilizce kullanılarak herhangi iki dil arasında çeviri yapılabilir) (8 Mayıs 2008'de başlatıldı)
    1. Bulgarca
    2. Hırvat
    3. Çek
    4. Danimarkalı
    5. Fince
    6. Norveççe ( Bokmål )
    7. Lehçe
    8. Rumence
    9. İsveççe
  11. 11. aşama (25 Eylül 2008'de başlatıldı)
    1. Katalanca
    2. Filipinli
    3. İbranice
    4. Endonezya dili
    5. Letonca
    6. litvanyaca
    7. Sırpça
    8. Slovak
    9. Sloven
    10. Ukrayna
    11. Vietnam
  12. 12. aşama (30 Ocak 2009'da başlatıldı)
    1. Arnavut
    2. estonyaca
    3. Galiçyaca
    4. Macarca
    5. Maltaca
    6. Tay
    7. Türk
  13. 13. aşama (19 Haziran 2009'da başlatıldı)
    1. Farsça
  14. 14. aşama (24 Ağustos 2009'da başlatıldı)
    1. Afrikaanca
    2. belarusça
    3. İzlandaca
    4. İrlandalı
    5. Makedonca
    6. Malayca
    7. Svahili
    8. Galce
    9. Yidiş
  15. 15. aşama (19 Kasım 2009'da başlatıldı)
    1. Beta aşaması tamamlandı. Kullanıcılar artık romanizasyonun Belarusça, Bulgarca, Çince, Yunanca, Hintçe, Japonca, Korece, Rusça, Tayca ve Ukraynaca için yazılmasını seçebilirler . Arapça, Hintçe ve Farsçadan yapılan çeviriler için, kullanıcı metnin Latince harf çevirisini girebilir ve metin, kullanıcı yazarken bu diller için yerel alfabeye çevrilecektir. Metin artık İngilizce, Fransızca, Almanca ve İtalyanca dillerinde bir metin okuma programı tarafından okunabilir .
  16. 16. aşama (30 Ocak 2010'da başlatıldı)
    1. Haiti Kreyolu
  17. 17. aşama (Nisan 2010'da başlatıldı)
    1. Hintçe ve İspanyolca olarak başlatılan konuşma programı.
  18. 18. aşama (5 Mayıs 2010'da başlatıldı)
    1. Afrikanca, Arnavutça, Katalanca, Çince (Mandarin), Hırvatça, Çekçe, Danca, Felemenkçe, Fince, Yunanca, Macarca, İzlandaca, Endonezyaca, Letonca, Makedonca, Norveççe, Lehçe, Portekizce, Rumence, Rusça, Sırpça, Slovakça dillerinde konuşma programı başlatıldı , Swahili, İsveççe, Türkçe, Vietnamca ve Galce ( eSpeak'e göre )
  19. 19. aşama (13 Mayıs 2010'da başlatıldı)
    1. Ermeni
    2. Azerice
    3. Bask dili
    4. Gürcü
    5. Urduca
  20. 20. aşama (Haziran 2010'da başlatıldı)
    1. Arapça için romanizasyon sağlar.
  21. 21. aşama (Eylül 2010'da başlatıldı)
    1. Arapça, Yunanca, Hintçe, Farsça, Rusça, Sırpça ve Urduca için fonetik yazmaya izin verir.
    2. Latince
  22. 22. aşama (Aralık 2010'da başlatıldı)
    1. Arapçanın Romanizasyonu kaldırıldı.
    2. Yazım denetimi eklendi.
    3. Google, bazı diller için metin-konuşma sentezleyicilerini eSpeak'in robot sesinden anadili konuşmacının SVOX tarafından yapılan doğal ses teknolojilerine (Çince, Çekçe, Danca, Felemenkçe, Fince, Yunanca, Macarca, Norveççe, Lehçe, Portekizce, Rusça, İsveççe, Türkçe) ve ayrıca Fransızca, Almanca, İtalyanca ve İspanyolca'nın eski versiyonları; Latince, İtalyanca ile aynı sentezleyiciyi kullanır.
    4. Arapça, Japonca ve Korece dillerinde konuşma programı başlatıldı.
  23. 23. aşama (Ocak 2011'de başlatıldı)
    1. Bir kelime için farklı çeviri seçenekleri.
  24. 24. aşama (Haziran 2011'de başlatıldı)
    1. 5 yeni Hint dili (alfa olarak) ve harf çevirisi yapılmış bir giriş yöntemi:
    2. Bengalce
    3. Gujarati
    4. kannada
    5. Tamilce
    6. Telugu
  25. 25. aşama (Temmuz 2011'de başlatıldı)
    1. Çeviri derecelendirmesi tanıtıldı.
  26. 26. aşama (Ocak 2012'de başlatıldı)
    1. Hollandalı erkek ses sentezleyicisi dişi ile değiştirildi.
    2. SVOX'tan Elena, Slovakça eSpeak sesinin yerini aldı.
    3. Yidiş çevirisi eklendi.
  27. 27. aşama (Şubat 2012'de başlatıldı)
    1. Tay dilinde konuşma programı başlatıldı.
    2. Esperanto
  28. 28. aşama (Eylül 2012'de başlatıldı)
    1. Lao
  29. 29. aşama (Ekim 2012'de başlatıldı)
    1. Lao'nun çevirisi eklendi. (alfa durumu)
  30. 30. aşama (Ekim 2012'de başlatıldı)
    1. Yeni konuşma programı İngilizce olarak başlatıldı.
  31. 31. aşama (Kasım 2012'de başlatıldı)
    1. Fransızca, Almanca, İtalyanca, Latince ve İspanyolca dillerinde yeni konuşma programı.
  32. 32. aşama (Mart 2013'te başlatıldı)
    1. Sözcük kitabı eklendi.
  33. 33. aşama (Nisan 2013'te başlatıldı)
    1. Kmer
  34. 34. aşama (Mayıs 2013'te başlatıldı)
    1. Boşnakça
    2. Cebuano
    3. hmong
    4. Cava
    5. Marathi
  35. 35. aşama (Mayıs 2013'te başlatıldı)
    1. Kamera girişi ile 16 ek dil kullanılabilir: Bulgarca, Katalanca, Hırvatça, Danca, Estonca, Fince, Macarca, Endonezyaca, İzlandaca, Letonca, Litvanca, Norveççe, Rumence, Slovakça, Slovence ve İsveççe.
  36. 36. aşama (Aralık 2013'te başlatıldı)
    1. Hausa
    2. İbo
    3. Maori
    4. Moğolca
    5. Nepalce
    6. Pencap ( Gurmukhi )
    7. somali
    8. Yoruba
    9. Zuluca
  37. 37. aşama (Haziran 2014'te başlatıldı)
    1. Kelimelerin tanımı eklendi.
  38. 38. aşama (Aralık 2014'te başlatıldı)
    1. Burma
    2. çiğnemek
    3. Kazak
    4. Madagaskar
    5. Malayalamca
    6. Sinhalese
    7. soto
    8. Sunda dili
    9. Tacik
    10. Özbekçe
  39. 39. aşama (Ekim 2015'te başlatıldı)
    1. Arapça'nın çevirisi restore edildi.
  40. 40. aşama (Kasım 2015'te başlatıldı)
    1. Aurebesh
  41. 41. aşama (Şubat 2016'da başlatıldı)
    1. Aurebesh kaldırıldı.
    2. Bengalce konuşma programı başlatıldı.
    3. Amharca
    4. Korsikalı
    5. Hawaii dili
    6. Kürtçe ( Kurmanci )
    7. Kırgızca
    8. Lüksemburgca
    9. Peştuca
    10. Samoaca
    11. İskoç Galcesi
    12. Şona
    13. Sindhi
    14. Batı Frizcesi
    15. Xhosa
  42. 42. aşama (Eylül 2016'da başlatıldı)
    1. Ukraynaca konuşma programı başlatıldı.
  43. 43. aşama (Aralık 2016'da başlatıldı)
    1. Kmer ve Sinhala'da konuşma programı başlatıldı.
  44. 44. aşama (Haziran 2018'de başlatıldı)
    1. Birmanya, Malayalam, Marathi, Nepalce ve Telugu dilinde konuşma programı başlatıldı.
  45. 45. aşama (Eylül 2019'da başlatıldı)
    1. Gujarati, Kannada ve Urduca'da konuşma programı başlatıldı.
  46. 46. ​​aşama (Şubat 2020'de başlatıldı)
    1. Kinyarwanda
    2. Odia
    3. Tatar
    4. Türkmen
    5. Uygur
  47. 47. aşama (Şubat 2021'de başlatıldı)
    1. Afrikanca, Bulgarca, Katalanca, İzlandaca, Letonca, Malayca ve Sırpça konuşma programı başlatıldı (eSpeak'ten doğal sese değiştirildi).
    2. Birkaç dil için yeni konuşma sistemi (WaveNet).

Geliştirme ve beta sürümündeki diller

Aşağıdaki diller henüz Google Çeviri tarafından desteklenmemektedir, ancak Çeviri Topluluğu'nda mevcuttur. Ekim 2021 itibariyle, geliştirme aşamasında olan 126 dil vardır ve bunların 25'i beta sürümündedir.

Beta sürümündeki diller , genel kullanıma sunulmalarına daha yakındır ve 50 karaktere kadar bir İngilizce metni çevirerek beta sürümünün 4'e kadar çevirisinin değerlendirilmesine olanak tanıyan özel bir ek katkı seçeneğine sahiptir .

Dilekçe verilen, ancak henüz eklenmemiş diller

Çeviri metodolojisi

Nisan 2006'da Google Translate, istatistiksel bir makine çevirisi motoruyla hizmete girdi.

Google Çeviri , algoritmaları geleneksel kural tabanlı analiz yerine istatistiksel veya kalıp analizine dayandığından dilbilgisi kuralları uygulamaz . Sistemin orijinal yaratıcısı Franz Josef Och , kural tabanlı algoritmaların etkinliğini istatistiksel yaklaşımlar lehine eleştirdi . Google Çeviri'nin orijinal sürümleri, istatistiksel makine çevirisi adı verilen bir yönteme ve daha özel olarak, 2003 yılında DARPA hızlı makine çevirisi yarışmasını kazanan Och'un araştırmasına dayanıyordu . Och, Human Longevity'ye katılmak üzere ayrılana kadar Google'ın makine çevirisi grubunun başkanıydı. , Inc. Temmuz 2014'te.

Google Çeviri bir dilden diğerine çeviri yapmaz (L1 → L2). Bunun yerine, genellikle önce İngilizce'ye, ardından hedef dile çevirir (L1 → EN → L2). Ancak, tüm insan dilleri gibi İngilizce'nin de belirsiz olması ve bağlama bağlı olması, çeviri hatalarına neden olabilir. Örneğin, vous'u Fransızca'dan Rusça'ya çevirmek vous → you → ты OR Bы/вы verir . Google aracı olarak açık, yapay bir dil kullanıyor olsaydı, vous → sen → Bы/вы OR tu → sen → ты olurdu . Sözcüklerin böyle bir son eki, onların farklı anlamlarını belirsizleştirir. Bu nedenle, İngilizce yayınlamak, açık kelimeler kullanmak, bağlam sağlamak, "hepiniz" gibi ifadeler kullanmak genellikle tek adımlı daha iyi bir çeviri yapar.

Aşağıdaki dillerin İngilizce'ye veya İngilizce'den doğrudan bir Google çevirisi yoktur. Bu diller, İngilizce'ye ek olarak belirtilen ara dil (çoğu durumda istenen dille yakından ilgilidir ancak daha yaygın olarak konuşulur) aracılığıyla çevrilir:

Och'a göre, sıfırdan yeni bir dil çifti için kullanılabilir bir istatistiksel makine çeviri sistemi geliştirmek için sağlam bir temel, 150-200 milyon kelimeden fazla iki dilli bir metin külliyatından (veya paralel koleksiyondan ) ve her biri iki tek dilli külliyattan oluşacaktır . bir milyardan fazla kelime. Bu verilerden elde edilen istatistiksel modeller daha sonra bu diller arasında çeviri yapmak için kullanılır.

Google, bu büyük miktarda dilsel veriyi elde etmek için Birleşmiş Milletler ve Avrupa Parlamentosu belgelerini ve transkriptlerini kullandı. BM tipik olarak , çok büyük bir 6 dilli külliyat oluşturan altı resmi BM dilinin tamamında belgeler yayınlar .

Google Çeviri bir çeviri teklifi oluşturduğunda , en iyi çeviriye karar vermek için yüz milyonlarca belgedeki kalıpları arar . Google Çeviri, insan çevirmenler tarafından halihazırda çevrilmiş belgelerdeki kalıpları tespit ederek, uygun bir çevirinin ne olması gerektiği konusunda bilinçli tahminler (AI) yapar .

Ekim 2007'den önce, Arapça , Çince ve Rusça dışındaki diller için Google Çeviri, Babel Fish (artık feshedilmiş) gibi bazı diğer çevrimiçi çeviri hizmetleri tarafından hala kullanılan bir yazılım motoru olan SYSTRAN'a dayanıyordu . Ekim 2007'den itibaren Google Çeviri, sinirsel makine çevirisine geçmeden önce istatistiksel makine çevirisine dayalı tescilli, şirket içi teknolojiyi kullandı .

Google Çeviri Topluluğu

Google, gönüllülerin Google Çeviri'nin doğruluğunu iyileştirmeye yardımcı olmayı amaçlayan "Çeviri Topluluğunun" bir parçası olmaları için kitle kaynaklı özelliklere sahiptir . Gönüllüler, çeviriyi geliştirmeye yardımcı olmak için en fazla beş dil seçebilir; kullanıcılar çevrilmiş ifadeleri doğrulayabilir ve kendi dillerindeki ifadeleri İngilizce'ye ve İngilizce'den çevirebilir, bu da daha nadir ve karmaşık ifadeleri çevirmenin doğruluğunu artırmaya yardımcı olur. Ağustos 2016'da, Android kullanıcıları için çeviri görevlerinin sunulduğu bir Google Crowdsource uygulaması yayınlandı. Katkıda bulunmanın üç yolu vardır. İlk olarak, Google, çevrilmiş sürümde yazılması gereken bir kelime öbeği gösterecektir. İkinci olarak, Google, bir kullanıcının kabul etmesi, katılmaması veya atlaması için önerilen bir çeviriyi gösterecektir. Üçüncüsü, kullanıcılar Google'ın sonuçlarını iyileştirebileceklerini düşündükleri ifadeler için çeviriler önerebilirler. 44 dilde yapılan testler, "düzenleme öner" özelliğinin dört yıl boyunca vakaların en fazla %40'ında bir iyileşmeye yol açtığını gösterirken, kapsamlı analizler, Google'ın kalabalık prosedürlerinin genellikle hatalı çevirileri azalttığını gösteriyor.

İstatistiksel makine çevirisi

Google, daha kaliteli çeviri için sinirsel makine çevirisi adı verilen yeni bir sistem kurmuş olsa da, istatistiksel makine çevirisi adı verilen geleneksel çeviri yöntemini kullanan diller var. Yabancı dillerdeki metinleri çevirmenin yollarını tahmin etmek için tahmine dayalı algoritmaları kullanan kural tabanlı bir çeviri yöntemidir. Tek tek kelimeler yerine tüm ifadeleri çevirmeyi ve ardından çeviri için örtüşen ifadeleri toplamayı amaçlar. Ayrıca, metinleri bir dilden diğerine çeviren istatistiksel bir model oluşturmak için iki dilli metin külliyatını da analiz eder.

Google Nöral Makine Çevirisi

Eylül 2016'da Google'daki bir araştırma ekibi, Google Çeviri'de akıcılığı ve doğruluğu artırmak için Google Sinirsel Makine Çevirisi sisteminin (GNMT) geliştirildiğini duyurdu ve Kasım ayında Google Çeviri'nin GNMT'ye geçeceğini duyurdu.

Google Translate'in sinirsel makine çeviri sistemi , özellikle uzun kısa süreli bellek ağları olmak üzere derin öğrenme gerçekleştirmeye çalışan büyük bir uçtan uca yapay sinir ağı kullanır . GNMT , sistemin "milyonlarca örnekten öğrendiği" örnek tabanlı bir makine çevirisi (EBMT) yöntemi kullandığı için bazı durumlarda SMT üzerinden çeviri kalitesini artırır . Google araştırmacılarına göre, "tüm cümleleri parça parça değil, bir seferde çevirir. Bu daha geniş bağlamı, en alakalı çeviriyi bulmasına yardımcı olmak için kullanır, ardından daha çok konuşan bir insan gibi olacak şekilde yeniden düzenler ve ayarlar. düzgün dilbilgisi". GNMT'nin "sistem öğrenimi" için "önerilen mimarisi", Google Translate tarafından desteklenen yüzün üzerinde dilde uygulandı. Uçtan uca çerçeve ile Google, çoğu dil için "sistemin daha iyi, daha doğal çeviriler oluşturmak için zamanla öğrendiğini" belirtir ancak göstermez. GNMT ağı , " cümleden tümceye çevirileri ezberlemek yerine cümlenin anlambilimini" kodlayan diller arası makine çevirisini deniyor ve sistem kendi evrensel dilini icat etmedi, ancak "birçok dil arasında bulunan ortaklığı" kullanıyor. . GNMT ilk olarak sekiz dil için etkinleştirildi: İngilizce ve Çince, Fransızca, Almanca, Japonca, Korece, Portekizce, İspanyolca ve Türkçe'ye ve bu dillerden. Mart 2017'de Hintçe, Rusça ve Vietnamca, ardından Nisan ayında Bengalce, Gujarati, Endonezyaca, Kannada, Malayalam, Marathi, Punjabi, Tamil ve Telugu için etkinleştirildi.

Kesinlik

Google Çeviri, insan çevirisi kadar güvenilir değildir. Metin iyi yapılandırıldığında, eğitim verilerinin yeterli olduğu resmi konularla ilgili basit cümlelerle, resmi dil kullanılarak yazıldığında, genellikle İngilizce ve bir dizi yüksek kaynaklı dil arasında insan çevirilerine benzer dönüşümler üretir. Bu koşullardan daha azı geçerli olduğunda, örneğin cümle uzunluğu arttığında veya metin tanıdık veya edebi bir dil kullandığında, bu diller için doğruluk azalır. İngilizce'ye kıyasla diğer birçok dil için, bu biçimsel koşullarda metnin özünü üretebilir. İngilizce'den 102 dile yapılan insan değerlendirmesi, bir metnin ana fikrinin 35 dilde zamanın %50'sinden fazlasını aktardığını göstermektedir. 67 dil için, %50 veya daha fazla bir sürede minimum düzeyde anlaşılabilir bir sonuç elde edilemez. Birkaç çalışma Çince, Fransızca, Almanca ve İspanyolca'yı İngilizce'ye değerlendirdi, ancak çoğu Google Çeviri dilinden İngilizce'ye sistematik bir insan değerlendirmesi yapılmadı. İngilizceden diğerlerine yapılan ölçümlerden tahmin edilen spekülatif dilden dile puanları, Google Çeviri'nin, dil çiftlerinin yaklaşık %1'inde zamanın yarısından fazlasında bir metnin özünü bir dilden diğerine aktaran çeviri sonuçları üreteceğini göstermektedir. dil İngilizcedir.

Tek kelimeleri çevirmek için bir sözlük olarak kullanıldığında, Google Çeviri çok anlamlı kelimeler arasında tahmin yapması gerektiğinden son derece yanlıştır . Tüm yazılı İngilizce'nin %50'sinden fazlasını oluşturan İngilizce dilindeki en iyi 100 kelime arasında, ortalama bir kelimenin 15'ten fazla anlamı vardır, bu da her bir duyu farklı bir anlamla eşleşirse doğru bir çeviriye karşı şansı 15'e 1 yapar. hedef dilde kelime. En yaygın İngilizce kelimelerin en az iki anlamı vardır, bu da hedef dilin bu farklı duyular için farklı kelimeler kullanması muhtemel durumda 50/50 oran üretir. Oranlar diğer dillerden İngilizceye benzer. Google Translate doğru bir çeviri çoğunluk veya çoğunluk eşleşmeyen durumlarda elde edilemez olacak bunun sonucu da bir kelimenin en sık duygusu oluşturma ihtimallerini yükseltmek istatistiki tahminler yapar korpus oluşumunu. Tek kelimelik tahminlerin doğruluğu hiçbir dil için ölçülmemiştir. Neredeyse tüm İngilizce olmayan dil çiftleri İngilizce üzerinden döndüğü için, İngilizce olmayan bir dilden diğerine doğru tek kelimelik çeviriler elde etme olasılığı, kaynak dildeki duyuların sayısı ile bunların her birinin duyu sayısı çarpılarak tahmin edilebilir. terimler ingilizce var. Google Çeviri sözlüğünde bir kelime olmadığında, algoritmasının bir parçası olarak bir sonuç oluşturur.

Google Translate'in yanlışlığı, bir dilden diğerine ve ardından orijinal dile çevrilerek gösterilebilir. Bu, genellikle orijinal metnin kurtarılması yerine, anlamsız yapılarla sonuçlanacaktır.

sınırlamalar

Diğer otomatik çeviri araçları gibi Google Çeviri'nin de sınırlamaları vardır. Hizmet, çevrilebilecek paragraf sayısını ve teknik terimlerin aralığını sınırlar ve okuyucunun yabancı dildeki bir metnin genel içeriğini anlamasına yardımcı olsa da, her zaman doğru çeviriler sağlamaz ve çoğu zaman tekrar etme eğilimindedir. kelimesi kelimesine aynı kelimeyi tercüme etmesi beklenir. Örneğin, dilbilgisi açısından Google Çeviri , Roman dillerindeki kusurlu ve mükemmel yönler arasında ayrım yapmakta zorlanır, bu nedenle geçmişteki alışılmış ve sürekli eylemler genellikle tekil tarihsel olaylar haline gelir . Bilgiç gibi görünse de, bu genellikle bir insan çevirmenin kaçınabileceği yanlış sonuçlara (örneğin Fransızca ve İspanyolca ana dili konuşanlar için) yol açabilir. Bilgi dilek kipi denecek olduğunu. Ayrıca, bağlam veya kabul edilen kullanım ne olursa olsun , resmi ikinci kişi ( vous ) sıklıkla seçilir. İngilizce referans materyali sadece "siz" formlarını içerdiğinden, "hepiniz" veya resmi "siz" varyasyonları olan bir dili tercüme etmekte zorluk çekiyor.

Diller arasındaki yatırım, araştırma ve dijital kaynakların kapsamı farklılıkları nedeniyle, Google Çeviri'nin doğruluğu diller arasında büyük farklılıklar gösterir. Bazı diller diğerlerinden daha iyi sonuçlar verir. Afrika, Asya ve Pasifik'teki dillerin çoğu, birçok iyi finanse edilmiş Avrupa dilinin puanlarına kıyasla düşük puan alma eğilimindedir; Afrikaanca ve Çince, kıtalarından en yüksek puan alan istisnalardır. Avustralya'ya veya Amerika'ya özgü hiçbir dil Google Çeviri'ye dahil edilmemiştir. Avrupa için daha yüksek puanlar kısmen , Avrupa Parlamentosu'nun Avrupa Birliği'nin yetkisiyle profesyonel olarak 21 dile çevrilmiş bir belge hazinesi olan Europarl Corpus'a atfedilebilir . 2010 yılında yapılan bir analiz, Fransızca'dan İngilizce'ye çevirinin nispeten doğru olduğunu ve 2011 ve 2012 analizleri, İtalyanca'dan İngilizce'ye çevirinin de nispeten doğru olduğunu göstermiştir. Ancak, kaynak metin daha kısaysa, kural tabanlı makine çevirileri genellikle daha iyi performans gösterir; bu etki özellikle Çince'den İngilizce'ye çevirilerde belirgindir. Çevirilerin düzeltmeleri gönderilebilirken, özellikle Çince'de cümleler bir bütün olarak düzenlenemez. Bunun yerine, bazen rastgele karakter kümelerini düzenlemek gerekir, bu da yanlış düzenlemelere yol açar. İyi bir örnek, Rusça'dan İngilizce'ye. Eskiden bir taslak yapmak için Google Translate'i kullanır ve ardından sayısız hatayı düzeltmek için bir sözlük ve sağduyu kullanırdı. 2018'in başlarından itibaren Çeviri, Rusça Vikipedi'yi İngilizce okuyabilen kişiler için erişilebilir kılmak için yeterince doğrudur. Translate'in kalitesi, Chrome veya Firefox'a bir uzantı olarak eklenerek ve herhangi bir Wikipedia makalesinin sol dil bağlantılarına uygulanarak kontrol edilebilir. Kelimeleri yazarak sözlük olarak kullanılabilir. Google Drive gibi bir tarayıcı ve OCR kullanılarak bir kitaptan çeviri yapılabilir, ancak bu sayfa başına yaklaşık beş dakika sürer.

Yazılı Söz Çevirisi işlevinde, bir kerede çevrilebilecek metin miktarında bir sözcük sınırı vardır. Bu nedenle, uzun metinler bir belge formuna aktarılmalı ve Belge Çeviri işlevi aracılığıyla çevrilmelidir.

Ayrıca, tüm makine çevirisi programları gibi, Google Çeviri çokanlamlılık (bir kelimenin sahip olabileceği çoklu anlamlar) ve çok kelimeli ifadeler (onları oluşturan tek tek kelime birimlerinin analiz edilmesiyle anlaşılamayan veya çevrilemeyen anlamlara sahip terimler) ile mücadele eder. Yabancı dildeki bir kelimenin çevrildiği dilde iki farklı anlamı olabilir. Bu yanlış çevirilere yol açabilir.

Ek olarak, dil bilgisi hataları Google Çeviri'nin doğruluğunun önemli bir sınırlaması olmaya devam etmektedir.

Açık kaynak lisansları ve bileşenleri

Dilim WordNet Lisans
Arnavut Albanet CC-BY 3.0/GPL 3
Arapça Arapça Kelime Ağı CC-BY-SA 3
Katalanca Çok Dilli Merkezi Depo CC-BY-3.0
Çince Çince Kelime Ağı kelime ağı
Danimarkalı Dannet kelime ağı
İngilizce Princeton Wordnet kelime ağı
Fince FinnWordnet kelime ağı
Fransızca KURT (WOrdnet Libre du Français) CeCILL-C
Galiçyaca Çok Dilli Merkezi Depo CC-BY-3.0
İbranice İbranice Wordnet kelime ağı
Hintçe HTE Bombay Wordnet Hintçe Wordnet
Endonezya dili Wordnet Bahasa MİT
İtalyan ÇokluKelime Ağı CC-BY-3.0
Japonca Japonca Wordnet kelime ağı
Cava Cava Kelime Ağı kelime ağı
Malayca Wordnet Bahasa MİT
Norveççe Norveççe Wordnet kelime ağı
Farsça Farsça Kelime Ağı Kullanımı Ücretsiz
Lehçe plWordnet kelime ağı
Portekizce OpenWN-PT CC-BY-SA-3.0
İspanyol Çok Dilli Merkezi Depo CC-BY-3.0
Tay Tayca Wordnet kelime ağı

İncelemeler

Çeviri hizmetini ilk kez başlattıktan kısa bir süre sonra Google, İngilizce-Arapça ve İngilizce-Çince makine çevirisi için uluslararası bir yarışma kazandı.

Çeviri hataları ve tuhaflıklar

Google Çeviri, çeviri yapmak için istatistiksel eşleme kullandığından, çevrilen metin genellikle görünüşte anlamsız ve bariz hatalar içerebilir, bazen ortak terimleri diğer dildeki benzer ancak eşdeğer olmayan ortak terimlerle değiştirebilir veya cümle anlamını tersine çevirebilir. Bad Translator ve Translation Party gibi yenilik web siteleri , çocukların oyun telefonuna benzer şekilde, birden çok dil arasında ileri geri çeviri yaparak mizahi metinler üretmek için hizmetten yararlandı .

Uygulama, Monty Python'un " Dünyanın En Komik Şakası "nı İngilizce'ye çevirmeye çalışırsa , hizmet "[FATAL ERROR]" mesajını döndürür.

Mahkeme kullanımı

2017'de Teesside Sulh Mahkemesi'ndeki mahkeme yetkilileri Çinli sanık için bir tercüman ayarlayamadıklarında bir mahkeme duruşması sırasında Google Çeviri kullanıldı.

Ayrıca bakınız

Referanslar

Dış bağlantılar