Çapraz dil bilgi erişimi - Cross-language information retrieval

Çapraz dil bilgi erişimi ( CLIR ), kullanıcının sorgusunun dilinden farklı bir dilde yazılmış bilgilerin geri getirilmesiyle ilgilenen bilgi erişiminin bir alt alanıdır . "Diller arası bilgi erişim" terimi birçok eşanlamlılığa sahiptir ve bunlardan belki de en sık kullanılanları şunlardır: diller arası bilgi erişim, diller arası bilgi erişim, çok dilli bilgi erişim . " Çok dilli bilgi erişim " terimi, daha genel olarak hem çok dilli koleksiyonlara erişim teknolojisine hem de materyalleri bir dilde diğerine işlemek için taşınan teknolojiye atıfta bulunur. Çok Dilli Bilgi Erişimi (MLIR) terimi, çeşitli dillerde bilgi için sorguları kabul eden ve çeşitli dillerdeki geri dönüş nesnelerini (metin ve diğer medya), kullanıcının diline çevrilen sistemlerin çalışmasını içerir. Çapraz dil bilgi erişimi, daha spesifik olarak, kullanıcıların bilgi gereksinimlerini bir dilde formüle ettiği ve sistemin ilgili belgeleri başka bir dilde aldığı kullanım durumuna atıfta bulunur. Bunu yapmak için çoğu CLIR sistemi çeşitli çeviri teknikleri kullanır. CLIR teknikleri, farklı çeviri kaynaklarına göre farklı kategorilere ayrılabilir:

  • Sözlük tabanlı CLIR teknikleri
  • Paralel şirket tabanlı CLIR teknikleri
  • Karşılaştırılabilir şirket tabanlı CLIR teknikleri
  • Makine çevirmeni tabanlı CLIR teknikleri

CLIR sistemleri o kadar gelişmiştir ki, günümüzün en doğru çok dilli ve diller arası anlık bilgi erişim sistemleri neredeyse tek dilli sistemler kadar etkilidir. Medya izleme , bilgi filtreleme ve yönlendirme, duyarlılık analizi ve bilgi çıkarma gibi diğer ilgili bilgi erişim görevleri, daha karmaşık modeller ve tipik olarak ilgilenilen bilgi öğelerinin daha fazla işlenmesi ve analizini gerektirir. Bu işlemenin çoğunun, konuşlandırıldığı hedef dillerin özelliklerinin farkında olması gerekir.

Çoğunlukla, insan dilindeki çeşitli varyasyon mekanizmaları, bilgi erişim sistemleri için kapsama zorlukları ortaya çıkarır: bir koleksiyondaki metinler, ilgilenilen bir konuyu ele alabilir, ancak kullanıcı tarafından verilen bilgi ihtiyacının ifadesiyle eşleşmeyen terimler veya ifadeler kullanabilir. Bu, tek dilli bir durumda bile doğru olabilir, ancak bu özellikle, kullanıcıların hedef dili yalnızca bir dereceye kadar bildiği diller arası bilgi erişiminde geçerlidir. CLIR teknolojisinin hedef dilde yetersiz ila orta düzeyde yeterliliği olan kullanıcılar için faydalarının akıcı olanlara göre daha fazla olduğu bulunmuştur. CLIR hizmetleri için mevcut olan spesifik teknolojiler arasında , bileşik terimleri işlemek için çekim , ayrıştırma veya bileşik bölmeyi işlemek için morfolojik analiz ve bir sorguyu bir dilden diğerine çevirmek için çeviri mekanizmaları yer alır.

CLIR ile ilgili ilk atölye SIGIR-96 konferansı sırasında Zürih'te yapıldı. Çalıştaylar 2000 yılından beri Cross Language Evaluation Forum (CLEF) toplantılarında her yıl düzenlenmektedir . Araştırmacılar ayrıca, farklı bilgi erişim sistemleri ve yöntemlerine ilişkin bulgularını tartışmak için yıllık Metin Erişim Konferansı'nda (TREC) bir araya gelirler ve konferans, CLIR alt alanı için bir referans noktası görevi görmüştür.

Google Arama , 2013'te kaldırılan bir diller arası arama özelliğine sahipti.

Ayrıca bakınız

  • EXCLAIM (Genişletilebilir Dil Arası Otomatik Bilgi Makinesi)
  • CLEF (daha önce Çapraz Dil Değerlendirme Forumu olarak bilinen Değerlendirme Forumu Konferansı ve Laboratuvarları)
  • MLIR (Çok Dilli Bilgi Erişim)

Referanslar

  1. ^ Wang, Jianqiang ve Douglas W. Oard. "Diller arası bilgi erişimi için uygun anlam." Bilgi İşleme ve Yönetimi 48.4 (2012): 631-53.
  2. ^ Thai, Perishan. "Diller Arası Bilgi Erişim Yaklaşımlarına Giriş". Ağ. Web.simmons.edu
  3. ^ Oard, Douglas. "Çok Dilli Bilgi Erişimi." Bilgi Erişim Sistemlerini Anlamak (2011): 373-80. Ağ.
  4. ^ Airio, Eija (2008). "Web erişiminde CLIR'den kim yararlanır?" . Dokümantasyon Dergisi . 64 (5): 760–778. doi : 10.1108 / 00220410810899754 .
  5. ^ Bu atölye çalışmasının bildirileri Cross-Language Information Retrieval (Grefenstette, ed; Kluwer, 1998) ISBN   0-7923-8122-X kitabında bulunabilir .
  6. ^ Olvera-Lobo, María-Dolores. "Web'de Çapraz Dil Bilgisine Erişim." Anlamsal Teknolojiler ve Web Hizmetlerinin Sosyal Boyutları Üzerine Araştırma El Kitabı (nd): 704-19. Ağ.
  7. ^ "Google," Çevrilmiş Sayfaları "Kullanılmaması Nedeniyle" Arama Seçeneğini Bıraktı " . 20 Mayıs 2013.

Dış bağlantılar