Makine tarafından okunabilen sözlük - Machine-readable dictionary

Makine tarafından okunabilen sözlük ( MRD ), kağıda yazdırılmak yerine makine (bilgisayar) verisi olarak saklanan bir sözlüktür . Bu bir olan elektronik sözlük ve sözcük veritabanı .

Makine tarafından okunabilen sözlük, bir veritabanına yüklenebilen ve uygulama yazılımı aracılığıyla sorgulanabilen elektronik biçimdeki bir sözlüktür. İki veya daha fazla dil arasındaki çevirileri veya her ikisinin birleşimini desteklemek için tek bir dil açıklayıcı sözlük veya çok dilli bir sözlük olabilir. Birden çok dil arasındaki çeviri yazılımı genellikle çift yönlü sözlükler uygular. Bir MRD, özel bir yazılım tarafından sorgulanan (örneğin internet üzerinden çevrimiçi) özel bir yapıya sahip bir sözlük olabilir veya açık bir yapıya sahip olan ve bilgisayar veritabanlarına yüklenebilen ve böylece çeşitli yazılımlar aracılığıyla kullanılabilen bir sözlük olabilir. uygulamalar. Geleneksel sözlükler , çeşitli açıklamalar içeren bir lemma içerir . Makine tarafından okunabilen bir sözlük ek yeteneklere sahip olabilir ve bu nedenle bazen akıllı sözlük olarak adlandırılır. Akıllı sözlüğe bir örnek, Açık Kaynak Gellish İngilizce sözlüğüdür .
Sözlük terimi aynı zamanda örneğin yazım denetleyicilerinde kullanıldığı gibi elektronik bir sözlük veya sözlüğü ifade etmek için de kullanılır . Sözlükler, kavramların (veya terimlerin) alt tür-üst tür hiyerarşisinde düzenlenirse, buna taksonomi denir . Kavramlar arasında başka ilişkiler de içeriyorsa ontoloji olarak adlandırılır . Arama motorları, arama sonuçlarını optimize etmek için bir kelime dağarcığı, bir sınıflandırma veya bir ontoloji kullanabilir. Özel elektronik sözlükler, morfolojik sözlükler veya sözdizimsel sözlüklerdir.

MRD terimi , bir MRD'nin daha önce kağıda basılmış bir sözlüğün elektronik biçimi olması anlamında , genellikle NLP sözlüğüyle karşılaştırılır. Her ikisi de programlar tarafından kullanılmasına rağmen, NLP sözlüğü terimi, sözlük NLP düşünülerek sıfırdan oluşturulduğunda tercih edilir. MRD ve NLP için bir ISO standardı her iki yapıyı da temsil edebilir ve Lexical Markup Framework olarak adlandırılır .

Tarih

İlk yaygın olarak dağıtılan MRD'ler Merriam-Webster Seventh Collegiate (W7) ve Merriam-Webster New Pocket Dictionary (MPD) idi. Her ikisi de John Olney yönetimindeki System Development Corporation'da hükümet tarafından finanse edilen bir proje tarafından üretildi . Her iki kitabın da dizgi bandı mevcut olmadığı için elle klavyeyle yazılmışlardı. Başlangıçta her biri, basılı sözlükte kullanımının ayrıntılarını gösteren çok sayıda özel kod içeren ayrı bir delikli kartta her tanımın her bir ayrı kelimesi ile kart görüntüleri olarak birden fazla manyetik bant makarasına dağıtıldı. Olney, sözlükteki tanımların analizi için büyük bir plan çizdi, ancak analizi gerçekleştirilemeden projesi sona erdi. Austin'deki Texas Üniversitesi'nden Robert Amsler, analize devam etti ve Ulusal Bilim Vakfı finansmanı altında Cep Sözlüğü'nün taksonomik bir tanımını tamamladı , ancak taksonomik veriler dağıtılmadan önce projesi sona erdi. Roy Byrd ve ark. IBM'de Yorktown Heights, Amsler'in çalışmasının ardından Webster's Seventh Collegiate'in analizine yeniden başladı. Son olarak, 1980'lerde NSF, dahil olmak üzere çeşitli ABD federal ajansları tarafından finanse sonra ilk Bellcore'dur destek ve ile başlayan ARDA , DARPA , DTO ve REFLEKSİ , George Armitage Miller ve Christiane Fellbaum bir sözlük oluşturma ve geniş dağıtım Princeton Üniversitesi'nde tamamladı ve bugün en yaygın olarak dağıtılan hesaplama sözlükbilimi kaynağı olarak duran WordNet projesindeki taksonomisi .

Referanslar