Kategorik dilbilgisi - Categorial grammar

Kategorik dilbilgisi , sözdizimsel bileşenlerin işlevler ve argümanlar olarak bir araya geldiğine dair merkezi varsayımı paylaşan doğal dil sözdizimindeki bir formalizm ailesidir . Kategorik dilbilgisi, sözdizimi ve anlamsal bileşim arasında yakın bir ilişki olduğunu varsayar , çünkü tipik olarak sözdizimsel kategorileri anlamsal türlere karşılık geliyormuş gibi ele alır. Kategorik gramerler 1930'larda Kazimierz Ajdukiewicz , Yehoshua Bar-Hillel ve Joachim Lambek tarafından geliştirildi . 1970'lerde , Montague dilbilgisi benzer bir sözdizimi görüşü benimseyen Richard Montague'in çalışmasının ardından bir ilgi artışı gördü . Özellikle biçimsel anlambilimde önemli bir paradigma olmaya devam ediyor .

Temel bilgiler

Kategori dilbilgisi iki bölümden oluşur: her temel simgeye bir dizi tür (kategori olarak da adlandırılır) atayan bir sözlük ve bir simge dizisinin türünün, kurucu türlerden nasıl çıktığını belirleyen bazı tür çıkarım kuralları. semboller. Belirli bir dil gramerinin belirtimi tamamen sözlük tarafından belirlenecek şekilde, tür çıkarım kurallarının bir kez ve herkes için sabitlenebilmesi avantajına sahiptir.

Kategori dilbilgisi, basit yazılan lambda hesabıyla bazı özellikleri paylaşır . Oysa Lambda taşı tek fonksiyon tipi vardır , bir kategorik gramer tipik olarak iki çalışma şekillerini, bir sol uygulanır tipi ve sağ tarafta bir sahiptir. Örneğin, basit bir kategori dilbilgisi iki işlev türüne sahip olabilir ve . İlk, , türünde bir ifade sonuçlanır ki ifade türüdür tür bir ifade ile (sağda) takip . İkincisi, , öncesinde (solda) type türünde bir tümcecik geldiğinde , bir tür tümcesiyle sonuçlanan bir tümcecik türüdür .

Notasyon cebire dayanmaktadır. Bir kesir, paydasıyla çarpıldığında (yani bir araya getirildiğinde ) payını verir. Sıralama değişmeli olmadığından paydanın sağda veya solda oluşu fark eder. Birleştirmenin, iptal etmesi için payda ile aynı tarafta olması gerekir.

Kategori dilbilgisinin ilk ve en basit türü, temel kategori dilbilgisi veya bazen AB dilbilgisi ( Ajdukiewicz ve Bar- Hillel'den sonra ) olarak adlandırılır. İlkel türler kümesi verildiğinde, ilkel türlerden oluşturulan türler kümesi olsun . Temel durumda, bu en az ayarlanmış olan ve if o zaman . Bunları, ilkel türlerden özgürce üretilen salt biçimsel ifadeler olarak düşünün; herhangi bir anlam bilgisi daha sonra eklenecektir. Bazı yazarlar, tüm gramerler tarafından kullanılan sabit bir sonsuz ilkel türler kümesi olduğunu varsayar, ancak ilkel türleri dilbilgisinin bir parçası yaparak, tüm yapı sonlu tutulur.

Temel bir kategorik gramer tuple olduğu , sembollerinin bir sonlu dizi temel tür, sınırlı bir grubu, ve .

İlişki , türleri sembollerle ilişkilendiren sözlüktür . Sözlük sonlu olduğundan, gibi bir çiftler kümesi listelenerek belirtilebilir .

İngilizce için böyle bir dilbilgisinin üç temel türü olabilir; sayım adlarına türe , tam ad öbeklerine türe ve cümlelere türe atama . O zaman bir sıfat türe sahip olabilir , çünkü arkasından bir isim geliyorsa, o zaman tüm ifade bir isimdir. Benzer şekilde, bir belirleyicinin türü vardır , çünkü arkasından bir isim geldiğinde tam bir isim tamlaması oluşturur. Geçişsiz fiiller türe , geçişli fiiller ise türe sahiptir . O zaman bir sözcük dizisi, genel bir türü varsa bir cümledir .

Örneğin, "kötü çocuk bu karışıklığı yaptı" dizesini alın. Şimdi "the" ve "that" belirleyicidir, "boy" ve "mess" isimlerdir, "bad" bir sıfattır ve "made" geçişli bir fiildir, dolayısıyla sözlük { , , , , , } şeklindedir.

ve dizedeki türlerin sırası

şimdi işlevleri ve uygun argümanları bulun ve bunları iki çıkarım kuralına göre azaltın ve :






Sonucun olması, dizgenin bir cümle olduğu anlamına gelirken, indirgeme dizisi ((the (bad boy)) (made (that mess))) olarak ayrıştırılabileceğini gösterir.

Bu formun kategorik dilbilgisi (yalnızca işlev uygulama kurallarına sahip), içerikten bağımsız dilbilgisine üretken kapasitede eşdeğerdir ve bu nedenle genellikle doğal dil sözdizimi teorileri için yetersiz kabul edilir. CFGS aksine, ulamsal dilbilgisi edilir sözcüklere (çoğunlukla dilden bağımsız) kuralların sadece az sayıda istihdam edilmektedir ve tüm diğer sözdizimsel fenomenler belirli kelimelerin sözcük girişlerinden elde yani.

Kategorisel gramerlerin bir başka çekici yönü, ilk önce tüm temel kategorilere yorumlama türleri atayarak ve ardından tüm türetilmiş kategorileri uygun işlev türleri ile ilişkilendirerek onlara bir kompozisyon semantiği atamanın genellikle kolay olmasıdır . Herhangi bir bileşenin yorumu, bir argümandaki bir fonksiyonun değeridir. Yoğunluk ve nicelemeyi ele almak için bazı değişikliklerle , bu yaklaşım çok çeşitli anlamsal fenomenleri kapsamak için kullanılabilir.

Lambek hesabı

Bir Lambek dilbilgisi, türler için bir birleştirme operatörüne ve diğer birkaç çıkarım kuralına sahip olan bu fikrin detaylandırılmasıdır. Mati Pentus, bunların hala bağlamdan bağımsız gramerlerin üretken kapasitesine sahip olduğunu göstermiştir.

Lambek hesabı için bir tür birleştirme operatörü vardır , bu nedenle ve eğer öyleyse .

Lambek hesabı, tür dahil etme iddialarının nasıl türetilebileceğini belirten birkaç kesinti kuralından oluşur. Aşağıdaki kurallarda, büyük harfli roma harfleri türleri, büyük harfli Yunanca harfleri ise tür dizilerini temsil etmektedir. Formun bir dizisi okunabilir: bir dize, içindeki türlerin her birinin dizelerinin birleşiminden oluşuyorsa türdedir . Bir tür bir dizi dizi olarak yorumlanırsa , o zaman "alt küme olarak içerir" olarak yorumlanabilir . Yatay bir çizgi, çizginin üstündeki içermenin, çizginin altındakini ima ettiği anlamına gelir.

Süreç, öncülü olmayan ve sadece herhangi bir türün kendisini içerdiğini söyleyen Aksiyom kuralıyla başlatılır.

Kes kuralı, inklüzyonların oluşturulabileceğini söyler.

Diğer kurallar çiftler halinde gelir, her tip inşaat operatörü için bir çift, her bir çift, okun hedefindeki operatör için bir kural, bir kaynakta bir operatör için bir kuraldan oluşur. Bir kuralın adı, operatör ve bir oktan oluşur ve operatör, sonuçta gerçekleştiği okun yanında bulunur.

Hedef Kaynak

Bir örnek olarak, burada "tür yetiştirme" nin bir türevi var, ki bu . Kuralların adları ve kullanılan ikameler sağdadır.

Bağlamdan bağımsız gramerlerle ilişkisi

Bir hatırlayın bağlam-gramer 4-lü olduğu yerde

  1. sonlu bir terminal olmayan veya değişkenler kümesidir .
  2. sonlu bir uçbirim simgeleri kümesidir .
  3. sonlu bir üretim kuralları dizisidir , yani sonlu bir ilişkidir .
  4. başlangıç ​​değişkenidir.

Kategori dilbilgisi açısından, bağlamdan bağımsız bir dilbilgisi, her dil için bir dizi özel amaçlı aksiyom içeren bir hesap olarak görülebilir, ancak tür oluşturma operatörleri ve Kes dışında hiçbir çıkarım kuralı yoktur.

Spesifik olarak, yukarıdaki gibi bağlamdan bağımsız bir dilbilgisi verildiğinde , burada , ve . Bir aksiyomu orada olalım her sembolün , bir aksiyomu her üretim kuralı için bir sözlük girdisi her terminal sembolü için tek kural için ve Kes. Bu kategorik dilbilgisi, verilen CFG ile aynı dili oluşturur.

Elbette bu, dile bağlı özel aksiyomları olduğundan, temel bir kategorik dilbilgisi değildir; yani sözlükleşmemiştir. Ayrıca, ilkel olmayan türlerin hiçbirinde işe yaramaz.

Bağlamdan bağımsız herhangi bir dilin temel bir kategori dilbilgisi tarafından oluşturulabileceğini göstermek için, herhangi bir bağlamdan bağımsız dilin Greibach normal biçiminde bağlamdan bağımsız bir dilbilgisi tarafından oluşturulabileceğini hatırlayın .

Her üretim kuralı, büyük harflerin değişken olduğu ve , yani üretimin sağ tarafının sıfır veya daha fazla (terminal olmayan) değişkenin izlediği tek bir terminal sembolü olduğu biçimdeyse, dilbilgisi Greibach normal biçimindedir. .

Şimdi Greibach normal biçiminde bir CFG verildiğinde, her bir terminal olmayan değişken için ilkel bir türle ve her üretim kuralı için sözlükte bir girişle temel bir kategorik dilbilgisi tanımlayın . Bu temel kategorik dilbilgisinin orijinal CFG ile aynı dili oluşturduğunu görmek oldukça kolaydır. Bu dilbilgisinin sözlüğünün genellikle her bir sembole birden çok tür atayacağını unutmayın.

Aynı yapı Lambek gramerleri için de geçerlidir, çünkü bunlar temel kategorik gramerlerin bir uzantısıdır. Ekstra çıkarım kurallarının oluşturulan dili değiştirmediğini doğrulamak gerekir. Bu yapılabilir ve bağlamdan bağımsız her dilin bazı Lambek dilbilgisi tarafından üretildiğini gösterir.

Bir Lambek dilbilgisi tarafından oluşturulan her dilin bağlamdan bağımsız olduğunu tersini göstermek çok daha zordur. 1960'ların başından Pentus tarafından kanıtlandığı 1991 yılına kadar yaklaşık otuz yıl boyunca açık bir sorundu.

Temel fikir, bir Lambek dilbilgisi verildiğinde , aynı terminal sembolleri seti, aynı başlangıç ​​sembolü, bazı (tümü değil) tür değişkenleri ve sözlükteki her giriş için bir üretim kuralı ile bağlamdan bağımsız bir dilbilgisi oluşturmaktır. ve Lambek hesabında türetilebilen belirli diziler için üretim kuralları .

Tabii ki, sonsuz sayıda tür ve sonsuz sayıda türetilebilir ardışık vardır, bu nedenle sonlu bir dilbilgisi yapmak için ihtiyaç duyulan türlerin ve dizilerin boyutuna bir sınır koymak gerekir. Pentus'un kanıtının özü, böyle bir sonlu sınır olduğunu göstermektir.

gösterim

Bu alandaki gösterim standardize edilmemiştir. Biçimsel dil kuramı, mantık, kategori kuramı ve dilbilimde kullanılan gösterimler birbiriyle çelişir. Mantıkta oklar, daha özelden daha genele, yani hipotezlerden çıkan sonuca işaret eder. Bu makalede, bu kural izlenir, yani okun hedefi daha genel (kapsayıcı) türdür.

Mantıkta, oklar genellikle soldan sağa işaret eder. Bu makalede, bu kural, tek terminal olmayan sembolün her zaman solda olduğu bağlamdan bağımsız dilbilgisi notasyonu ile tutarlılık sağlamak için tersine çevrilir. Sembolü Backus–Naur formunda olduğu gibi bir üretim kuralında kullanırız . Bazı yazarlar, dilbilgisinin dili oluşturma veya tanıma olarak düşünülüp düşünülmediğine bağlı olarak, ne yazık ki her iki yöne de işaret edebilen bir ok kullanır.

Kategorik dilbilgisi üzerine bazı yazarlar bunun yerine yazarlar . Burada kullanılan kural Lambek ve cebiri takip eder.

Tarihsel notlar

Kategorik dilbilgisinin temel fikirleri, Kazimierz Ajdukiewicz (1935'te) ve Yehoshua Bar-Hillel'in (1953'te) çalışmalarına dayanmaktadır . 1958'de Joachim Lambek , fonksiyon tipi oluşturucularını , fonksiyonların kombinasyonu için çeşitli kurallarla birlikte resmileştiren bir sözdizimsel hesabı tanıttı . Bu hesap, bir altyapı mantığı olduğu için lineer mantığın öncüsüdür . Montague dilbilgisi , kategorik dilbilgisi ilkelerine dayanan İngilizce için özel bir sözdizimsel sistem kullanır. Her ne kadar Montague'nün işi bazen sözdizimsel ilginç olarak kabul edilir, bu doğal dil son derece başarılı bir resmi tedavi ile ilişkilendirerek ulamsal dilbilgisi ilgi katmıştır semantik . Kategorik dilbilgisindeki daha yakın tarihli çalışmalar, sözdizimsel kapsamın iyileştirilmesine odaklanmıştır. Son yıllarda oldukça dikkat çekmiştir biri formalizmdir Steedman ve Szabolcsi 'ın kombinatoriyel ulamsal gramer , üzerine inşa hangi kombinatoriyel mantığı tarafından icat Musa Schönfinkel ve Haskell Curry .

Dilbilimde, tür mantıksal dilbilgisi ve soyut kategorili dilbilgisi gibi, bu türden bir dizi ilgili biçimcilik vardır .

Bazı tanımlar

türetme
Bir türetme, bir kanıtı kodlayan ikili bir ağaçtır.
Ayrıştırma ağacı
Bir ayrıştırma ağacı, bir cümlenin sözdizimsel yapısını gösteren bir türetme görüntüler.
Functor ve argüman
Sağ (sol) işlev uygulamasında, A\B (B/A) tipindeki düğüme functor denir ve A tipindeki düğüme argüman denir.
Functor-argüman yapısı

Kategorik dilbilgisinin incelikleri

Sözdizimsel kapsamı geliştirmek için kategorik dilbilgisinde çeşitli değişiklikler önerilmiştir. En yaygın olanlardan bazıları aşağıda listelenmiştir.

Özellikler ve alt kategoriler

Kategori dilbilgisi sistemlerinin çoğu kategorileri alt bölümlere ayırır. Bunu yapmanın en yaygın yolu, onları kişi , cinsiyet , sayı ve zaman gibi özelliklerle etiketlemektir . Bazen sadece atom kategorileri bu şekilde etiketlenir. Montague dilbilgisinde, bir çoklu eğik çizgi kuralı kullanarak işlev kategorilerini alt bölümlere ayırmak gelenekseldir, bu nedenle A/B ve A//B , aynı argümanları alan ancak diğer işlevler tarafından ayırt edilebilen iki farklı sola uygulama işlevi kategorisi olacaktır. onları argüman olarak almak.

Fonksiyon bileşimi

İşlev kompozisyonu kuralları birçok kategorik gramerde yer almaktadır. Böyle bir kuralın bir örneği, A/B türünden bir bileşenin B/C türünden biriyle birleştirilmesine izin vererek A/C türünde yeni bir bileşen üretilmesine izin veren bir kural olabilir . Böyle bir kuralın semantiği, basitçe ilgili işlevlerin bileşimini içerecektir. İşlev bileşimi , özellikle sağ düğüm yükseltme gibi fenomenlerle ilgili olduklarından, bağlantı ve çıkarmanın kategorik hesaplarında önemlidir . İşlev bileşiminin kategorik bir dilbilgisine dahil edilmesi, anlamsal belirsizliklere karşılık gelmemeleri anlamında anlamsız olan birçok türevsel belirsizliğe yol açar .

Bağlaç

Birçok kategorik dilbilgisi , X'in bir kategori olduğu X CONJ X → X genel biçiminde tipik bir bağlantı kuralı içerir . Bağlaç genellikle tip yükseltme veya işlev bileşiminden kaynaklanan standart olmayan bileşenlere uygulanabilir.

Süreksizlik

Dilbilgisi, süreksiz deyimler, boşluk bırakma ve çıkarma gibi dilbilimsel fenomenleri ele alacak şekilde genişletilir.

Ayrıca bakınız

Referanslar

  • Curry, Haskell B. ; Feys, Richard (1958), Kombinatoryal Mantık , 1 , Kuzey Hollanda
  • Jacobson, Pauline (1999), "Değişkensiz bir anlambilime doğru.", Dilbilim ve Felsefe , 22 (2): 117–184, doi : 10.1023/A:1005464228727 , S2CID  60578091
  • Lambek, Joachim (1958), "Cümle yapısının matematiği", Amer. Matematik. Aylık , 65 (3): 154–170, CiteSeerX  10.1.1.538.885 , doi : 10.1080/00029890.1958.11989160
  • Pentus, Mati (1997), Lambek Matematik ve Biçimsel Gramerler (PDF) , Amer. Matematik. Soc. Tercüme
  • Steedman, Mark (1987), "Birleştirici dilbilgisi ve parazit boşlukları", Doğal Dil ve Dilbilim Teorisi , 5 (3): 403–439, doi : 10.1007/bf00134555 , S2CID  170899264
  • Steedman, Mark (1996), Yüzey Yapısı ve Yorumlama , MIT Press
  • Steedman, Mark (2000), Sözdizimsel Süreç , MIT Press
  • Szabolci, Anna (1989). "Söz diziminde bağlı değişkenler (var mı?)" (PDF) . Bartsch'ta; van Benthem; van Emde Boas (ed.). Semantik ve Bağlamsal İfade . İçin. s. 294–318.
  • Szabolci, Anna (1992). "Birleştirici dilbilgisi ve sözlükten izdüşüm" (PDF) . Sag'da; Szabolcsi (ed.). Sözcüksel Konular . CSLI Ders Notları . 24 . Stanford: CSLI Yayınları. s. 241–269.
  • Szabolcsi, Anna (2003), "Anında bağlama: Değişken-serbest anlambilimde çapraz cümle anaphora", Kruijff'te; Oehrle (eds.), Resource Sensitivity in Binding and Anaphora , Studies in Linguistics and Philosophy, 80 , Kluwer, pp. 215–229, CiteSeerX  10.1.1.205.3142 , doi : 10.1007/978-94-010-0037-6_8 , ISBN'si 978-1-4020-1692-9
  • Morril, Glyn (1995), "Kategorik gramerde süreksizlik", Dilbilim ve Felsefe , 18 (2): 175–219, doi : 10.1007/bf00985216 , S2CID  62533943

daha fazla okuma

  • Michael Moortgat, Kategori Tipi Mantıklar , Bölüm 2, J. van Benthem ve A. ter Meulen (ed.) Handbook of Logic and Language . Elsevier, 1997, ISBN  0-262-22053-9
  • Wojciech Buszkowski, Matematiksel dilbilim ve ispat teorisi , Bölüm 12, J. van Benthem ve A. ter Meulen (ed.) Handbook of Logic and Language . Elsevier, 1997, ISBN  0-262-22053-9
  • Gerhard Jäger (2005). Anaphora ve Tip Mantıksal Dilbilgisi . Springer. ISBN'si 978-1-4020-3904-1.
  • Glyn Morrill (2010). Kategorik Dilbilgisi: Mantıksal Sözdizimi, Anlambilim ve İşleme . Oxford Üniversitesi Yayınları. ISBN'si 978-0-19-958986-9.
  • Richard Müstehcen; Christian Retore (2012). Kategorik Dilbilgilerinin Mantığı: Doğal Dil Sözdizimi ve Semantiğinin Tümdengelimli Bir Hesabı . Springer Verlag. ISBN'si 978-3-642-31554-1.

Dış bağlantılar