İskoç Metinler ve Konuşma Derlemi - Scottish Corpus of Texts and Speech

Metinler & Konuşma İskoç Corpus ( SCOTS ) bir inşa etmek devam eden bir projedir corpus günümüz arasında (post-1940) yazılı ve sözlü metinlerin İskoç İngilizce ve çeşitleri İskoç . SCOTS, Kasım 2004'ten beri çevrimiçi olarak mevcuttur ve serbestçe aranabilir ve göz atılabilir. 2015 yılına kadar 4,7 milyon kelimeye ulaştı.

Proje, Glasgow Üniversitesi'ndeki İngiliz Dili Bölümü ve STELLA projesinin bir girişimidir . SCOTS, Sanat ve Beşeri Bilimler Araştırma Konseyi tarafından hibe ile finanse edilmektedir .

Dil çeşitliliği

SCOTS, İskoç İngilizcesi metinleri ve Dor , Lallans , Glaswegian ve Insular Scots gibi kentsel çeşitler dahil olmak üzere geniş İskoç çeşitlerini içerir . SCOTS, metinlerin coğrafi dağılımını ve demografik yayılımı içerir. Her metne, yazarın doğum yılı, cinsiyeti, mesleği, doğum yeri ve ikamet yeri gibi bilgiler ve yayın bilgileri, okuyucu kitlesi, tarih ve tür gibi metinle ilgili ayrıntılar dahil olmak üzere kapsamlı meta veriler eşlik eder .

Tür ve mod

SCOTS bir olduğu multimedya korpus olarak kullanılabilir yazılı metinleri ve sözlü metinleri içeren, imla transkripsiyonlarını kaynak ses veya görüntü dosyaları eşliğinde. SCOTS, düzyazı kurgu, şiir, iş ve kişisel yazışmalar, dini metinler, parlamento ve idari belgeler, e-postalar, konuşmalar ve röportajlar dahil olmak üzere çok sayıda tür ve metin türünü içerir .

Arama ve analiz

SCOTS, kullanıcının ilgisine bağlı olarak çeşitli şekillerde araştırılabilir. Derlem, örneğin yazarın adı veya metnin tarihine göre taranabilir ve tüm metinler düz metin biçiminde indirilebilir .

Transkripsiyonlar , akışa alınan ve ayrıca indirilebilen ses / video dosyalarıyla senkronize edilir.

Gelişmiş Arama özelliği, kullanıcının meta verilerde bulunan tüm alanlar arasından seçim yaparak daha karmaşık sorgular oluşturmasına olanak tanır . Coğrafi sonuçlar etkileşimli bir harita üzerinde çizilir, böylece bölgesel varyasyon araştırılabilir.

Gelişmiş Arama sonuçları, eşdizimli kalıpları vurgulamak için yeniden düzenlenebilen bir KWIC uyumu olarak da görüntülenebilir .

Referanslar

Dış bağlantılar