ISO 639 - ISO 639

ISO 639 , Uluslararası Standardizasyon Örgütü tarafından dillerin ve dil gruplarının adlarının temsili ile ilgili bir dizi standarttır .

Aynı zamanda 1967'de onaylanan ( ISO 639/R olarak ) ve 2002'de geri çekilen orijinal standardın da adıydı. ISO 639 seti beş bölümden oluşuyor.

ISO 639 kodlarının kullanımı

ISO 639'un çeşitli bölümlerinde tanımlanan dil kodları, bibliyografik amaçlarla ve bilgi işlem ve internet ortamlarında yerel verilerin temel bir unsuru olarak kullanılır . Kodlar , farklı dillerdeki sürümleri için Wikipedia URL'leri gibi çeşitli uygulamalarda da kullanım bulur .

Standardın güncel ve tarihi bölümleri

Standart Ad ( Dil adlarının temsili için kodlar – ... ) Kayıt Otoritesi İlk baskı Akım Listedeki numara (18 Şubat 2021 itibariyle)
ISO 639-1 Bölüm 1: Alfa-2 kodu bilgi terimi 1967 (ISO 639 olarak) 2002 184
ISO 639-2 Bölüm 2: Alfa-3 kodu Kongre Kütüphanesi 1998 1998 482 + 20 B-sadece + 4 özel + 520 yerel kullanım için
ISO 639-3 Bölüm 3: Kapsamlı dil kapsamı için Alfa-3 kodu SIL Uluslararası 2007 2007 Yerel kullanım için 7.893 + 4 özel + 520
ISO 639-4 Bölüm 4: Dil kodlaması için uygulama yönergeleri ve genel ilkeler ISO/TC 37 / SC 2 2010-07-16 2010-07-16 (liste değil)
ISO 639-5 Bölüm 5: Dil aileleri ve grupları için Alfa-3 kodu Kongre Kütüphanesi 2008-05-15 2013-02-11 115 (ISO 632-2'den 36 kalan + 29 normal grup dahil)
ISO 639-6 Bölüm 6: Dil değişkenlerinin kapsamlı kapsamı için Alfa-4 gösterimi (geri çekilmiş) coğrafi dil 2009-11-17 geri çekilmiş 21.000+

Standardın her bir parçası, gerektiğinde kodları ekleyen ve kodların durumunu değiştiren bir bakım kuruluşu tarafından korunur. ISO 639-6, 2014 yılında geri çekildi.

Bireysel kodların özellikleri

Kapsamlar:

  • Bireysel diller
  • Makrodiller (Bölüm 3)
  • Dil koleksiyonları (Bölüm 1, 2, 5). Bölüm 1 yalnızca bir koleksiyon içerir ( bh), bazı koleksiyonlar zaten Bölüm 2'deydi ve diğerleri yalnızca Bölüm 5'te eklendi:
    • Kalan gruplar: Bölüm 2 ve 5'teki 36 koleksiyon bu türdendir (Bölüm 1'de kodlanmış olanlar da dahil) — Bölüm 5 henüz yayınlanmadığında Bölüm 2 ile uyumluluk için, kalan gruplar herhangi bir dil ve koleksiyon içermez Bölüm 2'de zaten kodlanmış olan (ancak Bölüm 5 ile uyumlu yeni uygulamalar, Bölüm 5'te yayınlanan kapsama hiyerarşisine uyduğu ve dilleri gruplandırırken en özel koleksiyonu kullandıkları sürece bu grupları kapsayıcı olarak ele alabilir);
    • Normal gruplar: Bölüm 2 ve 5'teki 29 koleksiyon bu türdendir — Bölüm 2 ile uyumluluk için başka grupları içeremezler;
    • Aileler: Yalnızca Bölüm 5'te kodlanmış 50 yeni koleksiyon (2. Bölümde kodlanmış normal bir grubu içeren biri dahil) — Bölüm 2 ile uyumluluk için, kalan gruplar dışında başka koleksiyonlar içerebilirler.
  • Lehçeler : Bölüm 6'da ele alınması amaçlandı (önerilen ancak şimdi geri çekildi).
  • Özel durumlar (Bölüm 2, 3).
  • Yerel kullanım için ayrılmıştır (Bölüm 2, 3). Ayrıca bazen Bölüm 1 ve 2'deki (özel kodun misuygun olmadığı yerlerde) standart kodlar gibi bir alfa-2 koduna veya Bölüm 5'teki standart kodlar gibi koleksiyonlar için bir alfa-3 koduna ihtiyaç duyan uygulamalarda kullanılır .

Türler (bireysel diller için):

  • Yaşayan diller (Bölüm 2, 3) (tüm makro diller yaşayan dillerdir)
  • Soyu tükenmiş diller (Bölüm 2, 3) (608, 5 tanesi Bölüm 2: chb, chg, cop, lui, sam; hiçbiri Bölüm 1'de değil)
  • Eski dil (Parça 1, 2, 3) (124, 19 tanesi Bölüm 2'de olduğu ve 5 tanesi, yani ave, chu, lat, plive san, aynı zamanda Kısım 1 'de, bir kodu vardır: ae, cu, la, pi, sa)
  • Tarihsel diller (Bölüm 2, 3) (83, 16 tanesi Bölüm 2'dedir; hiçbiri Bölüm 1'de değildir)
  • Yapılandırılmış diller (Bölüm 1, 2, 3) (22, 9 tanesi Bölüm 2: afh, epo, ido, ile, ina, jbo, tlh, vol, zbl; 5 tanesi Bölüm 1: eo, ia, ie, io, vo)

Bölüm 2'de iki farklı alfa-3 koduna sahip bireysel diller ve makro diller:

  • Bibliyografik (bazıları kullanımdan kaldırıldı, hiçbiri Bölüm 3'te tanımlanmadı): bunlar eski kodlardır (İngilizce dil adlarına göre).
  • Terminolojik (Bölüm 3'te de tanımlanmıştır): bunlar tercih edilen kodlardır (ana dil adlarına dayalı, gerekirse romanlaştırılmış).
  • Diğerlerinin tümü (dil koleksiyonları ve özel/ayrılmış kodlar dahil), her iki kullanım için yalnızca tek bir alfa-3 koduna sahiptir.

Parçalar arasındaki ilişkiler

ISO 639'un farklı bölümleri, hiçbir kodun bir bölümde bir şey, diğerinde başka bir şey ifade etmeyeceği şekilde birlikte çalışmak üzere tasarlanmıştır. Ancak, tüm diller tüm bölümlerde değildir ve belirli dillerin ve diğer öğelerin farklı bölümlerde ele alınmasının çeşitli farklı yolları vardır. Bu, örneğin, bir dilin Bölüm 1 veya 2'de listelenip listelenmediğine, Bölüm 2'de ayrı B/T kodlarına sahip olup olmadığına veya Bölüm 3'te bir makro dil olarak sınıflandırılıp sınıflandırılmadığına vb. bağlıdır.

Bu çeşitli tedaviler aşağıdaki çizelgede detaylandırılmıştır. Her satır grubunda (ISO 639-3'ün her kapsamı için bir tane), son dört sütun, ISO 639'un bölümleri arasındaki belirli bir ilişki türünü örnekleyen temsili bir dil için kodlar içerir, ikinci sütun ilişkinin bir açıklamasını sağlar. , ve ilk sütun, bu tür bir ilişkiye sahip öğelerin sayısını gösterir. Örneğin, Bölüm 1'de kodu olan, B/T kodu olan ve Bölüm 3'te makro diller olarak sınıflandırılan dört öğe vardır. Bu dört öğenin bir temsilcisi "Farsça" fa/ per/ 'dir fas.

Kapsam vaka sayısı Açıklama Eşleşen kodlara örnek
ISO 639-1 ISO 639-2 ISO 639-3 ISO 639-5
Bireysel diller
("I")
128 Her bir Bölüm 1, 2 ve 3'te kod bulunan bir makro dilin parçası olmayan bireysel diller (Bölüm 2'de yalnızca bir kod).
Bölüm 1'de tek tek diller, makro diller veya gruplar için 184 atanmış kod vardır; aşağıdaki satırlarda sayılanları çıkarın, bu kalır: 184 - (2 "I (eski B/T)") ‒ (3+11 "I") ‒ (3+2 "I (B/T)") ‒ (28 +4+1+1 "M") ‒ (1 "C") = 128 kod.
tr ingilizce -
2 Bölüm 2'de ayrı B/T kodlarına sahip olan, ancak B kodları geri çekilen (2008-06-28'den beri) her bir Bölüm 1, 2 ve 3'te kod bulunan bireysel diller, T kodlarını tüm kullanımlar için korumuştur. Bunlar: hr/( scr)/ hrvve sr/( ser)/ srp.
Her ikisi de hbs, Bölüm 3'te yeni kodlanmış diğer bireysel dilleri de içerecek şekilde eklenen aynı makrodilin parçasıdır , ancak shBölüm 1'deki kodu da geri çekilmiştir ve Bölüm 2'de tanımlanmış hiçbir kodu yoktur.
saat (scr)/hrv (B/T) hrv
3 Bölüm 3'te bir makro dile ait, Bölüm 2'de tek bir kod ve Bölüm 1'de de bir koda sahip olan bireysel diller: bs/ bos(makrodilin bir parçası hbs), nb/ nobve nn/ non(her ikisi de makrodilin no/ nor). not asil
11 Bölüm 2'de ayrı B/T kodlarına sahip bireysel diller, ancak sonraki satırlardaki özel durumların hiçbirinde değil.
Bölüm 2'de ayrı dillere veya makro dillere atanan 20 çift ayrı B/T kodu vardır; aşağıdaki özel durumları çıkarın, geriye: 20 ‒ (3+2 "M") ‒ (4 "C") = 11 çift kod.
de ger/deu (B/T) deu
3 Bölüm 2'de ayrı B/T kodlarına sahip bireysel diller, ancak Bölüm 1 kodundaki harfler, Bölüm 2 T kodunun ilk iki harfi değildir. Bunlar: cs/ cze/ ces, mi/ mao/ mrive sk/ slo/ slk. cs cze/ces (B/T) ces
3 Bölüm 2 ve 3'teki bireysel diller (bir makro dile ait değildir), ancak Bölüm 1'de bölüm 2'deki eşdeğeri bir kolektif olan bir kodla ele alınan diller. Bunlar: bho, mai, ve mag. (bh) bho
bir kaç Bölüm 1'de kod içermeyen, Bölüm 2 ve 3'teki diğer herhangi bir bireysel dil. - ast
1 Bölüm 1 ve 2'de kodlar olmadan Bölüm 3'e eklenen, ancak Bölüm 2 ve 3'te bir makro dil tarafından kapsanan, ayrıca Bölüm 1'de kodlanmış diller. (ar) (ara) arb
1 Bölüm 3'te, Bölüm 2'de kodu olmayan, ancak Bölüm 1'de Bölüm 2'deki eşdeğeri toplu bir grup olan bir kodla kapsanan bireysel bir dil (bu grup için aşağıdaki girişe bakın). (bh) (bih) sck
> 7000 Bölüm 1 ve 2'de herhangi bir kod olmaksızın Bölüm 3'teki diğer herhangi bir bireysel dil (muhtemelen Bölüm 2'de nickalan bir grup olan "Nijer-Kodofanian (Diğer)" gibi toplu bir kod kapsamındadır ). - (nice) aaa
Makro diller
("M")
28 Bölüm 1 ve 2'de de kodları olan Bölüm 3'teki makrodiller Bölüm 3'te makrodiller
için atanmış 62 kod vardır; aşağıda özel durumları olanları çıkarın, bu kalır: 62 ‒ (4 "B/T") ‒ 1 ‒ (25+1+3 "Bölüm 1'de değil") = 28 kod.
ar ara
4 Bölüm 3'teki makro diller ve Bölüm 2'deki ayrı B/T kodları. Bunlar: fa/ per/ fas, ms/ may/ msa, sq/ alb/ sqive zh/ chi/ zho. fa başına/fas (B/T) fas
1 Bölüm 1'de kodları olan dilleri içeren Bölüm 3'teki makro dil. Yalnızca: no/ nor(şunu içeren: nb/ nob, ve nn/ non). numara ne de
25 Bölüm 2 ve 3'te makro diller, ancak Bölüm 1'de kod yoktur. - bal
1 Bölüm 3'teki makro dil, Bölüm 2'deki kodsuz ve Bölüm 1'deki kodu kullanımdan kaldırılan. (NS) - hbs
3 Bölüm 3'teki makro diller, Bölüm 1 veya 2'de kodlar yoktur. Bunlar: bnc, kln, ve luy. - - bnc
Aileler ve gruplar (toplu)
("C")
1 Bihari , toplu olarak işaretlenir ve ISO 639-2 koduna sahiptir ve aynı zamanda ISO 639-1 koduna (diğer tüm kodların ayrı diller veya ayrılmış olduğu) sahip tek dil grubudur. Bunun nedeni, (ISO 639-3 için aynı makro dili oluşturamayacak kadar farklı olan) üç ayrı Bihari dilinin farklı ISO 639-2 kodlarını ( bho, mai, mag) almasıdır, bu da Bihari'yi amaçlar için bir geri kalan grup haline getirir. ISO 639-2 (bu üçü dışındaki grubun dillerini içerir). bh bih - bih
35 Bölüm 2'deki kalan gruplar, yani aynı kod ancak farklı diller dahil. Bölüm 2'de, Bölüm 2'de afabireysel dil tanımlayıcısı olmayan ve geri kalan üç gruba girmeyen bir Afro-Asya diline atıfta bulunulmaktadır: ber"Berberi (Diğer)", cus"Cushitic (Diğer)" veya semHepsi Afro-Asya dil grupları olan "Semitik (Diğer)". - afa afa
29 Bölüm 2'deki düzenli grup, Bölüm 5'teki dil ailesiyle aynı, Bölüm 1'de kod yok. Bunların arasında, ypkBölüm 2'deki normal grup , Bölüm 5'te, Bölüm'deki başka bir yeni düzenli grubun parçası olarak kodlanan tek gruptu. Bölüm 2'de kodlanmayan 5 (aşağıya bakınız). aus aus
50 Yalnızca Bölüm 5'te eklenen, daha önce Bölüm 1, 2 ve 3'te kodlanmayan düzenli gruplar ine. yeni normal grup sqj), 7 tanesi hariç: aav, esx, euq, hmx, jpx, urjve syd(yeni normal grubun bir parçası urj). Ancak normal grup ypk(yeni düzenli grubun parçası esx) Bölüm 2'de zaten kodlanmıştı . ISO 639-5 kodları listesindeki dil gruplarının hiyerarşisine bakın . - sqj
Özel kodlar
("S")
1 Bireysel bir dil kodunun gerekli olduğu tek dilli bir bağlamda kullanılabilir, ancak dilin kendisinin standart bir kodu yoktur. Daha kesin bir alternatif, ISO 639-2'den kalan bir grup veya ISO 639-5'ten bir dil ailesi kodu kullanmak olabilir, böyle bir gruptaki diğer diller hariç tutulmadıkça (kendi kodlarıyla ayrıldıkları için) veya standart bir toplu kod kullanılmadıkça uygun. Bazı uygulamalar, yerel kullanım için ayrılmış olanlar içinde daha özel bir kod kullanmayı tercih edebilir. - yanlış -
1 Çok dilli içerik (ayrılabilir kısımlarda en az iki dil içerir). Tüm içerik için tek bir dil kodu beklendiğinde kullanılacaktır. İçeriğin her bir parçası için ayrı diller veya makro diller muhtemelen hala kodlanmamış olabilir (ve mistoplu kod olarak veya daha kesin olarak gösterilebilir). çok
1 Belirsiz (içerik, isteğe bağlı kombinasyonda sıfır, bir veya birçok dil içerir). ve
1 Hiç dil bilgisi yok (2006-01-11 eklendi). İçerik (örneğin, bir insan dilinde metin içermeyen grafikler, fotoğraflar veya ses/video kayıtları veya teknik meta veriler ve çoğu programlama kaynak kodu) herhangi bir dilde olduğu gibi kullanılabilir ve tercüme edilmemelidir (muhtemelen ayrı olarak ilişkilendirilmiş açıklaması hariç). veya içeriğin önemli olmayan parçaları için). zxx
Yerel kullanım için ayrılmıştır
("R")
20 Bölüm 1'deki Alpha2 kodları, aralıkta qa.. qt. Bu kodlar önerilmez, ancak Bölüm 1'de atanmadan bırakılır. qa -
520 Bölüm 2 ve 3'teki Alpha3 kodları, aralıkta qaa... qtz. Bu kodlar aynı zamanda toplu diller (veya diğer özel durumlar) için de kullanılabilir, ancak Bölüm 5'te bunlarla birlikte standart dil aileleri ve grupları atanmayacaktır. - kaa

Bu farklılıklar aşağıdaki faktörlerden kaynaklanmaktadır.

Olarak ISO 639-2 , iki farklı kodlar 22 ayrı diller, yani bibliyografik ve terminoloji kodu (B / T kodları) tahsis edilmiştir. B kodları, daha önce yaygın olarak kullanılan bibliyografik sistemler, dilin İngilizce adına dayalı dil kodlarını kullandığından, tarihsel nedenlerle dahil edilmiştir. Buna karşılık, ISO 639-1 kodları dilin yerel adına dayanıyordu ve aynı zamanda bu diller için 2 karakterli koda benzeyen 639-2 koduna (T kodları) sahip olmak için güçlü bir istek vardı. ISO 639-1.

  • Örneğin, Almanca dilinin (Bölüm 1: de) Bölüm 2'de iki kodu vardır: ger(B kodu) ve deu(T kodu), İngilizce dilieng için Bölüm 2'de yalnızca bir kod vardır .
  • 2 eski B kodu geri çekildi ve bugün sadece 20 çift B/T kodu kaldı.

Bölüm 2'deki tek tek dillerin Bölüm 3'te her zaman bir kodu vardır (burada yalnızca Bölüm 2 terminoloji kodu yeniden kullanılır), ancak aşağıdaki örneklerde gösterildiği gibi Bölüm 1'de bir kod olabilir veya olmayabilir:

  • Bölüm 3 eng, Bölüm 2 engve Bölüm 1'e karşılık geliren
  • Bölüm 3 ast, Bölüm 2'ye karşılık gelir astancak Bölüm 1'de bir kod yoktur.

Bölüm 3'teki bazı kodlar (62) makro dillerdir. Bunlar, karşılıklı olarak iyi bir anlayışa sahip olan ve genellikle karıştırılan veya karıştırılan birden çok bireysel dili içeren gruplardır. Bazı makro diller, kendi dillerinden birinde varsayılan bir standart form geliştirmiştir (örn. Mandarin, Çince makro dili için varsayılan olarak ima edilir, gerekirse diğer bireysel diller hala ayırt edilebilir, ancak cmnMandarin için özel kod nadiren kullanılır).

  • 1 makrodilinde Bölüm 2 kodu ve Bölüm 1 kodu bulunurken, üye bireysel dillerinde ayrıca Bölüm 1 ve Bölüm 2'de kodlar bulunur: nor/ noiçerir non/ nn, nob/ nb; veya
  • 4 makro dilde iki Kısım 2 kodu (B/T) ve bir Kısım 1 kodu vardır: per/ fas/ fa, may/ msa/ ms, alb/ sqi/ sq, ve chi/ zho/ zh;
  • 28 makro dilde Bölüm 2 kodu vardır, ancak Bölüm 1 kodu yoktur;
  • Diğer 29 makro dilde yalnızca Bölüm 3'te kodlar bulunur.

Bölüm 2'deki toplu kodların Bölüm 5'te bir kodu vardır: örneğin aus, Avustralya dilleri anlamına gelen Bölüm 2 ve 5'te .

  • Bölüm 2'deki bir toplu kodun ayrıca Bölüm 1: bih/ ' de bir kodu vardır bh.
  • Bölüm 5'te bazı kodlar eklendi, ancak Bölüm 2'de kod yoktu: ör. sqj

Bölüm 2 ve 3 ayrıca ayrılmış bir menzile ve dört özel koda sahiptir:

  • Kodlar qaaaracılığıyla qtzyerel kullanım için ayrılmıştır.
  • Dört özel kod vardır: mishenüz kodu atanmamış muldiller için, "birden çok dil" undiçin, "tanımsız" zxxiçin ve "dilsel içerik yok, uygulanamaz" için.

kod alanı

Alfa-2 kod alanı

ISO 639-1'de "Alfa-2" kodları ( ISO temel Latin alfabesinin 2 harfinden oluşan kodlar için ) kullanılmaktadır . Daha geniş bir dil yelpazesi için kodlar istendiğinde, 2'den fazla harf kombinasyonu (maksimum 26 2 = 676) kapsayabildiğinde , Alfa-3 kodları kullanılarak ISO 639-2 geliştirilmiştir. (Ancak, ikincisi resmi olarak önce yayınlandı.)

Alfa-3 kod alanı

"Alfa-3" kodları ( ISO temel Latin alfabesinin 3 harfinden oluşan kodlar için ) ISO 639-2 , ISO 639-3 ve ISO 639-5'te kullanılmaktadır . Bu şekilde temsil edilebilecek dil ve dil gruplarının sayısı 26 3 = 17.576'dır.

Alfa-3 kodlarının ISO 639'un üç bölümü tarafından ortak kullanımı, daha büyük bir sistem içinde biraz koordinasyon gerektirir.

Bölüm 2, dört özel kod mis, mul, und, zxx, ayrılmış bir aralık qaa-qtz(20 × 26 = 520 kod) tanımlar ve 20 çift girişe (B/T kodları) ve ayrıca kullanımdan kaldırılmış B kodlu 2 girişe sahiptir. Bu, 3. bölümde dilleri temsil etmek için veya 5. bölümde dil ailelerini veya gruplarını temsil etmek için kullanılamayan 520 + 22 + 4 = 546 kodu toplar. Kalan 17.576 – 546 = 17.030'dur.

Bugün Dünya'da yaklaşık altı veya yedi bin dil var. Dolayısıyla bu 17.030 kod, her bir dile benzersiz bir kod atamak için yeterlidir, ancak bazı diller, o dilin geleneksel adlarına hiçbir şekilde benzemeyen rastgele kodlarla sonuçlanabilir.

Alfa-4 kod alanı (geri çekilmiş)

Geri çekilen ISO 639-6'da "Alfa-4" kodları ( ISO temel Latin alfabesinin 4 harfinden oluşan kodlar için ) önerilmiştir . Temsil edilebilecek dil ve lehçe sayısı için üst sınır 26 4 = 456.976'dır.

Ayrıca bakınız

Notlar ve referanslar

Dış bağlantılar