ISO 639 - ISO 639
ISO 639 , Uluslararası Standardizasyon Örgütü tarafından dillerin ve dil gruplarının adlarının temsili ile ilgili bir dizi standarttır .
Aynı zamanda 1967'de onaylanan ( ISO 639/R olarak ) ve 2002'de geri çekilen orijinal standardın da adıydı. ISO 639 seti beş bölümden oluşuyor.
ISO 639 kodlarının kullanımı
ISO 639'un çeşitli bölümlerinde tanımlanan dil kodları, bibliyografik amaçlarla ve bilgi işlem ve internet ortamlarında yerel verilerin temel bir unsuru olarak kullanılır . Kodlar , farklı dillerdeki sürümleri için Wikipedia URL'leri gibi çeşitli uygulamalarda da kullanım bulur .
Standardın güncel ve tarihi bölümleri
Standart | Ad ( Dil adlarının temsili için kodlar – ... ) | Kayıt Otoritesi | İlk baskı | Akım | Listedeki numara (18 Şubat 2021 itibariyle) |
---|---|---|---|---|---|
ISO 639-1 | Bölüm 1: Alfa-2 kodu | bilgi terimi | 1967 (ISO 639 olarak) | 2002 | 184 |
ISO 639-2 | Bölüm 2: Alfa-3 kodu | Kongre Kütüphanesi | 1998 | 1998 | 482 + 20 B-sadece + 4 özel + 520 yerel kullanım için |
ISO 639-3 | Bölüm 3: Kapsamlı dil kapsamı için Alfa-3 kodu | SIL Uluslararası | 2007 | 2007 | Yerel kullanım için 7.893 + 4 özel + 520 |
ISO 639-4 | Bölüm 4: Dil kodlaması için uygulama yönergeleri ve genel ilkeler | ISO/TC 37 / SC 2 | 2010-07-16 | 2010-07-16 | (liste değil) |
ISO 639-5 | Bölüm 5: Dil aileleri ve grupları için Alfa-3 kodu | Kongre Kütüphanesi | 2008-05-15 | 2013-02-11 | 115 (ISO 632-2'den 36 kalan + 29 normal grup dahil) |
ISO 639-6 | Bölüm 6: Dil değişkenlerinin kapsamlı kapsamı için Alfa-4 gösterimi (geri çekilmiş) | coğrafi dil | 2009-11-17 | geri çekilmiş | 21.000+ |
Standardın her bir parçası, gerektiğinde kodları ekleyen ve kodların durumunu değiştiren bir bakım kuruluşu tarafından korunur. ISO 639-6, 2014 yılında geri çekildi.
Bireysel kodların özellikleri
Kapsamlar:
- Bireysel diller
- Makrodiller (Bölüm 3)
- Dil koleksiyonları (Bölüm 1, 2, 5). Bölüm 1 yalnızca bir koleksiyon içerir (
bh
), bazı koleksiyonlar zaten Bölüm 2'deydi ve diğerleri yalnızca Bölüm 5'te eklendi:- Kalan gruplar: Bölüm 2 ve 5'teki 36 koleksiyon bu türdendir (Bölüm 1'de kodlanmış olanlar da dahil) — Bölüm 5 henüz yayınlanmadığında Bölüm 2 ile uyumluluk için, kalan gruplar herhangi bir dil ve koleksiyon içermez Bölüm 2'de zaten kodlanmış olan (ancak Bölüm 5 ile uyumlu yeni uygulamalar, Bölüm 5'te yayınlanan kapsama hiyerarşisine uyduğu ve dilleri gruplandırırken en özel koleksiyonu kullandıkları sürece bu grupları kapsayıcı olarak ele alabilir);
- Normal gruplar: Bölüm 2 ve 5'teki 29 koleksiyon bu türdendir — Bölüm 2 ile uyumluluk için başka grupları içeremezler;
- Aileler: Yalnızca Bölüm 5'te kodlanmış 50 yeni koleksiyon (2. Bölümde kodlanmış normal bir grubu içeren biri dahil) — Bölüm 2 ile uyumluluk için, kalan gruplar dışında başka koleksiyonlar içerebilirler.
- Lehçeler : Bölüm 6'da ele alınması amaçlandı (önerilen ancak şimdi geri çekildi).
- Özel durumlar (Bölüm 2, 3).
- Yerel kullanım için ayrılmıştır (Bölüm 2, 3). Ayrıca bazen Bölüm 1 ve 2'deki (özel kodun
mis
uygun olmadığı yerlerde) standart kodlar gibi bir alfa-2 koduna veya Bölüm 5'teki standart kodlar gibi koleksiyonlar için bir alfa-3 koduna ihtiyaç duyan uygulamalarda kullanılır .
Türler (bireysel diller için):
- Yaşayan diller (Bölüm 2, 3) (tüm makro diller yaşayan dillerdir)
-
Soyu tükenmiş diller (Bölüm 2, 3) (608, 5 tanesi Bölüm 2:
chb
,chg
,cop
,lui
,sam
; hiçbiri Bölüm 1'de değil) -
Eski dil (Parça 1, 2, 3) (124, 19 tanesi Bölüm 2'de olduğu ve 5 tanesi, yani
ave
,chu
,lat
,pli
vesan
, aynı zamanda Kısım 1 'de, bir kodu vardır:ae
,cu
,la
,pi
,sa
) - Tarihsel diller (Bölüm 2, 3) (83, 16 tanesi Bölüm 2'dedir; hiçbiri Bölüm 1'de değildir)
-
Yapılandırılmış diller (Bölüm 1, 2, 3) (22, 9 tanesi Bölüm 2:
afh
,epo
,ido
,ile
,ina
,jbo
,tlh
,vol
,zbl
; 5 tanesi Bölüm 1:eo
,ia
,ie
,io
,vo
)
Bölüm 2'de iki farklı alfa-3 koduna sahip bireysel diller ve makro diller:
- Bibliyografik (bazıları kullanımdan kaldırıldı, hiçbiri Bölüm 3'te tanımlanmadı): bunlar eski kodlardır (İngilizce dil adlarına göre).
- Terminolojik (Bölüm 3'te de tanımlanmıştır): bunlar tercih edilen kodlardır (ana dil adlarına dayalı, gerekirse romanlaştırılmış).
- Diğerlerinin tümü (dil koleksiyonları ve özel/ayrılmış kodlar dahil), her iki kullanım için yalnızca tek bir alfa-3 koduna sahiptir.
Parçalar arasındaki ilişkiler
ISO 639'un farklı bölümleri, hiçbir kodun bir bölümde bir şey, diğerinde başka bir şey ifade etmeyeceği şekilde birlikte çalışmak üzere tasarlanmıştır. Ancak, tüm diller tüm bölümlerde değildir ve belirli dillerin ve diğer öğelerin farklı bölümlerde ele alınmasının çeşitli farklı yolları vardır. Bu, örneğin, bir dilin Bölüm 1 veya 2'de listelenip listelenmediğine, Bölüm 2'de ayrı B/T kodlarına sahip olup olmadığına veya Bölüm 3'te bir makro dil olarak sınıflandırılıp sınıflandırılmadığına vb. bağlıdır.
Bu çeşitli tedaviler aşağıdaki çizelgede detaylandırılmıştır. Her satır grubunda (ISO 639-3'ün her kapsamı için bir tane), son dört sütun, ISO 639'un bölümleri arasındaki belirli bir ilişki türünü örnekleyen temsili bir dil için kodlar içerir, ikinci sütun ilişkinin bir açıklamasını sağlar. , ve ilk sütun, bu tür bir ilişkiye sahip öğelerin sayısını gösterir. Örneğin, Bölüm 1'de kodu olan, B/T kodu olan ve Bölüm 3'te makro diller olarak sınıflandırılan dört öğe vardır. Bu dört öğenin bir temsilcisi "Farsça" fa
/ per
/ 'dir fas
.
Kapsam | vaka sayısı | Açıklama | Eşleşen kodlara örnek | |||
---|---|---|---|---|---|---|
ISO 639-1 | ISO 639-2 | ISO 639-3 | ISO 639-5 | |||
Bireysel diller ("I") |
128 | Her bir Bölüm 1, 2 ve 3'te kod bulunan bir makro dilin parçası olmayan bireysel diller (Bölüm 2'de yalnızca bir kod). Bölüm 1'de tek tek diller, makro diller veya gruplar için 184 atanmış kod vardır; aşağıdaki satırlarda sayılanları çıkarın, bu kalır: 184 - (2 "I (eski B/T)") ‒ (3+11 "I") ‒ (3+2 "I (B/T)") ‒ (28 +4+1+1 "M") ‒ (1 "C") = 128 kod. |
tr | ingilizce | - | |
2 | Bölüm 2'de ayrı B/T kodlarına sahip olan, ancak B kodları geri çekilen (2008-06-28'den beri) her bir Bölüm 1, 2 ve 3'te kod bulunan bireysel diller, T kodlarını tüm kullanımlar için korumuştur. Bunlar: hr /( scr )/ hrv ve sr /( ser )/ srp . Her ikisi de hbs , Bölüm 3'te yeni kodlanmış diğer bireysel dilleri de içerecek şekilde eklenen aynı makrodilin parçasıdır , ancak sh Bölüm 1'deki kodu da geri çekilmiştir ve Bölüm 2'de tanımlanmış hiçbir kodu yoktur.
|
saat | (scr)/hrv (B/T) | hrv | ||
3 | Bölüm 3'te bir makro dile ait, Bölüm 2'de tek bir kod ve Bölüm 1'de de bir koda sahip olan bireysel diller: bs / bos (makrodilin bir parçası hbs ), nb / nob ve nn / non (her ikisi de makrodilin no / nor ).
|
not | asil | |||
11 | Bölüm 2'de ayrı B/T kodlarına sahip bireysel diller, ancak sonraki satırlardaki özel durumların hiçbirinde değil. Bölüm 2'de ayrı dillere veya makro dillere atanan 20 çift ayrı B/T kodu vardır; aşağıdaki özel durumları çıkarın, geriye: 20 ‒ (3+2 "M") ‒ (4 "C") = 11 çift kod. |
de | ger/deu (B/T) | deu | ||
3 | Bölüm 2'de ayrı B/T kodlarına sahip bireysel diller, ancak Bölüm 1 kodundaki harfler, Bölüm 2 T kodunun ilk iki harfi değildir. Bunlar: cs / cze / ces , mi / mao / mri ve sk / slo / slk .
|
cs | cze/ces (B/T) | ces | ||
3 | Bölüm 2 ve 3'teki bireysel diller (bir makro dile ait değildir), ancak Bölüm 1'de bölüm 2'deki eşdeğeri bir kolektif olan bir kodla ele alınan diller. Bunlar: bho , mai , ve mag .
|
(bh) | bho | |||
bir kaç | Bölüm 1'de kod içermeyen, Bölüm 2 ve 3'teki diğer herhangi bir bireysel dil. | - | ast | |||
1 | Bölüm 1 ve 2'de kodlar olmadan Bölüm 3'e eklenen, ancak Bölüm 2 ve 3'te bir makro dil tarafından kapsanan, ayrıca Bölüm 1'de kodlanmış diller. | (ar) | (ara) | arb | ||
1 | Bölüm 3'te, Bölüm 2'de kodu olmayan, ancak Bölüm 1'de Bölüm 2'deki eşdeğeri toplu bir grup olan bir kodla kapsanan bireysel bir dil (bu grup için aşağıdaki girişe bakın). | (bh) | (bih) | sck | ||
> 7000 | Bölüm 1 ve 2'de herhangi bir kod olmaksızın Bölüm 3'teki diğer herhangi bir bireysel dil (muhtemelen Bölüm 2'de nic kalan bir grup olan "Nijer-Kodofanian (Diğer)" gibi toplu bir kod kapsamındadır ).
|
- | (nice) | aaa | ||
Makro diller ("M") |
28 | Bölüm 1 ve 2'de de kodları olan Bölüm 3'teki makrodiller Bölüm 3'te makrodiller için atanmış 62 kod vardır; aşağıda özel durumları olanları çıkarın, bu kalır: 62 ‒ (4 "B/T") ‒ 1 ‒ (25+1+3 "Bölüm 1'de değil") = 28 kod. |
ar | ara | ||
4 | Bölüm 3'teki makro diller ve Bölüm 2'deki ayrı B/T kodları. Bunlar: fa / per / fas , ms / may / msa , sq / alb / sqi ve zh / chi / zho .
|
fa | başına/fas (B/T) | fas | ||
1 | Bölüm 1'de kodları olan dilleri içeren Bölüm 3'teki makro dil. Yalnızca: no / nor (şunu içeren: nb / nob , ve nn / non ).
|
numara | ne de | |||
25 | Bölüm 2 ve 3'te makro diller, ancak Bölüm 1'de kod yoktur. | - | bal | |||
1 | Bölüm 3'teki makro dil, Bölüm 2'deki kodsuz ve Bölüm 1'deki kodu kullanımdan kaldırılan. | (NS) | - | hbs | ||
3 | Bölüm 3'teki makro diller, Bölüm 1 veya 2'de kodlar yoktur. Bunlar: bnc , kln , ve luy .
|
- | - | bnc | ||
Aileler ve gruplar (toplu) ("C") |
1 |
Bihari , toplu olarak işaretlenir ve ISO 639-2 koduna sahiptir ve aynı zamanda ISO 639-1 koduna (diğer tüm kodların ayrı diller veya ayrılmış olduğu) sahip tek dil grubudur. Bunun nedeni, (ISO 639-3 için aynı makro dili oluşturamayacak kadar farklı olan) üç ayrı Bihari dilinin farklı ISO 639-2 kodlarını ( bho , mai , mag ) almasıdır, bu da Bihari'yi amaçlar için bir geri kalan grup haline getirir. ISO 639-2 (bu üçü dışındaki grubun dillerini içerir).
|
bh | bih | - | bih |
35 | Bölüm 2'deki kalan gruplar, yani aynı kod ancak farklı diller dahil. Bölüm 2'de, Bölüm 2'de afa bireysel dil tanımlayıcısı olmayan ve geri kalan üç gruba girmeyen bir Afro-Asya diline atıfta bulunulmaktadır: ber "Berberi (Diğer)", cus "Cushitic (Diğer)" veya sem Hepsi Afro-Asya dil grupları olan "Semitik (Diğer)".
|
- | afa | afa | ||
29 | Bölüm 2'deki düzenli grup, Bölüm 5'teki dil ailesiyle aynı, Bölüm 1'de kod yok. Bunların arasında, ypk Bölüm 2'deki normal grup , Bölüm 5'te, Bölüm'deki başka bir yeni düzenli grubun parçası olarak kodlanan tek gruptu. Bölüm 2'de kodlanmayan 5 (aşağıya bakınız).
|
aus | aus | |||
50 | Yalnızca Bölüm 5'te eklenen, daha önce Bölüm 1, 2 ve 3'te kodlanmayan düzenli gruplar ine . yeni normal grup sqj ), 7 tanesi hariç: aav , esx , euq , hmx , jpx , urj ve syd (yeni normal grubun bir parçası urj ). Ancak normal grup ypk (yeni düzenli grubun parçası esx ) Bölüm 2'de zaten kodlanmıştı . ISO 639-5 kodları listesindeki dil gruplarının hiyerarşisine bakın .
|
- | sqj | |||
Özel kodlar ("S") |
1 | Bireysel bir dil kodunun gerekli olduğu tek dilli bir bağlamda kullanılabilir, ancak dilin kendisinin standart bir kodu yoktur. Daha kesin bir alternatif, ISO 639-2'den kalan bir grup veya ISO 639-5'ten bir dil ailesi kodu kullanmak olabilir, böyle bir gruptaki diğer diller hariç tutulmadıkça (kendi kodlarıyla ayrıldıkları için) veya standart bir toplu kod kullanılmadıkça uygun. Bazı uygulamalar, yerel kullanım için ayrılmış olanlar içinde daha özel bir kod kullanmayı tercih edebilir. | - | yanlış | - | |
1 | Çok dilli içerik (ayrılabilir kısımlarda en az iki dil içerir). Tüm içerik için tek bir dil kodu beklendiğinde kullanılacaktır. İçeriğin her bir parçası için ayrı diller veya makro diller muhtemelen hala kodlanmamış olabilir (ve mis toplu kod olarak veya daha kesin olarak gösterilebilir).
|
çok | ||||
1 | Belirsiz (içerik, isteğe bağlı kombinasyonda sıfır, bir veya birçok dil içerir). | ve | ||||
1 | Hiç dil bilgisi yok (2006-01-11 eklendi). İçerik (örneğin, bir insan dilinde metin içermeyen grafikler, fotoğraflar veya ses/video kayıtları veya teknik meta veriler ve çoğu programlama kaynak kodu) herhangi bir dilde olduğu gibi kullanılabilir ve tercüme edilmemelidir (muhtemelen ayrı olarak ilişkilendirilmiş açıklaması hariç). veya içeriğin önemli olmayan parçaları için). | zxx | ||||
Yerel kullanım için ayrılmıştır ("R") |
20 | Bölüm 1'deki Alpha2 kodları, aralıkta qa .. qt . Bu kodlar önerilmez, ancak Bölüm 1'de atanmadan bırakılır.
|
qa | - | ||
520 | Bölüm 2 ve 3'teki Alpha3 kodları, aralıkta qaa ... qtz . Bu kodlar aynı zamanda toplu diller (veya diğer özel durumlar) için de kullanılabilir, ancak Bölüm 5'te bunlarla birlikte standart dil aileleri ve grupları atanmayacaktır.
|
- | kaa |
Bu farklılıklar aşağıdaki faktörlerden kaynaklanmaktadır.
Olarak ISO 639-2 , iki farklı kodlar 22 ayrı diller, yani bibliyografik ve terminoloji kodu (B / T kodları) tahsis edilmiştir. B kodları, daha önce yaygın olarak kullanılan bibliyografik sistemler, dilin İngilizce adına dayalı dil kodlarını kullandığından, tarihsel nedenlerle dahil edilmiştir. Buna karşılık, ISO 639-1 kodları dilin yerel adına dayanıyordu ve aynı zamanda bu diller için 2 karakterli koda benzeyen 639-2 koduna (T kodları) sahip olmak için güçlü bir istek vardı. ISO 639-1.
- Örneğin, Almanca dilinin (Bölüm 1:
de
) Bölüm 2'de iki kodu vardır:ger
(B kodu) vedeu
(T kodu), İngilizce dilieng
için Bölüm 2'de yalnızca bir kod vardır . - 2 eski B kodu geri çekildi ve bugün sadece 20 çift B/T kodu kaldı.
Bölüm 2'deki tek tek dillerin Bölüm 3'te her zaman bir kodu vardır (burada yalnızca Bölüm 2 terminoloji kodu yeniden kullanılır), ancak aşağıdaki örneklerde gösterildiği gibi Bölüm 1'de bir kod olabilir veya olmayabilir:
- Bölüm 3
eng
, Bölüm 2eng
ve Bölüm 1'e karşılık geliren
- Bölüm 3
ast
, Bölüm 2'ye karşılık gelirast
ancak Bölüm 1'de bir kod yoktur.
Bölüm 3'teki bazı kodlar (62) makro dillerdir. Bunlar, karşılıklı olarak iyi bir anlayışa sahip olan ve genellikle karıştırılan veya karıştırılan birden çok bireysel dili içeren gruplardır. Bazı makro diller, kendi dillerinden birinde varsayılan bir standart form geliştirmiştir (örn. Mandarin, Çince makro dili için varsayılan olarak ima edilir, gerekirse diğer bireysel diller hala ayırt edilebilir, ancak cmn
Mandarin için özel kod nadiren kullanılır).
- 1 makrodilinde Bölüm 2 kodu ve Bölüm 1 kodu bulunurken, üye bireysel dillerinde ayrıca Bölüm 1 ve Bölüm 2'de kodlar bulunur:
nor
/no
içerirnon
/nn
,nob
/nb
; veya - 4 makro dilde iki Kısım 2 kodu (B/T) ve bir Kısım 1 kodu vardır:
per
/fas
/fa
,may
/msa
/ms
,alb
/sqi
/sq
, vechi
/zho
/zh
; - 28 makro dilde Bölüm 2 kodu vardır, ancak Bölüm 1 kodu yoktur;
- Diğer 29 makro dilde yalnızca Bölüm 3'te kodlar bulunur.
Bölüm 2'deki toplu kodların Bölüm 5'te bir kodu vardır: örneğin aus
, Avustralya dilleri anlamına gelen Bölüm 2 ve 5'te .
- Bölüm 2'deki bir toplu kodun ayrıca Bölüm 1:
bih
/ ' de bir kodu vardırbh
. - Bölüm 5'te bazı kodlar eklendi, ancak Bölüm 2'de kod yoktu: ör.
sqj
Bölüm 2 ve 3 ayrıca ayrılmış bir menzile ve dört özel koda sahiptir:
- Kodlar
qaa
aracılığıylaqtz
yerel kullanım için ayrılmıştır. - Dört özel kod vardır:
mis
henüz kodu atanmamışmul
diller için, "birden çok dil"und
için, "tanımsız"zxx
için ve "dilsel içerik yok, uygulanamaz" için.
kod alanı
Alfa-2 kod alanı
ISO 639-1'de "Alfa-2" kodları ( ISO temel Latin alfabesinin 2 harfinden oluşan kodlar için ) kullanılmaktadır . Daha geniş bir dil yelpazesi için kodlar istendiğinde, 2'den fazla harf kombinasyonu (maksimum 26 2 = 676) kapsayabildiğinde , Alfa-3 kodları kullanılarak ISO 639-2 geliştirilmiştir. (Ancak, ikincisi resmi olarak önce yayınlandı.)
Alfa-3 kod alanı
"Alfa-3" kodları ( ISO temel Latin alfabesinin 3 harfinden oluşan kodlar için ) ISO 639-2 , ISO 639-3 ve ISO 639-5'te kullanılmaktadır . Bu şekilde temsil edilebilecek dil ve dil gruplarının sayısı 26 3 = 17.576'dır.
Alfa-3 kodlarının ISO 639'un üç bölümü tarafından ortak kullanımı, daha büyük bir sistem içinde biraz koordinasyon gerektirir.
Bölüm 2, dört özel kod mis
, mul
, und
, zxx
, ayrılmış bir aralık qaa-qtz
(20 × 26 = 520 kod) tanımlar ve 20 çift girişe (B/T kodları) ve ayrıca kullanımdan kaldırılmış B kodlu 2 girişe sahiptir. Bu, 3. bölümde dilleri temsil etmek için veya 5. bölümde dil ailelerini veya gruplarını temsil etmek için kullanılamayan 520 + 22 + 4 = 546 kodu toplar. Kalan 17.576 – 546 = 17.030'dur.
Bugün Dünya'da yaklaşık altı veya yedi bin dil var. Dolayısıyla bu 17.030 kod, her bir dile benzersiz bir kod atamak için yeterlidir, ancak bazı diller, o dilin geleneksel adlarına hiçbir şekilde benzemeyen rastgele kodlarla sonuçlanabilir.
Alfa-4 kod alanı (geri çekilmiş)
Geri çekilen ISO 639-6'da "Alfa-4" kodları ( ISO temel Latin alfabesinin 4 harfinden oluşan kodlar için ) önerilmiştir . Temsil edilebilecek dil ve lehçe sayısı için üst sınır 26 4 = 456.976'dır.
Ayrıca bakınız
- IETF dil etiketleri (ISO 639'a göre)
- ISO 3166 (ülkeler için kodlar)
- ISO 15924 ( yazı sistemleri için kodlar )
- Yapılandırılmış diller için kodlar
- Dil kodu
- Dil aileleri ve diller
- dillerin listesi
- resmi dillerin listesi
- ISO 639 kodlarının listesi
Notlar ve referanslar
Dış bağlantılar
- Resmi ISO 639-1/RA (Kayıt Otoritesi) Infoterm
- Resmi ISO 639-2/RA (Kayıt Otoritesi) Kongre Kütüphanesi
- Resmi ISO 639-3/RA (Tescil Kurumu) SIL International
- Resmi ISO 693-5/RA (Kayıt Otoritesi) Kongre Kütüphanesi
- Resmi ISO 639-6/RA (Tescil Kurumu) Geolang
- ISO 639 kodlarının diğer dillerdeki çevirilerini XML biçiminde içeren Ortak Yerel Veri Deposu . CLDR anket aracı da veri daha okunabilir formatı içeriyor.