Kod sayfası - Code page

Gelen bilgi işlem , bir kod sayfası bir olan karakter kodlama ve gibi yazdırılabilir bir dizi spesifik bir birliktelik olduğunu karakterler ve kontrol karakterleri benzersiz sayılarla. Tipik olarak her sayı, tek bir bayttaki ikili değeri temsil eder. (Bazı bağlamlarda bu terimler daha kesin olarak kullanılır; bkz. Karakter kodlaması § Karakter kümeleri, karakter haritaları ve kod sayfaları .)

Dönem "kod sayfası" kökenli IBM'in 'ın EBCDIC tabanlı anabilgisayar sistemleri, ama Microsoft , SAP ve Oracle Corporation bu terimi kullanmak birkaç satıcıları arasında yer almaktadır. Satıcıların çoğu, kendi karakter kümelerini bir adla tanımlar. Çok sayıda karakter kümesi olması durumunda (IBM'de olduğu gibi), karakter kümelerini bir sayı aracılığıyla tanımlamak, onları ayırt etmenin uygun bir yoludur. Başlangıçta, kod sayfa numaraları sevk sayfa numaraları , IBM standart karakter seti kılavuzunda uzun süre tutulan henüz bir durum. Bir kod sayfası sistemi kullanan satıcılar, başka bir adla daha iyi bilinse bile, bir karakter kodlamasına kendi kod sayfa numaralarını tahsis eder; örneğin, UTF-8'e IBM'de 1208, Microsoft'ta 65001 ve SAP'de 4110 sayfa numaraları atanmıştır.

Hewlett-Packard , HP-UX işletim sisteminde ve yazıcılar için (HP yazıcılar için olsun veya olmasın) Yazıcı Komut Dili (PCL) protokolünde benzer bir konsept kullanır . Bununla birlikte, terminoloji farklıdır: Başkalarının karakter kümesi dediği şeye HP bir simge kümesi der ve IBM veya Microsoft'un kod sayfası dediğine HP bir simge kümesi kodu der . HP, hem kendi karakter setlerini hem de diğer satıcıların karakter setlerini kodlamak için her biri ilişkili bir sembol seti koduna sahip bir dizi sembol seti geliştirdi.

Çok sayıda karakter kümesi, birçok satıcının Unicode'u önermesine yol açar .

Kod sayfası numaralandırma sistemi

IBM, bir bilgisayar sisteminin veya bilgisayar sistemleri koleksiyonunun karşılaşabileceği her karakter kodlamasına sistematik olarak küçük, ancak küresel olarak benzersiz, 16 bitlik bir sayı atama kavramını tanıttı. Numaralandırma şemasının IBM kaynağı, en küçük (ilk) sayıların IBM'in EBCDIC kodlamasının varyasyonlarına atanması ve biraz daha büyük sayıların, IBM'in PC donanımında kullanıldığı şekliyle genişletilmiş ASCII kodlamasının varyasyonlarına atıfta bulunması gerçeğinde yansıtılır .

Yayımlanmasıyla birlikte PC DOS sürüm 3.3 (ve yakın özdeş MS-DOS kod sayfa numaraları (ve ifade "kod sayfası") yeni komutlar kullanılmıştır olarak 3.3), IBM, normal bilgisayar kullanıcılarına kod sayfası numaralandırma sistemini tanıttı İşletim sisteminin tüm bölümleri tarafından kullanılan karakter kodlamasının sistematik bir şekilde ayarlanmasına izin verin.

IBM ve Microsoft, 1990'larda işbirliğini bıraktıktan sonra, iki şirket, atanan kod sayfa numaralarının listesini birbirinden bağımsız olarak korudu ve bu da bazı çakışan atamalara neden oldu. En az bir üçüncü taraf satıcının ( Oracle ) ayrıca kendi farklı sayısal atama listesi vardır. IBM'in mevcut atamaları CCSID deposunda listelenirken , Microsoft'un atamaları MSDN içinde belgelenmiştir . Ayrıca, herhangi bir Windows makinesinde kurulu kod sayfalarının adlarının ve yaklaşık IANA ( Internet Assigned Numbers Authority ) kısaltmalarının bir listesi, o makinedeki Kayıt Defteri'nde bulunabilir (bu bilgi, Internet Explorer gibi Microsoft programları tarafından kullanılır ).

CJK dilleri ve Vietnamca için olanlar hariç, en iyi bilinen kod sayfaları, tüm kod noktalarını sekiz bite sığdırır ve her bir kod noktasını tek bir karaktere eşlemekten başka bir şey içermez; ayrıca karakterleri birleştirme, karmaşık komut dosyaları vb. gibi teknikler dahil değildir.

Standart ( VGA uyumlu ) PC grafik donanımının metin modu, 8 bitlik bir kod sayfası kullanılarak oluşturulmuştur, ancak biraz renk derinliğinden ödün vererek ikisini aynı anda kullanmak mümkündür ve ekran bağdaştırıcısında sekiz adede kadar saklanabilir kolay geçiş için. Bu tür donanımlara yüklenebilecek bir dizi üçüncü taraf kod sayfası yazı tipi vardı. Ancak, işletim sistemi satıcılarının, grafik modunda çalışan kendi karakter kodlama ve işleme sistemlerini sağlamaları ve bu donanım sınırlamasını tamamen aşmaları artık yaygın bir uygulamadır. Bununla birlikte, e-posta ve web sayfaları gibi çeşitli protokollerde kullanım için IETF ve IANA tarafından belirtilenler gibi dize tanımlayıcılarına etkili bir alternatif olarak, bir kod sayfa numarasıyla karakter kodlamalarına atıfta bulunulan sistem uygulanabilir olmaya devam etmektedir.

ASCII ile İlişki

Halen kullanılmakta kod sayfalarının çoğunluğunun süpersetler olan ASCII , 128 denetim kodlarını ve yazdırılabilir karakterleri temsil eden bir 7 bit kodu. Uzak geçmişte, ASCII kodunun 8 bitlik uygulamaları, üst biti sıfıra ayarlar veya ağ veri iletimlerinde eşlik biti olarak kullanırdı. Üst bit, karakter verilerini temsil etmek için kullanılabilir hale getirildiğinde, toplam 256 karakter ve kontrol kodu gösterilebilir. Çoğu satıcı (IBM dahil), bu genişletilmiş aralığı, çeşitli diller tarafından kullanılan karakterleri ve salt metin çıktı aygıtlarında ilkel grafiklerin taklit edilmesini sağlayan grafik öğelerini kodlamak için kullandı. Bu "genişletilmiş ASCII karakter kümeleri" için hiçbir resmi standart mevcut değildi ve satıcılar, IBM'in EBCDIC kodlamalarının varyantları için her zaman yaptığı gibi, varyantları kod sayfaları olarak adlandırdı.

Unicode ile İlişki

Unicode, şu anda ve geçmişte kullanılan tüm insan dillerinden tüm karakterleri tek karakterli numaralandırmaya (etkin bir şekilde büyük bir tek kod sayfası) dahil etme çabasıdır ve dijital olarak depolanmış metinleri işlerken farklı kod sayfaları arasında ayrım yapma ihtiyacını ortadan kaldırır. Unicode, tasarım sürecinde bazı kod sayfalarını 1:1 kopyalayarak birçok eski kod sayfasıyla geriye dönük uyumluluğu korumaya çalışır. Unicode'un açık bir tasarım hedefi, tüm yaygın eski kod sayfaları arasında gidiş-dönüş dönüştürmeye izin vermekti, ancak bu hedefe her zaman ulaşılamamıştı. Bazı satıcılar, yani IBM ve Microsoft, Unicode kodlamalarına anakronik olarak kod sayfa numaraları atamıştır. Bu kural, ikili depolanmış verilerle karşılaşıldığında doğru kod çözme algoritmasını tanımlamak için kod sayfa numaralarının meta veri olarak kullanılmasına izin verir.

IBM kod sayfaları

EBCDIC tabanlı kod sayfaları

Bu kod sayfaları, IBM tarafından ana bilgisayar bilgisayarları için EBCDIC karakter kümelerinde kullanılır .

  • 1 – ABD WP, Orijinal
  • 2 – ABD
  • 3 – ABD Muhasebesi, Versiyon A
  • 4 – ABD
  • 5 – ABD
  • 6 – Latin Amerika
  • 7 – Almanya FR / Avusturya
  • 8 – Almanya FR
  • 9 – Fransa, Belçika
  • 10 – Kanada (İngilizce)
  • 11 – Kanada (Fransızca)
  • 12 – İtalya
  • 13 – Hollanda
  • 14 –
  • 15 – İsviçre (Fransızca)
  • 16 – İsviçre (Fransızca / Almanca)
  • 17 – İsviçre (Almanca)
  • 18 – İsveç / Finlandiya
  • 19 – İsveç / Finlandiya WP, sürüm 2
  • 20 – Danimarka/Norveç
  • 21 – Brezilya
  • 22 – Portekiz
  • 23 – Birleşik Krallık
  • 24 – Birleşik Krallık
  • 25 – Japonya (Latince)
  • 26 – Japonya (Latince)
  • 27 – Yunanistan (Latince)
  • 28 –
  • 29 – İzlanda
  • 30 – Türkiye
  • 31 – Güney Afrika
  • 32 – Çekoslovakya (Çek / Slovakça)
  • 33 – Çekoslovakya
  • 34 – Çekoslovakya
  • 35 – Romanya
  • 36 – Romanya
  • 37 – ABD/Kanada - CECP (euro ile aynı: 1140)
  • 37-2 – C/370 tarafından kullanıldığı şekliyle gerçek 3279 APL kod sayfası. Bu, şapka ve işaretsiz ters çevrilmiş hariç, 1047'ye çok yakındır. SHARE, varlığına işaret etmesine rağmen, IBM tarafından resmi olarak tanınmamaktadır.
  • 38 – ABD ASCII
  • 39 – Birleşik Krallık / İsrail
  • 40 – Birleşik Krallık
  • 251 – Çin
  • 252 – Polonya
  • 254 – Macaristan
  • 256 – Uluslararası #1 (500 ile değiştirildi)
  • 257 – Uluslararası 2.
  • 258 – Uluslararası #3
  • 259 – Semboller, Set 7
  • 260 – Kanada Fransızcası – 116
  • 264 – Baskı Treni ve Metin işleme genişletildi
  • 273 – Almanya FR/Avusturya - CECP (euro ile aynı: 1141)
  • 274 – Eski Belçika Kod Sayfası
  • 275 – Brezilya - CECP
  • 276 – Kanada (Fransızca) – 94
  • 277 – Danimarka, Norveç - CECP (euro ile aynı: 1142)
  • 278 – Finlandiya, İsveç - CECP (euro ile aynı: 1143)
  • 279 – Fransızca - 94
  • 280 – İtalya - CECP (euro ile aynı: 1144)
  • 281 – Japonya (Latince) - CECP
  • 282 – Portekiz - CECP
  • 283 – İspanya – 190
  • 284 – İspanya/Latin Amerika - CECP (euro ile aynı: 1145)
  • 285 – Birleşik Krallık - CECP (euro ile aynı: 1146)
  • 286 – Avusturya / Almanya FR Alternatif
  • 287 – Danimarka / Norveç Alternatif
  • 288 – Finlandiya / İsveç Alternatif
  • 289 – İspanya Alternatif
  • 290 – Japonca (Katakana) Genişletilmiş
  • 293 – APL
  • 297 – Fransa (euro ile aynı: 1147)
  • 298 – Japonya (Katakana)
  • 300 – Japonya (Kanji) DBCS (JIS X 0213 için)
  • 310 – Grafik Kaçış APL/TN
  • 320 – Macaristan
  • 321 - Yugoslavya
  • 322 – Türkiye
  • 330 – Uluslararası #4
  • 351 – GDDM varsayılanı
  • 352 – Yazdırma ve yayınlama seçeneği
  • 353 – BCDIC-A
  • 355 – PTTC/BCD standart seçeneği
  • 357 – PTTC/BCD H seçeneği
  • 358 – PTTC/BCD Yazışma seçeneği
  • 359 – PTTC/BCD Monocase seçeneği
  • 360 – PTTC/BCD Duocase seçeneği
  • 361 – EBCDIC Publishing International
  • 363 – Semboller, set 8
  • 382 – EBCDIC Publishing Avusturya, Almanya FR Alternatif
  • 383 – EBCDIC Yayıncılık Belçika
  • 384 – EBCDIC Yayıncılık Brezilya
  • 385 – EBCDIC Publishing Canada (Fransızca)
  • 386 – EBCDIC Yayıncılık Danimarka, Norveç
  • 387 – EBCDIC Publishing Finlandiya, İsveç
  • 388 – EBCDIC Yayıncılık Fransa
  • 389 – EBCDIC Yayıncılık İtalya
  • 390 – EBCDIC Publishing Japan (Latince)
  • 391 – EBCDIC Yayıncılık Portekiz
  • 392 – EBCDIC Yayıncılık İspanya, Filipinler
  • 393 – EBCDIC Publishing Latin Amerika (İspanyolca Konuşma)
  • 394 – EBCDIC Publishing China (Hong Kong), Birleşik Krallık, İrlanda
  • 395 – EBCDIC Publishing Avustralya, Yeni Zelanda, ABD, Kanada (İngilizce)
  • 410 – Kiril (revizyonlar: 880, 1025, 1154)
  • 420 – Arapça
  • 421 – Mağrip/Fransızca
  • 423 – Yunanca (yerini 875 almıştır)
  • 424 – İbranice (Bülten Kodu)
  • 425 – OS/390 Open Edition için Arapça / Latince
  • 435 – Teletekst İzomorfik
  • 500 – Uluslararası #5 (ECECP; 256'nın yerine geçer) (euro ile aynı: 1148)
  • 803 – İbranice Karakter Seti A (Eski Kod)
  • 829 – Host Math Symbols – Yayıncılık
  • 833 – Korece Genişletilmiş (SBCS)
  • 834 – Korece Hangul (KSC5601; UDC'li DBCS)
  • 835 – Geleneksel Çince DBCS
  • 836 – Basitleştirilmiş Çince Genişletilmiş
  • 837 – Basitleştirilmiş Çince DBCS
  • 838 – Düşük İşaretli ve Aksanlı Karakterli Tayca (euro ile aynı: 1160)
  • 839 – Tay DBCS
  • 870 – Latince 2 (euro ile aynı: 1153) (revizyon: 1110)
  • 871 – İzlanda (euro ile aynı: 1149)
  • 875 - Yunanca (423'ün yerine geçer)
  • 880 – Kiril (410'un revizyonu) (revizyonlar: 1025, 1154)
  • 881 – Amerika Birleşik Devletleri - 5080 Grafik Sistemi
  • 882 – Birleşik Krallık - 5080 Grafik Sistemi
  • 883 – İsveç - 5080 Grafik Sistemi
  • 884 – Almanya - 5080 Grafik Sistemi
  • 885 – Fransa - 5080 Grafik Sistemi
  • 886 – İtalya - 5080 Grafik Sistemi
  • 887 – Japonya - 5080 Grafik Sistemi
  • 888 – Fransa AZERTY - 5080 Grafik Sistemi
  • 889 – Tayland
  • 890 - Yugoslavya
  • 892 – EBCDIC, OCR A
  • 893 – EBCDIC, OCR B
  • 905 – Latince 3
  • 918 – Urduca İki Dilli
  • 924 - Latince 9
  • 930 – Japan MIX (290 + 300) (euro ile aynı: 1390)
  • 931 – Japonya MIX (37 + 300)
  • 933 – Korea MIX (833 + 834) (euro ile aynı: 1364)
  • 935 – Basitleştirilmiş Çince MIX (836 + 837) (euro ile aynı: 1388)
  • 937 – Geleneksel Çin KARIŞIMI (37 + 835) (euro ile aynı: 1371)
  • 939 – Japan MIX (1027 + 300) (euro ile aynı: 1399)
  • 1001 – MİKRO
  • 1002 – EBCDIC DCF Sürüm 2 Uyumluluğu
  • 1003 – EBCDIC DCF, US Text alt kümesi
  • 1005 – EBCDIC İzomorfik Metin İletişimi
  • 1007 – EBCDIC Arapça (XCOM2)
  • 1024 – EBCDIC T.61
  • 1025 – Kiril, Çok Dilli (euro ile aynı: 1154) (880 revizyonu)
  • 1026 – EBCDIC Türkiye (Latin 5) (euro ile aynı: 1155) (o ülkede 905'in yerine geçer)
  • 1027 – Japonca (Latin) Genişletilmiş (JIS X 0201 Genişletilmiş)
  • 1028 – EBCDIC Yayıncılık İbranice
  • 1030 – Japonca (Katakana) Genişletilmiş
  • 1031 - Japonca (Latin) Genişletilmiş
  • 1032 – MICR, E13-B Kombine
  • 1033 – MICR, CMC-7 Kombine
  • 1037 – Kore - 5080/6090 Grafik Sistemi
  • 1039 – GML Uyumluluğu
  • 1047 – Latince 1/Açık Sistemler
  • 1068 – DCF Uyumluluğu
  • 1069 - Latince 4
  • 1070 – ABD / Kanada Sürüm 0 ([[Kod sayfası 37 Sürüm 0)
  • 1071 – Almanya FR / Avusturya
  • 1073 – Brezilya
  • 1074 – Danimarka, Norveç
  • 1075 – Finlandiya, İsveç
  • 1076 – İtalya
  • 1077 – Japonya (Latince)
  • 1078 – Portekiz
  • 1079 – İspanya / Latin Amerika Sürüm 0 ([[Kod sayfası 284 Sürüm 0)
  • 1080 – Birleşik Krallık
  • 1081 – Fransa Sürüm 0 ([[Kod sayfası 297 Sürüm 0)
  • 1082 – İsrail (İbranice)
  • 1083 – İsrail (İbranice)
  • 1084 – International#5 Sürüm 0 ([[Kod sayfası 500 Sürüm 0)
  • 1085 – İzlanda
  • 1087 – Sembol Seti
  • 1091 – Değiştirilmiş Semboller, Set 7
  • 1093 – IBM Logosu
  • 1097 – Farsça İki Dilli
  • 1110 – Latince 2 (870 Revizyonu)
  • 1112 – Baltık Çok Dilli (euro ile aynı: 1156)
  • 1113 - Latince 6
  • 1122 – Estonya (euro ile aynı: 1157)
  • 1123 – Kiril, Ukrayna (euro ile aynı: 1158)
  • 1130 – Vietnamca (euro ile aynı: 1164)
  • 1132 – Lao EBCDIC
  • 1136 - Hitachi Katakana
  • 1137 – Devanagari EBCDIC
  • 1140 – ABD, Kanada, vb. ECECP (euro hariç aynı: 37) (Geleneksel Çince versiyon: 1159)
  • 1141 – Avusturya, Almanya ECECP (euro hariç aynı: 273)
  • 1142 – Danimarka, Norveç ECECP (euro hariç aynı: 277)
  • 1143 – Finlandiya, İsveç ECECP (euro hariç aynı: 278)
  • 1144 – İtalya ECECP (euro hariç aynı: 280)
  • 1145 – İspanya, Latin Amerika (İspanyolca) ECECP (euro hariç aynı: 284)
  • 1146 – Birleşik Krallık ECECP (euro hariç aynı: 285)
  • 1147 – Euro ile Fransa ECECP (euro olmadan aynı: 297)
  • 1148 – Euro ile Uluslararası ECECP (euro olmadan aynı: 500)
  • 1149 – İzlanda ECECP'si euro ile (euro olmadan aynı: 871)
  • 1150 – Korece Genişletilmiş kutu karakterleriyle
  • 1151 - Kutu karakterleriyle Genişletilmiş Basitleştirilmiş Çince
  • 1152 – Kutu karakterleriyle Genişletilmiş Geleneksel Çince
  • 1153 – Latince 2 Euro ile çok dilli (euro olmadan aynı: 870)
  • 1154 – Kiril, Euro ile çok dilli (euro olmadan aynı: 1025; eski sürüm * 1166)
  • 1155 – Euro ile Türkiye (euro olmadan aynı: 1026)
  • 1156 – Baltık Multi euro ile (euro olmadan aynı: 1112)
  • 1157 – Euro ile Estonya (euro olmadan aynı: 1122)
  • 1158 – Kiril, Ukrayna euro ile (euro olmadan aynı: 1123)
  • 1159 – T-Chinese EBCDIC (Geleneksel Çin euro güncellemesi * 1140)
  • 1160 – Düşük İşaretli Tay Dili ve Euro ile Aksanlı Karakterler (euro olmadan aynı: 838)
  • 1164 – Euro ile Vietnamca (euro olmadan aynı: 1130)
  • 1165 – Latince 2/Açık Sistemler
  • 1166 – Kiril Kazakçası
  • 1278 – EBCDIC Adobe (PostScript) Standart Kodlama
  • 1279 – Hitachi Japonca Katakana Sunucusu
  • 1303 – EBCDIC Barkodu
  • 1364 – Korea MIX (833 + 834 + euro) (euro hariç aynı: 933)
  • 1371 – Geleneksel Çin KARIŞIMI (1159 + 835) (euro hariç aynı: 937)
  • 1376 – HKSCS için Geleneksel Çince DBCS Ana Bilgisayar uzantısı
  • 1377 – Karışık Konak HKSCS Büyüyor (37 + 1376)
  • 1388 – Basitleştirilmiş Çince MIX (euro hariç aynı: 935) (836 + 837 + euro)
  • 1390 – Basitleştirilmiş Çince MIX Japan MIX (euro hariç aynı: 930) (290 + 300 + euro)
  • 1399 – Japan MIX (1027 + 300 + euro) (euro hariç aynı: 939)

DOS kod sayfaları

Bu kod sayfaları, IBM tarafından PC DOS işletim sisteminde kullanılır. Bu kod sayfaları, orijinal olarak , karakter kümeleri yalnızca yazı tipini içeren bir ROM yongasının fiziksel olarak değiştirilmesiyle değiştirilebilen orijinal MDA ve CGA bağdaştırıcıları da dahil olmak üzere, IBM PC ve klonları ile kullanılan grafik bağdaştırıcılarının metin modu donanımına doğrudan yerleştirildi . Bu bağdaştırıcıların arabirimi (VGA gibi sonraki tüm bağdaştırıcılar tarafından öykünülmüş) tipik olarak, her yazı tipinde/kodlamada yalnızca 256 karakter içeren tek baytlık karakter kümeleriyle sınırlıydı (VGA, biraz daha büyük karakter kümeleri için kısmi destek eklemiş olsa da).

  • 301 – IBM-PC Japonya (Kanji) DBCS
  • 437 – Orijinal IBM PC donanım kod sayfası
  • 720 – Arapça (Şeffaf ASMO)
  • 737Yunanca
  • 775 - Latince-7
  • 808 – Euro ile Rusça (euro olmadan aynı: 866 )
  • 848 – Euro ile Ukraynaca (euro olmadan aynı: 1125 )
  • 849 – Beyaz Rusya, euro ile (euro olmadan aynı: 1131 )
  • 850 – Latince-1
  • 851 – Yunanca
  • 852 – Latince-2
  • 853 – Latince-3
  • 855Kiril (euro ile aynı: 872 )
  • 856İbranice
  • 857 - Latince-5
  • 858Euro sembollü Latin-1
  • 859 - Latince-9
  • 860Portekizce
  • 861İzlandaca
  • 862İbranice
  • 863Kanada Fransızcası
  • 864Arapça
  • 865Danca / Norveççe
  • 866 – Beyaz Rusça, Rusça, Ukraynaca (euro ile aynı: 808 )
  • 867İbranice + euro (CP862'ye dayalıdır) (çatışmalı ID: NEC Çekçe (Kamenický) , bu kod sayfasından önce oluşturulmuş)
  • 868Urduca
  • 869Yunanca
  • 872 – Euro ile Kiril (euro olmadan aynı: 855 )
  • 874 – Düşük Ton İşaretleri ve Eski Karakterlerle Tay Dili (Windows 874 ile çakışan kimlik; euro ile sürüm: 1161 Windows sürümü: IBM 1162'dir )
  • 876 – OCR A
  • 877 – OCR B
  • 878KOI8-R
  • 891 – Korece PC SBCS
  • 898 – IBM-PC WP Çok Dilli
  • 899 – IBM-PC Sembolü
  • 903 – Basitleştirilmiş Çince PC SBCS
  • 904 – Geleneksel Çince PC SBCS
  • 906 – Uluslararası Set #5 3812/3820
  • 907 – ASCII APL (3812)
  • 909 – IBM-PC APL2 Genişletilmiş
  • 910 – IBM-PC APL2
  • 911 – IBM-PC Japonya #1
  • 926 – Korece PC DBCS
  • 927 – Geleneksel Çince PC DBCS
  • 928 – Basitleştirilmiş Çince PC DBCS
  • 929 – Tay PC DBCS
  • 932 – IBM-PC Japan MIX (DOS/V) (DBCS) ( 897 + 301 ) (Windows 932 ile çakışan kimlik; Windows sürümü IBM 943)
  • 934 – IBM-PC Korea MIX (DOS/V) (DBCS) ( 891 + 926 )
  • 936 – IBM-PC Basitleştirilmiş Çince MIX (gb2312) (DOS/V) (DBCS) ( 903 + 928 ) (Windows 936 ile çakışan kimlik; Windows sürümü IBM 1386'dır)
  • 938 – IBM-PC Geleneksel Çince MIX (DOS/V, OS/2) ( 904 + 927 )
  • 942 – IBM-PC Japan MIX (Japon SAA (OS/2)) ( 1041 + 301 )
  • 943 – IBM-PC Japonya AÇIK ( 897 + 941 ) (Windows CP 932)
  • 944 – IBM-PC Korea MIX (Kore SAA (OS/2)) ( 1040 + 926 )
  • 946 – IBM-PC Basitleştirilmiş Çince (Basitleştirilmiş Çince SAA (OS/2)) ( 1042 + 928 )
  • 948 – IBM-PC Geleneksel Çince (Geleneksel Çince SAA (OS/2)) ( 1043 + 927 )
  • 949 – Korece (Genişletilmiş Wansung (ks_c_5601-1987)) ( 1088 + 951 ) (Windows 949 (Birleşik Hangul Kodu) ile çakışan kimlik; Windows sürümü IBM 1363)
  • 951 - Korece DBCS (IBM KS Kodu) (Windows 951 ile çakışan kimlik, dosya adına dayalı olarak HKSCS'de bulunan bazı PUA Unicode karakterleri için Unicode eşlemeli Windows 950 hack'i)
  • 1034 – Yazıcı Uygulaması - Sevkiyat Etiketi, Set #2
  • 1040 – Korece Genişletilmiş
  • 1041 – Genişletilmiş Japonca (JIS X 0201 Genişletilmiş)
  • 1042 – Basitleştirilmiş Çince Genişletilmiş
  • 1043 – Geleneksel Çince Genişletilmiş
  • 1044 – Yazıcı Uygulaması - Sevkiyat Etiketi, Set #1
  • 1086 – IBM-PC Japonya #1
  • 1088 – Gözden geçirilmiş Korece (SBCS)
  • 1092 – IBM-PC Değiştirilmiş Semboller
  • 1098Farsça
  • 1108 – DITROFF Baz Uyumluluğu
  • 1109 – DITROFF Özel Uyumluluk
  • 1115 – IBM-PC Çin Halk Cumhuriyeti
  • 1116 – Estonca
  • 1117 – Letonca
  • 1118 – Litvanca (IBM'nin Lika'nın kod sayfası 774 uygulaması )
  • 1119 – Litvanca ve Rusça (IBM'nin Lika'nın kod sayfasını uygulaması 772 )
  • 1125 – Kiril, Ukraynaca (euro ile aynı: 848 ) (RUSCII'nin IBM modifikasyonu )
  • 1127 – IBM-PC Arapça / Fransızca
  • 1131 – IBM-PC Verileri, Kiril, Beyaz Rusça (euro ile aynı: 849 )
  • 1139 – Japonya Alfanümerik Katakana
  • 1161 – Düşük Ton İşaretli Tay ve Euro ile Eski Karakterler (euro hariç aynı: 874 )
  • 1167KOI8-RU
  • 1168KOI8-U
  • 1300 – ANSI [PTS-DOS 6.70, 6.51 değil]
  • 1370 – Geleneksel Çince MIX ( Big5 kodlaması ) ( 1114 + 947 + euro) (euro hariç aynı: 950 )
  • 1380 – IBM-PC Basitleştirilmiş Çince GB PC-DATA (DBCS PC IBM GB 2312-80)
  • 1381 – IBM-PC Basitleştirilmiş Çince ( 1115 + 1380 )
  • 1393 – Japonca JIS X 0213 DBCS
  • 1394 – IBM-PC Japonya (JIS X 0213) ( 897 + 1393 )

Eski donanımlar, protokoller ve dosya formatlarıyla uğraşırken, genellikle bu kod sayfalarını desteklemek gerekir, ancak daha yeni kodlama sistemleri, özellikle Unicode, yeni tasarımlar için teşvik edilir.

DOS kod sayfaları genellikle .CPI dosyalarında depolanır.

IBM AIX kod sayfaları

Bu kod sayfaları, IBM tarafından AIX işletim sisteminde kullanılır. UNIX benzeri işletim sistemleri gibi ISO'ya göre kullanılmak üzere tasarlanmış olanlar olmak üzere çeşitli karakter kümelerini öykünürler.

Kod sayfası 819, Latin-1, ISO/IEC 8859-1 ile aynıdır ve biraz değiştirilmiş komutlarla, MS-DOS makinelerinin bu kodlamayı kullanmasına izin verir. IBM AS/400 mini bilgisayarları ile kullanıldı.

IBM OS/2 kod sayfaları

Bu kod sayfaları, IBM tarafından OS/2 işletim sisteminde kullanılır.

  • 1004 – Latin-1 Genişletilmiş, Masa Üstü Yayıncılık/Windows

Windows öykünme kodu sayfaları

Bu kod sayfaları, Microsoft Windows karakter kümelerini taklit ederken IBM tarafından kullanılır . Bu kod sayfalarının çoğu, tam olarak aynı olmasalar da, Microsoft kod sayfalarıyla aynı numaraya sahiptir . Yine de bazı kod sayfaları IBM'den yenidir, Microsoft tarafından tasarlanmamıştır.

Macintosh öykünme kodu sayfaları

Bu kod sayfaları, Apple Macintosh karakter kümelerini taklit ederken IBM tarafından kullanılır .

  • 1275 – Elma Roma
  • 1280 – Elma Yunanca
  • 1281 – Elma Türkçesi
  • 1282 – Elma Orta Avrupa
  • 1283 – Elma Kiril
  • 1284 – Elma Hırvatçası
  • 1285 – Elma Romence
  • 1286 – Elma İzlandaca

Adobe öykünme kodu sayfaları

Bu kod sayfaları, Adobe karakter kümelerinin öykünmesi sırasında IBM tarafından kullanılır .

  • 1038 – Adobe Sembol Kodlaması
  • 1276 – Adobe (PostScript) Standart Kodlama
  • 1277 – Adobe (PostScript) Latince 1

HP öykünme kodu sayfaları

Bu kod sayfaları, HP karakter kümelerinin öykünmesi sırasında IBM tarafından kullanılır .

DEC öykünme kodu sayfaları

Bu kod sayfaları, DEC karakter kümelerinin öykünmesi sırasında IBM tarafından kullanılır .

  • 1020 – 7-bit Kanada (Fransızca) NRC Seti
  • 1021 – 7-bit İsviçre NRC Seti
  • 1023 – 7-bit İspanyol NRC Seti
  • 1090 – Özel Karakterler ve Çizgi Çizme Seti
  • 1100 – Aralık Çokuluslu
  • 1101 – 7-bit İngiliz NRC Seti
  • 1102 – 7-bit Hollanda NRC Seti
  • 1103 – 7-bit Fin NRC Seti
  • 1104 – 7-bit Fransız NRC Seti
  • 1105 – 7-bit Norveç/Danimarka NRC Seti
  • 1106 – 7-bit İsveç NRC Seti
  • 1107 – 7-bit Norveç/Danimarka NRC Alternatif
  • 1287 – Aralık Yunanca
  • 1288 – Aralık Türkçe

IBM Unicode kod sayfaları

Microsoft kod sayfaları

Windows kod sayfaları

Bu kod sayfaları Microsoft tarafından kendi Windows işletim sisteminde kullanılmaktadır. Microsoft , ANSI kod sayfaları olarak bilinen bir dizi kod sayfası tanımladı (ilk sayfa olarak, 1252, ISO 8859-1 haline gelenin uydurma bir ANSI taslağına dayanıyordu ). Kod sayfası 1252, ISO 8859-1'de oluşturulmuştur ancak ekstra yazdırılabilir karakterler için ISO 8859-1'de belirtilen ISO 6429'daki C1 kontrol kodları yerine 0x80-0x9F aralığını kullanır . Diğerlerinden bazıları kısmen ISO 8859'un diğer bölümlerine dayanmaktadır, ancak genellikle onları 1252'ye yaklaştıracak şekilde yeniden düzenlenmiştir.

Microsoft, yeni uygulamaların bu kod sayfaları yerine UTF-8 veya UCS-2/UTF-16 kullanmasını önerir.

DBCS kod sayfaları

Bu kod sayfaları , çeşitli CJK dilleri için DBCS karakter kodlamalarını temsil eder . Microsoft işletim sistemlerinde bunlar, geçerli yerel ayar için hem "OEM" hem de "Windows" kod sayfası olarak kullanılır.

MS-DOS kod sayfaları

Bu kod sayfaları, Microsoft tarafından MS-DOS işletim sisteminde kullanılmaktadır. Microsoft bunları OEM kod sayfaları olarak adlandırır, çünkü bunlar Microsoft veya bir standart kuruluşu tarafından değil, donanımlarıyla birlikte dağıtılmak üzere MS-DOS'u lisanslayan orijinal ekipman üreticileri tarafından tanımlanmıştır . Bu kod sayfalarının çoğu, tam olarak aynı olmasalar da, eşdeğer IBM kod sayfalarıyla aynı numaraya sahiptir . IBM ve Microsoft'tan bazı kod sayfalarında minimum farklılıklar vardır.

Macintosh öykünme kodu sayfaları

Bu kod sayfaları, Apple Macintosh karakter kümelerini taklit ederken Microsoft tarafından kullanılır .

Diğer çeşitli Microsoft kod sayfaları

Aşağıdaki kod sayfa numaraları Microsoft Windows'a özeldir. IBM, bu kod sayfaları için farklı numaralar kullanabilir. UNIX benzeri işletim sistemleri gibi ISO'ya göre kullanılmak üzere tasarlanmış olanlar olmak üzere çeşitli karakter kümelerini öykünürler.

Microsoft Unicode kod sayfaları

HP Sembol Setleri

HP, kendi karakter setlerini veya diğer satıcıların karakter setlerini kodlamak için bir dizi Sembol Seti (her biri ilgili Sembol Seti Kodu ile) geliştirmiştir. Bunlar normalde 7 bitlik karakter kümeleridir ve üst kısma taşındıklarında ve ASCII karakter kümesiyle ilişkilendirildiğinde 8 bitlik karakter kümelerini oluştururlar.

HP'nin kendi Sembol Setleri

  • Sembol Seti 0E — HP Roman Uzantısı — aksanlı harflerle 7 bit karakter seti (IBM tarafından kod sayfası 1050 olarak kodlanmıştır )
  • Sembol Seti 0G — HP 7-bit Almanca
  • Sembol Seti 0L — HP Line Draw (IBM tarafından kod sayfası 1056 olarak kodlanmıştır )
  • 0M Sembol Seti — HP Math-7
  • 0T Sembol Seti — HP Thai-8
  • Sembol Seti 1S — HP 7-bit İspanyolca
  • Sembol Seti 1U — HP 7-bit Gothic Legal (IBM tarafından kod sayfası 1052 olarak kodlanmıştır )
  • Sembol Seti 4Q — 7-bit PC Hattı (IBM tarafından kod sayfası 1055 olarak kodlanmıştır )
  • Sembol Seti 4U — HP Roman-9 — Roman-8 + €
  • Sembol Seti 7J — HP Masaüstü
  • Sembol Seti 7S — HP 7-bit Avrupa İspanyolcası
  • Sembol Seti 8E — HP East-8
  • Sembol Seti 8G — HP Yunanca-8 (IR 088'e göre; ELOT 927'ye göre değil)
  • Sembol Seti 8H — HP İbranice-8
  • Sembol Seti 8I — MS LineDraw (ASCII + HP PC Line)
  • Sembol Seti 8K — HP Kana-8 (ASCII + Japonca Katakana)
  • Sembol Seti 8L — HP LineDraw (ASCII + HP Line Draw)
  • Sembol Seti 8M — HP Math-8 (ASCII + HP Math-8)
  • Sembol Seti 8R — HP Kiril-8
  • Sembol Seti 8S — HP 7-bit Latin Amerika İspanyolcası
  • Sembol Seti 8T — HP Turkish-8
  • Sembol Seti 8U — HP Roman-8 (ASCII + HP Roman Uzantısı; IBM tarafından kod sayfası 1051 olarak kodlanmıştır )
  • Sembol Seti 8V — HP Arapça-8
  • Sembol Seti 9K — HP Korece-8
  • Sembol Seti 9T — PC 8T (Kod Sayfası 437-T olarak da bilinir; bu kod sayfası 857 değildir )
  • Sembol Seti 9V — Windows için Latince / Arapça (bu, kod sayfası 1256 değildir )
  • Sembol Seti 11U — PC 8D/N (Kod Sayfası 437-N olarak da bilinir; IBM tarafından kod sayfası 1058 olarak kodlanmıştır ; bu kod sayfası 865 değildir )
  • Sembol seti 14G — PC-8 Yunanca Alternatif (Kod Sayfası 437-G olarak da bilinir; kod sayfası 737 ile hemen hemen aynı )
  • Sembol Seti 18K —
  • Sembol Seti 18T —
  • Sembol Seti 19C —
  • Sembol Seti 19K —

Diğer satıcılardan Sembol Setleri

  • Sembol Seti 0D — ISO 60: 7-bit Norveççe
  • Sembol Seti 0F — ISO 25: 7-bit Fransızca
  • Sembol Seti 0H — HP 7-bit İbranice — İsrail Standardı SI 960 ile hemen hemen aynı
  • Sembol Seti 0I — ISO 15: 7-bit İtalyanca
  • Sembol Seti 0K — ISO 14: 7-bit Japonca Katakana
  • Sembol Kümesi 0N — ISO 8859-1 Latin 1 (Başlangıçta "Gotik-1" olarak adlandırılır; IBM tarafından kod sayfası 1052 olarak kodlanmıştır)
  • Sembol Seti 0R — ISO 8859-5 Latin/Kiril (1986 versiyonu — IR 111)
  • Sembol Seti 0S — ISO 11: 7-bit İsveççe
  • Sembol Seti 0U — ISO 6: 7-bit ABD
  • 0V Sembol Seti — Arapça
  • Sembol Seti 1D — ISO 61: 7-bit Norveççe
  • Sembol Seti 1E — ISO 4: 7-bit İngiltere
  • Sembol Seti 1F — ISO 69: 7-bit Fransızca
  • Sembol Seti 1G — ISO 21: 7-bit Almanca
  • Sembol Seti 1K — ISO 13: 7-bit Japonca Latin
  • Sembol Seti 1T — Windows Tay Dili (Pratik olarak 874 ile aynı )
  • Sembol Seti 2K — ISO 57: 7-bit Basitleştirilmiş Çince Latince
  • Sembol Seti 2N — ISO 8859-2 Latince 2
  • Sembol Seti 2S — ISO 17: 7-bit İspanyolca
  • Sembol Seti 2U — ISO 2: 7-bit Uluslararası Saygı Versiyonu
  • Sembol Seti 3N — ISO 8859-3 Latince 3
  • Sembol Seti 3R — PC-866 Rusya (Pratik olarak kod sayfası 866 ile aynı )
  • Sembol Seti 3S — ISO 10: 7-bit İsveççe
  • Sembol Seti 4N — ISO 8859-4 Latince 4
  • Sembol Seti 4S — ISO 16: 7-bit Portekizce
  • Sembol Seti 5M — PS Matematik Sembolü (Pratik olarak Adobe Symbols ile aynı )
  • Sembol Seti 5N — ISO 8859-9 Latince 5
  • Sembol Seti 5S — ISO 84: 7-bit Portekizce
  • Sembol Seti 5T — Windows 3.1 Latin-5 (Pratik olarak kod sayfası 1254 ile aynı )
  • Sembol Seti 6J — Microsoft Publishing
  • 6M Sembol Seti — Ventura Math
  • Sembol Seti 6N — ISO 8859-10 Latince 6
  • Sembol Seti 6S — ISO 85: 7-bit İspanyolca
  • Sembol Seti 7H — ISO 8859-8 Latin/İbranice
  • Sembol Seti 9E — Windows 3.1 Latin 2 (Pratik olarak kod sayfası 1250 ile aynı )
  • Sembol Seti 9G — Windows 98 Yunanca (Pratik olarak kod sayfası 1253 ile aynı )
  • Sembol Seti 9J — PC 1004
  • Sembol Seti 9L — Ventura ITC Zapf Dingbats
  • Sembol Seti 9N — ISO 8859-15 Latince 9
  • Sembol Seti 9R — Windows 98 Kiril (Pratik olarak 1251 kod sayfasıyla aynı )
  • Sembol Kümesi 9U — Windows 3.0
  • Sembol Seti 10G — PC-851 Latin/Yunanca (Pratik olarak kod sayfası 851 ile aynı )
  • Sembol Seti 10J — PS Metni ( Adobe Standard ile hemen hemen aynı )
  • Sembol Seti 10L — PS ITC Zapf Dingbats ( Adobe Dingbats ile hemen hemen aynı )
  • Sembol Seti 10N — ISO 8859-5 Latin/Kiril (1988 versiyonu — IR 144)
  • Sembol Seti 10R — PC-855 Kiril (Pratik olarak kod sayfası 855 ile aynı )
  • Sembol Seti 10T — Teleteks
  • Sembol Seti 10U — PC-8 (Pratik olarak kod sayfası 437 ile aynı ; IBM tarafından kod sayfası 1057 olarak kodlanmıştır )
  • Sembol Seti 10V — CP-864 (Pratik olarak kod sayfası 864 ile aynı )
  • Sembol Seti 11G — CP-869 (Pratik olarak kod sayfası 869 ile aynı )
  • Sembol Seti 11J — PS ISO Latin-1 (Pratik olarak Adobe Latin-1 ile aynı )
  • Sembol Seti 11N — ISO 8859-6 Latin/Arapça
  • Sembol Seti 12G — PC Latince/Yunanca (Pratik olarak kod sayfası 737 ile aynı )
  • Sembol Seti 12J — MC Metni (Pratik olarak Macintosh Roman ile aynı )
  • Sembol Seti 12N — ISO 8859-7 Latin/Yunanca
  • Sembol Seti 12R — PC Gost (Pratik olarak PC GOST Main ile aynı )
  • Sembol Seti 12U — PC-850 Latin 1 ( Kod sayfası 850 ile hemen hemen aynı )
  • 13J Sembol Seti — Ventura International
  • Sembol Seti 13R — PC Bulgarca (Pratik olarak MIK ile aynı )
  • Sembol Seti 13U — PC-858 Latince 1 + € (Pratik olarak kod sayfası 858 ile aynı )
  • Sembol Seti 14J — Ventura TR
  • Sembol Seti 14L — Windows Dingbats
  • Sembol Seti 14P — ABICOMP International (Pratik olarak ABICOMP ile aynı )
  • Sembol Seti 14R — PC Ukraynaca (Pratik olarak RUSCII ile aynı )
  • Sembol Seti 15H — PC-862 İsrail (Pratik olarak kod sayfası 862 ile aynı )
  • Sembol Seti 16U — PC-857 Latin 5 (Pratik olarak kod sayfası 857 ile aynı )
  • Sembol Seti 17U — PC-852 Latin 2 (Pratik olarak 852 kod sayfasıyla aynı )
  • Sembol Seti 18N — UTF-8
  • Sembol Seti 18U — PC-853 Latin 3 (Pratik olarak kod sayfası 853 ile aynı )
  • Sembol Seti 19L — Windows 98 Baltık (Pratik olarak kod sayfası 1257 ile aynı )
  • Sembol Seti 19M — Windows Sembolü
  • Sembol Seti 19U — Windows 3.1 Latin 1 (Pratik olarak kod sayfası 1252 ile aynı )
  • Sembol Seti 20U — PC-860 Portekiz (Pratik olarak kod sayfası 860 ile aynı )
  • Sembol Seti 21U — PC-861 İzlanda (Pratik olarak kod sayfası 861 ile aynı )
  • Sembol Seti 23U — PC-863 Kanada - Fransızca (Pratik olarak kod sayfası 863 ile aynı )
  • Sembol Seti 24Q — PC-Polonya Mazowia (Pratik olarak Mazovia kodlaması ile aynı )
  • Sembol Seti 25U — PC-865 Danimarka/Norveç (Pratik olarak kod sayfası 865 ile aynı )
  • Sembol Seti 26U — PC-775 Latin 7 (Pratik olarak kod sayfası 775 ile aynı )
  • Sembol Seti 27Q — PC-8 PC Nova (Pratik olarak PC Nova ile aynı )
  • Sembol Seti 27U — PC Letonca Rusça (866-Letonca olarak da bilinir)
  • Sembol Seti 28U — PC Litvanca/Rusça (Pratik olarak kod sayfası 774 ile aynı )
  • Sembol Seti 29U — PC-772 Litvanca/Rusça (Pratik olarak kod sayfası 772 ile aynı )

Diğer satıcılardan kod sayfaları

Bu kod sayfaları, üçüncü taraf satıcılar tarafından yapılan bağımsız atamalardır. Orijinal IBM PC kod sayfası ( sayı 437 ) gerçekten uluslararası kullanım için tasarlanmadığından, kısmen uyumlu birkaç ülkeye veya bölgeye özgü varyantlar ortaya çıktı.

Bu kod sayfaları numarası atamaları ne IBM tarafından ne de Microsoft tarafından resmi değildir ve neredeyse hiçbiri IANA tarafından kullanılabilir karakter kümesi olarak adlandırılmamaktadır. Bu kod sayfalarına atanan numaralar isteğe bağlıdır ve IBM veya Microsoft tarafından kullanılan kayıtlı numaralarla çakışabilir. Bazıları, DOS 3.3'te eklenen kod sayfası geçişinden önce gelebilir.

  • 100 – DOS İbranice donanım yazı tipi sayfası (IBM'den değil; HDOS )
  • 111 – DOS Yunanca (IBM'den değil; AST Premium Exec DOS 5.0 )
  • 112 – DOS Türkçe (IBM'den değil; AST Premium Exec DOS 5.0)
  • 113 – DOS Yugoslav (IBM'den değil; AST Premium Exec DOS 5.0)
  • 151 – DOS Nafitha Arapça (IBM'den değil; ADOS )
  • 152 – DOS Nafitha Arapça (IBM'den değil; ADOS )
  • 161 – DOS Arapça (IBM'den değil; ADOS )
  • 162 – DOS Arapça (IBM'den değil; ADOS)
  • 163 – DOS Arapça (IBM'den değil; ADOS)
  • 164 – DOS Arapça (IBM'den değil; ADOS)
  • 165 – DOS Arapça (IBM'den değil; ADOS)
  • 166 – IBM Arapça PC (ADOS)
  • 210 – DEC DOS Yunanca (NEC Jetmate yazıcılar)
  • 220 – DEC DOS İspanyolca (IBM'den değil)
  • 489 – Çekoslovak [OCR yazılımı 1993]
  • 620 – DOS Lehçe (Mazovia) (IBM'den değil)
  • 667 – DOS Lehçe (Mazovia) (IBM'den değil)
  • 668 – DOS Lehçe (IBM'den değil)
  • 706 - MS-DOS (Not IBM'den; Sunucu Arapça Sakhr Sakhr Yazılım den MSX Bilgisayarlar)
  • 707 - MS-DOS (Not IBM'den; Arapça Sakhr Sakhr Yazılım den MSX Bilgisayarlar)
  • 711 – MS-DOS Arapça Nafitha Enhanced (IBM'den değil)
  • 714 – MS-DOS Arapça Sakr (IBM'den değil)
  • 715 – MS-DOS Arapça APTEC (IBM'den değil)
  • 721 – MS-DOS Arapça Nafitha International (IBM'den değil)
  • 768 – Arapça Al-Arabi (IBM'den değil)
  • 770 – DOS Estonca, Letonca, Litvanyaca (Litvanya Lika Yazılımından; Litvanya RST 1095-89 Ulusal Standardı)
  • 771 – DOS Litvanca/Kiril — KBL (Litvanca Lika Yazılımından)
  • 772 – DOS Litvanca/Kiril (Litvanya Lika Yazılımından; Litvanya LST 1284:1993 Ulusal Standardı; IBM tarafından kod sayfası 1119 olarak benimsenmiştir )
  • 773 – DOS Latin-7 — KBL (Litvanya Lika Yazılımından)
  • 774 – DOS Litvanca (Litvanya Lika Yazılımından; Litvanya LST 1283:1993 Ulusal Standardı; IBM tarafından kod sayfası 1118 olarak kabul edilmiştir )
  • 775 – DOS Latin-7 Baltic Rim (Litvanya Lika Yazılımından; Litvanya LST 1590-1 Ulusal Standardı; IBM ve Microsoft tarafından kod sayfası 775 olarak benimsenmiştir )
  • 776 – DOS Litvanca (genişletilmiş CP770) (Litvanca Lika Yazılımından)
  • 777 – DOS Aksanlı Litvanca (eski) (genişletilmiş CP773) — KBL (Litvanya Lika Yazılımından)
  • 778 – DOS Aksanlı Litvanca (genişletilmiş CP775) (Litvanca Lika Yazılımından)
  • 790 – DOS Lehçe (Mazovia)
  • 854 – İspanyolca
  • 881 – Latin 1 (IBM'den değil; AST Premium Exec DOS 5.0) (IBM EBCDIC 881 ile çakışan kimlik )
  • 882 – Latin 2 (ISO 8859-2) (IBM'den değil; Kod sayfası 912 ile aynı; AST Premium Exec DOS 5.0) (IBM EBCDIC 882 ile çakışan kimlik )
  • 883 – Latin 3 (IBM'den değil; AST Premium Exec DOS 5.0) (IBM EBCDIC 883 ile çakışan kimlik )
  • 884 – Latince 4 (IBM'den değil; AST Premium Exec DOS 5.0) (IBM EBCDIC 884 ile çakışan kimlik )
  • 885 – Latin 5 (IBM'den değil; AST Premium Exec DOS 5.0) (IBM EBCDIC 885 ile çakışan kimlik )
  • 895Çekçe (Kamenický) , (IBM'den değil; IBM CP895 ile çakışan kimlik — 7-bit EUC Japonca Roman)
  • 896 – DOS Lehçe (Mazovia) (IBM'den değil; IBM CP896 ile çakışan kimlik — 7-bit EUC Japonca Katakana)
  • 900 – DOS Rusça (Rusça MS-DOS 5.0 LCD.CPI)
  • 928 – Yunanca (Star yazıcılarda); Yunan Ulusal Standardı ELOT 928 ile aynı (IBM'den değil; IBM CP928 ile çakışan kimlik — Basitleştirilmiş Çince PC DBCS)
  • 966 – Suudi Arabistan (IBM'den değil)
  • 991 – DOS Lehçe (Mazovia) (IBM'den değil)
  • 999 – DOS Sırp-Hırvat I (IBM'den değil); PC Nova ve CroSCII olarak da bilinir; alt kısım JUSI.B1.002, üst kısım kod sayfası 437'dir; Slovence ve Sırp-Hırvatçayı destekler (Latin alfabesi)
  • 1001 – Arapça (Star yazıcılarda) (IBM'den değil; IBM CP1001 — MICR ile çakışan kimlik)
  • 1261 -, Windows Kore IBM 1261 LMBCS-17, benzer 1363
  • 1270 – Windows Sami
  • 2001 – Litvanya KBL (Star yazıcılarda); kod sayfası 771 ile aynı
  • 3001 – Estonca 1 (Star yazıcılarda); kod sayfası 1116 ile aynı
  • 3002 – Estonca 2 (Star yazıcılarda); kod sayfası 922 ile aynı
  • 3011 – Letonya 1 (Star yazıcılarda); kod sayfası 437-Letonya ile aynı
  • 3012 – Letonya-2 (Star yazıcılarda); kod sayfası 866-Letonya ile aynı (Letonya RST 1040-90 Ulusal Standardı)
  • 3021 – Bulgarca (Star yazıcılarda); MIK ile aynı
  • 3031 – İbranice (Star yazıcılarda); kod sayfası 862 ile aynı
  • 3041 – Maltaca (Star yazıcılarda); ISO 646 Malta ile aynı
  • 3840 – IBM-Rusça (Star yazıcılarda); CP 866 ile neredeyse aynı
  • 3841 – Gost-Russian (Star yazıcılarda); GOST 13052 artı Orta Asya dilleri için karakterler
  • 3843 – Lehçe (Star yazıcılarda); Mazovia ile aynı
  • 3844 – CS2 (Star yazıcılarda); Kamenický ile aynı
  • 3845 – Macarca (Star yazıcılarda); CWI ile aynı
  • 3846 – Türkçe (Star yazıcılarda); A8 kod noktasında PC-8 Türk + eski Türk Lirası işareti (Tʟ) ile aynı
  • 3847 – Brezilya-ABNT (Star yazıcılarda); Brezilya Ulusal Standardı NBR-9614:1986 ile aynı
  • 3848 – Brezilya-ABICOMP (Star yazıcılarda); ABICOMP ile aynı
  • 3850 – Standart KU (Star yazıcılarda); Tayca için Kasetsart Üniversitesi kodlamasının varyasyonu
  • 3860 – Rajvitee KU (Star yazıcılarda); Tayca için Kasetsart Üniversitesi kodlamasının varyasyonu
  • 3861 – Microwiz KU (Star yazıcılarda); Tayca için Kasetsart Üniversitesi kodlamasının varyasyonu
  • 3863 – STD988 TIS (Star yazıcılarda); Tay dili için TIS 620 kodlamasının varyasyonu
  • 3864 – Popüler TIS (Star yazıcılarda); Tay dili için TIS 620 kodlamasının varyasyonu
  • 3865 – Newsic TIS (Star yazıcılarda); Tay dili için TIS 620 kodlamasının varyasyonu
  • (sayı eksik) – CWI-2 (DOS için) Macarca'yı destekler
  • (sayı eksik) – MIK (DOS için) Bulgarcayı destekler
  • (sayı eksik) – DOS Sırp-Hırvatça II; Slovence ve Sırp-Hırvatçayı destekler (Latin alfabesi)
  • (sayı eksik) — Rusça Alternatif kod sayfası (DOS için); bu, IBM CP 866'nın kökenidir

Kod sayfası atamalarının listesi

Bilinen kod sayfası atamalarının listesi (tamamlanmamış):

İD İsimler Tanım Menşei Platformu DOS OS/2 pencereler Mac Başka kodlama Yorum
0 Yok Ayrılmış IBM, Microsoft Yok 3.3+ 1.0+ ? ? ? Dahili işletim sistemi kullanımı
437 CP437, IBM437 PC ABD IBM IBM bilgisayar 3.3+ 1.0+ Evet ? Evet 8 bit SBCS
57344 - 61439 Yok Özel kullanım türevleri IBM Yok Yok Yok Yok Yok Yok çeşitli Özel kullanım kodu sayfası türevleri (E000h-EFFFh)
65280 - 65533 Yok Özel kullanım tanımları IBM Yok Yok Yok Yok Yok Yok çeşitli Özel kullanım kodu sayfası tanımları (FF00h-FFFDh)
65534 Yok Ayrılmış IBM, Microsoft Yok ? ? ? ? ? çeşitli Dahili işletim sistemi kullanımı (FFFEh)
65535 Yok Ayrılmış IBM, Microsoft Yok 3.3+ 1.0+ ? ? ? çeşitli Dahili işletim sistemi kullanımı (FFFFh)

eleştiri

Birçok eski karakter kodlaması (Unicode'dan farklı olarak) çeşitli problemlerden muzdariptir. Bazı kod sayfası satıcıları, metinsel verilerin çeşitli bilgisayar sistemleri aracılığıyla tutarlı bir şekilde işlenmesinin güvenilirliğini azaltan tüm kod noktası değerlerinin anlamını yetersiz şekilde belgelemektedir. Bazı satıcılar, belirli kod noktası değerlerini eklemek veya değiştirmek için bazı kod sayfalarına özel uzantılar ekler; örneğin, Shift JIS'deki bayt 0x5C , platforma bağlı olarak ters eğik çizgi veya yen para birimi sembolünü temsil edebilir . Son olarak, Unicode kullanmayan bir programda birkaç dili desteklemek için, her dize/belge için kullanılan kod sayfasının saklanması gerekir.

Unicode'un kapsamlı dokümantasyonu, geniş karakter repertuarı ve karakterlerin kararlılık politikası nedeniyle, yukarıda listelenen sorunlar nadiren Unicode için bir endişe kaynağıdır. Uygulamalar ayrıca Windows- 1252'deki metni ISO-8859-1 olarak yanlış etiketleyebilir . Neyse ki, bu kod sayfaları arasındaki tek fark, ISO-8859-1 tarafından kontrol karakterleri için kullanılan kod noktası değerlerinin bunun yerine Windows-1252'de ek yazdırılabilir karakterler olarak kullanılmasıdır. Kontrol karakterlerinin HTML'de bir işlevi olmadığından, web tarayıcıları ISO-8859-1 yerine Windows-1252 kullanma eğilimindedir. HTML5'te ISO-8859-1'in Windows-1252 olarak ele alınması standart olarak kodlanmıştır. Daha sonra, UTF-8, İnternet'teki popülerlik açısından her iki kodlamayı da başardı.

Özel kod sayfaları

Kişisel bilgisayar tarihinin başlarında, kullanıcılar karakter kodlama gereksinimlerinin karşılanmadığını fark ettiğinde, Terminate and Stay Resident yardımcı programları kullanılarak veya BIOS EPROM'ları yeniden programlanarak özel veya yerel kod sayfaları oluşturuldu . Bazı durumlarda, resmi olmayan kod sayfa numaraları icat edildi (örn. CP895).

Daha çeşitli karakter seti desteği kullanıma sunulduğunda, bu kod sayfalarının çoğu , Çek ve Slovak alfabeleri için Kamenický veya KEYBCS2 kodlaması gibi bazı istisnalar dışında kullanım dışı kaldı . Diğer bir karakter seti, Iran System şirketi tarafından Farsça dil desteği için oluşturulmuş Iran System kodlama standardıdır . Bu standart İran'da DOS tabanlı programlarda kullanılıyordu ve Microsoft kod sayfası 1256'nın tanıtılmasından sonra bu standart geçersiz hale geldi. Ancak bu kodlamayı kullanan bazı Windows ve DOS programları hala kullanımdadır ve bu kodlamaya sahip bazı Windows yazı tipleri mevcuttur.

Bu tür sorunların üstesinden gelmek için, IBM Karakter Veri Temsil Mimarisi düzey 2, kullanıcı tarafından tanımlanabilen ve özel kullanım atamaları için özel olarak çeşitli kod sayfası kimlikleri ayırır. Bu tür kod sayfası kimlikleri kullanıldığında, kullanıcı, özellikle bununla ilgilenmediği sürece, aynı işlevsellik ve görünümün başka bir sistem yapılandırmasında veya başka bir cihazda veya sistemde yeniden üretilebileceğini varsaymamalıdır. Kod sayfası aralığı 57344-61439 ( E000h - EFFFh ) resmi olarak kullanıcı tanımlı kod sayfaları (veya aslında IBM CDRA bağlamında CCSID'ler ) için ayrılmıştır , oysa 65280-65533 ( FF00h - FFFDh ) aralığı herhangi bir kullanıcı için ayrılmıştır. tanımlanabilir "özel kullanım" atamaları. Örneğin, 437 ( 1B5h ) veya 28591 ( 6FAF ) kod sayfasının kayıtlı olmayan bir özel varyantı, diğer atamalarla olası çakışmaları önlemek ve bazen mevcut dahili verileri korumak için sırasıyla 57781 ( E1B5h ) veya 61359 ( EFAFh ) olabilir. orijinal kod sayfalarının atamalarında sayısal mantık. Mevcut bir kod sayfasına dayalı olmayan, kayıtlı olmayan bir özel kod sayfası, sistem için adreslenebilir hale gelmesi için mantıksal bir tutamaca ihtiyaç duyan yazıcı yazı tipi gibi cihaza özel bir kod sayfası, sık değişen bir indirme yazı tipi veya sembolik bir kod sayfası numarası yerel ortamdaki anlamı, 65280 ( FF00h ) gibi özel aralıkta bir atamaya sahip olabilir .

0, 65534 ( FFFEh ) ve 65535 ( FFFFh ) kod sayfası kimlikleri, DOS gibi işletim sistemleri tarafından dahili kullanım için ayrılmıştır ve herhangi bir özel kod sayfasına atanmamalıdır.

Ayrıca bakınız

Referanslar

Dış bağlantılar