Unicode

Unicode


Unicode (Evrensel Kod) Unicode Consortium organizasyonu tarafından geliştirilen ve her karaktere bir sayı değeri karşılığı atayan bir standarttır. Evrensel Karakter Seti (UCS) olarak bilinen ISO/IEC 10646 standardı ise, her iki organizasyonun işbirliği ile aynı sayısal karşılıkları taşımaktadır. Bu set,

  • Yeryüzündeki tüm karakterlere bir sayı değeri atamayı amaçlamaktadır.
  • Zaman içinde yeni karakterler eklenebilir ama eski karakterlerin sayı değerleri aynı kalır.
  • Sayı değerleri UCS-4 adlı 32 bitlik set üzerinden verilir. İlk 7 bit Group, sonraki 8 bit Plane, sonraki 8 bit Row, en son 8 bit Cell olarak gruplanır. İlk Plane (group = 0, plane = 0) Basic Multilingual Plane (BMP) olarak adlandırılır. BMP, UCS-2 adı verilen 16 bitlik sete karşılık gelmektedir.
  • UCS üzerindeki karakter kod noktaları genellikle u+0a31 biçiminde onaltılık sistemde sayılar olarak gösterilir.
  • u+0021 - u+007e arasındaki kodlar ASCII ile, u+00a0 - u+00ff arasındaki kodlar ISO-8859-9 ile aynı tutulmuştur.

Unicode kodlarından oluşan karakter dizilerini (metinleri) bilgisayarda verimli bir biçimde saklayabilmek amacıyla çeşitli karakter kodlamaları (encoding) geliştirilmiştir.

Türkçe karakterlerin unicode karşılıkları şunlardır;

  • ğ - \u011f
  • Ğ - \u011e
  • ı - \u0131
  • İ - \u0130
  • ö - \u00f6
  • Ö - \u00d6
  • ü - \u00fc
  • Ü - \u00dc
  • ş - \u015f
  • Ş - \u015e
  • ç - \u00e7
  • Ç - \u00c7

Dış bağlantılar

  • Unicode Consortium
Standardlar
  • RFC 3629
  • RFC 3492
  • Unicode karakterleri topluca bulabileceğiniz bir site.

Ayrıca bakınız

  • UTF-7
  • UTF-8
  • UTF-16
  • UTF-32



Unicode Hakkında Bilgi

Unicode
Unicode
Unicode
Unicode

Unicode Hakkında Video


Unicode konusunu görüntülemektesiniz.
Unicode nedir, Unicode kimdir, Unicode açıklaması

There are excerpts from wikipedia on this article and video



Rastgele Yazılar

Sosyal Hesaplar

Youtube Facebook Twitter
Unicode
Copyright © 2014. Türk Arama Motoru
mail