|
Przez długi czas kwestia kodowania znaków narodowych nie była do końca ujednolicona i można powiedzieć, że w tym zakresie panował bałagan. W 1965 roku amerykański instytut ANSI zdefiniował tzw. kod ASCII (American Standard Code for Information Interchange), zawierający pierwotnie 127 znaków. Komputery posługiwały się w operacjach liczbami ośmiobitowymi, więc kod ten umożliwiał zapisanie maksymalnie 256 różnych wartości (symboli).
Przez długi czas kwestia kodowania znaków narodowych nie była do końca ujednolicona i można powiedzieć, że w tym zakresie panował bałagan. W 1965 roku amerykański instytut ANSI zdefiniował tzw. kod ASCII (American Standard Code for Information Interchange), zawierający pierwotnie 127 znaków. Komputery posługiwały się w operacjach liczbami ośmiobitowymi, więc kod ten umożliwiał zapisanie maksymalnie 256 różnych wartości (symboli). Poszczególne kraje na własną rękę modyfikowały w zestawach symbole o numerach od 128 do 255 , przyporządkowując im m.in. własne znaki narodowe. Wśród takich zestawów, które zawierały polskie znaki diakrytyczne można znaleźć przynajmniej kilkanaście standardów kodowania. Na początku lat 80. organizacja normalizacyjna ISO (International Organization for Standarization) wprowadziła serię standardów ISO 8859. W Europie Zachodniej miał obowiązywać standard ISO 8859-1 (Latin‑1), dla Europy Środkowowschodniej opracowano standard ISO 8859-2 (Latin-2). W 1993 roku ukazała się Polska Norma 93/T-42118, zgodna z ISO 8859-2 - międzynarodowym standardem dotyczącym kodowania narodowych znaków diakrytycznych.. Została ona uznana za oficjalny standard kodowania polskich znaków w Internecie. Jednak nie zawsze jest stosowana, często używa się strony kodowej Windows - CP1250. Dla zachowania zgodności ze standardem, wiadomości e-mail powinny być tworzone z wykorzystaniem normy ISO 8859‑2. Większość programów pocztowych potrafi odczytywać i zapisywać polskie litery w tym formacie. W trakcie konfiguracji programów należy wskazać standard kodowania ISO 8859-2 (środkowoeuropejski ISO) jako domyślny. Pomimo opracowania powyższych standardów nadal problemem był zapis znaków narodowych języków azjatyckich z uwagi na ich liczbę. Zaistniała potrzeba opracowania międzynarodowego, uniwersalnego standardu kodowania. Powstał więc standard Unicode, w którym każdemu znakowi przyporządkowano liczbę 16-bitową. Pierwszych 256 pozycji odpowiada dotychczasowemu standardowi kodowania ISO 8859‑1. W ramach dostępnego zestawu znaków (ponad 65 tys. wartości) zbiory znaków są grupowane w tzw. skrypty (np. grecki, hebrajski, arabski, cyrylica, i inne). Unicode ma szansę stać się powszechnie stosowanym standardem. |