ANSI i Unicode

Anonim

ANSI vs Unicode

ANSI i Unicode su dva znakovna kodiranja koja su, u jednom trenutku ili drugom, u širokoj upotrebi. Korištenje je također glavna razlika između dva jer je ANSI vrlo star i koristi se operacijskim sustavima kao što je Windows 95/98 i stariji, a Unicode je noviji kodiranje koje danas koriste svi trenutni operacijski sustavi. ANSI je imao mnoga ograničenja koja nisu bila vidljiva tijekom ranih stadija njezine uporabe, ali su postala bolno jasna kada se računanje počelo širiti globalno.

Glavni nedostatak ANSI-ja je uporaba mnogih kodnih stranica, ovisno o jeziku koji se koristi; postoji jedan za engleski (poznat kao zapadnoeuropski latinski), grčki, turski, hebrejski, arapski i mnogi drugi. Nema problema kada sva računala koja pristupaju podacima upotrebljavaju istu kôdnu stranicu, ali kad su u uporabi različite stranice s kodovima, podaci čita neće biti isti kao i napisani podaci. To bi moglo rezultirati korupcijom podataka, pa čak i padovima programa u određenim scenarijima.

Razlog zašto ANSI ne može primiti je da koristi samo 8 bita da predstavlja svaku šifru. Ova širina je fiksna i ima ukupno 256 različitih kombinacija. Za usporedbu, Unicode koristi maksimalno 32 bita za svaku točku koda; koristi se u fiksnoj širini u UTF-32. No, budući da je upotreba četiri bajta za svaki znak takav ogroman gubitak prostora, kod UTF-8 i UTF-16 upotrebljava se kodiranje promjenjive širine kako bi se uštedio prostor.

Budući da je Unicode noviji standard, očekuje se da ga starije operacijske sustave možda neće podržati. Iako su kodne točke UTF-8 i ANSI uglavnom identične, starije operacijske sustave poput sustava Windows 95 ne mogu surađivati ​​s njom. Stoga programi koji koriste Unicode ne bi mogli ispravno raditi na ovim operacijskim sustavima. S obzirom na suprotno, ili pokrenute ANSI kodirane programe na novijim operacijskim sustavima, moguće je da postoje mehanizmi za pretvorbu između ANSI i Unicode. Imajte na umu da pretvorba dodaje malo obrade nad glavom. To možda neće biti značajno s obzirom na današnja računala, ali još uvijek je vrijedno napomenuti kako bi se poboljšala učinkovitost programa.

Sažetak:

1. ANSI je vrlo stari kodiranje znakova i Unicode je trenutni standard koji se danas koristi 2. ANSI koristi različite stranice za različite jezike dok Unicode ne 3. ANSI koristi šifru fiksne širine dok Unicode može koristiti fiksnu i promjenjivu širinu 4. Unicode programi neće raditi na starijim sustavima 5. ANSI programi su sporiji od Unicode programa na tekućim računalima