lki@lki.lt lki@lki.lt   EN  
   
 
LIKIT » Rašmenys » Koduotės

Rašmenys » Koduotės


Dabar kompiuteriuose dažniausiai vartojamos 8 bitų koduotės ir palaipsniui pereinama prie 16 bitų koduotės – Unikodo.

Dideliuose kompiuteriuose kodavimą aštuoniais bitais apibrėžia EBCDIC koduotė. Mikrokompiuteriuose (asmeniniuose kompiuteriuose) – tarptautinių standartų ISO/IEC 8859 serija. Lietuvoje standartu priimta tryliktoji šios serijos dalis ISO/IEC 8859-13 ir vadinama LST ISO/IEC 8859-13. Tai yra ta pati koduotė, kuri anksčiau buvo vadinama „Baltic Rim“ ir apibrėžta iki 2000 m. galiojusiu standartu. Ši koduotė yra pagrindinė, nepriklausoma nuo operacinės sistemos, todėl vartotina telekomunikacijoje duomenų mainams tarp įvairių operacinių sistemų.

Operacinės sistemos įneša savo specifiką, todėl jose vartojamos skirtingos koduotės. Lietuvos Respublikos standartai apibrėžia tokias koduotes atskiroms operacinėms sistemoms:

DOS 775

Koduotė 775 turi visą standarte LST ISO/IEC 8859-13 abibrėžtą rašto ženklų aibę. Tik dalies ženklų kodai skiriasi. Koduotę apibrėžia standartas LST 1590-1:2000.

„Windows“ 1257

Koduotė 1257 turi visą standarte LST ISO/IEC 8859-13 abibrėžtą rašto ženklų aibę. Visų lietuviškų ženklų, išskyrus kabutes, kodai sutampa su minėto ISO standarto kodais. Lentelę apibrėžia standartas LST 1590-2:2000.

„MacOs“ 10029

Ši koduotė dar nėra standartizuota, bet šioje sistemoje vienintelė, turinti lietuviškus rašto ženklus.

„Unix“ LST ISO/IEC 8859-13.

„Unix“ genties operacinės sistemos („Linux“ ir kt.) savos specifikos į ženklų kodavimą neįneša. Jose vartojamos ISO/IEC 8859 standartais apibrėžtos kodų lentelės. Lietuvoje vartojama šio standarto 13 dalis: LST ISO/IEC 8859-13.

Unikodas

Visos lietuvių k. abėcėlės raidės įtrauktos į dviejų baitų (16 bitų) koduotę – Unikodą. Unikodas yra keturių 4 baitų (32 bitų) Lietuvos ir tarptautinio standarto LST ISO/IEC 10646 koduotės poaibis.

Dar ne visa aparatinė ir programinė įranga gali veikti su dviejų baitų ženklų kodais. Todėl daug kur, ypač telekomunikacijose, Unikodo kodai išreiškiami vienbaičių UTF-8 kodų sekomis.

Lietuvių k. abėcėlės raidės, neturinčios diakritinių ženklų (a, b, c, d, ...), išreiškiamos vienu UTF-8 kodu, sutampančiu su standartinių LST ISO/IEC 8859-13 ir LST 1590-2 (Windows 1257) koduočių kodais. Raidės su diakritiniais ženklais (č, ę, ė, ...) vaizduojamos dviem UTF-8 kodais (dviem baitais).

Dar yra programų, kurios „nesupranta“ ir UTF-8. Jeigu gautame elektroniniame laiške arba žinutėje vietoj raidžių su diakritiniais ženklais matomi du ženklai, tai beveik visada reiškia, kad tekstas buvo išsiųstas teisingas, tik jį priėmusi įranga (pašto programa, mobilusis telefonas) jo neiškodavo ir reikėtų ją pakeisti šiuolaikiškesne.

Anksčiau (DOS laikais) Lietuvoje buvo vartotos įvairios DOS sistemos koduotės (770, 771, 772, 774). Dokumentus, parengtus senomis DOS koduotėmis, galima perkoduoti į standartines pasinaudojant perkodavimo programa. Daugiau informacijos apie kodų lenteles galima rasti straipsnyje „Lietuviški rašmenys ir koduotės“.



 

 
   
 
© 2001–2014 Lietuvių kalbos institutas
Atnaujinta 2010-02-25