|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
|
|
| |
|
|
Lietuviškų kirčiuotų raidžių ir kitų rašto ženklų aibės sudarymas bei kodavimas |
|
| |
|
Lietuvių kalbos abėcėlė turi 32
raides: Lietuvių kalbos abėcėlėje dviejų raidžių junginys CH anksčiau buvo pateikiamas kaip atskira raidė. Dabar abi junginio raidės laikomos savarankiškomis. Raidžių rikiavime, paieškos sistemose ir, apskritai, informatikoje, šis junginys neturi atskiros raidės statuso. Rikiuojant žodžius pagal abėcėlę didžiosios ir mažosios raidės laikomos lygiavertėmis t.y., turi tą patį svorį. Lygiavertėmis laikomos ir raidės, parašytos vienoje eilutėje: Raidžių rikiavimą apibrėžia standartas LST 1285:1993. Lietuviškame tekste pasitaikančiuose užsienio kalbų žodžiuose (pvz., asmenvardžiuose, vietovardžiuose), rašomuose originalo kalba, gali būti vartojamos ir kitos lotyniškosios abėcėlės raidės (pvz., Q, W, X, Ä, Õ). Kompiuteriuose problemų dėl lietuviškos abėcėlės atsiranda dėl to, kad
dalis lietuviškų raidžių nepatenka į 7 bitų ASCII kodų lentelę, į kurią
įtrauktos tik 26 pagrindinės lotyniškosios abėcėlės raidės.
| ||||||
|
Dabar kompiuteriuose dažniausiai vartojamos 8 bitų kodų lentelės ir palaipsniui pereinama prie 16 bitų kodų lentelės Unikodo. Dideliuose kompiuteriuose kodavimą aštuoniais bitais apibrėžia EBCDIC kodų lentelė. Mikrokompiuteriuose (asmeniniuose kompiuteriuose) tarptautinių standartų ISO/IEC 8859 serija. Lietuvoje standartu priimta tryliktoji šios serijos dalis ISO/IEC 8859-13 ir vadinama LST ISO/IEC 8859-13. Tai yra ta pati kodų lentelė, kuri anksčiau buvo vadinama Baltic Rim ir apibrėžta iki 2000 m. galiojusiu standartu. Ši kodų lentelė yra pagrindinė, nepriklausoma nuo operacinės sistemos, todėl vartotina telekomunikacijoje duomenų mainams tarp įvairių operacinių sistemų. Operacinės sistemos įneša savo specifiką, todėl jose vartojamos skirtingos kodų lentelės. Lietuvos Respublikos standartai apibrėžia tokias kodų lenteles atskiroms operacinėms sistemoms: DOS 775
Windows 1257 MacOs 10029 Unix LST ISO/IEC 8859-13.
Lietuvoje plačiausiai paplitusi nestandartinė, vadinamoji
skaitmeninė, klaviatūra, kuri gaunama perdarius amerikietiškąją
klaviatūrą aštuonių skaitmenų (18) ir dešimties skyrybos ženklų
klavišus (viršutinę ženklų eilę) pakeitus lietuviškomis raidėmis. Kita,
rečiau vartojama, yra Lietuvos standartą Nuo 2000 m. įsigaliojo naujas lietuviškos kompiuterio klaviatūros standartas Daugiau informacijos apie klaviatūrą galima rasti straipsniuose.
Lietuvių kalba turi 68 kirčiuotas raides (34 didžiąsias ir tiek pat
mažųjų). Kirčiuotų raidžių kodavimą apibrėžia standartas LST 1564. Jame nekirčiuotos lietuviškos abėcėlės raidės turi tuos pačius kodus, kaip ir kodų lentelėje LST ISO/IEC 8859-13, o kirčiuotos raidės įdėtos vietoj kitų kalbų raidžių. Šis standartas taikomas Unix genties operacinėms sistemoms ir duomenų mainams tarp skirtingų operacinių sistemų. Operacinei sistemai Windows rengiamas kirčiuotų raidžių kodavimo standartas LST 1590-4. Lyginant su standartu LST 1564, jo kodų lentelė papildyta fonetiniais ženklais. Operacinei sistemai DOS taikomas kirčiuotų raidžių kodavimo standartas LST 1590-2. Jame visos pagrindinės lietuviškos abėcėlės raidės turi tuos pačius kodus, kaip ir kodų lentelėje LST 1590-1, o kirčiuotos raidės bei fonetiniai ženklai įdėti vietoj kitų kalbų raidžių. Kirčiuotų raidžių rinkimas su mirusiu klavišu numatytas klaviatūros standarte LST 1582 . Tam reikalinga kirčiuotų raidžių klaviatūros tvarkyklė. Kirčiuotoms raidėms rodyti ekrane arba spausdinti reikalingi specialūs šriftai. Unikode ir 32 bitų standarte ISO/IEC 10646 yra tik 33 kirčiuotos
raidės, o dar 35 nėra. Trūkstamas raides galima išreikšti kompozicinėmis
sekomis (raidė + kirčio ženklas). Teoriškai laikoma, kad kompozicinė seka
lygiavertė vienam ja komponuojamam ženklui, tačiau tik nedidelė dabartinės
programinės įrangos dalis susidoroja su kompozicinėmis sekomis.
Tikriausiai problemos greitai neišnyks, todėl reikia arba įtraukti
kirčiuotas raides į Unikodą (tuo pačiu ir ISO/IEC 10646) arba, kaip
suinteresuotai valstybei, aktyviai prisidėti prie problemų, susijusių su
ženklų kompozicija ir dekompozicija, sprendimo. Pirmasis kelias
paprastesnis, pigesnis ir juo jau einama. Tarptautinei standartų
organizacijai yra pateiktas pasiūlymas dėl trūkstamų raidžių įtraukimo į
Unikodą, bet susiduriama su opozicija, motyvuojančia tuo, kad trūkstamas
kirčiuotas raides galima išreikšti kompozicinėmis sekomis.
Lietuvių kalbos rašte vartojami šie skyrybos ženklai:
Dėl to, kad neturime lokalizuotų tekstų redagavimo programų ir iki šiol
neturėjome lietuviškos klaviatūros su visais reikalingais rašto ženklais,
dažnai pasitaiko rašybos klaidų su brūkšniu ir kabutėmis. Minėtų ženklų
kodai populiariausiose kodų lentelėse yra tokie:
Smulkiau apie tai rašoma straipsnyje Brūkšniai ir kabutės. Skaičiaus trupmeninė dalis nuo sveikosios skiriama kableliu. Datos rašymui naudojami du formatai:
Lietuviški rašto ženklai elektroniniame pašte Problemos su lietuviškų laiškų persiuntimu elektroniniu paštu atsiranda dėl to, kad laiško siuntėjo ir laiško gavėjo operacinės sistemos gali būti skirtingos ir naudoti skirtingas kodavimo lenteles. Problema sprendžiama taip: siunčiami laiškai perkoduojami iš siuntėjo kompiuteryje vartojamo kodo į kurį nors telekomunikacijose priimtiną kodą, o gauti laiškai iš to kodo perkoduojami į gavėjo kompiuteryje vartojamą kodą. Perkodavimus atlieka pašto programos. Lietuviškiems laiškams persiųsti vartotinas tarptautiniu ir Lietuvos mastu priimtas standartas LST ISO/IEC 8859-13. Konkrečius reikalavimus pašto programoms apibrėžia taisyklės. Lietuvoje paplitusios operacinės sistemos turi bent po vieną elektroninio pašto programą, kurią galima suderinti taip, kad ji taisyklingai atliktų minėtus perkodavimus. Išvardysime jas:
Čia paminėjome tik operacinės sistemos MacOS Eudorą. Jos nereikia
painioti su Windows operacinės sistemos Eudora, kuri gali persiųsti
laiškus, tik Vakarų Europos valstybių kalbomis, naudojančiomis standartą
ISO/IEC Galima būtų tvirtinti, kad lietuviškų laiškų persiuntimo problema iš
esmės išspręsta. Tačiau daug kas elektroniniam paštui naudoja Windows terpėje esančias pašto programas MS Outlook arba Outlook Express, kuriose lietuviškų laiškų siuntimas dar nesutvarkytas.
Abiejose programose tebelaikoma, kad lietuviški rašto ženklai koduojami
standartu ISO/IEC 8859-4, kuris Lietuvoje nebegalioja nuo 1993
metų.
Rašykite mums info@likit.lt
| ||||||||||||||||||||||||||||||||||||||