Abėcėlė

  

Kodų lentelės

  

Klaviatūra

  

Kirčiuotos raidės

  

Kiti rašto ženklai

  

Lietuviški rašto ženklai elektroniniame pašte 

  

Lietuviškų kirčiuotų raidžių ir kitų rašto ženklų aibės sudarymas bei kodavimas

 

Abėcėlė


 Lietuvių kalbos abėcėlė turi 32 raides:

           abėcėlė

Lietuvių kalbos abėcėlėje dviejų raidžių junginys CH anksčiau buvo pateikiamas kaip atskira raidė. Dabar abi junginio raidės laikomos savarankiškomis. Raidžių rikiavime, paieškos sistemose ir, apskritai, informatikoje, šis junginys neturi atskiros raidės statuso.

Rikiuojant žodžius pagal abėcėlę didžiosios ir mažosios raidės laikomos lygiavertėmis t.y., turi tą patį svorį. Lygiavertėmis laikomos ir raidės, parašytos vienoje eilutėje:     

         raidžių grupės

Raidžių rikiavimą apibrėžia standartas LST 1285:1993.

Lietuviškame tekste pasitaikančiuose užsienio kalbų žodžiuose (pvz., asmenvardžiuose, vietovardžiuose), rašomuose originalo kalba, gali būti vartojamos ir kitos lotyniškosios abėcėlės raidės (pvz., Q, W, X, Ä, Õ).

Kompiuteriuose problemų dėl lietuviškos abėcėlės atsiranda dėl to, kad dalis lietuviškų raidžių nepatenka į 7 bitų ASCII kodų lentelę, į kurią įtrauktos tik 26 pagrindinės lotyniškosios abėcėlės raidės.

Į turinį

Į viršų

 
 

Kodų lentelės


Dabar kompiuteriuose dažniausiai vartojamos 8 bitų kodų lentelės ir palaipsniui pereinama prie 16 bitų kodų lentelės – Unikodo.

Dideliuose kompiuteriuose kodavimą aštuoniais bitais apibrėžia EBCDIC kodų lentelė. Mikrokompiuteriuose (asmeniniuose kompiuteriuose) – tarptautinių standartų ISO/IEC 8859 serija. Lietuvoje standartu priimta tryliktoji šios serijos dalis ISO/IEC 8859-13 ir vadinama LST ISO/IEC 8859-13. Tai yra ta pati kodų lentelė, kuri anksčiau buvo vadinama „Baltic Rim“ ir apibrėžta iki 2000 m. galiojusiu standartu. Ši kodų lentelė yra pagrindinė, nepriklausoma nuo operacinės sistemos, todėl vartotina telekomunikacijoje duomenų mainams  tarp įvairių operacinių sistemų.

Operacinės sistemos įneša savo specifiką, todėl jose vartojamos skirtingos kodų lentelės. Lietuvos Respublikos standartai apibrėžia tokias kodų lenteles atskiroms operacinėms sistemoms:

        DOS  775
Kodų lentelė 775 turi visą standarte LST ISO/IEC 8859-13 abibrėžtą rašto ženklų aibę. Tik dalies ženklų kodai skiriasi. Lentelę apibrėžia standartas LST 1590-1:2000.

        „Windows“ 1257
Kodų lentelė 1257 turi visą standarte LST ISO/IEC 8859-13 abibrėžtą rašto ženklų aibę. Visų lietuviškų ženklų, išskyrus kabutes, kodai sutampa su minėto ISO standarto kodais. Lentelę apibrėžia standartas LST 1590-2:2000.

        „MacOs“ 10029
Ši koduotė dar nėra standartizuota, bet šioje sistemoje vienintelė, turinti lietuviškus rašto ženklus.

        „Unix“ LST ISO/IEC 8859-13.
„Unix“ genties operacinės sistemos („Linux“ ir kt.) savos specifikos į ženklų kodavimą neįneša. Jose vartojamos ISO/IEC 8859 standartais apibrėžtos kodų lentelės. Lietuvoje vartojama šio standarto 13 dalis: LST ISO/IEC 8859-13.
 
Anksčiau (DOS laikais) Lietuvoje buvo vartotos įvairios DOS sistemos koduotės (770, 771, 772, 774). Dokumentus, parengtus senomis DOS koduotėmis, galima perkoduoti į standartines pasinaudojant perkodavimo programa. Daugiau informacijos apie kodų lenteles galima rasti straipsnyje „Lietuviški rašmenys ir kodų lentelės“

Į turinį

Į viršų

Klaviatūra


Lietuvoje plačiausiai paplitusi nestandartinė, vadinamoji skaitmeninė,  klaviatūra, kuri gaunama perdarius amerikietiškąją klaviatūrą – aštuonių skaitmenų (1–8) ir dešimties skyrybos ženklų klavišus (viršutinę ženklų eilę) pakeitus lietuviškomis raidėmis. Kita, rečiau vartojama, yra Lietuvos standartą LST 1205-92, atitinkanti klaviatūra, kurioje yra visos lietuviškos raidės, bet trūksta trijų pagrindinės lotyniškos abėcėlės raidžių Q, W ir X ir daugelio specialiųjų ASCII ženklų ([, ], @, &,%, $ ir kt.). Abi klaviatūros nepilnavertės, nes nei viena iš jų negalima surinkti visų kasdieniniam darbui su kompiuteriu būtinų ženklų.

Nuo 2000 m. įsigaliojo naujas lietuviškos kompiuterio klaviatūros standartas LST 1582:2000, pakeičiantis iki šiol galiojusį standartą LST 1205-92. Šia klaviatūra galima surinkti visus lietuviškus rašto ženklus ir visus ASCII ženklus. Todėl renkant pakaks vienos klaviatūros, nebereikės persijunginėti tarp skirtingų kalbų klaviatūrų. 

Daugiau informacijos apie klaviatūrą galima rasti straipsniuose.

Į turinį

Į viršų

Kirčiuotos raidės


Lietuvių kalba turi 68 kirčiuotas raides (34 didžiąsias ir tiek pat mažųjų). 

kirčiuotų raidžių sąrašas

Kirčiuotų raidžių kodavimą apibrėžia standartas LST 1564. Jame nekirčiuotos lietuviškos abėcėlės raidės turi tuos pačius kodus, kaip ir kodų lentelėje  LST ISO/IEC 8859-13, o kirčiuotos raidės įdėtos vietoj kitų kalbų raidžių. Šis standartas taikomas „Unix“ genties operacinėms sistemoms ir duomenų mainams tarp skirtingų operacinių sistemų. 

Operacinei sistemai „Windows“ rengiamas kirčiuotų raidžių kodavimo standartas  LST 1590-4. Lyginant su standartu LST 1564, jo kodų lentelė papildyta fonetiniais ženklais. 

Operacinei sistemai DOS taikomas  kirčiuotų raidžių kodavimo standartas  LST 1590-2. Jame visos pagrindinės lietuviškos abėcėlės raidės turi tuos pačius kodus, kaip ir kodų lentelėje  LST 1590-1, o kirčiuotos raidės bei fonetiniai ženklai įdėti vietoj kitų kalbų raidžių. 

Kirčiuotų raidžių rinkimas su mirusiu klavišu numatytas klaviatūros standarte LST 1582 . Tam reikalinga kirčiuotų raidžių klaviatūros tvarkyklė. 

Kirčiuotoms raidėms rodyti ekrane arba spausdinti reikalingi specialūs šriftai.

Unikode ir 32 bitų standarte ISO/IEC 10646 yra tik 33 kirčiuotos raidės, o dar 35 nėra. Trūkstamas raides galima išreikšti kompozicinėmis sekomis (raidė + kirčio ženklas). Teoriškai laikoma, kad kompozicinė seka lygiavertė vienam ja komponuojamam ženklui, tačiau tik nedidelė dabartinės programinės įrangos dalis susidoroja su kompozicinėmis sekomis. Tikriausiai problemos greitai neišnyks, todėl reikia arba įtraukti kirčiuotas raides į Unikodą (tuo pačiu ir ISO/IEC 10646) arba, kaip suinteresuotai valstybei, aktyviai prisidėti prie problemų, susijusių su ženklų kompozicija ir dekompozicija, sprendimo. Pirmasis kelias paprastesnis,  pigesnis ir juo jau einama. Tarptautinei standartų organizacijai yra pateiktas pasiūlymas dėl trūkstamų raidžių įtraukimo į Unikodą, bet susiduriama su opozicija, motyvuojančia tuo, kad trūkstamas kirčiuotas raides galima išreikšti kompozicinėmis sekomis.

Į turinį

Į viršų

 

 Kiti rašto ženklai


Lietuvių kalbos rašte vartojami šie skyrybos ženklai: 

rašto ženklai
 

Dėl to, kad neturime lokalizuotų tekstų redagavimo programų ir iki šiol neturėjome lietuviškos klaviatūros su visais reikalingais rašto ženklais, dažnai pasitaiko rašybos klaidų su brūkšniu ir kabutėmis. Minėtų ženklų kodai populiariausiose kodų lentelėse yra tokie:
 

Windows 1257

ISO 8859-13

DOS 775 Mac OS

Smulkiau apie tai rašoma straipsnyje „Brūkšniai ir kabutės“

Skaičiaus trupmeninė dalis nuo sveikosios skiriama kableliu. 

Datos rašymui naudojami du formatai:
pilnas, pvz,. 2000 m. sausio 3 d.,
sutrumpintas, pvz., 2000.01.03, 2000-01-03, 2000 01 03. Tris skirtingus formatus apibrėžia trys skirtingi Lietuvos standartai, atitinkamai LST 1285:1993, LST ISO 8601:1997, LST 6.1-92.

Į turinį

Į viršų

Lietuviški rašto ženklai elektroniniame pašte 


Problemos su lietuviškų laiškų persiuntimu elektroniniu paštu atsiranda dėl to, kad laiško siuntėjo ir laiško gavėjo operacinės sistemos gali būti skirtingos ir naudoti skirtingas kodavimo lenteles. Problema sprendžiama taip: siunčiami laiškai perkoduojami iš siuntėjo kompiuteryje vartojamo kodo į kurį nors telekomunikacijose priimtiną kodą, o gauti laiškai iš to kodo perkoduojami į gavėjo kompiuteryje vartojamą kodą. Perkodavimus atlieka pašto programos. Lietuviškiems laiškams persiųsti vartotinas tarptautiniu ir Lietuvos mastu priimtas standartas LST ISO/IEC 8859-13. Konkrečius reikalavimus pašto programoms apibrėžia taisyklės.

Lietuvoje paplitusios operacinės sistemos turi bent po vieną elektroninio pašto programą, kurią galima suderinti taip, kad ji taisyklingai atliktų minėtus perkodavimus. Išvardysime jas: 

„Windows“  „Pegasus Mail“, „Opera“, „Netscape“, „Mozilla“;
„Unix“  „Pine“, „Mutt“;
MacOS  „Eudora“.

Čia paminėjome tik operacinės sistemos MacOS „Eudorą“. Jos nereikia painioti su „Windows“ operacinės sistemos „Eudora“, kuri gali persiųsti laiškus, tik Vakarų Europos valstybių kalbomis, naudojančiomis standartą ISO/IEC 8859-1. 

Galima būtų tvirtinti, kad lietuviškų laiškų persiuntimo problema iš esmės išspręsta. Tačiau daug kas elektroniniam paštui naudoja „Windows“ terpėje esančias pašto programas „MS Outlook“ arba „Outlook Express“, kuriose lietuviškų laiškų siuntimas dar nesutvarkytas. Abiejose programose tebelaikoma, kad lietuviški rašto ženklai koduojami standartu ISO/IEC 8859-4, kuris Lietuvoje nebegalioja nuo 1993 metų.

Naujausią informaciją apie elektroninio pašto programų pritaikymą lietuviškiems laiškams persiųsti galima rasti Viktoro Dagio ir Ryčio Umbraso tvarkomame tinklalapyje.

Į turinį

Į viršų

 

 


Rašykite mums  info@likit.lt
Atnaujinta 2002.08.19 .