2. BALSO TECHNOLOGIJŲ REIKŠMĖ INFORMACINĖJE VISUOMENĖJE

 

2.1. Svarbiausios balso technologijos ir jų paskirtis

 

Skirsime tris balso technologijų grupes:

·        balsų tariamų vienetų ( žodžiai, jų sekos, frazės ) automatinis nustatymas arba kalbos atpažinimas;

·        teksto skaitymas balsu arba kalbos sintezė;

·        kitos balso technologijos (asmens tapatybės vertinimas pagal jo balsą, kalbos signalų suspaudimas bei kodavimas, triukšmų slopinimas ir pan. ).

Toks grupavimas yra parinktas sąmoningai, nes pirmųjų dviejų technologijos grupių plėtrai reikia pakankamai gero lietuvių kalbos žinojimo. Mažai tikėtina, kad jos gali būti sėkmingai kuriamos ne Lietuvoje. Kitos balso technologijos gali būti pakankamai savarankios, bet dažnai jos kartu yra ir sudėtinės atpažinimo bei sintezės dalys.

Atpažinimas. Jo paskirtis yra automatiškai nustatyti, kas balsu sakoma informacijos priėmimo sistemai. Tai gali būti atskiras žodis ( balso komanda ), žodžių seka ( PIN kodas ), net rišlių sakinių skaitymas. Informacijos priėmimo sistema, nustačiusi, kas jai buvo pasakyta, atlieka adekvačius veiksmus, t.y. atpažinimas yra informacijos prieigos forma.

Sintezė. Jos pagalba pagal reikiamą komandą balsu perskaitoma informacinėje sistemoje teksto pavidalu saugoma informacija. Sintezei priskiriamos ir paprastesnės informacijos pateikimo balsu formos, pvz. iš anksto paruoštu žodžių ar jų sekų pateikimas balsu, esant tam tikram reikalavimui.

Kitos balso technologijos. Trumpai apibūdinsime keletą tokių technologijų. Asmens tapatybės vertinimas pagal jo balsą reikalingas teisėsaugoje ir komercinių operacijų vykdymui ( asmens parašas ). Triukšmų šalinimas nuo kalbos signalų yra priemonė sukauptoms kultūros vertybėms restauruoti. Beje, triukšmų apdorojimo problemos iš esmės persmelkia veik visas kitas balso technologijas. Balso signalų suspaudimas yra taupaus balso įrašų sugojimo ar perdavimo priemonė, kurios poreikis jau jaučiamas ir Lietuvoje, operuojant balsu Internete ( VoIP ).

 

2.2. Balso technologijų plėtros motyvai

 

Trumpai peržvelgsime tuos argumentais, kuriais grindžiamas balso technologijų plėtros būtinumas, tarp kurių išskirsime tris motyvus:

·        Lietuva – draugiškos daugiakalbės Europos narė

·        visuotinė, integruota ir intuityvi informacijos prieiga bei jos pateikimas,

·        visuomenės perkrova technologinėmis priemonėmis.

Lietuva – draugiškos daugiakalbės Europos narė. Tuo tvirtinama, kad Europa, skirtingai nuo kitų pasaulio regionų yra daugiakalbė, o balso technologijos yra Europos lingvistinės infrastruktūros, palankaus draugiškos daugiakalbės Europos kūrimo veiksnio, sudėtinė dalis [1]. Jų plėtrai reikia ir kiekvienos Europos valstybės valios.

Visuotinė, integruota ir intuityvi informacijos prieiga bei jos pateikimas. Visuotinumo prasmė gerai matoma mobilaus vartotojo atveju, kai yra labai ribotos klaviatūros galimybės. Be to, balso technologijos papildo grafinę, teksto ir kitas informacijos vaizdavimo formas. Balso technologijos, kaip natūraliausias bendravimo būdas, turi unikalių intuityvios informacijos prieigos galimybių. [2,3].

Visuomenės perkrova technologinėmis priemonėmis. Vakaruose vis labiau pabrėžiama, kad žmonės pageidauja paprastesnio ir lengvesnio gyvenimo stiliaus [3]. Iš vienos pusės skatinamas pastovus ir visuotinis informacinis lavinimasis, tačiau kartu suprantama, kad visko mokėti negalima ( primirštama, kas išmokta; kai kurių funkcijų retokai reikia konkrečioje veikloje arba jas užgožia svarbesnės; kartais neįmanoma be išorinės pagalbos pasinaudoti informacija , pvz. neįgaliems, ir pan.).

 

Literatūra

 

1)      Towards a European Language Infrastructure. // Report by A.Danzin and the Strategic Planning Study Group for the Commission of the European Communities (DG XIII), 31 March 1992.

2)      R. V. Cox, C. A. Kamm, L.R.Rabiner, J. Schroeter, and J. G. Wilpon. Speech and Language Processing for Next-Millenium. // Proceedings of the IEEE, vol. 88, No. 8, August 2000, pp. 1314 – 1337

3)      R. V. Cox, B. G. Haskell, Y. LeCun, B. Shahrary, and L. Rabiner. On the Applications on Multimedia Processing to Communications. // Proceedings of the IEEE, vol. 86, No. 5, May 1998, pp. 755 - 824

 

2.3. Balso technologijų panaudojimo sferos

 

Mes apibrėšime tas balso technologijų panaudojimo sferas, kurių, mūsų nuomone, plėtojimas Lietuvoje yra aktualiausias, be to galima išnaudoti bei stiprinti esamą mokslinį potencialą, o kalbos signalų technologijų įsigijimas (kaip ir eksploatavimo įsisavinimas) yra brangus:

·        mokymo procesų tobulinimas;

·        priemonės neįgaliems, kai kurie medicininiai taikymai;

·        teisėsauga bei krašto apsauga;

·        kultūros bei kalbos vertybių sutvarkymas ir išsaugojimas;

·        administravimas ir telekomunikacinės paslaugos

Mokymo proceso tobulinimas. Lietuvoje reikia pasiekti, kad mokymo procesas būtų artimas pasauliniam [1]. Tai reiškia, kad technologinėse informatikos, telekomunikacijų disciplinose turėtų būti žymiai daugiau lingvistikos ir atvirkščiai. Pagrindines kliūtis galima pašalinti, sukuriant reikalingas technologines mokymo priemones. Kartu turi būti kuriami treniruokliai gimtosios bei užsienio kalbų mokymuisi, pritaikyti logopedijai ir kiti.

Priemonės neįgaliems. Paminėtinos kompiuterizuotos darbo vietos akliems, kurtiems, turintiems motorinių funkcijų sutrikimus, neprigirdintiems. Balso technologijos taip pat naudingos LOR medicinoje, pooperacinėje reabilitacijoje, ką rodo nuolat augantis dėmesys kitose šalyse.

Teisėsauga bei krašto apsauga. Kalbos signalų technologijų procedūros naudingos fonoskopinių ekspertizių tobulinimui, operatyvinėje veikloje, kalbos signalų neviešam saugojimui ar perdavimui, civilinėje saugoje ir panašiai. Plintant  techninėmis naujovėmis plinta ir nauji falsifikavimo būdai [2], todėl svarbu paruošti tinkamas priemones.

Kultūros, istorijos ir kalbos vertybių sutvarkymas ir išsaugojimas. Per eilę dešimtmečių garso pavidalu yra sukaupta labai vertingos medžiagos, kurią reikia šiuolaikinėmis priemonėmis sutvarkyti.

Administravimas ir telekomunikacinės paslaugos. Neretai įvairaus lygmens pareigūnai neturi galimybių priimti visus pageidaujančius, o telefoninės kalbos signalų technologijų priemonės padėtų išplėsti aptarnaujamų piliečių skaičių. Vis plečiasi internetinės balso panaudojimo priemonės. Balso technologijos jau senokai priskiriamos strateginei naujų telekomunikacinių paslaugų kūrimo krypčiai.

 

Literatūra

 

1)      The Landscape of Future Education in Speech Communication Sciences 1 Analysis. // Edited by Gerrit Bloothooft et al., Utrecht, The Netherlands, August 1997.

2)      Detective Sergeant Bosse Norgren, “Criminal Behaviour in Information Technology”, Proc. COST 250 Workshop on Application of Speaker Recognition Techniques in Telephony, Vigo, Spain, November 1996, pp. 9-14.

Į pradžią (turinį)