- IT bazė inf.
- Teksto dydis:
- Spausdinti
Pirmasis lietuvių kalbos elektroninis sinonimų žodynas „Sinonimai.lt“ pradėjo veikti 2010 m. Tai – visuomeninis projektas, kurio tikslas – įtraukti visuomenę ir ypatingai jaunimą į kalbos puoselėjimo ir turtinimo veiklą. Kuo gi ypatingas šis žodynas ir su kokiais iššūkiais susiduriama jį tobulinant?
Priešingai nuo daugumos žodynų (pvz., kalbinių ar terminų žodynų), sinonimų žodynas išsiskiria savo sudėtingumu. Jį sudarant, iškyla vartojimo pavyzdžių, kalbinių ypatybių priskyrimo, prasminių grupių įvardinimo bei morfologinės analizės užduotys.
Kaip šias užduotis išsprendė Sinonimų žodynas?
Šiuo metu sinonimų žodyną sudaro daugiau nei 40 000 įrašų. Norint priskirti kiekvienam sinononimui vartojimo pavyzdį ir nustatyti jo prasminę grupę, vienas žmogus sugaištų ne vienerius metus.
Sinonimų žodynas naudojasi tekstine duombaze, kurią sudaro 18 000 psl. tekstų, paimtų iš įvairiausių lietuvių literatūros kampelių, pradedant 1650 m. parašytu Mažvydo katekizmu ir apimant daugmaž visą lietuvių literatūros klasiką (nors duomenų skaičius atrodo didelis, deja to užtenka tik apytiksliai 60 % atvejų).
Kai sistemos administratorius prisijungia prie valdymo pulto, Sinonimų žodyno programa neria ieškoti pagalbos į anksčiau minėtą duomenų bazę. Žodyno programa naudoja algoritmą, kuris atlieka žodžio morfologinę analizę, sukuria visų jo įmanomų formų masyvą ir atlieka šimtus užklausų, kurios tikrina tekstus duomenų bazėje ir atrenka sakinius, kuriuose buvo pavartota viena iš užklausiamo žodžio formų. Kai programa baigia savo darbą, administratorius turi perskaityti visas pateiktas ištraukas kol suranda vieną, kurioje pavartotas žodis atitinka sinonimo prasminę grupę.
Kitas žingsnis reikalauja sutikrinti duomenis su LKŽ ir kitais autentiškais šaltiniais, surasti naujus sinonimus ir nustatyti antonimus. Įvestus duomenis dar kartą patikrina sistemos vyr. administratorius. Taip nauji duomenys atsiranda Sinonimų žodyne.
Tūkstančiai žodžių našlaičių
Sinonimų žodynas yra nekomercinis projektas, tačiau žmonės, kurie palaiko projekto idėją, skiria nemažą savo laiko dalį tobulindami šitą įrankį.
Šiuo metu Sinonimų žodyno duomenų bazėje yra apie 200 tūkstančių dar nesugrupuotų žodžių, kurie neturi sinonimų ir nėra sinonimai kitems žodžiams. Be abejo, dauguma jų yra tarmybės, kurios šiuolaikinėje kalboje yra menkai naudojamos.
Kiekvienas Sinonimų žodyno naudotojas gali padėti sutvarkyti duomenų bazę, pasiūlydamas sinonimus, kurių kitų projekto dalyvių galvos dar nesugalvojo. Vartotojai skatinami prizais.
Sinonimų žodyno perspektyva
Kiekvieną dieną Sinonimų žodyną aplanko apie 600 žmonių. Tai nedaug, tačiau vidutiniškai kiekvienas žmogus per dieną atlieka 20 užklausų. Iš to galime padaryti išvadą, kad Sinonimų žodynas yra naudingas įrankis, tačiau dar nedaug žmonių apie jį žino. Tekste užsiminta apie antonimus –vieną dieną galbūt Sinonimų žodyną papildys ir brolis Antonimų žodynas.
NAUJAUSI KOMENTARAI
SUSIJĘ STRAIPSNIAI
-
Neištvėrė baisaus poveikio vaikams: ketiname išvyti šį banditą iš savo kaimynystės2
Albanijos ministras pirmininkas Edi Rama (Edis Rama) šeštadienį pareiškė, kad vyriausybė nuo 2025-ųjų bent vieneriems metams uždarys socialinį tinklą „TikTok“. ...
-
Protingiausiu pasaulio žmogumi tituluojamas vyras tikina turįs atsakymą, kas vyksta po mirties17
Christopheris Langanas, kurio intelekto koeficientas (IQ), teigiama, yra aukštesnis nei Alberto Einšteino, pasidalijo savo teorija apie pomirtinį gyvenimą. ...
-
Įstrigę kosmose: NASA vėl atidėjo dviejų astronautų sugrąžinimo misiją
Jau kelis mėnesius Tarptautinėje kosminėje stotyje (TKS) įstrigę du JAV astronautai ten liks bent iki kovo pabaigos, antradienį pranešė amerikiečių kosmoso agentūra NASA. ...
-
JK svarsto DI autorių teisių įstatymą, kad padėtų apsaugoti menininkų teises
Jungtinės Karalystės vyriausybė antradienį pradėjo konsultacijas dėl planų suteikti dirbtinio intelekto kūrėjams aiškumo autorių teisių klausimais, siekdama paremti menininkų pajamas ir paskatinti ekonomiką. ...
-
„TikTok“ lygties sprendimų ieško ir Rumunija, ir ES8
Rumunijos politinė sistema išgyvena precedento neturintį sukrėtimą. Kai antrojo prezidento rinkimų turo išvakarėse Konstitucinis teismas anuliavo pirmojo turo rezultatus, kilo poreikis skubiai įsivertinti, kas kelia didesnį pavojų demokr...
-
Žiniasklaida: sutriko socialinių tinklų veikla1
Trečiadienio vakarą sutriko socialinių tinklų „Facebook“ ir „Instagram“ veikla, praneša naujienų portalas „Delfi“. ...
-
Artėjant Kalėdoms „Meta“ stiprina kovą su internetinio apsipirkimo sukčiavimu
JAV technologijų bendrovė „Meta“ pirmadienį paskelbė apie pasaulinę kampaniją prieš sukčiavimą internete, skirtą apsaugoti socialinių tinklų naudotojus nuo internetinių sukčių prieš didžiąsias metų šventes. ...
-
Paviešinta, ko lietuviai ieškojo „Google“ 2024 metais: kas labiausiai kurstė smalsumą?1
Antradienį, „Google“ pateikė sąrašus tendencijų, ko šiemet internete ieškojo Lietuvos gyventojai. Dėmesio centre 2024-aisiais atsidūrė „Eurovizijos“ ir vasaros olimpinių žaidynių herojai, Europos futbolo ...
-
Europos raketa „Vega-C“ po atidėjimų iškėlė palydovą į orbitą
Naujoji Europos raketa nešėja „Vega-C“ ketvirtadienį buvo paleista iš Prancūzijos Gvianos ir pirmą kartą po nesėkmingo 2022 metų skrydžio iškėlė į orbitą palydovą. ...
-
Paleisti du Europos palydovai, turintys imituoti Saulės užtemimus
Į orbitą ketvirtadienį buvo paleisti du Europos palydovai, vykdysiantys pirmąją dirbtinių Saulės užtemimų misiją preciziška rikiuote kosminėje erdvėje. ...