Raziskovanje
Razvoj raziskovalne infrastrukture za mednarodno konkurenčnost slovenskega RRI prostora
Ime projekta: Razvoj raziskovalne infrastrukture za mednarodno konkurenčnost slovenskega RRI prostora – RI-SI – CLARIN
Akronim projekta: RI-SI - CLARIN
Referenčna številka (št. pogodbe): C3330-19-952059
Področje: Jezikovne tehnologije
Spletna stran/povezava: /
Naročnik projekta/program:
Časovni okvir: 01. 10. 2018-31. 08. 2021
Vrednost projekta: 477.932,82 €
Stopnja lastnega financiranja (v %): 0 %
Višina sofinanciranja (delež UM FERI): 315.000,00 €
Nosilec projekta na UM FERI: Darinka Verdonik
Koordinator projekta: Institut Jožef Stefan
Sodelujoče organizacije: Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko (UM FERI, SLO), Univerza v Ljubljani
Povzetek projekta:
Cilj evropske infrastrukture CLARIN je spodbujanje raziskovalne dejavnosti na področju humanističnih in družbenih ved. Ta vizija se uresničuje z gradnjo in delovanjem raziskovalne infrastrukture v skupni uporabi, ki raziskovalnim skupnostim zagotavlja jezikovne vire, tehnologije in strokovno znanje.
V okviru projekta RI-SI Clarin je obstoječa raziskovalna infrastruktura CLARIN.SI nadgrajena in dopolnjena z novimi visokotehnološkimi komponentami, kot so diskovna polja, strežniki, GPU-gruča.
Cilji že izvedenih in še načrtovanih nabav so med drugim:
- zagotoviti nadaljnje delovanje tehničnih storitev infrastrukture CLARIN.SI,
- omogočiti hranjenje velikih multimodalnih jezikovnih podatkov,
- omogočiti, da CLARIN.SI sledi paradigmi »velepodatkov« (angl. big data),
- omogočiti, da CLARIN.SI ponuja javno dostopne spletne storitve za obdelavo velikih količin slovenskih besedil,
- vzpostaviti namensko gručo računalnikov s pospeševalniki GPGPU za potrebe globokega učenja.
Aktivnosti UM FERI: UM FERI je v okviru projekta RI-SI Clarin nabavila gručo GPU-strežnikov, ki je optimirana za izvajanje aplikacij, temelječih na uporabi globokega učenja, strežnike za obdelavo velikih jezikovnih podatkov in diskovno polje za hranjenje velikih količin jezikovnih podatkov.