Raziskovanje

Razvoj raziskovalne infrastrukture za mednarodno konkurenčnost slovenskega RRI prostora

Ime projekta: Razvoj raziskovalne infrastrukture za mednarodno konkurenčnost slovenskega RRI prostora – RI-SI – CLARIN

Akronim projekta: RI-SI - CLARIN

Referenčna številka (št. pogodbe): C3330-19-952059

Področje: Jezikovne tehnologije

Spletna stran/povezava: /

Naročnik projekta/program:

Časovni okvir: 01. 10. 2018-31. 08. 2021

Vrednost projekta: 477.932,82 €

Stopnja lastnega financiranja (v %): 0 %

Višina sofinanciranja (delež UM FERI): 315.000,00 €

Nosilec projekta na UM FERI: Darinka Verdonik

Koordinator projekta: Institut Jožef Stefan

Sodelujoče organizacije: Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko (UM FERI, SLO), Univerza v Ljubljani

Povzetek projekta:

Cilj evropske infrastrukture CLARIN je spodbujanje raziskovalne dejavnosti na področju humanističnih in družbenih ved. Ta vizija se uresničuje z gradnjo in delovanjem raziskovalne infrastrukture v skupni uporabi, ki raziskovalnim skupnostim zagotavlja jezikovne vire, tehnologije in strokovno znanje.

V okviru projekta RI-SI Clarin je obstoječa raziskovalna infrastruktura CLARIN.SI nadgrajena in dopolnjena z novimi visokotehnološkimi komponentami, kot so diskovna polja, strežniki, GPU-gruča.

Cilji že izvedenih in še načrtovanih nabav so med drugim:

  • zagotoviti nadaljnje delovanje tehničnih storitev infrastrukture CLARIN.SI,
  • omogočiti hranjenje velikih multimodalnih jezikovnih podatkov,
  • omogočiti, da CLARIN.SI sledi paradigmi »velepodatkov« (angl. big data),
  • omogočiti, da CLARIN.SI ponuja javno dostopne spletne storitve za obdelavo velikih količin slovenskih besedil,
  • vzpostaviti namensko gručo računalnikov s pospeševalniki GPGPU za potrebe globokega učenja.

Aktivnosti UM FERI: UM FERI je v okviru projekta RI-SI Clarin nabavila gručo GPU-strežnikov, ki je optimirana za izvajanje aplikacij, temelječih na uporabi globokega učenja, strežnike za obdelavo velikih jezikovnih podatkov in diskovno polje za hranjenje velikih količin jezikovnih podatkov.