Eihera
Deskribapen laburra:
Euskarazko entitate izendunak ezagutzen eta sailkatzen dituen tresna
Egileak (ixakideak):
Esteka (demoa):
Harremanetarako:
i.alegria@ehu.es
Deskribapena:
Eihera sistemak euskarazko entitate izendunak ezagutu eta sailkatzen dituen tresna da. Lau pausotan diseinatu da sistema: lehenengoan, ezagutzailea garatu da egoera finituzko transduktoretan errepresentatutako informazio linguistikoan oinarrituta; bigarrenean, transduktore horien emaitzetatik abiatuta erdi-automatikoki etiketatutako corpusak sortu dira; hirugarrenean, ML teknikak aplikatu dira corpus horien gainean ahalik eta ezagutzaile onena lortzeko, eta azkenik, lortutako ezagutzaileak konbinatu egin dira.
Funtzionalitatea:
Eiherak hiru klasetan sailkatzen ditu ezagututako entitateak: pertsonak, erakundeak eta tokiak.
Teknologia:
Finite-state and Machine learning.
Moduluak:
Recognition by rules, recognition by ML, classification by rules, classification by ML. Eustagger is a previous step.
Berrikuntza:
Euskararako lehenengo NERC sistema da
Garapena:
Eusko Jaurlaritzaren eta Espainiako I+G agentziaren zenbait proiekturen laguntza jaso du
Argitalpenak (artikuluak):
HiTZen bistaratu:
HiTZen bistaratu
Ixan bisataratu:
Ixan bisataratu