Aipamen testualen sailkapen automatikoa
Kurtsoa:
Saila:
Deskribapena:
Mundu errealeko objektuen erreferentziez osatzen dira testuak. Erreferentzia horiek izen berezien bidez egin daitezke, eta horiei entitate izendun deritze. Baina horiekin batera, sarri, beste kategoria bateko espresio testualak baliatzen dira objektuen erreferentziak edo aipamenak egiteko. Esate baterako, Joseba Sarrionaindiak saio bikaina idatzi du, eta hark irabazi du Euskadi Saria testuan, Joseba Sarrionaindia entitate izenduna da, mundu errealeko pertsona ezagunari erreferentzia egiten diona, baina testuko hark hori ere izaera bereko aipamena da, pertsona berari buruzkoa.
Era batekoak edo bestekoak izan, oso baliagarria da testuen ulerkuntza automatikorako objektu errealen aipamenak detektatzea, ondo mugatzea eta, are, sailkatzea.
Oso hedatua da hizkuntzaren prozesamenduko tekniken erabilera testuetako entitate izendunak ezagutzeko eta sailkatzeko, eta ugari dira horretarako tresnak. Euskaraz ere badugu zeregin horretarako tresna bat: Eihera.
Entitate izendunetatik harago, ordea, euskarazko bestelako aipamen testualen sailkapena hastapenetan da oraindik (nahiz aipamenen detekzioan lan mardula egin den berriki).
Testuinguru honetan, proiektu honen xedea aipamen testualen sailkapenean sakontzea da.
Zehatzago, ezagutzan eta ikasketa automatikoan oinarritutako metodoak konbinatuz corpus bateko aipamen testualen sailkapen automatikoa landu nahi da.
Era batekoak edo bestekoak izan, oso baliagarria da testuen ulerkuntza automatikorako objektu errealen aipamenak detektatzea, ondo mugatzea eta, are, sailkatzea.
Oso hedatua da hizkuntzaren prozesamenduko tekniken erabilera testuetako entitate izendunak ezagutzeko eta sailkatzeko, eta ugari dira horretarako tresnak. Euskaraz ere badugu zeregin horretarako tresna bat: Eihera.
Entitate izendunetatik harago, ordea, euskarazko bestelako aipamen testualen sailkapena hastapenetan da oraindik (nahiz aipamenen detekzioan lan mardula egin den berriki).
Testuinguru honetan, proiektu honen xedea aipamen testualen sailkapenean sakontzea da.
Zehatzago, ezagutzan eta ikasketa automatikoan oinarritutako metodoak konbinatuz corpus bateko aipamen testualen sailkapen automatikoa landu nahi da.
Irakaslea:
Olatz Arregi
Ikaslea:
Amane Jimeno
Esleitua:
Ez
Titulazioa:
Bigarren irakaslea:
Xabier Arregi
Estrategikoa:
Ez
Kodea:
91008