Tecnologı́as del lenguaje para la enseñanza e investigación en Humanidades Digitales

El acercamiento digital al estudio de las humanidades ofrece nuevas oportunidades para la enseñanza, la colaboración, la reutilización de herramientas y la difusión multimodal de estos estudios. Nuevas actividades, objetos de estudio y técnicas de investigación han propiciado nuevas formas para leer, escribir, revisar, buscar, ordenar, describir, enseñar e investigar.

Best system at the shared task on Automatic Disability Annotation at Ibereval 2018

This work was pursued by the IXAMed group in the DIANN-Ibereval 2018 task. The task consists of identifying disabilities within a collection of several abstracts from Elsevier journal papers related to the biomedical domain. These corpora include the annotation of negation when it applies to a disability. The evaluation of the task is divided in two sub-tasks; one corresponding to the detection of English entities and the other to Spanish entities. Our system achieves the best task F-score for both English and Spanish disability identification, showing the suitability of our approach even with quite small training corpus. Our F-score is 0.821 for English and of 0.786 for Spanish.

Hizkuntza-ulermenari ekarpenak: n-gramen arteko atentzio eta lerrokatzeak antzekotasun eta inferentzia interpretagarrirako

Hizkuntzaren Prozesamenduaren bitartez hezkuntzaren alorreko sistema adi-
mendunak hobetzea posible da, ikasleen eta irakasleen lan-karga nabarmenki
arinduz. Tesi honetan esaldi-mailako hizkuntza-ulermena aztertu eta propo-
samen berrien bitartez sistema adimendunen hizkuntza-ulermena areagotzen
dugu, sistemei erabiltzailearen esaldiak modu zehatzagoan interpretatzeko
gaitasuna emanez. Esaldiak modu finean interpretatzeko gaitasunak feed-
back a modu automatikoan sortzeko aukera ematen baitu.

Tesi hau garatzeko hizkuntza-ulermenean sakondu dugu antzekotasun seman-
tikoari eta inferentzia logikoari dagokien ezaugarriak eta sistemak aztertuz.
Bereziki, esaldi barneko hitzak multzotan egituratuz eta lerrokatuz esaldiak
hobeto modelatu daitezkeela erakutsi dugu. Horretarako, hitz solteak lerro-
katzen dituen aurrekarien egoerako neurona-sare sistema bat inplementatu
eta n-grama arbitrarioak lerrokatzeko moldaketak egin ditugu. Hitzen arte-
ko lerrokatzea aspalditik ezaguna bada ere, tesi honek, lehen aldiz, n-grama
arbitrarioak atentzio-mekanismo baten bitartez lerrokatzeko propo-
samenak plazaratzen ditu.

Gainera, esaldien arteko antzekotasunak eta desberdintasunak modu zeha-
tzean identifikatzeko, esaldien interpretagarritasuna areagotzeko eta ikasleei
feedback zehatza emateko geruza berri bat sortu dugu: iSTS. Antzekota-
sun semantikoa eta inferentzia logikoa biltzen dituen geruza horrekin
chunk ak lerrokatu ditugu, eta ikasleei feedback zehatza emateko gai izan
garela frogatu dugu hezkuntzaren testuinguruko bi ebaluazio-eszenariotan.

Tesi honekin batera hainbat sistema eta datu-multzo argitaratu dira etorki-
zunean komunitate zientifikoak ikertzen jarrai dezan.

Orriak

Ixa taldea RSS-rako harpidetza egin