Hizkuntza baliabideak

Detection of Reading Absorption in User-Generated Book Reviews: Resources Creation and Evaluation

To detect how and when readers are experiencing engagement with a literary work, we bring together empirical literary studies and language technology via focusing on the affective state of absorption. The goal of our resource development is to enable the detection of different levels of reading absorption in millions of user-generated reviews hosted on social reading platforms. We present a corpus of social book reviews in English that we annotated with reading absorption categories.

Annotation guidelines for the Fact-Ita Bank Negation corpus

Fact-Ita Bank for FactA@EVALITA 2016 has been enriched with a new level of annotation, namely negation cues, their scope and their focus. Here we present the guidelines for negation information annotation.

INTELE: red estratégica para la promoción de las infraestructuras de tecnologías del lenguaje en ehumanidades y ciencias sociales

INTELE propone la creación de una red estratégica, constituida por los investigadores españoles que están relacionados, por su participación anterior y su interés actual, con las actuales infraestructuras europeas, ya constituidas como European Research Infrastructure Consortium o ERIC, para las humanidades: CLARIN (www.clarin.eu) y DARIAH (www.dariah.eu).

Aditza+izena Unitate Fraseologikoak gaztelaniatik euskarara: azterketa eta tratamendu konputazionala // Verb+Noun Multiword Expressions: A linguistic analysis for identification and translation

Unitate Fraseologikoak (UFak) hizkuntzek bere-bereak dituzten hitz-konbinazio idiomatikoak dira. Hizkuntzaren Prozesamenduko (HPko) tresnek kalitatezko emaitzak izan ditzaten, beharrezkoa da halakoak ondo tratatzea, baina lan horrek hainbat zailtasun ditu; besteak beste, hitzez hitzeko itzulgarritasun eza. Tesi-lan honetan, aditza+izena motako UFen azterketa linguistiko bat egin dugu, halakoek HPren alorrean sortzen dituzten bi arazo garrantzitsuri aurre egiten laguntzeko: batetik, corpusetan UFak automatikoki identifikatzeari, eta bestetik, UF horiek gaztelaniaren eta euskararen

Pages

Subscribe to RSS - Hizkuntza baliabideak