Testuen analisia

INTELE: red estratégica para la promoción de las infraestructuras de tecnologías del lenguaje en ehumanidades y ciencias sociales

INTELE propone la creación de una red estratégica, constituida por los investigadores españoles que están relacionados, por su participación anterior y su interés actual, con las actuales infraestructuras europeas, ya constituidas como European Research Infrastructure Consortium o ERIC, para las humanidades: CLARIN (www.clarin.eu) y DARIAH (www.dariah.eu).

Gehiago irakurriINTELE: red estratégica para la promoción de las infraestructuras de tecnologías del lenguaje en ehumanidades y ciencias sociales -ri buruz

Cross-Lingual Word Embeddings (Book Review)

Gehiago irakurriCross-Lingual Word Embeddings (Book Review) -ri buruz

Aditza+izena Unitate Fraseologikoak gaztelaniatik euskarara: azterketa eta tratamendu konputazionala // Verb+Noun Multiword Expressions: A linguistic analysis for identification and translation

Unitate Fraseologikoak (UFak) hizkuntzek bere-bereak dituzten hitz-konbinazio idiomatikoak dira. Hizkuntzaren Prozesamenduko (HPko) tresnek kalitatezko emaitzak izan ditzaten, beharrezkoa da halakoak ondo tratatzea, baina lan horrek hainbat zailtasun ditu; besteak beste, hitzez hitzeko itzulgarritasun eza. Tesi-lan honetan, aditza+izena motako UFen azterketa linguistiko bat egin dugu, halakoek HPren alorrean sortzen dituzten bi arazo garrantzitsuri aurre egiten laguntzeko: batetik, corpusetan UFak automatikoki identifikatzeari, eta bestetik, UF horiek gaztelaniaren eta euskararen

Gehiago irakurriAditza+izena Unitate Fraseologikoak gaztelaniatik euskarara: azterketa eta tratamendu konputazionala // Verb+Noun Multiword Expressions: A linguistic analysis for identification and translation -ri buruz

Spelling Normalisation of Basque Historical Texts

Gehiago irakurriSpelling Normalisation of Basque Historical Texts -ri buruz

Measuring diachronic language distance using perplexity. Application to English, Portuguese and Spanish.

The objective of this work is to set a corpus-driven methodology to quantify automatically diachronic language distance between chronological periods of several languages. We apply a perplexity-based measure to written text representing different historical periods of three languages: European English, European Portuguese and European Spanish. For this purpose, we have built historical corpora for each period, which have been compiled from different open corpus sources containing texts as close as possible to its original spelling. The results of our experiments show that a diachronic

Gehiago irakurriMeasuring diachronic language distance using perplexity. Application to English, Portuguese and Spanish. -ri buruz

Cross-lingual Diachronic Distance: Application to Portuguese and Spanish

Gehiago irakurriCross-lingual Diachronic Distance: Application to Portuguese and Spanish -ri buruz

Towards a top-down approach for an automatic discourse analysis for Basque: Segmentation and Central Unit detection tool

Lately, discourse structure has received considerable attention due to the benefits carried out by its application in several NLP task such as opinion mining, summarization, question answering, text simplification, among others.

Gehiago irakurriTowards a top-down approach for an automatic discourse analysis for Basque: Segmentation and Central Unit detection tool -ri buruz

Probing for Semantic Classes: Diagnosing the Meaning Content of Word Embeddings

Gehiago irakurriProbing for Semantic Classes: Diagnosing the Meaning Content of Word Embeddings -ri buruz

BigKnowledge for Text Mining.

BigKnowledge proiektuak ingeles, gaztelania, katalan, euskara eta galizierazko testuak prozesatzeko ikasketa sakonean oinarritutako sistemak garatu eta ebaluatuko ditu, Big Data prozesatzeko teknikak erabiliz. Hauek dira proiektuaren helburu nagusiak: - Transferitzia bidezko ikasketa teknikak garatzea, errepresentazio jarraitu eleaniztunen bidez ezagumendua hizkuntza batetik bestera pasatzkeo, edo domeinu batetik bestera pasatzeko. - Tamaina handiko ezagutza-base eleaniztunak eta neurona-sare sakonak aprobetxatzea elkar aberastu eta hobetzeko.

Gehiago irakurriBigKnowledge for Text Mining. -ri buruz

DL4NLP: Deep Learning aplicado al Procesamiento del Lenguaje Natural como apoyo a los ámbitos del RIS3

Gehiago irakurriDL4NLP: Deep Learning aplicado al Procesamiento del Lenguaje Natural como apoyo a los ámbitos del RIS3 -ri buruz

Hizkuntzak

Nor gara?

Zer egiten dugu?

Beste batzuk