Products
Applications
![]() |
Analhitza | Online tool to extract linguistic information from a corpus | Morfologia, Bestelakoak | |
Anhitz | A Basque-Speaking Virtual 3D Expert on Science and Technology | Informazioaren berreskurapena eta erauzketa, Itzulpen automatikoa | ||
![]() |
BASYQUE | A web application to analyse syntactic variation of Basque dialects | Sintaxia-Morfosintaxia | |
![]() |
Berbatek_bikoizketa | Automatic dubbing of documentaries. | Itzulpen automatikoa | |
Berbatek_Irakasle | Personal teacher for language learning | Hizkuntzen ikasketa | ||
Bertso-eskola digitala | Bertso bat osatzeko laguntzak: Errimak bilatzeko, bertsoaren neurria ondo dagoela egiaztatzeko, sinonimoak, doinuak eta neurriak bilatzeko ere... | Hiztegiak, Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | ||
![]() |
BertsolariXa | Finds words ended by a given rhyme. | Hiztegiak, Lexikografia-Semantika, Informazioaren berreskurapena eta erauzketa | |
![]() |
Biografix | Biografix is a multilingual NLP tool that removes the parenthetical biographical structures and creates new sentences out of them. | Bestelakoak | |
![]() |
Diccionario Básico Escolar | Students basic dictionary (Cuba). | Hiztegiak, Lexikografia-Semantika | |
![]() |
Elhuyar-Word | Dictionary system integrated into the Word 2000 text-processor. | Hiztegiak | |
EusEduSeg: euskarazko diskurtso segmentatzaile automatikoa | EusEduSeg tresnak testu-fitxategia aditza duten perpaus adberbial edo adjuntuetan zatitzen du hiru formatu ezberdinetan: i) testu fitxategia, lerro saltoekin, ii) RS3 formatuan, RSTTool tresnarekin erlaziozko diskurtso egitura etiketatzeko eta iii) DiZer analizatzaile diskurtsibo automatikoan erabiltzeko. | Bestelakoak | ||
![]() |
EUSMT | Statistical Machine Translation from Spanish to Basque | Itzulpen automatikoa | |
![]() |
Ihardetsi | A Question-Answering system for the area of Science and Technology | Informazioaren berreskurapena eta erauzketa | |
leXkit | Generic XML-based Dictionary CMS | Lexikografia-Semantika | ||
![]() |
Maria chatbot | Mary is capable of answering questions about a person or something else that is on Wikipedia in 3 languages: Basque, Spanish and English. | ||
![]() |
![]() |
Matxin | Machine translation from Spanish to Basque | Itzulpen automatikoa |
![]() |
![]() |
MultiAzterTest: a Multilingual Analyzer on Multiple Levels of Language and Readability Assessment | MultiAzterTest is an open source NLP tool and web application which analyzes texts on over 125 measures of cohesion, language, and readability for English, Spanish and Basque. | Bestelakoak |
Multimeteo euskaraz | Generación automática de partes meteorológicos | Itzulpen automatikoa, Bestelakoak | ||
![]() |
Opentrad | Machine translation system | Itzulpen automatikoa | |
SentiTegi: Basque lexicon with semantic-oriented words | The lexicon contains 1,237 words of four grammatical categories. The semantic values of the words are between -5 and +5. | Hiztegiak | ||
![]() |
VecMap: cross-lingual word embedding mappings | Open source implementation of our framework to learn cross-lingual word embedding mappings and produce bilingual dictionaries | Lexikografia-Semantika, Itzulpen automatikoa | |
![]() |
![]() |
Xuxen | Basque spelling corrector on-line | Morfologia |
Linguistic Resources
![]() |
AnCora | AnCora consists of a Basque corpus (EPEC-EU), a Spanish corpus (ANCORA-CAS) and a Catalan corpus (ANCORA-CAT). | Sintaxia-Morfosintaxia, Corpusak | |
![]() |
CommonsCaptions Corpora | Wikimedia Commons-eko irudien azalpen elebidunak. es-eu eta en-ga // Bilingual captions of images from Wikimedia Commons, en-ga and es-eu | Corpusak | |
![]() |
DoQA | A dataset for Domain specific FAQs via conversational QA | Bestelakoak | |
![]() |
![]() |
e-ROLda | A tool for looking up verb entries in the BVI lexicon and examples in EPEC-RolSem corpus | Lexikografia-Semantika |
![]() |
EDBL | EDBL lexical database | Morfologia | |
EDGK | Rule-based Dependency Grammar for Basque | Sintaxia-Morfosintaxia | ||
![]() |
EDIEC | Basque Disambiguated Named Entities Corpus | Corpusak | |
![]() |
EIEC | Basque Named Entities Corpus | Corpusak | |
![]() |
ElkarHizketak | Conversational Question Answering dataset in Basque | Bestelakoak | |
![]() |
EPEC-DEP (BDT) | A syntactic corpus tagged using the Dependency Grammar Theory | Sintaxia-Morfosintaxia, Corpusak, Lexikografia-Semantika | |
![]() |
EPEC-EuSemcor | Corpus tagged with Basque WordNet senses | Corpusak, Lexikografia-Semantika | |
![]() |
EPEC-KORREF | Basque Correference Corpus | Corpusak | |
Erreus | A database system for storing errors | Hizkuntzen ikasketa | ||
Euskal RST Treebank | Basque RST relation- and tree-bank | Corpusak | ||
![]() |
Euskarazko hizkuntza ereduak | Euskararako entrenatu diren hiru eredu neuronal daude publikoki atzigarriak. | ||
![]() |
Euskarazko Testu Sinplifikatuen Corpusa (ETSC) - Corpus of Basque simplified texts (CBST) | Testu Sinplifikatuen Corpusa | Corpusak | |
![]() |
Euskarazko Wikipediaren esportazioa (2016ko apirilak 7ko bertsioa) | Basque wikipedia exportation | Bestelakoak | |
![]() |
![]() |
EusWN | Basque Wordnet | Ontologiak, Lexikografia-Semantika |
![]() |
Gero Corpus Historikoa | Datasets for modernising historical Basque words | Corpusak | |
![]() |
![]() |
Konbitzul | Online database of Spanish-Basque Multiword Expression translation | Corpusak, Hiztegiak |
MCR: Multilingual Central Repository | Multilingual lexical database with wordnets for several European languages. | Lexikografia-Semantika | ||
![]() |
NLTK-eu | Some Basque and Spanish resources to use with NLTK (Natural Language ToolKit) | Sintaxia-Morfosintaxia, Corpusak, Bestelakoak | |
QLDB | Lexical database of the Quechua language | Lexikografia-Semantika | ||
![]() |
RSTz eta sentimenduz etiketatutako iritzien corpusa | Corpusak | ||
![]() |
Spanish AMR Corpus | Spanish AMR corpus | Corpusak | |
![]() |
TZOS-rdf | RDF representation of TZOS terminology | Hiztegiak | |
![]() |
Universal Dependencies treebank for Basque | Universal Dependencies treebank for Basque | Corpusak | |
![]() |
Wikipedia_tituluak_es_eu_2018 | Corpus elebiduna: Euskal Wikipedian eta Espainierazko Wikipedian dauden artikuluen tituluak | Corpusak | |
![]() |
WordNetetik DBpediarako mapaketa | A mapping from English WordNet 3.0 URIs to DBpedia 3.9 URIs | Ontologiak | |
ZT Corpusa | Morphosyntactically-tagged Science and Technology corpus. | Sintaxia-Morfosintaxia, Corpusak, Lexikografia-Semantika |
Linguistic processors
![]() |
Eihera | Basque named entities recognizer/classifier | Informazioaren berreskurapena eta erauzketa | |
Eulia | Environment for text tagging | Sintaxia-Morfosintaxia, Morfologia | ||
![]() |
Eustagger | Basque lemmatizer and morphosyntactic analyzer | Sintaxia-Morfosintaxia, Morfologia | |
![]() |
IXA pipes: Hizkuntzaren Prozesamendurako tresnak | Multilingual NLP tools | Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | |
![]() |
ixaKat | A modular chain of Natural Language Processing tools for Basque | Sintaxia-Morfosintaxia, Morfologia | |
![]() |
IxaMedTagger | Gaztelerazko txosten medikuetan entitate izendunak (gaixotasunak, gorputz atalak, medikamentuak ...) identifikatzen dituen tresna. Ataza hori aurrera eramateko pertzeptroia erabiltzen du. | Informazioaren berreskurapena eta erauzketa | |
![]() |
Ixati | Chunker | Sintaxia-Morfosintaxia | |
LibiXaml | Library for integrating several linguistic processors | Bestelakoak | ||
![]() |
Maltixa | Statistic-based dependency parser | Sintaxia-Morfosintaxia | |
MateIXA | Mate statistic parser for Basque | Sintaxia-Morfosintaxia | ||
![]() |
Morfeus | Morphological analyzer | Morfologia | |
![]() |
UKB | Graph-based word sense disambiguation and similarity | Lexikografia-Semantika | |
![]() |
WSD-IXA | Word-Sense Disambiguation | Lexikografia-Semantika |