Products
Applications
| Ixan bisataratu | |||||
|---|---|---|---|---|---|
|
Analhitza | Online tool to extract linguistic information from a corpus | Morfologia, Bestelakoak | ✓ | |
|
BASYQUE | A web application to analyse syntactic variation of Basque dialects | Sintaxia-Morfosintaxia | ✓ | |
|
Berbatek_bikoizketa | Automatic dubbing of documentaries. | Itzulpen automatikoa | ✓ | |
|
BertsolariXa | Finds words ended by a given rhyme. | Hiztegiak, Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | ✓ | |
|
Diccionario Básico Escolar | Students basic dictionary (Cuba). | Hiztegiak, Lexikografia-Semantika | ✓ | |
|
EUSMT | Statistical Machine Translation from Spanish to Basque | Itzulpen automatikoa | ✓ | |
|
Ihardetsi | A Question-Answering system for the area of Science and Technology | Informazioaren berreskurapena eta erauzketa | ✓ | |
|
Maria chatbot | Mary is capable of answering questions about a person or something else that is on Wikipedia in 3 languages: Basque, Spanish and English. | ✓ | ||
|
|
Matxin | Machine translation from Spanish to Basque | Itzulpen automatikoa | ✓ |
|
Opentrad | Machine translation system | Itzulpen automatikoa | ✓ | |
|
|
Xuxen | Basque spelling corrector on-line | Morfologia | ✓ |
| Berbatek_Irakasle | Personal teacher for language learning | Hizkuntzen ikasketa | |||
| Bertso-eskola digitala | Bertso bat osatzeko laguntzak: Errimak bilatzeko, bertsoaren neurria ondo dagoela egiaztatzeko, sinonimoak, doinuak eta neurriak bilatzeko ere... | Hiztegiak, Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | |||
|
Biografix | Biografix is a multilingual NLP tool that removes the parenthetical biographical structures and creates new sentences out of them. | Bestelakoak | ||
|
Elhuyar-Word | Dictionary system integrated into the Word 2000 text-processor. | Hiztegiak | ||
| Anhitz | A Basque-Speaking Virtual 3D Expert on Science and Technology | Informazioaren berreskurapena eta erauzketa, Itzulpen automatikoa | |||
| EusEduSeg: euskarazko diskurtso segmentatzaile automatikoa | EusEduSeg tresnak testu-fitxategia aditza duten perpaus adberbial edo adjuntuetan zatitzen du hiru formatu ezberdinetan: i) testu fitxategia, lerro saltoekin, ii) RS3 formatuan, RSTTool tresnarekin erlaziozko diskurtso egitura etiketatzeko eta iii) DiZer analizatzaile diskurtsibo automatikoan erabiltzeko. | Bestelakoak | |||
| leXkit | Generic XML-based Dictionary CMS | Lexikografia-Semantika | |||
|
|
MultiAzterTest: a Multilingual Analyzer on Multiple Levels of Language and Readability Assessment | MultiAzterTest is an open source NLP tool and web application which analyzes texts on over 125 measures of cohesion, language, and readability for English, Spanish and Basque. | Bestelakoak | |
| Multimeteo euskaraz | Generación automática de partes meteorológicos | Itzulpen automatikoa, Bestelakoak | |||
| SentiTegi: Basque lexicon with semantic-oriented words | The lexicon contains 1,237 words of four grammatical categories. The semantic values of the words are between -5 and +5. | Hiztegiak | |||
|
VecMap: cross-lingual word embedding mappings | Open source implementation of our framework to learn cross-lingual word embedding mappings and produce bilingual dictionaries | Lexikografia-Semantika, Itzulpen automatikoa |
Linguistic Resources
| Ixan bisataratu | |||||
|---|---|---|---|---|---|
|
|
e-ROLda | A tool for looking up verb entries in the BVI lexicon and examples in EPEC-RolSem corpus | Lexikografia-Semantika | ✓ |
|
EDBL | EDBL lexical database | Morfologia | ✓ | |
|
|
EusWN | Basque Wordnet | Ontologiak, Lexikografia-Semantika | ✓ |
| Idiomatic language Test Suite (IdioTS dataset) | The Idiomatic language Test Suite (IdioTS dataset) | Corpusak | ✓ | ||
|
|
Konbitzul | Online database of Spanish-Basque Multiword Expression translation | Corpusak, Hiztegiak | ✓ |
|
AnCora | AnCora consists of a Basque corpus (EPEC-EU), a Spanish corpus (ANCORA-CAS) and a Catalan corpus (ANCORA-CAT). | Sintaxia-Morfosintaxia, Corpusak | ||
|
CommonsCaptions Corpora | Wikimedia Commons-eko irudien azalpen elebidunak. es-eu eta en-ga // Bilingual captions of images from Wikimedia Commons, en-ga and es-eu | Corpusak | ||
|
DoQA | A dataset for Domain specific FAQs via conversational QA | Bestelakoak | ||
| EDGK | Rule-based Dependency Grammar for Basque | Sintaxia-Morfosintaxia | |||
|
EDIEC | Basque Disambiguated Named Entities Corpus | Corpusak | ||
|
EIEC | Basque Named Entities Corpus | Corpusak | ||
|
ElkarHizketak | Conversational Question Answering dataset in Basque | Bestelakoak | ||
|
EPEC-DEP (BDT) | A syntactic corpus tagged using the Dependency Grammar Theory | Sintaxia-Morfosintaxia, Corpusak, Lexikografia-Semantika | ||
|
EPEC-EuSemcor | Corpus tagged with Basque WordNet senses | Corpusak, Lexikografia-Semantika | ||
|
EPEC-KORREF | Basque Correference Corpus | Corpusak | ||
| Erreus | A database system for storing errors | Hizkuntzen ikasketa | |||
| Euskal RST Treebank | Basque RST relation- and tree-bank | Corpusak | |||
|
Euskarazko hizkuntza ereduak | Euskararako entrenatu diren hiru eredu neuronal daude publikoki atzigarriak. | |||
|
Euskarazko Testu Sinplifikatuen Corpusa (ETSC) - Corpus of Basque simplified texts (CBST) | Testu Sinplifikatuen Corpusa | Corpusak | ||
|
Euskarazko Wikipediaren esportazioa (2016ko apirilak 7ko bertsioa) | Basque wikipedia exportation | Bestelakoak | ||
|
Gero Corpus Historikoa | Datasets for modernising historical Basque words | Corpusak | ||
| MCR: Multilingual Central Repository | Multilingual lexical database with wordnets for several European languages. | Lexikografia-Semantika | |||
|
NLTK-eu | Some Basque and Spanish resources to use with NLTK (Natural Language ToolKit) | Sintaxia-Morfosintaxia, Corpusak, Bestelakoak | ||
| QLDB | Lexical database of the Quechua language | Lexikografia-Semantika | |||
|
RSTz eta sentimenduz etiketatutako iritzien corpusa | Corpusak | |||
|
Spanish AMR Corpus | Spanish AMR corpus | Corpusak | ||
|
TZOS-rdf | RDF representation of TZOS terminology | Hiztegiak | ||
|
Universal Dependencies treebank for Basque | Universal Dependencies treebank for Basque | Corpusak | ||
|
Wikipedia_tituluak_es_eu_2018 | Corpus elebiduna: Euskal Wikipedian eta Espainierazko Wikipedian dauden artikuluen tituluak | Corpusak | ||
|
WordNetetik DBpediarako mapaketa | A mapping from English WordNet 3.0 URIs to DBpedia 3.9 URIs | Ontologiak | ||
| ZT Corpusa | Morphosyntactically-tagged Science and Technology corpus. | Sintaxia-Morfosintaxia, Corpusak, Lexikografia-Semantika |
Linguistic processors
| Ixan bisataratu | |||||
|---|---|---|---|---|---|
|
Eihera | Basque named entities recognizer/classifier | Informazioaren berreskurapena eta erauzketa | ✓ | |
|
Eustagger | Basque lemmatizer and morphosyntactic analyzer | Sintaxia-Morfosintaxia, Morfologia | ✓ | |
|
Ixati | Chunker | Sintaxia-Morfosintaxia | ✓ | |
|
Maltixa | Statistic-based dependency parser | Sintaxia-Morfosintaxia | ✓ | |
|
Morfeus | Morphological analyzer | Morfologia | ✓ | |
|
WSD-IXA | Word-Sense Disambiguation | Lexikografia-Semantika | ✓ | |
| Eulia | Environment for text tagging | Sintaxia-Morfosintaxia, Morfologia | |||
|
IXA pipes: Hizkuntzaren Prozesamendurako tresnak | Multilingual NLP tools | Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | ||
|
ixaKat | A modular chain of Natural Language Processing tools for Basque | Sintaxia-Morfosintaxia, Morfologia | ||
|
IxaMedTagger | Gaztelerazko txosten medikuetan entitate izendunak (gaixotasunak, gorputz atalak, medikamentuak ...) identifikatzen dituen tresna. Ataza hori aurrera eramateko pertzeptroia erabiltzen du. | Informazioaren berreskurapena eta erauzketa | ||
| LibiXaml | Library for integrating several linguistic processors | Bestelakoak | |||
| MateIXA | Mate statistic parser for Basque | Sintaxia-Morfosintaxia | |||
|
UKB | Graph-based word sense disambiguation and similarity | Lexikografia-Semantika |







