Products
Applications
Ixan bisataratu | |||||
---|---|---|---|---|---|
Analhitza | Online tool to extract linguistic information from a corpus | Morfologia, Bestelakoak | ✓ | ||
BASYQUE | A web application to analyse syntactic variation of Basque dialects | Sintaxia-Morfosintaxia | ✓ | ||
Berbatek_bikoizketa | Automatic dubbing of documentaries. | Itzulpen automatikoa | ✓ | ||
BertsolariXa | Finds words ended by a given rhyme. | Hiztegiak, Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | ✓ | ||
Diccionario Básico Escolar | Students basic dictionary (Cuba). | Hiztegiak, Lexikografia-Semantika | ✓ | ||
EUSMT | Statistical Machine Translation from Spanish to Basque | Itzulpen automatikoa | ✓ | ||
Ihardetsi | A Question-Answering system for the area of Science and Technology | Informazioaren berreskurapena eta erauzketa | ✓ | ||
Maria chatbot | Mary is capable of answering questions about a person or something else that is on Wikipedia in 3 languages: Basque, Spanish and English. | ✓ | |||
Matxin | Machine translation from Spanish to Basque | Itzulpen automatikoa | ✓ | ||
Opentrad | Machine translation system | Itzulpen automatikoa | ✓ | ||
Xuxen | Basque spelling corrector on-line | Morfologia | ✓ | ||
Berbatek_Irakasle | Personal teacher for language learning | Hizkuntzen ikasketa | |||
Bertso-eskola digitala | Bertso bat osatzeko laguntzak: Errimak bilatzeko, bertsoaren neurria ondo dagoela egiaztatzeko, sinonimoak, doinuak eta neurriak bilatzeko ere... | Hiztegiak, Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | |||
Biografix | Biografix is a multilingual NLP tool that removes the parenthetical biographical structures and creates new sentences out of them. | Bestelakoak | |||
Elhuyar-Word | Dictionary system integrated into the Word 2000 text-processor. | Hiztegiak | |||
Anhitz | A Basque-Speaking Virtual 3D Expert on Science and Technology | Informazioaren berreskurapena eta erauzketa, Itzulpen automatikoa | |||
EusEduSeg: euskarazko diskurtso segmentatzaile automatikoa | EusEduSeg tresnak testu-fitxategia aditza duten perpaus adberbial edo adjuntuetan zatitzen du hiru formatu ezberdinetan: i) testu fitxategia, lerro saltoekin, ii) RS3 formatuan, RSTTool tresnarekin erlaziozko diskurtso egitura etiketatzeko eta iii) DiZer analizatzaile diskurtsibo automatikoan erabiltzeko. | Bestelakoak | |||
leXkit | Generic XML-based Dictionary CMS | Lexikografia-Semantika | |||
MultiAzterTest: a Multilingual Analyzer on Multiple Levels of Language and Readability Assessment | MultiAzterTest is an open source NLP tool and web application which analyzes texts on over 125 measures of cohesion, language, and readability for English, Spanish and Basque. | Bestelakoak | |||
Multimeteo euskaraz | Generación automática de partes meteorológicos | Itzulpen automatikoa, Bestelakoak | |||
SentiTegi: Basque lexicon with semantic-oriented words | The lexicon contains 1,237 words of four grammatical categories. The semantic values of the words are between -5 and +5. | Hiztegiak | |||
VecMap: cross-lingual word embedding mappings | Open source implementation of our framework to learn cross-lingual word embedding mappings and produce bilingual dictionaries | Lexikografia-Semantika, Itzulpen automatikoa |
Linguistic Resources
Ixan bisataratu | |||||
---|---|---|---|---|---|
e-ROLda | A tool for looking up verb entries in the BVI lexicon and examples in EPEC-RolSem corpus | Lexikografia-Semantika | ✓ | ||
EDBL | EDBL lexical database | Morfologia | ✓ | ||
EusWN | Basque Wordnet | Ontologiak, Lexikografia-Semantika | ✓ | ||
Idiomatic language Test Suite (IdioTS dataset) | The Idiomatic language Test Suite (IdioTS dataset) | Corpusak | ✓ | ||
Konbitzul | Online database of Spanish-Basque Multiword Expression translation | Corpusak, Hiztegiak | ✓ | ||
AnCora | AnCora consists of a Basque corpus (EPEC-EU), a Spanish corpus (ANCORA-CAS) and a Catalan corpus (ANCORA-CAT). | Sintaxia-Morfosintaxia, Corpusak | |||
CommonsCaptions Corpora | Wikimedia Commons-eko irudien azalpen elebidunak. es-eu eta en-ga // Bilingual captions of images from Wikimedia Commons, en-ga and es-eu | Corpusak | |||
DoQA | A dataset for Domain specific FAQs via conversational QA | Bestelakoak | |||
EDGK | Rule-based Dependency Grammar for Basque | Sintaxia-Morfosintaxia | |||
EDIEC | Basque Disambiguated Named Entities Corpus | Corpusak | |||
EIEC | Basque Named Entities Corpus | Corpusak | |||
ElkarHizketak | Conversational Question Answering dataset in Basque | Bestelakoak | |||
EPEC-DEP (BDT) | A syntactic corpus tagged using the Dependency Grammar Theory | Sintaxia-Morfosintaxia, Corpusak, Lexikografia-Semantika | |||
EPEC-EuSemcor | Corpus tagged with Basque WordNet senses | Corpusak, Lexikografia-Semantika | |||
EPEC-KORREF | Basque Correference Corpus | Corpusak | |||
Erreus | A database system for storing errors | Hizkuntzen ikasketa | |||
Euskal RST Treebank | Basque RST relation- and tree-bank | Corpusak | |||
Euskarazko hizkuntza ereduak | Euskararako entrenatu diren hiru eredu neuronal daude publikoki atzigarriak. | ||||
Euskarazko Testu Sinplifikatuen Corpusa (ETSC) - Corpus of Basque simplified texts (CBST) | Testu Sinplifikatuen Corpusa | Corpusak | |||
Euskarazko Wikipediaren esportazioa (2016ko apirilak 7ko bertsioa) | Basque wikipedia exportation | Bestelakoak | |||
Gero Corpus Historikoa | Datasets for modernising historical Basque words | Corpusak | |||
MCR: Multilingual Central Repository | Multilingual lexical database with wordnets for several European languages. | Lexikografia-Semantika | |||
NLTK-eu | Some Basque and Spanish resources to use with NLTK (Natural Language ToolKit) | Sintaxia-Morfosintaxia, Corpusak, Bestelakoak | |||
QLDB | Lexical database of the Quechua language | Lexikografia-Semantika | |||
RSTz eta sentimenduz etiketatutako iritzien corpusa | Corpusak | ||||
Spanish AMR Corpus | Spanish AMR corpus | Corpusak | |||
TZOS-rdf | RDF representation of TZOS terminology | Hiztegiak | |||
Universal Dependencies treebank for Basque | Universal Dependencies treebank for Basque | Corpusak | |||
Wikipedia_tituluak_es_eu_2018 | Corpus elebiduna: Euskal Wikipedian eta Espainierazko Wikipedian dauden artikuluen tituluak | Corpusak | |||
WordNetetik DBpediarako mapaketa | A mapping from English WordNet 3.0 URIs to DBpedia 3.9 URIs | Ontologiak | |||
ZT Corpusa | Morphosyntactically-tagged Science and Technology corpus. | Sintaxia-Morfosintaxia, Corpusak, Lexikografia-Semantika |
Linguistic processors
Ixan bisataratu | |||||
---|---|---|---|---|---|
Eihera | Basque named entities recognizer/classifier | Informazioaren berreskurapena eta erauzketa | ✓ | ||
Eustagger | Basque lemmatizer and morphosyntactic analyzer | Sintaxia-Morfosintaxia, Morfologia | ✓ | ||
Ixati | Chunker | Sintaxia-Morfosintaxia | ✓ | ||
Maltixa | Statistic-based dependency parser | Sintaxia-Morfosintaxia | ✓ | ||
Morfeus | Morphological analyzer | Morfologia | ✓ | ||
WSD-IXA | Word-Sense Disambiguation | Lexikografia-Semantika | ✓ | ||
Eulia | Environment for text tagging | Sintaxia-Morfosintaxia, Morfologia | |||
IXA pipes: Hizkuntzaren Prozesamendurako tresnak | Multilingual NLP tools | Informazioaren berreskurapena eta erauzketa, Lexikografia-Semantika | |||
ixaKat | A modular chain of Natural Language Processing tools for Basque | Sintaxia-Morfosintaxia, Morfologia | |||
IxaMedTagger | Gaztelerazko txosten medikuetan entitate izendunak (gaixotasunak, gorputz atalak, medikamentuak ...) identifikatzen dituen tresna. Ataza hori aurrera eramateko pertzeptroia erabiltzen du. | Informazioaren berreskurapena eta erauzketa | |||
LibiXaml | Library for integrating several linguistic processors | Bestelakoak | |||
MateIXA | Mate statistic parser for Basque | Sintaxia-Morfosintaxia | |||
UKB | Graph-based word sense disambiguation and similarity | Lexikografia-Semantika |