Euskarazko Testu Sinplifikatuen Corpusa (ETSC) - Corpus of Basque simplified texts (CBST)

Euskarazko Testu Sinplifikatuen Corpusa (ETSC) eskuz sinplifikatutako testuekin eta euren jatorrizko bertsioarekin osatu dugun testu-bilduma da. Testuak sinplifikatzean egin diren eragiketak deskribatzeko etiketatze-eskema osatu dugu eta testuak BRAT tresnaren (Stenetorpet al., 2012) bitartez etiketatu ditugu. The corpus of Basque simplified texts compiles 227 original sentences of science popularisation domain and two simplified versions of each sentence. The simplified versions have been created following different approaches: the structural and the intuitive. The sentences are divided in three texts (Bernoulli, Etxeko and Exoplanetak) and have been aligned to their respective simplified versions.
Deskribapen laburra: 
Testu Sinplifikatuen Corpusa
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)