Learning about phraseology from corpora: A linguistically motivated approach for Multiword Expression identification.

Multiword Expressions (MWEs) are idiosyncratic combinations of words which pose important challenges to Natural Language Processing. Some kinds of MWEs, such as verbal ones, are particularly hard to identify in corpora, due to their high degree of morphosyntactic flexibility. This paper describes a linguistically motivated method to gather detailed information about verb+noun MWEs (VNMWEs) from corpora. Although the main focus of this study is Spanish, the method is easily adaptable to other languages.

Loturak landuz: idazketa errazeko programa

Honakoa, idaztean letren arteko loturak modu erraz batean lantzeko programa bat da. Letren arteko loturen konplexutasunaren arabera irakasten da letrak lotzen, 'Letra xeheak bai!' argitalpeneko 6 letra-familia kontuan hartuz. Idazketaren ikaskuntza ahalik eta xamurren egiteko asmoz, loturak sailkatu egin ditugu: batetik, letren aurretiko loturak lantzen dira eta, bestetik, letren atzetiko loturak. Lotura horiek ulergarri egiteko, bigramak (bi letra segida) eta trigramak (hiru letra segida) duten hitzak lantzea proposatu dugu.

Orriak

Ixa taldea RSS-rako harpidetza egin