Aelius is a suite of Python, NLTK-based modules and language data for training and evaluating POS-taggers for Brazilian Portuguese and annotating corpora in this language variety:
http://aelius.sourceforge.net/
Donatus is an on-going project consisting of Python, NLTK-based tools and grammars for deep parsing and syntactical annotation of Brazilian Portuguese corpora. It includes a user-friendly graphical user interface for building syntactic parsers with the NLTK, providing some additional functionalities:
http://donatus.sourceforge.net/
O grupo CompLin – Computação e Linguagem Natural foca a investigação, em nível teórico, dos aspectos computacionais das gramáticas das línguas naturais bem como a aplicação prática desses estudos no desenvolvimento de programas de processamento automático da linguagem humana em diferentes níveis, inserindo-se, portanto, na confluência entre a linguística teórica e descritiva, a linguística de corpus e a linguística computacional.
sexta-feira, 5 de outubro de 2012
terça-feira, 2 de outubro de 2012
Trabalhos no prelo
Artigo aceito para publicação
ALENCAR,
L. F. de. "Donatus: uma interface amigável para o estudo da sintaxe formal
utilizando a biblioteca em Python do NLTK". Alfa Revista de Linguística,
São José do Rio Preto, Universidade Estadual Paulista, vol. 56, n. 2. ISSN
Impresso: 0002-5216 ISSN Eletrônico: 1981-5794.
Capítulo de livro aceito para publicação
ALENCAR,
L. F. de. "Aelius:
uma ferramenta para anotação automática de corpora usando o NLTK". Livro
com trabalhos selecionados do IX Encontro de Linguística de Corpus,
Editora Mercado de Letras, Série Espaços da Linguística de Corpus, Campinas, São Paulo.
Assinar:
Postagens (Atom)