1º Colóquio de Linguística para o Processamento Automático de Linguagem Natural – 1º LiPrAL
UFES - Campus universitário de Goiabeiras
novembro 29, 2012 – novembro 30, 2012
UFES - Campus universitário de Goiabeiras
novembro 29, 2012 – novembro 30, 2012
Minicurso Introdução à análise sintática automática do português
Leonel Figueiredo de Alencar
Universidade Federal o Ceará (UFC)
No
âmbito das tecnologias da linguagem natural, a análise sintática
automática (parsing)
tem um amplo leque de aplicações, que vão da extração de
informações à tradução automática, passando pela resolução de
perguntas. Por outro lado, na linguística teórica e descritiva, a
implementação computacional de uma gramática de uma língua
permite verificar a sua consistência, adequação empírica e
plausibilidade psicológica, por meio da aplicação de um parser
a uma grande quantidade de textos. Neste minicurso, mostramos como
desenvolver e testar parsers
do português por meio do Aelius
e do Donatus, que
juntos constituem uma caixa de ferramentas para o parsing
tanto raso quanto profundo e a anotação de corpora, combinando o
processamento estatístico da linguagem natural com a abordagem
baseada em regras. Implementados em Python e distribuídos sob uma
licença livre, esses pacotes oferecem não só uma interface mais
amigável para o NLTK (no qual estão
sobretudo baseados) e outras bibliotecas, mas também várias outras
facilidades, ao mesmo tempo em que contribuem para diminuir a
carência de recursos livres para o processamento morfossintático
computacional do português do Brasil.
Leituras recomendadas
ALENCAR, L. F. de. Donatus: uma interface amigável para o estudo da sintaxe formal utilizando a biblioteca em Python do NLTK. Alfa, rev. linguíst. (São José Rio Preto) [online]. 2012, vol.56, n.2, pp. 523-555. ISSN 1981-5794.
ALENCAR, L. F. de (Org.) ; OTHERO, G. A. (Org.) . Abordagens computacionais da teoria da gramática. 1. ed. Campinas: Mercado de Letras, 2012. 304 p.
ALENCAR, L. F. de. Utilização de informações lexicais extraídas automaticamente de corpora na análise sintática computacional do português. Revista de Estudos da Linguagem, Belo Horizonte, vol. 19, n. 1, p. 7-85, jan./jun. 2011.
Cursos de Python:
Learn to Program: The Fundamentals
Think Python: How to Think Like a Computer Scientist
Python Brasil
Nenhum comentário:
Postar um comentário