segunda-feira, 12 de março de 2012

Disciplina Linguística Computacional




Lingüística Computacional e Lingüística de Corpus na Universidade Federal do Ceará

 

Programa da disciplina HBP727: Lingüística Computacional do Programa de Pós-Graduação em Lingüística da Universidade Federal do Ceará

Palavras-chave: Unix, Prolog, Python, NLTK, Natural Language Toolkit, sintaxe, semântica, morfologia, linguistica computacional, linguistica de corpus, lingüística computacional, lingüística de corpus, autômatos de estados finitos, transdutores de estados finitos, processamento computacional da linguagem natural, engenharia da gramática, corpora digitais, corpora eletrônicos

Ministério da Educação
Universidade Federal do Ceará
Pró-Reitoria de Pesquisa e Pós-Graduação

PROGRAMA DE DISCIPLINA


1. Identificação do Curso:

1.1 Curso:

Lingüística

2. Modalidades:

Mestrado ( X )
Doutorado ( X )

3. Turno(s)

Diurno (   X  )
Noturno (     )

4. Departamentos participantes

Letras Vernáculas
Letras Estrangeiras

5. Identificação da Disciplina:

Nome:

Lingüística Computacional

Código:

HBP727

Carga Horária:

64

Créditos: 

4

Optativa:

Sim ( X )                             Não (     )

Obrigatória:

Sim (     )                             Não ( X  )

6. Pré-Requisitos:


7. Professor Responsável:

Leonel Figueiredo de Alencar Araripe


8.   JUSTIFICATIVA


A lingüística computacional constitui área de interseção entre os estudos da linguagem natural e a ciência da computação. Esse enfoque interdisciplinar permite aos lingüistas não apenas direcionar suas pesquisas para aplicações tecnológicas, mas também verificar a consistência e a plausibilidade de análises descritivas de línguas particulares e de modelos teóricos da linguagem humana. A presente disciplina, que contempla subárea da Linha de Pesquisa Lingüística Aplicada do Programa de Pós-Graduação em Lingüística, oferece uma introdução ao processamento computacional das línguas naturais tanto no nível da gramática quanto do texto, voltada especialmente para estudantes de pós-graduação em lingüística sem embasamento em matemática, lógica e computação. A graduados dessas áreas, contudo, esta disciplina também poderá ser de proveito, na medida em que o processamento automático da linguagem natural pressupõe teorias, abordagens e ferramentas específicas que normalmente não integram a grade curricular desses cursos (pelo menos no Ceará).


9.   OBJETIVOS


i. Familiarizar com conceitos-chave da matemática e da lógica pressupostos pela lingüística formal e pela programação nos paradigmas procedural, lógico e de estados finitos.
ii. Desenvolver a capacidade de realizar análises gramaticais formais.
iii. Familiarizar com os elementos básicos da interface de linha de comandos bash do sistema operacional Unix, das linguagens de programação Prolog e Python, com ênfase na biblioteca NLTK (Natural Language Toolkit), e da programação de estados finitos nos sistemas FSA Utilities e xfst.
iv. Familiarizar com a metalinguagem das expressões regulares no sistema operacional Unix e na linguagem Python e desenvolver a habilidade de construir comandos com expressões regulares para extração de padrões em textos.
v. Desenvolver a habilidade de manipular corpora lingüísticos utilizando as ferramentas da biblioteca em Python do NLTK.
vi. Desenvolver a habilidade de implementar computacionalmente análises gramaticais nos formalismos do NLTK.
vii. Familiarizar com aplicações exemplares do processamento computacional da gramática.


10.   EMENTA


Estudo de formalismos para a modelação computacional da gramática das línguas naturais, de sua aplicação no desenvolvimento de ferramentas para o processamento automático da linguagem natural bem como de técnicas computacionais para a análise automática de textos no âmbito da lingüística de corpus.


11.  PROGRAMA DA DISCIPLINA


  • Fundamentos lógico-matemáticos: lógica proposicional; teoria dos conjuntos; relações e funções; lógica de predicados; línguas formais.
  • A organização da gramática: divisão de trabalho entre léxico, morfologia e sintaxe; regras de reescrita categoriais; propriedades morfossintáticas dos itens lexicais; teoria X-barra; interface semântica-sintaxe.
  • Elementos da linguagem de programação lógica PROLOG: predicados e cláusulas; fatos e regras; átomos, variáveis e listas; diretivas; unificação; operações sobre listas; mecanismo de resolução.
  • Emprego de PROLOG no processamento automático da morfologia e sintaxe: flexão e formação de palavras como concatenação de átomos; estruturação sintagmática como concatenação de listas; a Gramática de Cláusulas Definidas (Definite Clause Grammar - DCG).
  • Morfologia de estados finitos: processos morfológicos concatenativos e não-concatenativos; regras de formação de palavras; regras morfofonológicas; ferramentas de estados finitos dos pacotes FSA Utilities e xfst.
  • Lingüística de corpus: compilação e anotação de corpora; expressões regulares; ferramentas do Unix para extração de dados de corpora; processamento de textos em Python utilizando o NLTK.
  • Processamento automático da sintaxe no NLTK: Gramática livre de contexto; gramática baseada em estrutura de traços; métodos e estratégias de parsing.
  • Aplicações da análise morfológica e sintática computacionais: corretores gramaticais, sistemas de tradução automática e de diálogo homem-máquina etc.


12. FORMA DE AVALIAÇÃO


Participação nas aulas. Desempenho na resolução de exercícios teóricos e práticos, na apresentação de seminários e em provas escritas. Construção de um fragmento de gramática computacional de uma língua natural e elaboração da respectiva documentação. Desenvolvimento, apresentação e documentação de um miniprojeto na lingüística de corpus.


13.   BIBLIOGRAFIA BÁSICA

ABEILLE, Anne. Les nouvelles syntaxes. Paris: Armand Colin, 2003.
ALENCAR, Leonel Figueiredo de. Linguagem e inteligência artificial. In: MATTES, Marlene Gonçalves (Org.). Linguagens: as expressões do múltiplo. Fortaleza: Premius, 2006. p. 11-53.
ARARIBÓIA, G. Inteligência artificial: um curso prático. Rio de Janeiro: Livros Técnicos e Científicos, 1988.
BAILLY, Yves. Initiation à la programmation avec Python et C++. Paris: Pearson Education France, 2008.
BEESLEY, Kenneth R.; KARTTUNEN, Lauri. Finite state morphology. Stanford: CSLI Publications, 2003.
BIRD, S.; KLEIN, E.; LOPER, E. Natural language processing with Python: analyzing text with the Natural Language Toolkit. Sebastopol, CA, O'Reilly, 2009.
BLACKBURN, Patrick; BOS, Johan; STRIEGNITZ, Kristina. Learn Prolog now! Saarbrücken: Universität des Saarlandes, 2001. Disponível em:< http://www.coli.uni-saarland.de/~kris/learn-prolog-now/html/prolog-notes.pdf> Acesso em: 29.04.2005.
BUTT, Miriam et al. A grammar writer's cookbook. Stanford: CSLI Publications, 1999.
CARNIE, Andrew. Syntax: a generative introduction. Oxford: Blackwell, 2002.
CLOCKSIN, William F.; MELLISH, Christopher S. Programming in Prolog: using the ISO standard. 5. ed. Berlin: Springer, 2003.
DEVLIN, Keith. O gene da matemática. Tradução de Sérgio Moraes Rego. Rio de Janeiro: Record, 2004.
FALK, Yehuda N. Lexical-Functional Grammar: an introduction to parallel constraint-based syntax. Stanford: CSLI Publications, 2001.
JURAFSKY, Daniel; MARTIN, James H. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, NJ: Prentice Hall, 2008.
KLABUNDE, Ralf et al. (Orgs.). Computerlinguistik und Sprachtechnologie: eine Einführung. Heidelberg: Spektrum Akademischer Verlag, 2004.
KLENK, Ursula. Generative Syntax. Tübingen: Narr, 2003.
LANGENDOEN, D. Terence. Linguistic theory. In: BECHTEL, William; GRAHAM, George (Orgs.). A companion to cognitive science. Oxford: Blackwell, 1999. p.235-244.
LEMNITZER, Lothar; ZINSMEISTER, Heike. Korpuslinguistik: eine Einführung. Tübingen: Narr, 2006.
MIOTO, Carlos; FIGUEIREDO, Maria Cristina; LOPES, Ruth. Novo Manual de Sintaxe. Florianópolis: Insular, 2005.
MITKOV, Ruslan. The Oxford handbook of computational linguistics. Oxford: Oxford University Press, 2005.
MENUZZI, Sérgio de Moura; OTHERO, Gabriel de Ávila. Lingüística Computacional: teoria & prática. São Paulo: Parábola, 2005.
OTHERO, Gabriel de Ávila. Teoria X-barra: descrição do português e aplicação computacional. São Paulo: Contexto, 2006.
PAGANI, Luiz Arthur. Analisador gramatical em Prolog para gramáticas de estrutura sintagmática. Revista Virtual de Estudos em Linguagem - ReVEL. Ano 2, n.3, ag. 2004. [www.revelhp.cjb.net].
PARTEE, Barbara; TER MEULEN, Alice; WALL, Robert. Mathematical methods in linguistics. Kluwer, Dordrecht, 1990.
RANCHHOD, Elisabete Marques (Org.). Tratamento das línguas por computador: uma introdução à linguística computacional e suas aplicações. Lisboa: Caminho, 2001.
RAPOSO, Eduardo Paiva. Teoria da gramática: a faculdade da linguagem. 2. ed. Lisboa: Caminho, 1998.
REPPEN, Randi. Review of MonoConc Pro and WordSmith Tools. Language Learning & Technology, Vol. 5, No. 3, May 2001, pp. 32-36. Disponível em: <http://llt.msu.edu/vol5num3/review4/default.html> Acesso em: 03.09.2008
SAG, Ivan A.; WASOW, Thomas; BENDER, Emily. Syntactic theory: a formal introduction. 2. ed. Stanford: CSLI Publications, 2003.
SARDINHA, Tony Berber. Usando WordSmith Tools na investigação da linguagem. Direct Papers 40, LAEL, PUCSP, 1999. Disponível em:<www2.lael.pucsp.br/direct/DirectPapers40.pdf > Acesso em: 03.09.2008.
______. Preparação de material didático para Aprendizagem Baseada em Tarefas com WordSmith Tools e corpora. Calidoscópio, São Leopoldo, v. 4, n. 3, p. 148-155, 2006.
SOBELL, Mark G.; SEEBACH, Peter. A practical guide to UNIX for Mac OS X users. Upper Saddle River, NJ: Prentice Hall, 2006.
SOCHER, Guido. Regular expressions. LinuxFocus, July 1998. Disponível em: <http://www.linuxfocus.org/English/July1998/article53.html> Acesso em: 30.8.2008.
VIEIRA, Renata ; STRUBE DE LIMA, V. L. . Lingüística Computacional: princípios e aplicações. In: Ana Teresa Martins; Díbio leandro Borges. (Org.). SBC - Jornadas de Atualização em Inteligência Artificial (JAIA). Fortaleza - CE: , 2001, v. 3, p. 47-86. Disponível em: <http://www.di.ubi.pt/~pln/jaia12-vf.pdf>. Acesso em: 6 set. 2005.
ZELLE, John. Python programming: an introduction to computer science. Wilsonville, Oregon: Franklin, Beedle & Associates, 2004.

14.   BIBLIOGRAFIA COMPLEMENTAR

ABEILLE, Anne. Une grammaire électronique du français. Paris: CNRS Editions, 2002.
ALENCAR, Leonel Figueiredo de. Complementos verbais oracionais: uma análise léxico-funcional. Lingua(gem), Santa Maria, v. 1, n. 1, p. 173-218, jan./jun. 2004.
BAADER, Franz. Logic-based knowledge representation. In: WOOLDRIDGE, Michael J.;VELOSO, Manuela (Orgs.). Artificial intelligence today: recent trends and developments. Berlin: Springer, 1999. p.13-41.
BERMAN, Judith;FRANK, Anette. Deutsche und französische Syntax im Formalismus der LFG. Tübingen: Niemeyer, 1996.
BLACKBURN, Patrick; BOS, Johan. Representation and inference for natural language: a first course in computational semantics. Stanford: CSLI Publications, 2005.
BRESNAN, Joan. Lexical-functional syntax. Oxford: Blackwell, 2001.
CHUN, Wesley J. Core Python programming. 2. ed. Upper Saddle River, NJ: Prentice Hall, 2008.
FORST, Martin.  La traduction automatique dans le cadre formel de la LFG - Un système de traduction entre l'allemand standard et le zurichois. Cahiers du Centre de Traduction Littéraire de l'Université de Lausanne,  Lausanne, n. 41, 2002.
GOMEZ, Xavier Guinovart. Lingüística computacional. In: RAMALLO, Fernando; REI-DOVAL, Gabriel; RODRIGUEZ, Xoán Paulo (Orgs.). Manual de ciencias da linguaxe. Vigo: Xerais, 2000. p. 221-268.
HAUSSER, Roland. Foundations of computational linguistics: human-computer communication in natural language. 2. ed. Berlin: Springer, 2001.
HORNSTEIN, Norbert; NUNES, Jairo; GROHMANN, Kleanthes K. Understanding Minimalism. Cambridge: Cambridge University Press, 2005.
KRIEBEL, Wolfgang; ROSE, Andreas; SCHMITT, Dietmar. Zur Geschichte der Programmiersprache PROLOG. Disponível em:< http://www.dietmar-schmitt.de /essays/ SGI/Prolog_geschichte_1.html> Acesso em: 24.05.2005.
LOBIN, Henning; LEMNITZER, Lothar (Orgs.). Texttechnologie: Perspektiven und Anwendungen. Tübingen: Stauffenburg, 2004.
MEHLER, Alexander; LOBIN, Henning (Orgs.). Automatische Textanalyse: Systeme und Methoden zur Annotation und Analyse natürlichsprachlicher Texte. Wiesbaden: Verlag für Sozialwissenschaften, 2004.
MERTZ, David. Text processing in Python. Upper Saddle River, NJ: Addison-Wesley, 2003.
NEGNEVITSKY, Michael. Artificial intelligence: a guide to intelligent systems. New York: Addison-Wesley, 2002.
RADFORD, Andrew. Minimalist Syntax : exploring the Structure of English. 2. ed. Cambridge: Cambridge University Press, 2004.
RAPOSO, Eduardo Paiva. Da Teoria dos Princípios e Parâmetros ao Programa Minimalista: algumas idéias-chave. In: CHOMSKY, Noam. O Programa Minimalista. Tradução de Eduardo Paiva Raposo. Lisboa: Caminho, 1999. p.15-37.
REISCHER, Jürgen. Linguistische und philosophische Aspekte der natürlichen und maschinellen Sprachverarbeitung: über Denken, Sprache, Bedeutung und Handeln bei Mensch und Maschine. Idstein: Schulz-Kirchner, 2000.
RIBEIRO, Catarina Santiago. Relatório de estágio realizado no âmbito do projecto INQUER - Interacção Pessoa-Máquina em Linguagem Natural: módulo I - análise sintáctico-semântica. Lisboa: Departamento de Informática e Centro de Lingüística da Universidade de Lisboa. Disponível em: <http:// www. clul.ul. pt/clg/ inquer/ relatorio_Ribeiro03.pdf>  Acesso em: 06.02.2006.
SCHWARTZ, Randal L.; PHOENIX, Tom. Learning Perl. 3. ed. Sebastopol, CA: O'Reilly, 2001.
SCHWARZE, Christoph. Lexikalisch-funktionale Grammatik: eine Einführung in 10 Lektionen mit französischen Beispielen. Fachgruppe Sprachwissenschaft der Universität Konstanz, Arbeitspapier Nr. 76, 1998.
______. Introduction à la sémantique lexicale. Tübingen: Narr, 2001.
WIELEMAKER, Jan. SWI-Prolog 5.4 Reference Manual. Amsterdam: University of Amsterdam, Department of Social Science Informatics (SWI), 2004. Disponível em:< http://gollem.science.uva.nl/cgi-bin/nph-download/SWI-Prolog/refman/refman.pdf> Acesso em: 29.04.2005.
ZELLER, Frauke. Mensch-Roboter Interaktion: eine sprachwissenschaftliche Perspektive. Kassel: Kassel University Press, 2005.

Nenhum comentário:

Postar um comentário