User Tools

Site Tools


educacao:propostas_dissertacao_2010_2011

This is an old revision of the document!


Propostas Dissertação 2010/2011

Análise, comparação e homogeneização de etiquetadores

  • Tema/Título: Análise, comparação e homogeneização de etiquetadores
  • Área Científica: I.2.7 Natural Language Processing / Text analysis
  • Proponentes: José João Almeida (+ Alberto Simões)
  • Local: DIUM / Projecto PER-FIDE
  • Descrição: Existem disponíveis vários etiquetadores morfo-sintácticos para várias línguas. Infelizmente não existem todas as línguas disponíveis para cada motor, e existem models da mesma língua para motores diferentes. Ora, no projecto Per-Fide, será necessária a etiquetação de 7 línguas (PT, ES, RU, FR, IT, DE, EN). Assim, propõe-se uma análise cuidada aos vários etiquetadores disponíveis (TNT, FreeLing, TreeTagger, entre outros), comparação das línguas disponíveis e da qualidade de etiquetação, e da construção de uma interface homogénea para todas estas ferramentas (interface e instalador).

mkBookReport - Analisador e corrector de documentos textuais

  • Tema/Título: mkBookReport - Analisador e corrector de documentos textuais
  • Área Científica: I.2.7 Natural Language Processing / Text analysis
  • Proponentes: José João Almeida
  • Local: DIUM / Projecto PER-FIDE
  • Descrição: A conversão de formatos como PDF, DOC ou RTF para texto leva à perda de informação, e a introdução de lixo no documento final. Propõe-se a criação de uma ferramenta capaz de analisar o estado de um texto após a sua conversão, e que seja capaz, mediante um conjunto de opções, de proceder à limpeza do documento (e etiquetação num formato standard XML).

mkbookreport

Workflow

freeling

Perfide (alinhamento, anotação,cwb)

cross=DAG+...

educacao/propostas_dissertacao_2010_2011.1285700987.txt.gz · Last modified: 2010/09/28 21:09 by ambs