User Tools

Site Tools


educacao:dissertacoes_mestrado

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
Last revisionBoth sides next revision
educacao:dissertacoes_mestrado [2008/09/19 15:30] ambseducacao:dissertacoes_mestrado [2008/10/05 22:18] ambs
Line 7: Line 7:
   * **LL** para projectos de fim de curso de licenciaturas de letras.   * **LL** para projectos de fim de curso de licenciaturas de letras.
  
-===== Pacote RENA =====+===== Sistema RENA (Lingua::RENA) =====
  
 +  * **Âmbito:** PL/PM/TM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 17: Line 18:
 Pretende-se enriquecer o processo de detecção de entidades usando um motor de plug-ins, e também construir um pacote distributível do RENA, portável e fácil de instalar. Pretende-se enriquecer o processo de detecção de entidades usando um motor de plug-ins, e também construir um pacote distributível do RENA, portável e fácil de instalar.
  
 +Como caso de estudo, pretende-se a anotação geográfica e temporal dos depoimentos do Museu da Pessoa.
  
  
-===== Extracção de Informação Textual Estrutural ===== 
  
 +===== Extracção de Informação Estruturada =====
 +
 +  * **Âmbito:** PM/TM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
   * **Área Científica:** I.2.7 Natural Language Processing   * **Área Científica:** I.2.7 Natural Language Processing
  
-Com um reconhecedor de entidades mencionadas, como o RENA, é possível detectar as entidades intervenientes num documento. O que se pretende é a extracção de conhecimento relativo a estas entidades: detectando factos sobre as entidades.+Com um reconhecedor de entidades mencionadas, como o RENA, é possível detectar as entidades intervenientes num documento. O que se pretende é a extracção de conhecimento relativo a estas entidades: detectando entidades e factos (relações) sobre as entidades
 + 
 +Um exemplo de implementação seria a definição de padrões para extracção de informação, processamento da Wikipedia e construção de ontologias utilizando a ferramenta Biblio::Thesaurus.
  
-===== Tradução Automática --- Apertium =====+===== Tradução Automática — Apertium =====
  
 +  * **Âmbito:** PM/TM/LL
   * **Proponentes:** José João Almeida / Alberto Simões   * **Proponentes:** José João Almeida / Alberto Simões
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 35: Line 42:
 O Apertium é um motor livre para tradução automática. Os recursos de tradução usados são codificados em XML, em formatos que não permitem que o seu produtor se dedique ao conteúdo linguístico e não a toda a parafenália de etiquetas. Neste sentido, pretende-se desenvolver uma (ou mais) linguagens de domínio específico (DSL) que permitam a produção eficiente de recursos de tradução para o Apertium. Neste sentido, será dado especial ênfase à construção de um tradutor PT:ES ou PT:EN. O Apertium é um motor livre para tradução automática. Os recursos de tradução usados são codificados em XML, em formatos que não permitem que o seu produtor se dedique ao conteúdo linguístico e não a toda a parafenália de etiquetas. Neste sentido, pretende-se desenvolver uma (ou mais) linguagens de domínio específico (DSL) que permitam a produção eficiente de recursos de tradução para o Apertium. Neste sentido, será dado especial ênfase à construção de um tradutor PT:ES ou PT:EN.
  
-===== Tradução Automática --- Text::Translator =====+===== Tradução Automática — Text::Translator =====
  
 +  * **Âmbito:** PM/TM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 47: Line 55:
 ===== Memórias de Tradução Distribuídas ===== ===== Memórias de Tradução Distribuídas =====
  
 +  * **Âmbito:** PL/PM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 57: Line 66:
 ===== Ferramentas para Memórias de Tradução Grandes ===== ===== Ferramentas para Memórias de Tradução Grandes =====
  
 +  * **Âmbito:** PL/PM/...TM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 63: Line 73:
 Tarefas: limpeza, triangulação, extracção de sub-domínios activos, avaliador Tarefas: limpeza, triangulação, extracção de sub-domínios activos, avaliador
  
-===== Etiquetador Morfosintactico =====+===== Etiquetador para PLN =====
  
 +  * **Âmbito:** PM/TM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 73: Line 84:
 Pretende-se desenvolver um etiquetador para a língua portuguesa, havendo várias hipóteses, desde a construção de um modelo para a ferramenta TnT, quer a construção de uma espécie de shallow parser por processamento em força bruta à Floresta Sintá(c)tica. Pretende-se desenvolver um etiquetador para a língua portuguesa, havendo várias hipóteses, desde a construção de um modelo para a ferramenta TnT, quer a construção de uma espécie de shallow parser por processamento em força bruta à Floresta Sintá(c)tica.
  
-Possível uso de Constrain Grammars v3.+Possível uso de Constrain Grammars v3/Shallow Parsing.
  
  
Line 80: Line 91:
 ===== NooJ2jSpell ===== ===== NooJ2jSpell =====
  
 +  * **Âmbito:** PL... / PM / LL
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 87: Line 99:
  
  
-===== Etelvina =====+===== Etelvina: Um gerador de personagens para IM =====
  
 +  * **Âmbito:** PL/PM/TM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 96: Line 109:
  
 A ideia deste projecto não é a implementação de uma Eliza habitual, mas sim de um motor de Elizas. Um backend que mediante um conjunto de acções (mensagens dirigidas a si, mensagens entre outros utilizadores, etc) reaja de acordo com a forma como foi programado (com um conjunto de regras e padrões). A ideia deste projecto não é a implementação de uma Eliza habitual, mas sim de um motor de Elizas. Um backend que mediante um conjunto de acções (mensagens dirigidas a si, mensagens entre outros utilizadores, etc) reaja de acordo com a forma como foi programado (com um conjunto de regras e padrões).
 +
 +A interface destas elizas podem ser integradas em MUDs (MOOsaico), IRC ou IM (gtalk/xmpp)
  
  
 ===== SVN CMS ===== ===== SVN CMS =====
  
 +  * **Âmbito:** PL/PM
 +  * **Proponentes:** Alberto Simões / José João Almeida
 +  * **Local:** Departamento de Informática, Universidade do Minho 
 +  * **Área Científica:** I.2.7 Natural Language Processing
  
 Os CMS (Content Management Systems) têm um problema crónico: funcionam sobre Web. Enquanto que a ideia de publicar documentos é, na verdade, publicá-los na Internet, nem sempre se deseja que a interface com os gestores do Website seja também esta, via Web. Os CMS (Content Management Systems) têm um problema crónico: funcionam sobre Web. Enquanto que a ideia de publicar documentos é, na verdade, publicá-los na Internet, nem sempre se deseja que a interface com os gestores do Website seja também esta, via Web.
Line 105: Line 124:
 Nesse sentido pretende-se usar como backend o SVN (subversion) de forma a permitir publicar documentos remotamente ou localmente sem o uso de um browser. Nesse sentido pretende-se usar como backend o SVN (subversion) de forma a permitir publicar documentos remotamente ou localmente sem o uso de um browser.
  
-    * José João Almeida (jj@di) 
- 
-===== Apertium PT-EN ===== 
- 
- 
-O Apertium é um motor de tradução automática disponível livremente. Foi desenvolvido tendo como principal objectivo a tradução automática entre as várias línguas oficiais da nossa vizinha Espanha. Ultimamente tem vindo a incorporar novas línguas, nomeadamente a tradução entre espanhol e português, e a tradução espanhol e inglês. 
- 
-Neste trabalho pretende-se a adaptação do Apertium para tradução entre português e inglês, tirando partido do tradutor espanhol - inglês, e de recursos que o Projecto Natura tem vindo a recolher. 
  
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
  
 ===== Ferramentas de Criação de Dicionários ===== ===== Ferramentas de Criação de Dicionários =====
  
 +  * **Âmbito:** PL; PM; LL.
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 130: Line 140:
 ===== Parguess ===== ===== Parguess =====
  
 +  * **Âmbito:** PM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 140: Line 151:
 ===== UTF'ização de software de PLN ===== ===== UTF'ização de software de PLN =====
  
 +  * **Âmbito:** PM
   * **Proponentes:** Alberto Simões / José João Almeida   * **Proponentes:** Alberto Simões / José João Almeida
   * **Local:** Departamento de Informática, Universidade do Minho    * **Local:** Departamento de Informática, Universidade do Minho 
Line 147: Line 159:
  
 No sentido de tentar resolver este problema pretende-se fazer reverse-engineering de código C e Perl de aplicações de PLN desenvolvidas no projecto Natura, e a sua recodificação com suporte para Unicode (UTF8 ou UTF16). No sentido de tentar resolver este problema pretende-se fazer reverse-engineering de código C e Perl de aplicações de PLN desenvolvidas no projecto Natura, e a sua recodificação com suporte para Unicode (UTF8 ou UTF16).
 +
 +===== Conversão HaScore - ABC+ =====
 +
 +  * **Âmbito:** PM
 +  * **Proponentes:** Alberto Simões / José João Almeida / José Nuno Oliveira
 +  * **Local:** Departamento de Informática, Universidade do Minho 
 +  * **Área Científica:** D.3.4 - Processors
 +
 +O HaScore é uma representação (simples) em Haskell para partituras musicais de forma simbólica. O ABC+ é um processador de uma sintaxe específica para a representação de partituras musicais de forma gráfica. Pretende-se desenvolver um conversor (um isomorfismo) entre estes dois formatos.
 +
 +Esta tarefa obriga não só à implementação/adaptação de parsers destas duas linguagens, bem como a definição de equivalências das respectivas linguagens.
 +
 +
 +