User Tools

Site Tools


educacao:propostas_dissertacao_2011_2012

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
educacao:propostas_dissertacao_2011_2012 [2012/07/09 18:31] – [Abc Analytics] ambseducacao:propostas_dissertacao_2011_2012 [2012/07/24 16:33] (current) – [Geração Automática de (Listas de Terminologia|Dicionários Terminológicos)] nrc
Line 2: Line 2:
  
 (a seleccionar algumas) (a seleccionar algumas)
 +
 ===== Correção Gramatical ===== ===== Correção Gramatical =====
  
Line 7: Line 8:
   * **Área Científica:** ...   * **Área Científica:** ...
   * **Local:** DIUM   * **Local:** DIUM
-  * **Descrição:** Desenvolvimento/inferência de regras para correção gramatical, para o [[http://cogroo.sourceforge.net/|CoGrOO]] ou o [[http://www.languagetool.org/|LanguageTool]]+  * **Orientação:** José João Almeida (Alberto? Pilar? Álvaro?) 
 +  * **Descrição:** Desenvolvimento/inferência de regras para correção gramatical, para o [[http://cogroo.sourceforge.net/|CoGrOO]] ou o [[http://www.languagetool.org/|LanguageTool]] (registada) 
 +    * Ver também Maltparser 
 + 
 + 
 + 
 +===== Identificação de Língua ===== 
 + 
 +  * **Tema/Título:** Identificação de Língua 
 +  * **Área Científica:** ... 
 +  * **Local:** DIUM 
 +  * **Orientação:** Alberto? ... José João Almeida (Alberto? Pilar? Álvaro?) 
 +  * **Descrição:** Desenvolvimento de um módulo Perl para identificação de língua usando uma cascata de discriminadores. (registada) 
 +    * Olhar tb para textos multilingua. 
 +===== Makefile::Parallel::SSH ===== 
 + 
 +  * **Tema/Título:** Makefile::Parallel::SSH 
 +  * **Área Científica:** ... 
 +  * **Local:** DIUM 
 +  * **Orientação:** José João Almeida (Alberto?
 +  * **Descrição:** Desenvolver um mecanismo para solicitar execução remota via SSH de pequenas tarefas. Integração deste mecanismo no Makefile::Parallel, para paralelizar tarefas remotamente. 
 +    * Map Reduce via SSH 
 +    * Clouds + Amazons + etc 
 +===== Recauchutagem de Thesauri ===== 
 + 
 +  * **Tema/Título:** Recauchutagem de Thesauri 
 +  * **Área Científica:** ... 
 +  * **Local:** DIUM 
 +  * **Orientação:** José João Almeida (Alberto? Álvaro?) 
 +  * **Descrição:** Os dicionários ortográficos do Open Office incluem um thesaurus da língua portuguesa bastante incompleto, e antigo. Pretende-se desenvolver: 
 +    * Ferramentas capazes de manipular e apresentar o thesaurus no formato OOo; 
 +    * Enriquecer o thesaurus com fontes diversas (PAPEL, Dicionário Aberto, Wikipédia, ...) - (registada)
  
 ===== Métricas de Qualidade de Tradução ===== ===== Métricas de Qualidade de Tradução =====
Line 14: Line 46:
   * **Área Científica:** ...   * **Área Científica:** ...
   * **Local:** DIUM   * **Local:** DIUM
 +  * **Orientação:** José João Almeida (Alberto?)
   * **Descrição:** Definir um conjunto de métricas que sejam capazes de avaliar a qualidade de tradução entre dois segmentos (usando recursos externos, pistas, etc). Implementação das métricas numa ferramenta que seja capaz de associar a cada unidade de tradução de uma memória de tradução (TMX) um valor quantitativo de qualidade.   * **Descrição:** Definir um conjunto de métricas que sejam capazes de avaliar a qualidade de tradução entre dois segmentos (usando recursos externos, pistas, etc). Implementação das métricas numa ferramenta que seja capaz de associar a cada unidade de tradução de uma memória de tradução (TMX) um valor quantitativo de qualidade.
  
Line 19: Line 52:
  
   * **Tema/Título:** Geração Automática de (Listas de Terminologia|Dicionários Terminológicos)   * **Tema/Título:** Geração Automática de (Listas de Terminologia|Dicionários Terminológicos)
 +  * **Alt:** Extracção Automática de Terminologia
   * **Área Científica:** I.2.7 Natural Language Processing / Text analysis   * **Área Científica:** I.2.7 Natural Language Processing / Text analysis
 +  * **Orientação:** José João Almeida (Alberto? Álvaro?)
   * **Local:** DIUM   * **Local:** DIUM
   * **Descrição:** Uma série de aplicações e técnicas de processamento de linguagem natural utilizam ou necessitam de uma lista de termos relevantes numa determinada área, ou de dicionários terminológicos (exemplos ...). Nem sempre estas listas de termos estão disponíveis, principalmente sobre tópicos muitos específicos, e muitas vezes mesmo que existam sobre um determinado tópico podem não se adequar a situação em específico. Assim propõe-se a criação implementação de um algoritmo/técnica capaz de através de uma série de heurísticas e de opções calcular listas de termos (e/ou dicionários terminológicos) a partir de um mínimo de informação. Um possível workflow inclui tarefas com o crawling de informação em recursos já disponíveis (wikipedia, etc.) através de uma seed inicial, expandir este conjunto através do uso de dicionários, thesaurus, etc e for fim ainda formas de validação/medidas de qualidade das objectos criados, e utilização dos objectos finais (ou de um subset mais pequeno) para fazer bootstrap do processo novamente.   * **Descrição:** Uma série de aplicações e técnicas de processamento de linguagem natural utilizam ou necessitam de uma lista de termos relevantes numa determinada área, ou de dicionários terminológicos (exemplos ...). Nem sempre estas listas de termos estão disponíveis, principalmente sobre tópicos muitos específicos, e muitas vezes mesmo que existam sobre um determinado tópico podem não se adequar a situação em específico. Assim propõe-se a criação implementação de um algoritmo/técnica capaz de através de uma série de heurísticas e de opções calcular listas de termos (e/ou dicionários terminológicos) a partir de um mínimo de informação. Um possível workflow inclui tarefas com o crawling de informação em recursos já disponíveis (wikipedia, etc.) através de uma seed inicial, expandir este conjunto através do uso de dicionários, thesaurus, etc e for fim ainda formas de validação/medidas de qualidade das objectos criados, e utilização dos objectos finais (ou de um subset mais pequeno) para fazer bootstrap do processo novamente.
Line 26: Line 61:
  
   * **Tema/Título:** Abc Analytics   * **Tema/Título:** Abc Analytics
 +  * **Alt:** Abc Music Analytics
   * **Área Científica:** ...   * **Área Científica:** ...
   * **Local:** DIUM   * **Local:** DIUM
-  * **Orientação:** José João Almeida, José Nuno Oliveira+  * **Orientação:** José João Almeida, José Nuno Oliveira (Nuno Carvalho -- poderá ser?)
   * **Descrição:**   * **Descrição:**
     * Análise (parsing/semântica) de Abc com objectivo de validar invariantes e verificar coerência de Abc, validar não só o Abc gerado mas também o Abc que é editado através do Wiki.     * Análise (parsing/semântica) de Abc com objectivo de validar invariantes e verificar coerência de Abc, validar não só o Abc gerado mas também o Abc que é editado através do Wiki.
Line 36: Line 72:
       * Plugin EasyABC++       * Plugin EasyABC++
       * Pipeline Wiki <-> Abc       * Pipeline Wiki <-> Abc
 +  * registada...
educacao/propostas_dissertacao_2011_2012.1341851475.txt.gz · Last modified: 2012/07/09 18:31 by ambs