educacao:dissertacoes_mestrado
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
educacao:dissertacoes_mestrado [2008/09/19 17:51] – ambs | educacao:dissertacoes_mestrado [2008/10/05 22:20] (current) – removed ambs | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Projectos ====== | ||
- | |||
- | Estes projectos estão devidamente anotados com: | ||
- | * **TM** para propostas de tese de mestrado, | ||
- | * **PM** para projectos de mestrado (típica UCE15), | ||
- | * **PL** para projectos de licenciatura (típico LI4), | ||
- | * **LL** para projectos de fim de curso de licenciaturas de letras. | ||
- | |||
- | ===== Pacote RENA ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | O RENA é um reconhecedor de entidades mencionadas que usa como fonte de informação um conjunto diverso de recursos de onde se podem salientar thesaurus ou almanaques, tabelas de classificação, | ||
- | |||
- | Pretende-se enriquecer o processo de detecção de entidades usando um motor de plug-ins, e também construir um pacote distributível do RENA, portável e fácil de instalar. | ||
- | |||
- | |||
- | |||
- | ===== Extracção de Informação Textual Estrutural ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Com um reconhecedor de entidades mencionadas, | ||
- | |||
- | ===== Tradução Automática --- Apertium ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | O Apertium é um motor livre para tradução automática. Os recursos de tradução usados são codificados em XML, em formatos que não permitem que o seu produtor se dedique ao conteúdo linguístico e não a toda a parafenália de etiquetas. Neste sentido, pretende-se desenvolver uma (ou mais) linguagens de domínio específico (DSL) que permitam a produção eficiente de recursos de tradução para o Apertium. Neste sentido, será dado especial ênfase à construção de um tradutor PT:ES ou PT:EN. | ||
- | |||
- | ===== Tradução Automática --- Text:: | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | O Text:: | ||
- | |||
- | Neste trabalho pretende-se o desenvolvimento de camadas de tradução no Text:: | ||
- | |||
- | ===== Memórias de Tradução Distribuídas ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Os sistemas de Tradução Assistida por Computador usam memórias de tradução locais para reaproveitarem traduções já realizadas. No entanto, este modelo não é eficaz em comunidades grandes ou heterogéneas de tradutores. O que se pretende é implementar arquitecturas de suporte a memórias de tradução distribuídas, | ||
- | |||
- | Para a implementação do test-case sugere-se a adaptação da ferramenta OmegaT. | ||
- | |||
- | ===== Ferramentas para Memórias de Tradução Grandes ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Tarefas: limpeza, triangulação, | ||
- | |||
- | ===== Etiquetador Morfosintactico ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Um etiquetador morfosintáctico associa categorias (e propriedades) morfológicas a palavras de um texto tentanto sempre que possível remover a ambiguidade existente. | ||
- | |||
- | Pretende-se desenvolver um etiquetador para a língua portuguesa, havendo várias hipóteses, desde a construção de um modelo para a ferramenta TnT, quer a construção de uma espécie de shallow parser por processamento em força bruta à Floresta Sintá(c)tica. | ||
- | |||
- | Possível uso de Constrain Grammars v3. | ||
- | |||
- | |||
- | |||
- | |||
- | ===== NooJ2jSpell ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | O NooJ é uma ferramenta bastante interessante para estudos linguísticos e tradução automática. Têm vindo a ser desenvolvidos dicionários para análise morfológica para o NooJ em várias línguas. Com este trabalho pretende-se a criação de ferramentas de intercâmbio de dicionários de análise morfológica entre o NooJ e o jSpell (analisador morfológico do projecto Natura). | ||
- | |||
- | |||
- | ===== Etelvina ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Uma das aplicações mais antigas às quais se associa desde sempre a Inteligência Artificial são as Elizas: programas que tentam manter uma conversa com um ser humano. A ideia surgiu com o teste de Turing: o teste é considerado bem sucedido se um ser humano mantiver uma conversa com uma máquina sem nunca suspeitar de que na verdade não está a falar com um ser humano. | ||
- | |||
- | A ideia deste projecto não é a implementação de uma Eliza habitual, mas sim de um motor de Elizas. Um backend que mediante um conjunto de acções (mensagens dirigidas a si, mensagens entre outros utilizadores, | ||
- | |||
- | |||
- | ===== SVN CMS ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Os CMS (Content Management Systems) têm um problema crónico: funcionam sobre Web. Enquanto que a ideia de publicar documentos é, na verdade, publicá-los na Internet, nem sempre se deseja que a interface com os gestores do Website seja também esta, via Web. | ||
- | |||
- | Nesse sentido pretende-se usar como backend o SVN (subversion) de forma a permitir publicar documentos remotamente ou localmente sem o uso de um browser. | ||
- | |||
- | |||
- | |||
- | ===== Ferramentas de Criação de Dicionários ===== | ||
- | |||
- | * **Âmbito: | ||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Pretende-se construir ferramentas e uma línguam de suporte (Domain Specific Language) para a construção de dicionários de forma automática, | ||
- | |||
- | |||
- | |||
- | |||
- | ===== Parguess ===== | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Alguns dos recursos mais importantes em Processamento de Linguagem Natural são corpora: textos usados para analisar a linguagem. Para tradução automática e outras áreas de processamento de linguagem natural multilingues é importante a existência de corpora paralelos: textos juntamente com a sua tradução. Especialmente para pares de língua minoritárias, | ||
- | |||
- | Com este projecto pretende-se implementar algoritmos de " | ||
- | |||
- | ===== UTF' | ||
- | |||
- | * **Proponentes: | ||
- | * **Local:** Departamento de Informática, | ||
- | * **Área Científica: | ||
- | |||
- | Cada vez mais os velhos métodos de codificação de caracteres (encodings) têm vindo a desaparecer em favor do Unicode (UTF8 e UTF16). Muito software continua a conseguir lidar apenas com codificações de um byte. Este tipo de limitação é especialmente nefasta em aplicações que tendem a funcionar com línguas que não as ocientais habituais. | ||
- | |||
- | No sentido de tentar resolver este problema pretende-se fazer reverse-engineering de código C e Perl de aplicações de PLN desenvolvidas no projecto Natura, e a sua recodificação com suporte para Unicode (UTF8 ou UTF16). | ||
educacao/dissertacoes_mestrado.1221839465.txt.gz · Last modified: 2008/09/19 17:51 by ambs