User Tools

Site Tools


educacao:projectos_para_alunos

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

educacao:projectos_para_alunos [2008/06/15 17:58] – created ambseducacao:projectos_para_alunos [2008/09/19 15:24] (current) – removed ambs
Line 1: Line 1:
-====== Projectos para Alunos ====== 
- 
-Estes são vários projectos que o grupo Natura gostava de levar a cabo. Aos alunos interessados, por favor contactem-nos. 
- 
-===== NooJ2jSpell ===== 
- 
- 
-O NooJ é uma ferramenta bastante interessante para estudos linguísticos e tradução automática. Têm vindo a ser desenvolvidos dicionários para análise morfológica para o NooJ em várias línguas. Com este trabalho pretende-se a criação de ferramentas de intercâmbio de dicionários de análise morfológica entre o NooJ e o jSpell (analisador morfológico do projecto Natura). 
- 
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
- 
-===== Etelvina ===== 
- 
-Uma das aplicações mais antigas às quais se associa desde sempre a Inteligência Artificial são as Elizas: programas que tentam manter uma conversa com um ser humano. A ideia surgiu com o teste de Turing: o teste é considerado bem sucedido se um ser humano mantiver uma conversa com uma máquina sem nunca suspeitar de que na verdade não está a falar com um ser humano. 
- 
-A ideia deste projecto não é a implementação de uma Eliza habitual, mas sim de um motor de Elizas. Um backend que mediante um conjunto de acções (mensagens dirigidas a si, mensagens entre outros utilizadores, etc) reaja de acordo com a forma como foi programado (com um conjunto de regras e padrões). 
- 
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
- 
-===== SVN CMS ===== 
- 
- 
-Os CMS (Content Management Systems) têm um problema crónico: funcionam sobre Web. Enquanto que a ideia de publicar documentos é, na verdade, publicá-los na Internet, nem sempre se deseja que a interface com os gestores do Website seja também esta, via Web. 
- 
-Nesse sentido pretende-se usar como backend o SVN (subversion) de forma a permitir publicar documentos remotamente ou localmente sem o uso de um browser. 
- 
-    * José João Almeida (jj@di) 
- 
-===== Apertium PT-EN ===== 
- 
- 
-O Apertium é um motor de tradução automática disponível livremente. Foi desenvolvido tendo como principal objectivo a tradução automática entre as várias línguas oficiais da nossa vizinha Espanha. Ultimamente tem vindo a incorporar novas línguas, nomeadamente a tradução entre espanhol e português, e a tradução espanhol e inglês. 
- 
-Neste trabalho pretende-se a adaptação do Apertium para tradução entre português e inglês, tirando partido do tradutor espanhol - inglês, e de recursos que o Projecto Natura tem vindo a recolher. 
- 
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
- 
-===== Ferramentas de Criação de Dicionários ===== 
- 
- 
-Pretende-se construir ferramentas e uma línguam de suporte (Domain Specific Language) para a construção de dicionários de forma automática, usando como base recursos distintos, desde Corpora, Dicionários Probabilísticos de Tradução, n-gramas, listas de palavras, etc. 
- 
-    * José João Almeida (jj@di) 
- 
-===== Memórias de Tradução Distribuídas em Omega-T ===== 
- 
- 
-O Omega-T é um software Java de tradução assistida por computador. À medida que o tradutor vai realizando o seu trabalho, as traduções já realizadas são armazenadas numa base de dados (chamada de memória de tradução) que são posteriormente reutilizadas quando é preciso traduzir uma frase semelhante a uma já traduzida. 
- 
-Em 2004 foi proposta uma metodologia para o uso de Memórias de Tradução Distribuídas, memórias estas distribuídas em servidores dedicados ou em máquinas pessoais que estejam a correr o software de tradução. 
- 
-Neste projecto pretende-se a implementação de memórias de tradução distribuídas no Omega-T (numa abordagem centralizada ou P2P, de acordo com o andamento do trabalho) 
- 
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
- 
-===== Parguess ===== 
- 
- 
-Alguns dos recursos mais importantes em Processamento de Linguagem Natural são corpora: textos usados para analisar a linguagem. Para tradução automática e outras áreas de processamento de linguagem natural multilingues é importante a existência de corpora paralelos: textos juntamente com a sua tradução. Especialmente para pares de língua minoritárias, é difícil arranjar corpora paralelos em quantidades razoáveis para processamentos estatísticos. 
- 
-Com este projecto pretende-se implementar algoritmos de "adivinhação" sobre a Internet para a construção automática de corpora bilingue. 
- 
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
- 
-===== UTF'ização de software de PLN ===== 
- 
- 
-Cada vez mais os velhos métodos de codificação de caracteres (encodings) têm vindo a desaparecer em favor do Unicode (UTF8 e UTF16). Muito software continua a conseguir lidar apenas com codificações de um byte. Este tipo de limitação é especialmente nefasta em aplicações que tendem a funcionar com línguas que não as ocientais habituais. 
- 
-No sentido de tentar resolver este problema pretende-se fazer reverse-engineering de código C e Perl de aplicações de PLN desenvolvidas no projecto Natura, e a sua recodificação com suporte para Unicode (UTF8 ou UTF16). 
- 
-    * José João Almeida (jj@di) 
-    * Alberto Simões (ambs@di) 
  
educacao/projectos_para_alunos.1213545531.txt.gz · Last modified: 2008/06/15 17:58 by ambs