educacao:dissertacoes_mestrado
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionLast revisionBoth sides next revision | ||
educacao:dissertacoes_mestrado [2008/09/19 15:30] – ambs | educacao:dissertacoes_mestrado [2008/10/05 22:18] – ambs | ||
---|---|---|---|
Line 7: | Line 7: | ||
* **LL** para projectos de fim de curso de licenciaturas de letras. | * **LL** para projectos de fim de curso de licenciaturas de letras. | ||
- | ===== Pacote | + | ===== Sistema |
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 17: | Line 18: | ||
Pretende-se enriquecer o processo de detecção de entidades usando um motor de plug-ins, e também construir um pacote distributível do RENA, portável e fácil de instalar. | Pretende-se enriquecer o processo de detecção de entidades usando um motor de plug-ins, e também construir um pacote distributível do RENA, portável e fácil de instalar. | ||
+ | Como caso de estudo, pretende-se a anotação geográfica e temporal dos depoimentos do Museu da Pessoa. | ||
- | ===== Extracção de Informação Textual Estrutural ===== | ||
+ | ===== Extracção de Informação Estruturada ===== | ||
+ | |||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
* **Área Científica: | * **Área Científica: | ||
- | Com um reconhecedor de entidades mencionadas, | + | Com um reconhecedor de entidades mencionadas, |
+ | |||
+ | Um exemplo de implementação seria a definição de padrões para extracção de informação, | ||
- | ===== Tradução Automática | + | ===== Tradução Automática |
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 35: | Line 42: | ||
O Apertium é um motor livre para tradução automática. Os recursos de tradução usados são codificados em XML, em formatos que não permitem que o seu produtor se dedique ao conteúdo linguístico e não a toda a parafenália de etiquetas. Neste sentido, pretende-se desenvolver uma (ou mais) linguagens de domínio específico (DSL) que permitam a produção eficiente de recursos de tradução para o Apertium. Neste sentido, será dado especial ênfase à construção de um tradutor PT:ES ou PT:EN. | O Apertium é um motor livre para tradução automática. Os recursos de tradução usados são codificados em XML, em formatos que não permitem que o seu produtor se dedique ao conteúdo linguístico e não a toda a parafenália de etiquetas. Neste sentido, pretende-se desenvolver uma (ou mais) linguagens de domínio específico (DSL) que permitam a produção eficiente de recursos de tradução para o Apertium. Neste sentido, será dado especial ênfase à construção de um tradutor PT:ES ou PT:EN. | ||
- | ===== Tradução Automática | + | ===== Tradução Automática |
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 47: | Line 55: | ||
===== Memórias de Tradução Distribuídas ===== | ===== Memórias de Tradução Distribuídas ===== | ||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 57: | Line 66: | ||
===== Ferramentas para Memórias de Tradução Grandes ===== | ===== Ferramentas para Memórias de Tradução Grandes ===== | ||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 63: | Line 73: | ||
Tarefas: limpeza, triangulação, | Tarefas: limpeza, triangulação, | ||
- | ===== Etiquetador | + | ===== Etiquetador |
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 73: | Line 84: | ||
Pretende-se desenvolver um etiquetador para a língua portuguesa, havendo várias hipóteses, desde a construção de um modelo para a ferramenta TnT, quer a construção de uma espécie de shallow parser por processamento em força bruta à Floresta Sintá(c)tica. | Pretende-se desenvolver um etiquetador para a língua portuguesa, havendo várias hipóteses, desde a construção de um modelo para a ferramenta TnT, quer a construção de uma espécie de shallow parser por processamento em força bruta à Floresta Sintá(c)tica. | ||
- | Possível uso de Constrain Grammars v3. | + | Possível uso de Constrain Grammars v3/Shallow Parsing. |
Line 80: | Line 91: | ||
===== NooJ2jSpell ===== | ===== NooJ2jSpell ===== | ||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 87: | Line 99: | ||
- | ===== Etelvina ===== | + | ===== Etelvina: Um gerador de personagens para IM ===== |
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 96: | Line 109: | ||
A ideia deste projecto não é a implementação de uma Eliza habitual, mas sim de um motor de Elizas. Um backend que mediante um conjunto de acções (mensagens dirigidas a si, mensagens entre outros utilizadores, | A ideia deste projecto não é a implementação de uma Eliza habitual, mas sim de um motor de Elizas. Um backend que mediante um conjunto de acções (mensagens dirigidas a si, mensagens entre outros utilizadores, | ||
+ | |||
+ | A interface destas elizas podem ser integradas em MUDs (MOOsaico), IRC ou IM (gtalk/ | ||
===== SVN CMS ===== | ===== SVN CMS ===== | ||
+ | * **Âmbito: | ||
+ | * **Proponentes: | ||
+ | * **Local:** Departamento de Informática, | ||
+ | * **Área Científica: | ||
Os CMS (Content Management Systems) têm um problema crónico: funcionam sobre Web. Enquanto que a ideia de publicar documentos é, na verdade, publicá-los na Internet, nem sempre se deseja que a interface com os gestores do Website seja também esta, via Web. | Os CMS (Content Management Systems) têm um problema crónico: funcionam sobre Web. Enquanto que a ideia de publicar documentos é, na verdade, publicá-los na Internet, nem sempre se deseja que a interface com os gestores do Website seja também esta, via Web. | ||
Line 105: | Line 124: | ||
Nesse sentido pretende-se usar como backend o SVN (subversion) de forma a permitir publicar documentos remotamente ou localmente sem o uso de um browser. | Nesse sentido pretende-se usar como backend o SVN (subversion) de forma a permitir publicar documentos remotamente ou localmente sem o uso de um browser. | ||
- | * José João Almeida (jj@di) | ||
- | |||
- | ===== Apertium PT-EN ===== | ||
- | |||
- | |||
- | O Apertium é um motor de tradução automática disponível livremente. Foi desenvolvido tendo como principal objectivo a tradução automática entre as várias línguas oficiais da nossa vizinha Espanha. Ultimamente tem vindo a incorporar novas línguas, nomeadamente a tradução entre espanhol e português, e a tradução espanhol e inglês. | ||
- | |||
- | Neste trabalho pretende-se a adaptação do Apertium para tradução entre português e inglês, tirando partido do tradutor espanhol - inglês, e de recursos que o Projecto Natura tem vindo a recolher. | ||
- | * José João Almeida (jj@di) | ||
- | * Alberto Simões (ambs@di) | ||
===== Ferramentas de Criação de Dicionários ===== | ===== Ferramentas de Criação de Dicionários ===== | ||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 130: | Line 140: | ||
===== Parguess ===== | ===== Parguess ===== | ||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 140: | Line 151: | ||
===== UTF' | ===== UTF' | ||
+ | * **Âmbito: | ||
* **Proponentes: | * **Proponentes: | ||
* **Local:** Departamento de Informática, | * **Local:** Departamento de Informática, | ||
Line 147: | Line 159: | ||
No sentido de tentar resolver este problema pretende-se fazer reverse-engineering de código C e Perl de aplicações de PLN desenvolvidas no projecto Natura, e a sua recodificação com suporte para Unicode (UTF8 ou UTF16). | No sentido de tentar resolver este problema pretende-se fazer reverse-engineering de código C e Perl de aplicações de PLN desenvolvidas no projecto Natura, e a sua recodificação com suporte para Unicode (UTF8 ou UTF16). | ||
+ | |||
+ | ===== Conversão HaScore - ABC+ ===== | ||
+ | |||
+ | * **Âmbito: | ||
+ | * **Proponentes: | ||
+ | * **Local:** Departamento de Informática, | ||
+ | * **Área Científica: | ||
+ | |||
+ | O HaScore é uma representação (simples) em Haskell para partituras musicais de forma simbólica. O ABC+ é um processador de uma sintaxe específica para a representação de partituras musicais de forma gráfica. Pretende-se desenvolver um conversor (um isomorfismo) entre estes dois formatos. | ||
+ | |||
+ | Esta tarefa obriga não só à implementação/ | ||
+ | |||
+ | |||
+ | |||