User Tools

Site Tools


dicionarios:main

This is an old revision of the document!


Dicionários

Os dicionários disponíveis destinam-se a uso por correctores ortográficos ou analisadores morfológicos. São produzidos num ambiente Linux/Unix, contudo podem ser suportados também por outros sistemas operativos (Windows/Mac OS X). São periodicamente actualizados. Os dicionários estão cobertos pelas licenças GPL, LGPL, e MPL (ou pela menos uma delas).

Para todos os correctores ortográficos disponíveis, disponibilizamos versões pré-acordo ortográfico de 1990 e pós-acordo ortográfico. A versão por omissão é, neste momento, a pós-acordo ortográfico.

Aplicações Mozilla

Os pacotes para os dicionários de língua portuguesa das aplicações Mozilla foram disponibilizados durante anos pelo António Dias, a quem muito agradecemos. Recentemente abandonou esta tarefa, que será agora também da nossa responsabilidade.

A versão mais recente está disponível na página de Add-Ons da mozilla:

OOo/LibreOffice

Os pacotes para os dicionários de língua portuguesa das aplicações OpenOffice e LibreOffice foram disponibilizados durante anos pelo António Dias, a quem muito agradecemos. Recentemente abandonou esta tarefa, que será agora também da nossa responsabilidade.

As versões mais recentes estão disponíveis em:

iSpell

Dicionário IspellDownload

O ispell é um dos primeiros correctores ortográficos disponíveis para sistemas UNIX. Foi adoptado pela GNU para fazer parte das suas ferramentas, e só recentemente foi substituído pelo Aspell.

Embora com algumas limitações (especialmente para línguas de flexão rica, como é o caso do português), é baseado em dicionário de lemas e regras de afixação, o que confere aos seus dicionários um tamanho bastante reduzido. O jspell é baseado no código do ispell.

jSpell

Dicionário JspellDownload

O jspell é um analisador morfológica e um corrector ortográfico, e foi desenvolvido pelo projecto Natura em 1994, por expansão do Ispell. O Jspell foi desenvolvido tendo em conta as necessidades do português, existindo também uma versão Inglesa. O dicionário tem as seguintes características:

  • Língua: Português de Portugal - (pt_PT, port, portugues, português);
  • Suporta regras de afixação;
  • Contém lemas comuns, nomes próprios, siglas, abreviaturas, e estrangeirismos comuns;
  • Suporte de hífenes, palavras compostas por justaposição, e conjugações pronominais ;
  • Etiquetação morfológica e semântica;

aSpell

Dicionário Aspell (0.5)Download

GNU Aspell é um software livre para correcção ortográfica, tendo como objectivo, substituir o Ispell. Esta versão está a ser substituído pela versão 0.6, mas ainda é usada por alguns programas e vários sistemas operativos. GNU Aspell

  • Português europeu comum (O aspell 0.50 não suporta variantes que usem o mesmo código de língua)
  • Não oficial, porque não contém a variante do Brasil.
  • O dicionário não tem regras de afixação.
  • Não suporta palavras compostas e conjugações pronominais. São tratadas como 2 palavras distintas
  • Não contém o ficheiro de substituições por semelhança fonética.

Dicionário Aspell (0.6)Download

GNU Aspell é um software livre para correcção ortográfica, tendo como objectivo, substituir o Ispell. Esta versão substitui a versão 0.5 e é usada por alguns programas (Gaim, Emacs,…) e vários sistemas operativos. GNU Aspell

  • Oficial (também disponível em ftp://ftp.gnu.org/gnu/aspell/dict/0index.html)
  • O Dicionário tem regras de afixação (Semelhante ao Myspell)
  • Contém um mapa de substituições comuns de segmentos de palavras.
  • Não suporta palavras compostas, nem conjungações pronominais. São processadas como se tratassem de duas palavras distintas.

HunSpell

Dicionário HunspellDownload

O HunSpell (Hungarian spell) é uma evolução do myspell, sendo também um analisador morfológico, com um conjunto de novas funcionalidades em relação ao Myspell. É usado desde a versão 2.0.3 do OpenOffice como componente para a correcção ortográfica.

Um dicionário no formato myspell é compatível com os correctores baseados no hunspell.

Algumas características (versão 2.1.8 do hunspell)

  • Suporta parcialmente palavras compostas, e conjugações pronominais, embora necessite de ser revisto e testado!
  • Contém informação morfológica, embora a sua aplicação esteja limitada;
  • Tem um melhor mecanismo de substituição de segmentos de palavras;
  • Suporte de UTF-8;

Outros Recursos

Listas de PalavrasDownload

Lista de palavras portuguesas (incluindo algumas siglas, etc). Esta lista é derivada do dicionário Jspell para análise morfológica.

Há algumas situações de sobregeração. Esta lista tem sido usada em alguns correctores ortográficos como o do WinEdt.

Documentação da LínguaDownload

Em formato PDF estão disponíveis: tabelas de conjugação verbais (+6000 verbos), tabelas de conjugação de verbos regulares (~200), e uma lista de estrangeirismos.

Sobre os Dicionários

Notificação automática de actualizações

Um ficheiro em XML Atom está disponível para novas actualizações. Inclui resumo das alterações efectuadas (svn diff). Se não conhecer este sistema, recomendo que veja a seguinte página.

Breve história

O Jspell é um analisador morfológico open source para sistemas baseados em UNIX, baseado no Ispell, que permite mediante diversos tipos de interface analisar morfologicamente ou corrigir a ortografia de um texto. Está orientado para o processamento de textos/palavras da língua portuguesa.

O Jspell e o respectivo dicionário foi desenvolvido em 1994 por Ulisses Pinto e José João Almeida, sendo actualizado periodicamente.O nome do Jspell deriva do Ispell (I+1)

Características dos dicionários

Os dicionários não pretendem cobrir “todo” o vocabulário existente, apenas as formas mais frequentes. As palavras cuja terminologia é demasiado específica e rara, não são incluídas no dicionário.

Esta abordagem permite garantir um funcionamento mais eficiente dos recursos dos analisadores e correctores em relação ao seu tempo de processamento, uso de memória, qualidade nas sugestões do dicionário em caso de erro, e detecção efectiva de um erro (e.g. árvore (substantivo muito frequente) , arvore (modo verbal muito pouco usado)).

O dicionário para o português (Jspell), morfologicamente anotado, foi construído a partir da extracção de palavras de material académico da Universidade do Minho, como teses de Doutoramento e Mestrado, corpora jornalístico português de Portugal disponível publicamente, listas de nomes públicas, e diverso material livre de direitos de autor. Numa segunda fase, modificações individuais consoante o critério dos autores, recurso à consulta de prontuários, dicionários de definições, lista de frequências, sugestões de utilizadores, cruzamento e validação de palavras com a colaboração de entidades externas.

Desenvolvimento e manutenção

  • José João Almeida (jj ←_→ di.uminho.pt)
  • Alberto Simões (ambs ←_→ di.uminho.pt)
  • Rui Vilela (ruivilela ←_→ di.uminho.pt)

Sugestões para o dicionário

Para sugestões, erros, ou consulta online do dicionário, use o WebJspell (novo endereço)

Outras questões

  • Os dicionários disponíveis consoante a sua versão contêm apenas informação lexical, sintáctica e morfológica.
  • Nenhum dos dicionários contém definições.
  • Para instalação automática no OpenOffice, Thunderbird, e Firefox, veja a página do [Myspell]

Outros dicionários

Disponíveis para o Jspell, ou para uso no WebJspell

  • Inglês, link
  • Espanhol castelhano
  • Latim
  • Português de Portugal (Acordo ortográfico)
dicionarios/main.1334937137.txt.gz · Last modified: 2012/04/20 17:52 by ambs