espa~nol.dicc  Versi'on 1.7-- Un diccionario de Espa~nol para su uso
con la versi'on internacional de Ispell 3.1.13. o posterior



Copyright (c) 1994 1995 1996 1999 2001 Santiago Rodr'iguez y Jes'us Carretero

    Este paquete es gratis; se puede redistribuir y/o modificar bajo las
    condiciones especificadas en la Licencia Publica de GNU tal y como
    se publica por FSF. Este paquete se distribuye sin ninguna garant'ia
    de funcionamiento. Este paquete se puede obtener en ftp.fi.upm.es en
    el fichero /pub/unix/espa~nol.tar.gz o en
    http://www.datsi.fi.upm.es/~coes

Este conjunto de ficheros compone un diccionario de espa~nol para su uso
con la versi'on internacional del ispell 3.1.13 o posterior. El diccionario
contiene 53000 ra'ices (aproximadamente).

Para ejecutar correctamente este paquete el ispell se debe compilar sin
definir la macro NO8BIT en el fichero de configuraci'on local.h.

Contenido:

	1. Descompresi'on del paquete.
	2. Generaci'on del diccionario.
	3. Instalaci'on del diccionario.
	4. Formatos admitidos.
	5. Diccionario (fichero hash) para MSDOS.


	1. La distribuci'on se incluye en el fichero espa~nol.tar.gz. Para
extraer los ficheros fuente del fichero espa~nol.tar.gz basta con
teclear el comando:

      gzip -d < espa~nol.tar.gz | tar xf -

De este fichero se generan los siguientes:

	espa~nol.aff: Fichero de afijos.

	espa~nol.words: Contiene una lista de palabras que aparecen en
el Diccionario de la Real Academia Espa'nola de la Lengua (vig'esima
primera edici'on).

	espa~nol.comp: Contiene una lista de palabras que aunque no
aparecen en el Diccionario de la Real Academia Espa~nola de la Lengua, se
utilizan en entornos inform'aticos.

	antiguas.words: Contiene una lista de palabras que aunque aparecen
en el Diccionario de la Real Academia Espa~nola de la Lengua, son
acepciones antiguas y que en la actualidad han ca'ido en desuso.

	espa~nol.words+: Contiene la lista expandida de palabras
	correspondiente a los ficheros espa~nol.words y espa~nol.comp.

	e~nes: Es un script que remplaza las cadenas 'n and 'N por
~n y ~N en los ficheros espa~nol.aff, espa~nol.words y espa~nol.words+.
Si utiliza la segunda manera de especificar esta letra tiene que
ejecutar el script "e~nes". 'Este se ha desarrollado con la versi'on de
sed de GNU 2.05. Si desea ejecutar este script aseg'urese que tiene
instalada dicha versi'on y teclee:

		make e~ne

	Makefile: Es un fichero Makefile que permite generar el
fichero (espa~nol.hash) a partir del fichero de afijos y de la lista de
palabras sin expandir (espa~nol.words). Esta forma de generar el fichero
hash (espa~nol.hash) necesita del orden de 50 Mb de memoria
(paginaci'on) y del orden de 100 Mb de espacio en disco para
almacenamiento de ficheros temporales. Aseg'urese de que tiene
suficiente espacio para almacenar ficheros temporales (normalmente en
/usr/tmp). Si no es as'i, se debe establecer la variable de entorno
TMPDIR a un directorio que est'e ubicado en una partici'on que tenga
disponible 100Mb.


	2. Para generar el fichero espa~nol.hash basta teclear:

		make

	Generaci'on r'apida: Si se desea generar el fichero espa~nol.hash
a partir de la lista expandida de palabras se debe invocar el comando:

		make build

Esta operaci'on necesita muchos menos recursos.

	El tama'no del diccionario (espa~nol.hash) es de aproximadamente
2.5Mbytes (este problema se ha detectado en Solaris 2.7). Si se genera un
diccionario de un tama'no mucho mayor es debido al comando sort que se ha
utilizado. En este caso se recomienda la instalaci'on del paquete textutils
de GNU y aseg'urese que se utiliza el comando sort de este paquete.

	3. Para instalar el diccionario entre como administrador de
sistema y teclee:
		
		make install



	4. Las letras acentuadas propias del espa~nol se pueden
codificar de diferentes formas. Se soportan seis tipos diferentes de formatos:

	Formato por defecto: Las letras acentuadas se codifican como
	'<letra>:
		'a	�
		'e	�
		'i	�
		'o	�
		'u	�
		'n	�
		"u	�
		'A	�
		'E	�
		'I	�
		'O	�
		'U	�
		'N	�
		"U	�

	Formato TeX: Las letras acentuadas se codifican de la siguiente
	forma:
		\'a	�
		\'e	�
		\'{\i}	�
		\'o	�
		\'u	�
		\'n	�
		\"u	�
		\'A	�
		\'E	�
		\'{\I}	�
		\'O	�
		\'U	�
		\'N	�
		\"U	�

	Formato plainTeX: Las letras acentuadas se codifican de la siguiente
	forma:
		\'{a}	�
		\'{e}	�
		\'{\i}	�
		\'{o}	�
		\'{u}	�
		\'{n}	�
		\"{u}	�
		\'{A}	�
		\'{E}	�
		\'{\I}	�
		\'{O}	�
		\'{U}	�
		\'{N}	�
		\"{U}	�

	Formato latin1: Las letras acentuadas se codifican utilizando
	el c'odigo iso_8859_1.

	Formato msdos: Las letras acentuadas se codifican utilizando
	el c'odigo ASCII MS-DOS extendido.

	Formato html: Las letras acentuadas se codifican de la siguiente
	forma:
		&aacute;	�
		&eacute;	�
		&iacute;	�
		&oacute;	�
		&uacute;	�
		&ntilde;	�
		&uuml;		�
		&Aacute;	�
		&Eacute;	�
		&Iacute;	�
		&Oacute;	�
		&Uacute;	�
		&Ntilde;	�
		&Uuml;		�

	Para ejecutar el ispell con un determinado formato:

		ispell -T <formato> -d espa~nol <fichero>

	5. El fichero hash para el diccionario de espa~nol est'a
	generado para sistemas MSDOS en:

	http://www.datsi.fi.upm.es/~coes

	T'engase en cuenta que tanto el fichero de afijos como la lista
de palabras no est'an completos. Seguimos trabajando en ello. Si se
encuentran palabras que no aparecen en el diccionario o aparecen y no
son correctas, por favor, mande un mensaje a la direcci'on de correo
espanol-bugs@datsi.fi.upm.es.



Santiago Rodriguez & Jesus Carretero
Departamento de Arquitectura
y Tecnolog'ia de Sistemas Inform'aticos (DATSI)
Universidad Polit'ecnica de Madrid
Diciembre 1994
Enero 1995
Febrero 1995
Abril 1995
Noviembre 1996
Abril 1999
Junio 2001
Email: srodri@fi.upm.es, jcarrete@fi.upm.es