espa~nol.dicc Versi'on 1.7-- Un diccionario de Espa~nol para su uso con la versi'on internacional de Ispell 3.1.13. o posterior Copyright (c) 1994 1995 1996 1999 2001 Santiago Rodr'iguez y Jes'us Carretero Este paquete es gratis; se puede redistribuir y/o modificar bajo las condiciones especificadas en la Licencia Publica de GNU tal y como se publica por FSF. Este paquete se distribuye sin ninguna garant'ia de funcionamiento. Este paquete se puede obtener en ftp.fi.upm.es en el fichero /pub/unix/espa~nol.tar.gz o en http://www.datsi.fi.upm.es/~coes Este conjunto de ficheros compone un diccionario de espa~nol para su uso con la versi'on internacional del ispell 3.1.13 o posterior. El diccionario contiene 53000 ra'ices (aproximadamente). Para ejecutar correctamente este paquete el ispell se debe compilar sin definir la macro NO8BIT en el fichero de configuraci'on local.h. Contenido: 1. Descompresi'on del paquete. 2. Generaci'on del diccionario. 3. Instalaci'on del diccionario. 4. Formatos admitidos. 5. Diccionario (fichero hash) para MSDOS. 1. La distribuci'on se incluye en el fichero espa~nol.tar.gz. Para extraer los ficheros fuente del fichero espa~nol.tar.gz basta con teclear el comando: gzip -d < espa~nol.tar.gz | tar xf - De este fichero se generan los siguientes: espa~nol.aff: Fichero de afijos. espa~nol.words: Contiene una lista de palabras que aparecen en el Diccionario de la Real Academia Espa'nola de la Lengua (vig'esima primera edici'on). espa~nol.comp: Contiene una lista de palabras que aunque no aparecen en el Diccionario de la Real Academia Espa~nola de la Lengua, se utilizan en entornos inform'aticos. antiguas.words: Contiene una lista de palabras que aunque aparecen en el Diccionario de la Real Academia Espa~nola de la Lengua, son acepciones antiguas y que en la actualidad han ca'ido en desuso. espa~nol.words+: Contiene la lista expandida de palabras correspondiente a los ficheros espa~nol.words y espa~nol.comp. e~nes: Es un script que remplaza las cadenas 'n and 'N por ~n y ~N en los ficheros espa~nol.aff, espa~nol.words y espa~nol.words+. Si utiliza la segunda manera de especificar esta letra tiene que ejecutar el script "e~nes". 'Este se ha desarrollado con la versi'on de sed de GNU 2.05. Si desea ejecutar este script aseg'urese que tiene instalada dicha versi'on y teclee: make e~ne Makefile: Es un fichero Makefile que permite generar el fichero (espa~nol.hash) a partir del fichero de afijos y de la lista de palabras sin expandir (espa~nol.words). Esta forma de generar el fichero hash (espa~nol.hash) necesita del orden de 50 Mb de memoria (paginaci'on) y del orden de 100 Mb de espacio en disco para almacenamiento de ficheros temporales. Aseg'urese de que tiene suficiente espacio para almacenar ficheros temporales (normalmente en /usr/tmp). Si no es as'i, se debe establecer la variable de entorno TMPDIR a un directorio que est'e ubicado en una partici'on que tenga disponible 100Mb. 2. Para generar el fichero espa~nol.hash basta teclear: make Generaci'on r'apida: Si se desea generar el fichero espa~nol.hash a partir de la lista expandida de palabras se debe invocar el comando: make build Esta operaci'on necesita muchos menos recursos. El tama'no del diccionario (espa~nol.hash) es de aproximadamente 2.5Mbytes (este problema se ha detectado en Solaris 2.7). Si se genera un diccionario de un tama'no mucho mayor es debido al comando sort que se ha utilizado. En este caso se recomienda la instalaci'on del paquete textutils de GNU y aseg'urese que se utiliza el comando sort de este paquete. 3. Para instalar el diccionario entre como administrador de sistema y teclee: make install 4. Las letras acentuadas propias del espa~nol se pueden codificar de diferentes formas. Se soportan seis tipos diferentes de formatos: Formato por defecto: Las letras acentuadas se codifican como '<letra>: 'a � 'e � 'i � 'o � 'u � 'n � "u � 'A � 'E � 'I � 'O � 'U � 'N � "U � Formato TeX: Las letras acentuadas se codifican de la siguiente forma: \'a � \'e � \'{\i} � \'o � \'u � \'n � \"u � \'A � \'E � \'{\I} � \'O � \'U � \'N � \"U � Formato plainTeX: Las letras acentuadas se codifican de la siguiente forma: \'{a} � \'{e} � \'{\i} � \'{o} � \'{u} � \'{n} � \"{u} � \'{A} � \'{E} � \'{\I} � \'{O} � \'{U} � \'{N} � \"{U} � Formato latin1: Las letras acentuadas se codifican utilizando el c'odigo iso_8859_1. Formato msdos: Las letras acentuadas se codifican utilizando el c'odigo ASCII MS-DOS extendido. Formato html: Las letras acentuadas se codifican de la siguiente forma: á � é � í � ó � ú � ñ � ü � Á � É � Í � Ó � Ú � Ñ � Ü � Para ejecutar el ispell con un determinado formato: ispell -T <formato> -d espa~nol <fichero> 5. El fichero hash para el diccionario de espa~nol est'a generado para sistemas MSDOS en: http://www.datsi.fi.upm.es/~coes T'engase en cuenta que tanto el fichero de afijos como la lista de palabras no est'an completos. Seguimos trabajando en ello. Si se encuentran palabras que no aparecen en el diccionario o aparecen y no son correctas, por favor, mande un mensaje a la direcci'on de correo espanol-bugs@datsi.fi.upm.es. Santiago Rodriguez & Jesus Carretero Departamento de Arquitectura y Tecnolog'ia de Sistemas Inform'aticos (DATSI) Universidad Polit'ecnica de Madrid Diciembre 1994 Enero 1995 Febrero 1995 Abril 1995 Noviembre 1996 Abril 1999 Junio 2001 Email: srodri@fi.upm.es, jcarrete@fi.upm.es