%\documentclass[handout,dvips]{beamer} \documentclass[10pt]{beamer} \usepackage[portuges]{babel} %\usepackage{ucs} %\usepackage[utf8x]{inputenc} \usepackage[latin1]{inputenc} \usepackage{times} \usepackage[T1]{fontenc} \usepackage{listings} \def\imgy#1{\includegraphics[height=0.95\textheight]{#1}} \def\imgY#1#2{\includegraphics[height=#1\textheight]{#2}} \def\imgx#1{\includegraphics[width=0.95\textwidth]{#1}} \def\imgX#1#2{\includegraphics[width=#1\textwidth]{#2}} \usepackage{url} \usepackage[all]{xy} \usepackage{hyperref} \usepackage{aeguill} \usepackage{fancyvrb} \usepackage{graphicx} \usetheme{Frankfurt} \usecolortheme{crane} \usecolortheme{crane} \setbeamercovered{transparent} \beamertemplateheadempty %\AtBeginSection[] %{ % \begin{frame} % \frametitle{Outline} % \tableofcontents[currentsection] % \end{frame} %} \begin{document} \fvset{fontsize=\footnotesize, frame = single, numberblanklines = false} \title{RENA\\ Reconhecedor de Entidades} \author[jj]{J.João Dias de Almeida \\ Edgar Alves } \date{\today} \frame{\titlepage} =.Resumo \tableofcontents =Introdução =. Introdução RENA : . RENA é: . Uma biblioteca Perl: .1 \textbf{extrair a lista das Entidades} a partir de conjuntos de texto .2 \textbf{marcar Entidades} num conjunto de texto .3 baseada numa \textbf{configuração} alterável # . Uma (ou mais?) scripts para fazer processamento de entidades # . Contexto = projecto IKF (Information + Knowledge + Fusion) : . extracção de informação (rica) . classificação fuzzy e parcial . fusão (join) da informação extraída . _(Ficheiro* + BaseEnt --> BaseDoc + BaseEnt + ...)_ . Navegadores sobre caixas de mail, \emph{papelada} # # =Configuração =. Configuração do RENA Configuração de base : .1 Tabela de contextos .1 Gazetteer de cultura geral .1 Sistema de Nomes .1 Tabela de conversão/adaptação de nomes # Planeando-se ainda... : . Tabela de contextos atributivos \begin{Verbatim} X , no norte de Y o francês Z a atleta portuguesa A \end{Verbatim} # == Ontologia de classes =.Hirarquia de classes \begin{Verbatim} - pessoa: - advogado - arquitecto - atleta: - futebolista - escritor: - poeta - jornalista - militar: - general - almirante - brigadeiro - sargento - tenente - capitão - musico: - compositor - pianista - político: - presidente da república - deputado \end{Verbatim} == Tabela de contextos =. Tabela de contextos \begin{Verbatim} cidade (de do da) => cidade !lctx freguesia (de do da) => freguesia distrito (de do da) => distrito concelho (de do da) => concelho/90 estado (de do da) => estado capital => cidade !lctx (Rio Oceano Lago Mar Serra Cordilheira) => $_ Cabo (do de da) => cabo Golfo (do de da) => golfo (Lugar Largo Lg. Praça Rua R. Avenida) (de da do das dos)? => lugar (Travessa Beco Quinta Viela Rotunda) (de da do das dos)? => lugar # # Monumentos # (Convento Mosteiro Igreja Ig. Palácio Museu Sé) (de da)? => monumento \end{Verbatim} == Gazetteer de cultura geral =. Gazetteer de cultura geral ...Vista sobre a projecção de uma ontologia (exemplo: Rio Douro = {\small\begin{Verbatim} rio Douro IOF => rio AFLUENTES => rio Mau, rio Sousa, rio Varosa, rio Tâmega, rio Pinhão, .... rio Torto, rio Távora, rio Esla, rio Tua COMPRIMENTO => 927 FOZ => Porto IN => Portugal, Espanha NASCE => serra do Urbião PASSA_EM => barragem do Pocinho, barragem de Miranda, barragem de Crestuma, Miranda do Douro, barragem do Carrapatelo, Régua, barragem da Bemposta \end{Verbatim} } == Sistema de Nomes =. Sistema de Nomes Name-gazetteer \begin{Verbatim} Diana :nome: 35 Dias :apelido: 252 Dina :nome: 7 Dinis :misto: [2 13 15] Diogo :misto: [8 2 6] Domingues :apelido: 48 Dora :nome: 8 \end{Verbatim} == Tabela de conversão/adaptação de nomes =. Tabela de conversão/adaptação de nomes =Alternativas HAREM =. Alternativas Harem: sonhar não custa : . XML! . _(colecção = (MetaData \times Texto )^* )_ . taxonomia 2 níveis _( --> )_ ontologia multi-nível de classes eventualmente... \begin{Verbatim} país < entidade geográfica país < instituição administrativa \end{Verbatim} . _(erro \ne duvida \ne vagueza)_ . etiquetagem mais prática: . uma única tag Entidade . um atributo tipo _(T="país")_ : . com possibilidade de alternativas? _(T="t1|t2")_ # . um atributo de unificação # # ==Rena: tripas =.Rena: tripas _( (texto \times entidade)* --> (texto \times entidade)* )_ =Conclusões =.Conclusões e dívidas : . melhorar as regras de inferência e unificação e resumo . criar um processador estrutural . melhorar name-gazetteer estrangeiros . MELHORAR!!! . documentar melhor o interface de biblioteca Perl \begin{Verbatim} forent($texto){ .... } \end{Verbatim} # =* \end{document}