User Tools

Site Tools


spln2016:diario1

This is an old revision of the document!


SPLN

Diário de Bordo - Aula 1 - 2016-02-15

Scripts podem ser

  1. Descartáveis (usados uma vez e “deitados fora” não é necessário ter muitos cuidados)
  2. Continuidade (podem ser adicionados a módulos ou serem expandidos, convém ter algum cuidado, principalmente com as variáveis)

cola:

  1. módulo noutra Linguagem
  2. comando

podemos usar expressões regulares

Niveis de uma linguagem Natural

  1. Fonético
  2. Léxico
  3. Sintáctico
  4. Semântico - define o modelo semântico e transforma a frase nesse módulo
  5. Pragmático - reação esperada

Linguagens Naturais são usadas em:

  1. Tradução
  2. Information retriever (I.R.)
  3. Sumariedade
  4. Spell checker
  5. Correção gramatical
  6. “recortes de imprensa”
  7. Sentiment analizes
  8. Call centers, siri, QA (Question Answering)

Prática: necessário ter perl versão 5.14 ou mais para windows existe a possibilidade de utilizar o strawberry perl -script para contar palavras -instalação de modulos para o perl

Exercicíos Perl:

#!/usr/bin/perl

use warnings; use strict; #para dar os warnings e erros para nos ajudar a perceber o que se está a passar use utf8::all; #para usar o encoding utf8 para todos os inputs

# ————————————— Exemplo de declaração de uma variável ————————————

my $y = 20; #my é utilizado para declarar variáveis locais, para var globais utiliza-se o our print “Variavel $y\n”;

# ————————————— Contar as linhas de um input ———————————————–

my ($l,$c); while ($l = <>){ #<> - operador diamante vai ler o input, o diamante vazio permite receber ficheiros, já <STDIN> só recebe do STDIN

c++;

}

print “$c linhas\n”;

# ————————————— Exercicío com a var $_ —————————————————–

#se não guardarmos o que é lido em nenhuma variável ele vai para a var $_ my ($c); while (<>){

print $_;

print; #a var $_ pode ser omitida $c++; }

print “$c linhas\n”;

# ————————————— Contar palavras ————————————————————–

my ($c); while (<>){

while ($_ =~ /\w+/g) { #utilizamos expressões regulares para identificar o que é uma palavra, as letros inseridas depois das barras são modificadores, neste caso o g é utilizado para fazer o match à palavra quantas vezes forem possiveis na string
	$c++;
}

}

print “$c palavras\n”;

spln2016/diario1.1455825487.txt.gz · Last modified: 2016/02/18 20:58 by ambs