Differences

This shows you the differences between two versions of the page.

--- spln2016:diario2 [2016/02/24 16:18] – created ambs
+++ spln2016:diario2 [2016/02/24 16:25] (current) – ambs
@@ Line 1: / Line 1: @@
-Sumário
+====== SPLN ======
-- Revisões da aula anterior;
-- Estruturas de dados em Perl: arrays, arrays associativos (hashes);
-- Elemento de matching no perl &;
-- Lei de Zipf;
-- Scripts para análise do ficheiro cetemGordo.txt:
-. Contar ocorrências de palavras (script_1.pl);
-. Ordenar palavras;
-. Critério de comparação de ocorrências;
-. Funções em perl;
-. "Calculadora de Tabela de Capitalização Preferencial", ctcp.pl;
-- Registo e Visita guiada ao GitLab;
+==== Diário de Bordo - Aula 2 - 2016-02-22 ====
-Diário
+=== Sumário ===
+  * Revisões da aula anterior;
+  * Estruturas de dados em Perl: arrays, arrays associativos (hashes);
+  * Elemento de matching no perl (''$1''..., ''$&'');
+  * Lei de Zipf;
+  * Scripts para análise do ficheiro cetemGordo.txt:
+    * Contar ocorrências de palavras (script_1.pl);
+    * Ordenar palavras;
+    * Critério de comparação de ocorrências;
+    * Funções em perl;
+    * Calculadora de Tabela de Capitalização Preferencial", ctcp.pl;
+  * Registo e Visita guiada ao GitLab;
+==== Diário ====
 === Revisões ===
 Para introduzir a aula, começamos por rever a script criada na semana anterior, que conta o número de palavras proveniente do STDIN.
 === Estruturas de dados em Perl ===
-Declaração de lista (referência global à lista): @a
+Declaração de lista (referência global à lista): ''@a''
-Aceder ao elemento na posição i da lista a: $a[i]
+Aceder ao elemento na posição i da lista a: ''$a[$i]''
-Declaração de array associativo (hash): %a
+Declaração de array associativo (hash): ''%a''
-Aceder ao valor da chave k da lista a: $a{k}
+Aceder ao valor da chave k da lista a: ''$a{$k}''
-Acesso ao conteúdo da posição dada pelas chaves k1 e k2 de um array associativo (hash) bidimensional: $a{k1}{k2}
+Acesso ao conteúdo da posição dada pelas chaves k1 e k2 de um array associativo (hash) bidimensional: ''$a{$k1}{$k2}''
-=== & caratér especial de matching no Perl ===
+=== ''$&'' carácter especial de matching no Perl ===
-Na aula exploramos as funcionalidades do caratér & como acesso aos tokens que compõem uma dada linha que queremos tratar.
-    #!/usr/bin/perl
+Na aula exploramos as funcionalidades da variável `$&` como acesso aos tokens que compõem uma dada linha que queremos tratar.
+    #!/usr/bin/perl
     while(/(\w+) (\w+)/) {
       print "$1 $2\n";
@@ Line 40: / Line 46: @@
 === Lei de Zipf ===
 É uma lei empírica que rege à dimensão, importância ou frequência dos elementos de uma lista ordenada.
 Conclusões que retiramos na aula foram que existe uma relação entre o aumento de palavras comuns que surgem num determinado texto com a dimensão do mesmo.
@@ Line 48: / Line 55: @@
     #!/usr/bin/perl
     use warnings;
     use strict;
     use utf8::all;
     my (%oco);
     my ($c);
     while (<>) {
     	next if /</; #salta linhas com "<"
@@ Line 69: / Line 76: @@
     #!/usr/bin/perl
     use warnings;
     use strict;
     use utf8::all;
     my (%oco);
     my ($c);
     while (<>) {
     	next if /</; #salta linhas com "<"
@@ Line 91: / Line 98: @@
     #!/usr/bin/perl
     use warnings;
     use strict;
     use utf8::all;
     my (%oco);
     my ($c);
     while (<>) {
       next if /</; # salta linhas começadas por "<", poder-se-ia escrever "if (/^</){ next; }"
@@ Line 108: / Line 115: @@
     # $a e $b são definidos internamente pelo Perl quando definimos critérios de comparação,
     # pelo que se deve evitar declarar variáveis com esses nomes
     foreach my $p (sort{$oco{$a} <=> $oco{$b}} keys %oco){
       print "$p: $oco{$p}\n";
@@ Line 118: / Line 125: @@
     use strict;
     use utf8::all;
     my (%oco);
     while (<>) {
       next if /^</; # ou if (/^</) {next;}
         while( /\w+/g ) {
           $oco{$&}++;
         }
     }
     foreach my $p (sort{ mycompare($a, $b) } keys %oco) {
       print "$p: $oco{$p}\n";
     }
     # Criação de uma função
     # Esta função é usada como critério de comparação no sort
@@ Line 151: / Line 158: @@
     #!/usr/bin/perl
     use warnings;
     use strict;
     use utf8::all;
     use Data::Dumper; # Este módulo permite o print imediato de estruturas de dados
     my (%oco);
     my ($c);
     my $pm = qr{[[:upper:]]\w+}; # qr{..} - tudo o que vem dentro de chavetas é tratado como expressão regular
     my $prep = qr{d[eoa]s?};
     my $np = qr{$pm( ($prep )?$pm)*};
     while (<>) {
       next if /^</;
@@ Line 171: / Line 178: @@
       }
     }
     print Dumper(\%oco);
     # Quando em Perl queremos que o texto não seja processado podemos usar a marca __END__
     __END__
@@ Line 182: / Line 189: @@
 Neste script estuda-se para uma dada palavra o número de ocorrências dessa mesma palavra com capitalizações diferentes. Correndo o comando 'perl ctcp.pl cetemGordo.txt > out.txt' obtemos no ficheiro out.txt o seguite:
-'universidades' => {
+    'universidades' => {
                    'universidades' => 31,
                    'Universidades' => 5
-'anti-sida' => {
+    'anti-sida' => {
                'anti-sida' => 2
-'livros-sida' => {
+    'livros-sida' => {
       (...)
-'luminosidade' => {
+    'luminosidade' => {
                   'luminosidade' => 1
-'curiosidades' => {
+    'curiosidades' => {
                   'curiosidades' => 2
-'diversidade' => {
+    'diversidade' => {
                  'Diversidade' => 1,
                  'diversidade' => 11
-'subsidariedade' => {
+    'subsidariedade' => {
                     'Subsidariedade' => 1,
                     'subsidariedade' => 2