spln2016:diario8
Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
spln2016:diario8 [2016/05/05 00:22] – created ambs | spln2016:diario8 [2016/05/05 00:28] (current) – ambs | ||
---|---|---|---|
Line 1: | Line 1: | ||
- | sumário: | + | ====== SPLN ====== |
- | Módulo perl Lingua:: | + | ==== Diário |
- | *suporta várias línguas | + | |
- | *suporta modo servidor (perguntas feitas por um cliente) | + | |
- | *freeling capacidade | + | |
- | + | FreeLing | |
- | Lingua:: | + | * suporta várias línguas |
+ | * suporta modo servidor (perguntas feitas por um cliente) | ||
+ | * freeling capacidade de ser usado em java usando swig (Simplified Wrapper and Interface Generator) | ||
- | Lingua:: | + | Módulo Lingua:: |
+ | * Lingua:: | ||
+ | * Lingua:: | ||
+ | * FL3 -> Módulo shortcut de Lingua:: | ||
+ | * Para listar documentação: | ||
+ | * Pode ser usado tokenizador default ou não | ||
+ | * Métodos retornam sempre objetos com método utilizado | ||
+ | * Ideia da pipeline de freeling -> pegar num texto e dividir em tokens | ||
- | FL3 -> Módulo shortcut de Lingua:: | + | |
- | + | * splitter | |
- | + | * freeling morph guarda os vários resultados morfológicos possiveis de um token | |
- | Para listar documentação: | + | |
- | $ perldoc FL3 | + | |
- | *Pode ser usado tokenizador default ou não | + | |
- | *Métodos retornam sempre objetos com método utilizado | + | |
- | *Ideia da pipeline de freeling -> pegar num texto e dividir em tokens | + | |
- | *tokenização e segmentação não tem ordem para ser efetuada | + | |
- | + | ||
- | + | ||
- | FreeLing: | + | |
- | * divide em àtomos usando o tokenizer | + | |
- | * retorna lista de tokens | + | |
- | * splitter | + | |
- | * frases - referência para array de frases que referencia para array de tokens | + | |
- | * freeling morph guarda os vários resultados morfológicos possiveis de um token | + | |
* depois de analisar - etiquetação de (POS (part of speech) tagging) palavras | * depois de analisar - etiquetação de (POS (part of speech) tagging) palavras | ||
*hmm - hidden markov model (método estátística que calcula elementos mais prováveis) | *hmm - hidden markov model (método estátística que calcula elementos mais prováveis) |
spln2016/diario8.1462400536.txt.gz · Last modified: 2016/05/05 00:22 by ambs