Descrição: Uma série de aplicações e técnicas de processamento de linguagem natural utilizam ou necessitam de uma lista de termos relevantes numa determinada área, ou de dicionários terminológicos (exemplos …). Nem sempre estas listas de termos estão disponíveis, principalmente sobre tópicos muitos específicos, e muitas vezes mesmo que existam sobre um determinado tópico podem não se adequar a situação em específico. Assim propõe-se a criação implementação de um algoritmo/técnica capaz de através de uma série de heurísticas e de opções calcular listas de termos (e/ou dicionários terminológicos) a partir de um mínimo de informação. Um possível workflow inclui tarefas com o crawling de informação em recursos já disponíveis (wikipedia, etc.) através de uma seed inicial, expandir este conjunto através do uso de dicionários, thesaurus, etc e for fim ainda formas de validação/medidas de qualidade das objectos criados, e utilização dos objectos finais (ou de um subset mais pequeno) para fazer bootstrap do processo novamente.