pampo package

Submodules

pampo.ner module

pampo.pampo module

pampo.pattern_lists module

class pampo.pattern_lists.PortuguesePatterns[source]

Bases: object

common_family_names = [u'Silva', u'Santos', u'Ferreira', u'Pereira', u'Oliveira', u'Costa', u'Rodrigues', u'Martins', u'Jesus', u'Sousa', u'Fernandes', u'Gon\xe7alves', u'Gomes', u'Lopes', u'Marques', u'Alves', u'Almeida', u'Ribeiro', u'Pinto', u'Carvalho', u'Teixeira', u'Moreira', u'Correia', u'Mendes', u'Nunes', u'Soares', u'Vieira', u'Monteiro', u'Cardoso', u'Rocha', u'Neves', u'Coelho', u'Cruz', u'Cunha', u'Pires', u'Ramos', u'Reis', u'Sim\xf5es', u'Antunes', u'Matos', u'Fonseca', u'Machado', u'Ara\xfajo', u'Barbosa', u'Tavares', u'Louren\xe7o', u'Castro', u'Figueiredo', u'Azevedo', u'Melo']
preprositions = [u'da', u'das', u'dos', u'do', u'de', u'para']
starters = [u'A', u'As', u'O', u'Os', u'Em', u'Aos', u'Ao', u'No', u'Na', u'Nos', u'Nas']
stopwords = [u'Janeiro', u'Fevereiro', u'Mar\xe7o', u'Abril', u'Maio', u'Junho', u'Julho', u'Agosto', u'Setembro', u'Outubro', u'Novembro', u'Dezembro', u'Di\xe1rio', u'Semanal', u'Mensal', u'Minutos', u'Meses', u'Ano', u'Anos', u'Hoje', u'Anexo', u'Abertura', u'Atestado', u'Ata', u'Ado\xe7\xe3o', u'Atualiza\xe7\xe3o', u'\xc0s', u'\xc0', u'Capa', u'Convite', u'Compromisso', u'Condecora\xe7\xe3o', u'Convocat\xf3ria', u'Cart\xe3o', u'Causa', u'Comunica\xe7\xe3o', u'Corrup\xe7\xe3o', u'Converg\xeancia', u'Decreto', u'Ditadura', u'Democacia', u'Democrata', u'Estrutura', u'Ficha', u'Fax', u'Fixa\xe7\xe3o', u'Futuro', u'Gabinete', u'Gl\xf3ria', u'Harmonia', u'Iniciado', u'Instala\xe7\xe3o', u'Ibidem', u'Inventaria\xe7\xe3o', u'Irregularidades', u'Internet', u'Lda', u'Manuten\xe7\xe3o', u'Nomeado', u'Obedi\xeancia', u'Peti\xe7\xe3o', u'Passaporte', u'Proposta', u'Programa', u'Proibi\xe7\xe3o', u'Paz', u'Publica\xe7\xe3o', u'Question\xe1rio', u'Quadro', u'Relat\xf3rio', u'Redu\xe7\xe3o', u'Reorganiza\xe7\xe3o', u'Revolu\xe7\xe3o', u'Rep\xfablica', u'Reequil\xedbrio', u'Rea\xe7\xe3o', u'Sess\xe3o', u'Testamento', u'Toler\xe2ncia', u'T\xe9rmino', u'Vit\xf3ria', u'Visita', u'Aceite', u'Comprometo', u'Cabe', u'Coloca', u'Conhecemos', u'Casado', u'Considerava', u'Desejo', u'Dev\xedamos', u'Escolhiam', u'Executa', u'Fa\xe7a', u'Fica', u'Interrompidas', u'Indicar', u'Inclu\xeddo', u'Leva', u'Morrer', u'Ouvistes', u'Prestaste', u'Praticou', u'Pressiona', u'Pensa', u'Poder', u'Podes', u'Revolta', u'Sabe', u'Ser', u'Ter', u'Toque', u'Toma', u'Trata', u'Vens', u'Verificou', u'Viver', u'Vivemos', u'Venho', u'Aproveitamento', u'Cuidado', u'Decerto', u'Desta', u'Desenvolvimento', u'Lan\xe7amento', u'Levantamento', u'Muitos', u'Muitas', u'Nessa', u'Nesse', u'Nessas', u'Nesses', u'Nestes', u'Neste', u'Nesta', u'Nestas', u'Noutro', u'Outros', u'Outro', u'Outra', u'Outras', u'Onde', u'Poucos', u'Poucas', u'Perante', u'Pela', u'Rec\xe9m', u'Tal', u'V\xe1rios', u'V\xe1rias', u'V\xf3s']
tags_exclusions = [u'v-fin', u'num', u'conj-c', u'conj-s', u'adv', u'art', u'prp', u'pron-det', u'pron-indp', u'adj', u'v-ger', u'v-pcp']
titles = [u'gr\xe3o-mestre', u'papa', u'duque', u'duquesa', u'conde', u'condessa', u'presidente', u'rei', u'ra\xednha', u'pr\xedncipe', u'princesa', u'marqu\xeas', u'marquesa', u'secret\xe1rio', u'secret\xe1ria', u'bispo', u'visconde', u'viscondessa', u'ministro', u'ministra', u'bar\xe3o', u'baronesa', u'general', u'tenente', u'deputado', u'deputada', u'governador', u'governadora', u'capit\xe3o', u'capit\xe3', u'diretor', u'diretora', u'primeiro', u'primeira', u'sargento', u'ex', u'filho', u'filha', u'irm\xe3o', u'irm\xe3', u'pai', u'm\xe3e', u'tio', u'tia', u'padrinho', u'madrinha', u'sobrinho', u'sobrinha', u'afilhado', u'afilhada', u'av\xf3', u'av\xf4', u'neto', u'neta', u'enteado', u'enteada', u'padrasto', u'madrasta', u'vice']

Module contents