Aleph: uma ferramenta para seguir fluxos de dinheiro

Aleph é uma ferramenta livre para seguir fluxos de dinheiro. Por exemplo, para jornalistas investigativos, para combate à lavagem de dinheiro, etc. Ela possibilita reunir dados de diversas fontes:

  • conjuntos de dados e bancos de dados
  • raspagem de sites (usando o Memorious)
  • documentos em texto (doc, pdf, etc.), com indexação do texto
  • imagens, com OCR (reconhecimento ótico de caracteres de texto)

Por trás dos panos, o Aleph utiliza reconhecimento de entidades para detectar referências a organizações, pessoas, endereços, processos judiciais, etc. e mapear os relacionamentos entre eles. Em seguida, é possível consultar e filtrar as informações na interface de pesquisa.

aceefacb517b3ecc770565cf830d796a8d4865ee

As redes de relacionamento identificadas também podem ser visualizadas com a ferramenta VIS Desktop, que é parte do Aleph.

Screenshot 2019-08-29 at 11.09.30

Para saber como instalar, consulte as instruções na documentação.

Para conhecer a interface de pesquisa, você pode consultar a instância do Aleph da OCCRP, experimentando pesquisar por nomes de pessoas e de organizações e filtrando e vendo os resultados. OCCRP é o Organized Crime and Corruption Reporting Project, um projeto que apoia jornalistas de dados em todo o mundo a organizar e encontrar informações para combate à corrupção e o crime organizado.

Esta postagem apareceu primeiro no portal dadosabertos.social. Desculpem pelo cross-posting, mas considero que seria relevante aqui também.

2 Curtidas

Para uma raspagem normal, digamos sem procurar algo específico, ela serve?

1 Curtida

Olá, Luciano. Acho que não entendi a sua pergunta.

O que você chama de raspagem normal? O que eu entendo por raspagem já presume o fato de que você está procurando alguma informação específica na página que está sendo raspada.

1 Curtida

Isso, digamos ela poderia substituir o selenium, ou não ela é específica para um assunto

1 Curtida

Uma parte da ferramenta (chamada Memorious) lida com a raspagem de sites. Então, se o que você quer fazer é apenas a raspagem de sites, creio que o Memorious poderia substituir o Selenium ou qualquer outra ferramenta de raspagem.

Entretanto, o Aleph é mais abrangente e faz muitas outras coisas além da raspagem, como o reconhecimento de texto em imagens, cruzar diversas fontes de dados, indexar e facilitar a procura de referências a entidades dentro do texto, etc.

1 Curtida