Raspagem de dados - Diário Oficial DF

Bom dia, gente! Eu tava precisando de todos os diários oficiais do DF de 2020 em um formato que não fosse PDF pra eu conseguir analisar alguns termos chave. Tentei pelo web scraper mas só consigo de um por um - talvez por não ter muita experiência -, sendo que o ideal era eu conseguir baixar todos de uma vez ou pelo menos uma quantidade boa por vez… Tem como eu fazer isso? Sei que o governo disponibiliza em json mas só o do dia, eles não enviam/ disponibilizam edições anteriores. O que fazer?

1 Curtida

Olá, Anna. Já deu uma olhada no projeto Querido Diário da Open Knowledge Brasil? O objetivo dele é justamente coletar os diários oficiais de estados e municípios e disponibilizá-los em um formato processável por máquina. Os códigos do projeto também estão disponíveis no Github.

1 Curtida