Isso me lembra bastante um projeto semelhante que conheci em 2013, ainda no governo Dilma.
A CapGov da UFRJ desenvolveu um software e portal que fazem algo parecido, para o portal noticias.gov.br. Inexplicavelmente, esse portal ainda permanece até hoje no ar, embora as notícias tenham parado de ser atualizadas em 2016, data provável em que o projeto tenha sido abandonado.
O noticias.gov.br raspava as páginas de notícias de todos os sites governamentais e criava um feed único, onde se podia ler notícias (press releases das assessorias de comunicação, na verdade) de todos os órgãos do governo. A ferramenta também possibilita pesquisar as notícias por algum termo do interesse do usuário, ou até mesmo criar um feed RSS de notícias que contenham o termo pesquisado.