Infelizmente me tornei a criadora da etiqueta “Windows” neste fórum rs.
Gente,
Tem uns arquivos que o governo de SP divulga todo dia, mas cada dia meu Windows abre a planilha com um encoding diferente. É um arquivo por dia, então estou automatizando um código pra juntar todos eles e criar meu próprio histórico.
Estou tentando fazer uma limpeza inicial no Visual Studio Code pra ver se resolve, porque pelo Bloco de Notas não resolve também.
Vou dar os exemplos mais recentes:
https://www.saopaulo.sp.gov.br/wp-content/uploads/2021/01/20210118_leitos_ocupados_por_unidade_hospitalar.csv
Se eu abro cada arquivo no Excel, os acentos estão todos OK.
Mas eu só rodo um código pra puxar os arquivos e abrir no RStudio, o arquivo de 18/01 abre com os acentos corretos. Mas os demais abrem com encoding todo bagunçado. Testei em dois computadores diferentes (todos com Windows).
Queria saber se o problema sou eu e o meu Windows ou do cara que exporta esse CSV cada dia de um jeito (e aí não tenho como saber em que dia vai dar chabu, ou seja, inviabiliza a automatização).
E se existe algum caminho pra eu automatizar a abertura dessa planilha e a padronização do encoding de uma vez por todas. Talvez passar todas as planilhas por um mesmo tratamento automaticamente, antes do meu código pra criar uma coluna de data, juntar as planilhas e fazer um pivot_wider.
PRINT DO DATAFRAME DE 18/01 ARRUMADINHO NO RSTUDIO:
PRINT DO DATAFRAME DE 15/01 ZOADAÇO NO RSTUDIO: