Drop com índice no Pandas

Olá! Estou precisando de ajuda com a função drop no Pandas. Extraí os tuítes de um perfil com o twint pelo Google Colab e abri o csv com o “mount” do drive, mas gostaria de retirar linhas com tuítes anteriores a 2020-01-01 pra facilitar minha análise.

Com o Pandas tentei usar a seguinte função:

Indices=[x for x in df.index if ‘date < 2020-01-01’]
df = df.drop(Indices)

A ideia era criar esse “Indices” com a condição de acordo com a informação de “date”, que é uma das colunas. Porém, com isso ele eliminou todas as linhas do dataframe :frowning_face:
Tem alguma maneira de fazer isso “por condição”? Teria que ir pelo número das linhas (ainda não sei exatamente em qual linha está 2019-12-31)?

1 Curtida

Olá @mikhail,

Não sei se entendi bem, mas se a ideia é filtrar o DataFrame com base no valor da data, podes fazer isso diretamente com df[df['Data'] < '2020-01-01']. Onde ‘Data’ é o nome da coluna.

Abraço!

1 Curtida

É isso mesmo. Bem melhor essa solução rs. Obrigado!