Estou usando a biblioteca pandas para ler alguns dados CSV. Em meus dados, certas colunas contêm strings. A string "nan"
é um valor possível, assim como uma string vazia. I consegui fazer com que os pandas lessem "nan" como uma string, mas não consigo descobrir como fazê-lo não ler um valor vazio como NaN. Aqui estão os dados de amostra e saída
Um,Dois,Três a,1,um b,2,dois ,3,três d,4,nan e,5,cinco nan,6, g,7,sete >>> pandas.read_csv("test.csv", na_values={"Um": [], "Três": []}) Um Dois Três 0 a 1 um 1 b 2 dois 2 NaN 3 três 3 d 4 nan 4 e 5 cinco 5 nan 6 NaN 6 g 7 seven
Lê corretamente "nan" como a string "nan", mas ainda lê as células vazias como NaN. Tentei passar str
no argumento converters
para read_csv (com converters={"One": str})
), mas ele ainda lê as células vazias como NaN.
Percebo que posso preencher os valores após a leitura, com fillna, mas não há realmente nenhuma maneira de dizer aos pandas que uma célula vazia em uma coluna CSV específica deve ser lida como uma string vazia em vez de NaN?