Sto usando la libreria Pandas per leggere alcuni dati CSV. Nei miei dati, alcune colonne contengono stringhe. La stringa "nan"
è un possibile valore, così come una stringa vuota. I sono riuscito a convincere i panda a leggere "nan" come una stringa, ma non riesco a capire come farlo per non leggere un valore vuoto come NaN. Ecco i dati e l'output di esempio
Uno,Due,Tre a,1,uno b,2,due ,3,tre d,4,nan e,5,cinque nan,6, g,7,seven >>> pandas.read_csv("test.csv", na_values={"Uno": [], "Tre": []}) Uno Due Tre 0 a 1 uno 1 b 2 due 2 NaN 3 tre 3 d 4 nan 4 e 5 cinque 5 nan 6 NaN 6 g 7 sette
Legge correttamente "nan" come stringa "nan", ma continua a leggere le celle vuote come NaN. Ho provato a passare str
nell'argomento converters
a read_csv (con converters={"One": str})
), ma legge ancora le celle vuote come NaN.
Mi rendo conto che posso riempire i valori dopo aver letto, con fillna, ma non c'è davvero modo di dire ai panda che una cella vuota in una particolare colonna CSV dovrebbe essere letta come stringa vuota invece di NaN?