UnicodeDecodeError bij het lezen van CSV-bestand in Panda’s met Python

| | | | | | | | | | | | | |

Ik draai een programma dat 30.000 vergelijkbare bestanden verwerkt. Een willekeurig aantal van hen stopt en produceert deze fout...

Bestand "C:Importersrcdfmanimporter.py", regel 26, in import_chr data = pd.read_csv(filepath, names=fields) Bestand "C:Python33libsite-packagespandasioparsers.py", regel 400, in parser_f return _read(filepath_or_buffer, kwds) Bestand "C:Python33libsite-packagespandasioparsers.py" py", regel 205, in _read return parser.read() Bestand "C:Python33libsite-packagespandasioparsers.py", regel 608, in read ret = self._engine.read(nrows) Bestand "C:Python33libsite-packagespandasioparsers. py", regel 1028, in leesgegevens = self._reader.read(nrows) Bestand "parser.pyx", regel 706, in pandas.parser.TextReader.read (pandasparser.c:6745) Bestand "parser.pyx" ;, regel 728, in pandas.parser.TextReader._read_low_memory (pandasparser.c:6964) Bestand "parser.pyx", regel 804, in pandas.parser.TextReader._read_rows (pandasp arser.c:7780) Bestand "parser.pyx", regel 890, in pandas.parser.TextReader._convert_column_data (pandasparser.c:8793) Bestand "parser.pyx", regel 950, in pandas.parser.TextReader. _convert_tokens (pandasparser.c:9484) Bestand "parser.pyx", regel 1026, in pandas.parser.TextReader._convert_with_dtype (pandasparser.c:10642) Bestand "parser.pyx", regel 1046, in pandas.parser. TextReader._string_convert (pandasparser.c:10853) Bestand "parser.pyx", regel 1278, in pandas.parser._string_box_utf8 (pandasparser.c:15657) UnicodeDecodeError: "utf-8" codec kan byte 0xda niet decoderen in positie 6: ongeldige vervolgbyte 

De bron/aanmaak van deze bestanden komen allemaal van dezelfde plaats. Wat is de beste manier om dit te corrigeren om door te gaan met importeren?