Ich versuche, mit einem sehr großen Datensatz zu arbeiten, der einige nicht standardmäßige Zeichen enthält. Ich muss gemäß den Jobspezifikationen Unicode verwenden, aber ich bin verblüfft. (Und wahrscheinlich alles falsch machen.)
Ich öffne die CSV mit:
15 ncesReader = csv.reader(open("geocoded_output.csv", "rb "), delimiter=" ", quotechar=""")
Dann versuche ich, es zu codieren mit:
name=school_name.encode( "utf-8"), Straße=Reihe[9].encode("utf-8"), Stadt=Reihe[10].encode("utf-8"), Staat=Reihe[11].encode("utf -8"), zip5=Zeile[12], zip4=Zeile[13],county=Zeile[25].encode("utf-8"), lat=Zeile[22], lng=Zeile[23])
Ich codiere alles außer Lat und Lng, weil diese an eine API gesendet werden müssen. Wenn ich das Programm ausführe, um den Datensatz in das zu parsen, was ich verwenden kann, erhalte ich den folgenden Traceback.
Traceback (letzter Aufruf zuletzt): Datei "push_into_db.py", Zeile 80, in <Modul> main() Datei "push_into_db.py", Zeile 74, in main district_map = buildDistrictSchoolMap() Datei "push_into_db.py", Zeile 32, in buildDistrictSchoolMap county=row[25].encode("utf-8"), lat= row[22], lng=row[23]) UnicodeDecodeError: "ASCII"-Codec kann Byte 0xd1 in Position 2 nicht decodieren: Ordnungszahl nicht im Bereich (128)
Ich denke, ich sollte Ich sage Ihnen, dass ich Python 2.7.2 verwende und dies Teil einer App ist, die auf Django 1.4 erstellt wurde. Ich habe mehrere Beiträge zu diesem Thema gelesen, aber keiner scheint direkt zuzutreffen. Jede Hilfe wird sehr geschätzt.
Vielleicht möchten Sie auch wissen, dass einige der nicht standardmäßigen Zeichen das Problem verursachen sind √ë und möglicherweise √â.