將Unicode文本寫入文本文件?

| | | | | | | | | | | | |

我正在從 Google 文檔中提取數據,對其進行處理,然後將其寫入文件(最終我將粘貼到 Wordpress 頁面中)。

它有一些非 ASCII 符號。如何安全地將這些轉換為可在 HTML 源代碼中使用的符號?

目前,我正在將所有內容轉換為 Unicode,將它們全部連接到 Python 字符串中,然後執行以下操作:

p>
導入編解碼器 f = codecs.open("out.txt", mode="w", encoding="iso-8859-1") f.write(all_html.encode("iso-8859 -1", "replace")) 

最後一行出現編碼錯誤:

UnicodeDecodeError: "ascii" codec can"t decode位置 12286 中的字節 0xa0:序數不在範圍內(128)

部分解決方案:

此 Python 運行沒有錯誤:

p>
row = [unicode(x.strip()) if x is not None else u"" for x in row] all_html = row[0] + "<br/>" + row [1] f = open("out.txt", "w") f.write(all_html.encode("utf-8")) 

但是然後如果我打開實際的文本文件,我會看到很多符號,例如:

Qur,Äö√Ñ√¥an 

也許我需要寫到文本文件以外的東西?