Scrivere testo Unicode su un file di testo?

| | | | | | | | | | | | |

Sto estraendo dati da un documento Google, elaborandoli e scrivendoli in un file (che alla fine incollerò in una pagina Wordpress).

Ha dei simboli non ASCII. Come posso convertirli in modo sicuro in simboli che possono essere utilizzati nel sorgente HTML?

Attualmente sto convertendo tutto in Unicode in arrivo, unendo tutto insieme in una stringa Python, quindi facendo:

import codec f = codecs.open("out.txt", mode="w", encoding="iso-8859-1") f.write(all_html.encode("iso-8859 -1", "replace")) 

Si è verificato un errore di codifica nell'ultima riga:

UnicodeDecodeError: il codec "ascii" non può decodificare byte 0xa0 in posizione 12286: ordinale non in range(128)

Soluzione parziale:

Questo Python funziona senza errori:

riga = [unicode(x.strip()) se x non è Nessun altro u"" per x nella riga] all_html = riga[0] + "<br/>" + riga [1] f = open("out.txt", "w") f.write(all_html.encode("utf-8")) 

Ma quindi se apro il file di testo vero e proprio, vedo molti simboli come:

Qur’an 

Forse devo scrivere a qualcosa di diverso da un file di testo?