¿Escribir texto Unicode en un archivo de texto?

| | | | | | | | | | | | |

Estoy extrayendo datos de un documento de Google, procesándolos y escribiéndolos en un archivo (que eventualmente pegaré en una página de Wordpress).

Tiene algunos símbolos que no son ASCII. ¿Cómo puedo convertirlos de manera segura en símbolos que se puedan usar en fuente HTML?

Actualmente, estoy convirtiendo todo a Unicode en el camino, uniéndolo todo en una cadena de Python y luego haciendo:

importar codecs f = codecs.open("out.txt", mode="w", encoding="iso-8859-1") f.write(all_html.encode("iso-8859 -1", "reemplazar")) 

Hay un error de codificación en la última línea:

UnicodeDecodeError: el códec "ascii" no puede decodificar byte 0xa0 en la posición 12286: ordinal no está en el rango (128)

Solución parcial:

Este Python se ejecuta sin error:

fila = [unicode(x.strip()) si x no es Ninguno más u"" para x en la fila] all_html = fila[0] + "<br/>" + fila [1] f = open("out.txt", "w") f.write(all_html.encode("utf-8")) 

Pero luego, si abro el archivo de texto real, veo muchos símbolos como:

Qur’an 

Tal vez necesito escribir a algo que no sea un archivo de texto?