Écrire du texte Unicode dans un fichier texte ?

| | | | | | | | | | | | |

J'extrait des données d'un document Google, je les traite et je les écris dans un fichier (que je vais éventuellement coller dans une page Wordpress).

Il contient des symboles non ASCII. Comment puis-je les convertir en toute sécurité en symboles pouvant être utilisés dans la source HTML ?

Actuellement, je convertis tout en Unicode en cours de route, en joignant le tout dans une chaîne Python, puis en faisant :

importer des codecs f = codecs.open("out.txt", mode="w", encoding="iso-8859-1") f.write(all_html.encode("iso-8859 -1", "replace")) 

Il y a une erreur d'encodage sur la dernière ligne :

UnicodeDecodeError : le codec "ascii" ne peut pas décoder octet 0xa0 en position 12286 : ordinal hors plage (128)

Solution partielle :

Ce Python s'exécute sans erreur :

row = [unicode(x.strip()) si x n'est pas None else u"" for x in row] all_html = row[0] + "<br/>" + row [1] f = open("out.txt", "w") f.write(all_html.encode("utf-8")) 

Mais puis si j'ouvre le fichier texte réel, je vois beaucoup de symboles comme :

Qur’an 

Peut-être que j'ai besoin d'écrire à autre chose qu'un fichier texte ?