Comment supprimer le préfixe b dans une chaîne en python ?

| | | | | | | | | | | | | | | | | | | |

Un tas de tweets que j'importe ont ce problème de lecture

b"J'ai posté une nouvelle photo sur Facebook" 

Je recueillir le b indique qu'il s'agit d'un octet. Mais cela s'avère problématique car dans mes fichiers CSV que je finis par écrire, le b ne disparaît pas et interfère dans le code futur.

Existe-t-il un moyen simple de supprimer ce préfixe b de mes lignes de texte ?

Gardez à l'esprit que je semble avoir besoin d'avoir le texte encodé en utf-8 ou que tweepy a du mal à les extraire du Web .


Voici le contenu du lien que j"analyse :

https://www.dropbox.com/s/sjmsbuhrghj7abt/new_tweets.txt?dl=0

new_tweets = " contenu dans le lien" 

Tentative de code

outtweets = [[tweet.text.encode("utf-8").decode("utf- 8")] pour tweet dans new_tweets] print(outtweets) 

Erreur

UnicodeEncodeError Traceback (appel le plus récent en dernier) <ipython-input-21 -6019064596bf> dans <module>() 1 pour screen_name dans user_list : ----> 2 get_all_tweets(screen_name,"instanc e") <ipython-input-19-e473b4771186> dans get_all_tweets(screen_name, mode) 99 avec open(os.path.join(save_location,"%s.instance" % screen_name), "w") as f : 100 writer = csv.writer(f) --> 101 writer.writerows(outtweets) 102 else : 103 with open(os.path.join(save_location,"%s.csv" % screen_name), "w") as f : C:UsersStan ShunpikeAnaconda3libencodingscp1252.py in encode(self, entrée, finale) 17 classe IncrementalEncoder(codecs.IncrementalEncoder) : 18 def encode(self, input, final=False) : ---> 19 return codecs.charmap_encode(input,self.errors,encoding_table)[0] 20 21 class IncrementalDecoder(codecs.IncrementalDecoder) : UnicodeEncodeError : le codec « charmap » ne peut pas encoder les caractères en position 64-65 : les correspondances de caractères vers <undefined> ;