如何擺脫python字符串中的b前綴?

| | | | | | | | | | | | | | | | | | | |

我正在導入的一堆推文在閱讀時遇到了這個問題

b“我在 Facebook 上發布了一張新照片”

我收集 b 表示它是一個字節。但這被證明是有問題的,因為在我最終編寫的 CSV 文件中,b 不會消失並且會干擾未來的代碼。

有沒有簡單的方法可以從我的文本行中刪除此 b 前綴?

請記住,我似乎需要將文本編碼為 utf-8 或 tweepy 無法從網絡中提取它們.


這是我正在分析的鏈接內容:

https://www.dropbox.com/s/sjmsbuhrghj7abt/new_tweets.txt?dl=0

new_tweets = "鏈接中的內容" 

代碼嘗試

outtweets = [[tweet.text.encode("utf-8").decode("utf- 8")] for tweet in new_tweets] print(outtweets) 

Error

UnicodeEncodeError Traceback (最近一次調用最後一次) <ipython-input-21 -6019064596bf> 在 <module>() 1 for screen_name in user_list: ----> 2 get_all_tweets(screen_name,"instanc e 文件") <ipython-input-19-e473b4771186>在 get_all_tweets(screen_name, mode) 99 with open(os.path.join(save_location,"%s.instance" % screen_name), "w") as f: 100 writer = csv.writer(f) --> 101 writer.writerows(outtweets) 102 else: 103 with open(os.path.join(save_location,"%s.csv" % screen_name), "w") as f: C:UsersStan ShunpikeAnaconda3libencodingscp1252.py in encode(self,輸入,最終)17類IncrementalEncoder(codecs.IncrementalEncoder):18 def編碼(自我,輸入,最終=假):---> 19 return codecs.charmap_encode(input,self.errors,encoding_table)[0] 20 21 class IncrementalDecoder(codecs.IncrementalDecoder): UnicodeEncodeError: "charmap" codec can't encoding characters in position 64-65: character maps to <undefined> ;