İçe aktardığım tweetlerin bir kısmı
b"Facebook'a yeni bir fotoğraf gönderdim"
okudukları yerde bu sorunu yaşıyor. b
topla, bunun bir bayt olduğunu belirtir. Ancak bu sorun yaratıyor çünkü sonunda yazdığım CSV dosyalarımda b
kaybolmuyor ve gelecekteki koda müdahale ediyor. Bunun basit bir yolu var mı? bu b
önekini metin satırlarımdan kaldır? .
Analiz ettiğim bağlantı içeriği:
https://www.dropbox.com/s/sjmsbuhrghj7abt/new_tweets.txt?dl=0
new_tweets = " bağlantıdaki içerik"
Kod Denemesi
outtweets = [[tweet.text.encode("utf-8").decode("utf- 8")] new_tweets'te tweet için] print(outtweets)
Hata
UnicodeEncodeError Traceback (en son çağrı) <ipython-input-21 -6019064596bf> <module>() içinde 1 ekran_adı için user_list: ----> 2 get_all_tweets(screen_name,"instanc e dosyası") <ipython-input-19-e473b4771186> get_all_tweets(screen_name, mode) 99'da open(os.path.join(save_location,"%s.instance" % screen_name), "w") ile f: 100 yazar = csv.writer(f) --> 101writer.writerows(outtweets) 102 else: 103 open(os.path.join(save_location,"%s.csv" % screen_name), "w") f olarak: C:UsersStan ShunpikeAnaconda3libencodingscp1252.py encode(self, input, final) 17 sınıf ArtımlıEnkoder(codecs.IncrementalEncoder): 18 def kodlama(self, input, final=Yanlış): ---> 19 dönüş codecs.charmap_encode(input,self.errors,encoding_table)[0] 20 21 class IncrementalDecoder(codecs.IncrementalDecoder): UnicodeEncodeError: "charmap" codec 64-65 konumundaki karakterleri kodlayamaz: karakter eşlemeleri <undefined> ;