Pythonインタープリターが文字列操作で非ASCII文字を正しく処理するようにするにはどうすればよいですか?

| |

次のような文字列があります:

6 918 417 712 

この文字列をトリミングする明確な方法(Pythonを理解しているように)は、文字列が s という変数にあると言うだけで、次のようになります。

  s.replace( "√Ç"、 "") 

これでうまくいくはずです。しかしもちろん、ファイルblabla.pyの非ASCII文字 "xc2"がエンコードされていないという不満があります。

異なるエンコードを切り替える方法を完全に理解することはできませんでした。< / p>

ここにコードがあります。これは実際には上記とまったく同じですが、コンテキスト内にあります。ファイルはメモ帳にUTF-8として保存され、次のヘッダーがあります。

 #!/ usr / bin / python2.4#-*-コーディング:utf-8-*-

コード:

  f = urllib.urlopen(url)soup = BeautifulSoup(f)s = soup.find( "div"、{"id" :"main_count"})#ここで「s」を出力するとうまくいきます。 6√Ç918√Ç417√Ç712s.replace( "√Ç"、 "")save_main_count(s) 

それはs.replaceを超えないことを示しています ...