유니코드(UTF-8) Python에서 파일 읽기 및 쓰기

| | |

파일에 텍스트를 읽고 쓰는 것을 이해하는 데 약간의 두뇌 장애가 있습니다(Python 2.4).

# a-acute가 포함된 문자열입니다. ss = u "Capitxe1n" ss8 = ss.encode("utf8") repr(ss), repr(ss8) 

("u"Capitxe1n"", ""Capitxc3xa1n"")

print ss, ss8 print >> open("f1","w"), ss8 >>> file("f1").read( ) "Capitxc3xa1n " 

그래서 내가 좋아하는 편집기의 f2 파일에 Capitxc3xa1n을 입력합니다.

다음:

>>> open("f1").read() "Capitxc3xa1n " >>> open("f2").read() "Capitxc3xa1n " >> ;> open("f1").read().decode("utf8") u"Capitxe1n " >>> open("f2").read().decode("utf8") u"Capit xc3xa1n " 

여기서 내가 이해하지 못하는 것은 무엇입니까? 내가 놓치고 있는 중요한 마법(또는 좋은 감각)이 분명히 있습니다. 적절한 변환을 얻기 위해 텍스트 파일에 입력하는 것은 무엇입니까?

여기서 내가 진정으로 이해하지 못하는 것은 UTF-8 표현의 요점입니다. 실제로 Python을 가져올 수 없다면 외부에서 올 때 인식하십시오. 아마도 JSON은 문자열을 덤프하고 대신 사용할 수 있습니다. 더 요점으로, 파일에서 들어올 때 파이썬이 인식하고 디코딩할 이 유니코드 객체의 ASCII 표현이 있습니까? 그렇다면 어떻게 얻을 수 있습니까?

>>> print simplejson.dumps(ss) ""Capitu00e1n"" >>> 인쇄 >> 파일("f3","w"), simplejson.dumps(ss) >>> simplejson.load(open("f3")) u"Capitxe1n" 

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers

News


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method