Python에 유니코드 문자열이 있고 모든 악센트(분음 부호)를 제거하고 싶습니다.
웹에서 Java에서 이 작업을 수행하는 우아한 방법을 찾았습니다.
- 유니코드 문자열을 긴 정규화된 형식으로 변환합니다(문자와 분음 부호에 대해 별도의 문자 사용)
- 모든 유니코드 유형이 "분음 부호"인 문자.
pyICU와 같은 라이브러리를 설치해야 합니까 아니면 Python 표준 라이브러리만으로 가능한가요? 그리고 python 3은 어떻습니까?
중요 사항: 악센트가 있는 문자에서 악센트가 없는 문자로 명시적으로 매핑되는 코드는 피하고 싶습니다.