Ich habe einen Unicode-String in Python und möchte alle Akzente (diakritische Zeichen) entfernen.
Ich habe im Web einen eleganten Weg gefunden, dies zu tun (in Java):
- konvertiere den Unicode-String in seine lange normalisierte Form (mit einem separaten Zeichen für Buchstaben und diakritische Zeichen)
- entferne alle Zeichen, deren Unicode-Typ "diacritic" ist.
Muss ich eine Bibliothek wie pyICU installieren oder ist dies nur mit der Python-Standardbibliothek möglich? Und was ist mit Python 3?
Wichtiger Hinweis: Ich möchte Code mit einer expliziten Zuordnung von Zeichen mit Akzent zu ihrem Gegenstück ohne Akzent vermeiden.