Ho una stringa Unicode in Python e vorrei rimuovere tutti gli accenti (segni diacritici).
Ho trovato sul web un modo elegante per farlo (in Java):
- convertire la stringa Unicode nella sua forma lunga normalizzata (con un carattere separato per lettere e segni diacritici)
- rimuovere tutti i caratteri il cui tipo Unicode è "diacritico".
Devo installare una libreria come pyICU o è possibile solo con la libreria standard Python? E che dire di Python 3?
Nota importante: vorrei evitare il codice con una mappatura esplicita dai caratteri accentati alla loro controparte non accentata.