Ik heb een Unicode-string in Python en ik zou graag alle accenten (diakritische tekens) willen verwijderen.
Ik heb op internet een elegante manier gevonden om dit te doen (in Java):
- converteer de Unicode-tekenreeks naar zijn lange genormaliseerde vorm (met een apart teken voor letters en diakritische tekens)
- verwijder alle tekens waarvan het Unicode-type "diakritisch" is.
Moet ik een bibliotheek zoals pyICU installeren of is dit mogelijk met alleen de standaardbibliotheek van Python? En hoe zit het met python 3?
Belangrijke opmerking: ik zou graag code vermijden met een expliciete toewijzing van tekens met accenten naar hun niet-geaccentueerde tegenhanger.