Mam ciąg znaków Unicode w Pythonie i chciałbym usunąć wszystkie akcenty (znaki diakrytyczne).
Znalazłem w sieci elegancki sposób na zrobienie tego (w Javie):
- przekonwertuj ciąg znaków Unicode do jego długiej znormalizowanej postaci (z osobnym znakiem dla liter i znaków diakrytycznych)
- usuń wszystkie znaków, których typ Unicode to „diakrytyczne”.
Czy muszę instalować bibliotekę taką jak pyICU, czy jest to możliwe tylko ze standardową biblioteką Pythona? A co z Pythonem 3?
Ważna uwaga: chciałbym uniknąć kodu z wyraźnym mapowaniem znaków akcentowanych na ich odpowiedniki bez akcentów.