Comment se débarrasser de la ponctuation à l’aide du tokenizer NLTK ?

| | | | | | | | | |

Je commence tout juste à utiliser NLTK et je ne comprends pas très bien comment obtenir une liste de mots à partir d'un texte. Si j'utilise nltk.word_tokenize(), j'obtiens une liste de mots et de ponctuation. Je n'ai besoin que des mots à la place. Comment puis-je me débarrasser de la ponctuation ? De plus, word_tokenize ne fonctionne pas avec plusieurs phrases : des points sont ajoutés au dernier mot.