Jak pozbyć się interpunkcji za pomocą tokenizera NLTK?

| | | | | | | | | |

Właśnie zaczynam używać NLTK i nie do końca rozumiem, jak uzyskać listę słów z tekstu. Jeśli używam nltk.word_tokenize(), otrzymuję listę słów i znaków interpunkcyjnych. Zamiast tego potrzebuję tylko słów. Jak pozbyć się interpunkcji? Również word_tokenize nie działa z wieloma zdaniami: kropki są dodawane do ostatniego słowa.