NLTK belirteci kullanarak noktalama işaretlerinden nasıl kurtulurum?

| | | | | | | | | |

NLTK'yı yeni kullanmaya başlıyorum ve metinden bir kelime listesinin nasıl alınacağını tam olarak anlamıyorum. nltk.word_tokenize() kullanırsam, kelimelerin ve noktalama işaretlerinin bir listesini alırım. Bunun yerine sadece kelimelere ihtiyacım var. Noktalama işaretlerinden nasıl kurtulabilirim? Ayrıca word_tokenize birden çok cümleyle çalışmaz: son kelimeye noktalar eklenir.