NLTK'yı yeni kullanmaya başlıyorum ve metinden bir kelime listesinin nasıl alınacağını tam olarak anlamıyorum. nltk.word_tokenize()
kullanırsam, kelimelerin ve noktalama işaretlerinin bir listesini alırım. Bunun yerine sadece kelimelere ihtiyacım var. Noktalama işaretlerinden nasıl kurtulabilirim? Ayrıca word_tokenize
birden çok cümleyle çalışmaz: son kelimeye noktalar eklenir.