我剛開始使用 NLTK,我不太明白如何從文本中獲取單詞列表。如果我使用 nltk.word_tokenize()
,我會得到一個單詞和標點符號列表。我只需要單詞。我怎樣才能擺脫標點符號? word_tokenize
也不適用於多個句子:在最後一個單詞中添加點。
我剛開始使用 NLTK,我不太明白如何從文本中獲取單詞列表。如果我使用 nltk.word_tokenize()
,我會得到一個單詞和標點符號列表。我只需要單詞。我怎樣才能擺脫標點符號? word_tokenize
也不適用於多個句子:在最後一個單詞中添加點。