Python | Extrahiert Wörter aus einer gegebenen Zeichenkette

| | | | | | | | | | | | | | | | | | |

Methode Nr. 1: Verwenden von split()
Mit der split-Funktion können wir einen String in eine Liste von Wörtern aufteilen, und dies ist die gebräuchlichste und empfohlene Methode, wenn jemand diese spezielle Aufgabe ausführen möchte. Der Nachteil ist jedoch, dass es nicht funktioniert, wenn die Zeichenfolge Satzzeichen enthält.


# Python3-Democode < br> # Wörter aus Zeichenfolge extrahieren
# mit split ()


# initialization string

test_string = "Geeksforgeeks ist das beste Informatikportal"


# Originalzeile drucken

print ( "The original string is:" + test_string)


# using split ()
# Wörter aus der Zeichenfolge extrahieren

r es = test_string.split ()


# Ergebnis drucken

print ( "Die Liste der Wörter ist:" + str (res) )

Exit:

Die ursprüngliche Zeichenfolge lautet: Geeksforgeeks ist das beste Informatikportal
Das Liste der Wörter ist: [`Geeksforgeeks`,` is`, `best`, `Computer`, `Science`, `Portal`]

Methode Nr. 2: Mit regex (findall ())
In Fällen, die alle Sonderzeichen und Satzzeichen enthalten, wie oben besprochen, tr Die herkömmliche Methode der Suche nach Wörtern in einer Zeichenkette durch Aufteilen kann fehlschlagen und erfordert daher reguläre Ausdrücke, um diese Aufgabe zu erfüllen. Die Funktion findall gibt eine Liste zurück, nachdem die Zeichenfolge gefiltert und Wörter extrahiert wurden, wobei Satzzeichen ignoriert werden.


# Python3-Demo code
# Wörter aus der Zeichenfolge extrahieren
# unter Verwendung eines regulären Ausdrucks (findall ())

import re


# Initialisierungszeichenfolge

test_string = "Geeksforgeeks , ist am besten @ # Informatikportal. !!!"


# Originalzeile drucken

print ( "Der ursprüngliche String ist: " + test_string)


# unter Verwendung eines regulären Ausdrucks (findall ())
# Wörter aus Zeichenfolge extrahieren

res = re.findall (r `w +` , test_string)


# Ergebnis drucken

print ( "Die Liste der Wörter ist:" + str (res))

Ausgabe:

Der ursprüngliche String lautet: Geeksforgeeks, is best @ # Computer Science Portal. !!!
Die Liste der Wörter ist: [`Geeksforgeeks`, `is`, `best`, `Co mputer`, `Science`, `Portal`]

Methode Nr. 3: Verwenden von regex () + string.punctuation
Diese Methode verwendet ebenfalls reguläre Ausdrücke, aber die Funktion zum Abrufen aller Interpunktionszeichenfolgen wird verwendet, um alle Interpunktionen zu ignorieren und die gefilterte Ergebniszeichenfolge zu erhalten. p>

# Python3-Democode
# Wörter aus der Zeichenfolge extrahieren < br> # using regex () + string.punctuation

import re

import string


# initialisierende Zeichenkette

test_string = " Geeksforgeeks, is best @ # Computer Science Portal. !!! "


# print original string

print ( " Der ursprüngliche String ist: " + test_string)


# using regex () + string.punctuation
# Wörter aus Zeichenfolge extrahieren

res = re.sub ( `[` + string.punctuation + `] ` ,` `, test_string ) .split ()


# Druckergebnis

print ( "Die Liste der Wörter ist:" + str ( res))

Exit:

Die ursprüngliche Zeichenfolge lautet: Geeksforgeeks, is best @ # Computer Science Portal. !!!
Die Liste der Wörter ist: [`Geeksforgeeks`, `is`, `best`, `Computer`, `Science`, `Portal`]