Methode Nr. 1: Verwenden von split()
Mit der split-Funktion können wir einen String in eine Liste von Wörtern aufteilen, und dies ist die gebräuchlichste und empfohlene Methode, wenn jemand diese spezielle Aufgabe ausführen möchte. Der Nachteil ist jedoch, dass es nicht funktioniert, wenn die Zeichenfolge Satzzeichen enthält.
# Python3-Democode
< br> # Wörter aus Zeichenfolge extrahieren
# mit split ()
# initialization string
test_string
=
"Geeksforgeeks ist das beste Informatikportal"
# Originalzeile drucken
print
(
"The original string is:"
+
test_string)
# using split ()
# Wörter aus der Zeichenfolge extrahieren
r es
=
test_string.split ()
# Ergebnis drucken
print
(
"Die Liste der Wörter ist:"
+
str
(res) )
Exit:
Die ursprüngliche Zeichenfolge lautet: Geeksforgeeks ist das beste Informatikportal
Das Liste der Wörter ist: [`Geeksforgeeks`,` is`, `best`, `Computer`, `Science`, `Portal`]
Methode Nr. 2: Mit regex (findall ())
In Fällen, die alle Sonderzeichen und Satzzeichen enthalten, wie oben besprochen, tr Die herkömmliche Methode der Suche nach Wörtern in einer Zeichenkette durch Aufteilen kann fehlschlagen und erfordert daher reguläre Ausdrücke, um diese Aufgabe zu erfüllen. Die Funktion findall
gibt eine Liste zurück, nachdem die Zeichenfolge gefiltert und Wörter extrahiert wurden, wobei Satzzeichen ignoriert werden.
# Python3-Demo code
# Wörter aus der Zeichenfolge extrahieren
# unter Verwendung eines regulären Ausdrucks (findall ())
import
re
# Initialisierungszeichenfolge
test_string
=
"Geeksforgeeks , ist am besten @ # Informatikportal. !!!"
# Originalzeile drucken
print
(
"Der ursprüngliche String ist: "
+
test_string)
# unter Verwendung eines regulären Ausdrucks (findall ())
# Wörter aus Zeichenfolge extrahieren
res
=
re.findall (r
`w +`
, test_string)
# Ergebnis drucken
print
(
"Die Liste der Wörter ist:"
+
str
(res))
Ausgabe:
Der ursprüngliche String lautet: Geeksforgeeks, is best @ # Computer Science Portal. !!!
Die Liste der Wörter ist: [`Geeksforgeeks`, `is`, `best`, `Co mputer`, `Science`, `Portal`]
Methode Nr. 3: Verwenden von regex () + string.punctuation
Diese Methode verwendet ebenfalls reguläre Ausdrücke, aber die Funktion zum Abrufen aller Interpunktionszeichenfolgen wird verwendet, um alle Interpunktionen zu ignorieren und die gefilterte Ergebniszeichenfolge zu erhalten. p>
# Python3-Democode
# Wörter aus der Zeichenfolge extrahieren
< br> # using regex () + string.punctuation
import
re
import
string
# initialisierende Zeichenkette
test_string
=
" Geeksforgeeks, is best @ # Computer Science Portal. !!! "
# print original string
print
(
" Der ursprüngliche String ist: "
+
test_string)
# using regex () + string.punctuation
# Wörter aus Zeichenfolge extrahieren
res
=
re.sub (
`[`
+
string.punctuation
+
`] `
,` `, test_string ) .split ()
# Druckergebnis
print
(
"Die Liste der Wörter ist:"
+
str
( res))
Exit:
Die ursprüngliche Zeichenfolge lautet: Geeksforgeeks, is best @ # Computer Science Portal. !!!
Die Liste der Wörter ist: [`Geeksforgeeks`, `is`, `best`, `Computer`, `Science`, `Portal`]