Pandas str.wrap()
es una técnica importante cuando se trabaja con datos de texto extenso (párrafos o mensajes). Esto se usa para distribuir datos de texto largo en nuevas líneas, o para manejar espacios en blanco cuando excede el ancho pasado. Dado que este es un método de cadena, debe prefijar .str antes de llamar a este método.
Sintaxis: Serie .str.wrap (ancho, ** kwargs)
Parámetros:
ancho: Valor entero, define el ancho máximo de línea** kwargs [Parámetros opcionales]
expand_tabs: valor booleano, expande los caracteres de tabulación a espacios si es verdadero
replace_whitespace: Valor booleano, si es verdadero, cada carácter de espacio en blanco se reemplaza por un solo espacio en blanco.
drop_whitespace: Valor booleano, si es verdadero, elimina los espacios en blanco, si los hay, al comienzo de las nuevas líneas
break_long_words: valor booleano, si es verdadero, divide las palabras que son más largas que el ancho pasado.
break_on_hyphens: valor booleano, si es verdadero, divide la cadena en guiones donde la longitud de la cadena es menor que el ancho.Tipo de retorno: Serie con líneas divididas/caracteres agregados (``)
Para cargar el conjunto de datos utilizado en el código presione aquí.
En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. A continuación se adjunta una imagen del marco de datos antes de cualquier operación.
Ejemplo: < /b>
En este ejemplo, el equipo envolvió 5 caracteres de ancho. Por lo tanto, /n aparecerá después de cada 5 caracteres. Se imprime un elemento aleatorio de la columna del equipo nuevo y la columna del equipo antiguo para ver el trabajo. Antes de aplicar cualquier operación, los elementos nulos se eliminan mediante .dropna()
.
# leer el archivo CSV de la URL
data < /código>
)
# eliminar columnas nulas para evitar errores
data.dropna (inplace
=
< código clase = "color1"> Verdadero
# mostrar
datos [
"Team"
].
5
)
# mostrar el marco de datos
data
# imprimir el mismo índice por separado
print
(data [
" Team "< /código>
"Nuevo Equipo"
] [
120
])
Salida:
Como se muestra en las imágenes de salida, la nueva columna tiene & #39; / n ' después de cada 5 caracteres. Después de imprimir el mismo índice de las columnas de comando antiguo y nuevo, puede ver que sin agregar un carácter de nueva línea en la declaración de impresión, python lee automáticamente ' / n ' en una línea y lo coloca en una nueva línea.
Marco de datos con la columna Nuevo equipo
Salida:
Los Angeles Lakers ------------ Los A ngele s Lak ers