Python | Serie Pandas.str.wrap ()

| | | | | | | | | | | | | | | | | | |

Pandas str.wrap() es una técnica importante cuando se trabaja con datos de texto extenso (párrafos o mensajes). Esto se usa para distribuir datos de texto largo en nuevas líneas, o para manejar espacios en blanco cuando excede el ancho pasado. Dado que este es un método de cadena, debe prefijar .str antes de llamar a este método.

Sintaxis: Serie .str.wrap (ancho, ** kwargs)

Parámetros:
ancho: Valor entero, define el ancho máximo de línea

** kwargs [Parámetros opcionales]
expand_tabs: valor booleano, expande los caracteres de tabulación a espacios si es verdadero
replace_whitespace: Valor booleano, si es verdadero, cada carácter de espacio en blanco se reemplaza por un solo espacio en blanco.
drop_whitespace: Valor booleano, si es verdadero, elimina los espacios en blanco, si los hay, al comienzo de las nuevas líneas
break_long_words: valor booleano, si es verdadero, divide las palabras que son más largas que el ancho pasado.
break_on_hyphens: valor booleano, si es verdadero, divide la cadena en guiones donde la longitud de la cadena es menor que el ancho.

Tipo de retorno: Serie con líneas divididas/caracteres agregados (``)

Para cargar el conjunto de datos utilizado en el código presione aquí.

En los siguientes ejemplos, el marco de datos utilizado contiene datos de algunos jugadores de la NBA. A continuación se adjunta una imagen del marco de datos antes de cualquier operación.

Ejemplo: < /b>
En este ejemplo, el equipo envolvió 5 caracteres de ancho. Por lo tanto, /n aparecerá después de cada 5 caracteres. Se imprime un elemento aleatorio de la columna del equipo nuevo y la columna del equipo antiguo para ver el trabajo. Antes de aplicar cualquier operación, los elementos nulos se eliminan mediante .dropna() .


# importar módulo pandas

importar pandas como pd


# leer el archivo CSV de la URL

data < /código> = pd.read_csv ( " https://media.python.engineering/wp-content/uploads/nba.csv " )


# eliminar columnas nulas para evitar errores

data.dropna (inplace = < código clase = "color1"> Verdadero )


# mostrar

datos [ "Nuevo equipo" ] = datos [ "Team" ]. str . wrap ( 5 )


# mostrar el marco de datos
data


# imprimir el mismo índice por separado

print (data [ " Team "< /código> ] [ 120 ])

imprimir ( "---- -------- "< /código> )

imprimir (datos [ "Nuevo Equipo" ] [ 120 ])

Salida:
Como se muestra en las imágenes de salida, la nueva columna tiene & #39; / n ' después de cada 5 caracteres. Después de imprimir el mismo índice de las columnas de comando antiguo y nuevo, puede ver que sin agregar un carácter de nueva línea en la declaración de impresión, python lee automáticamente ' / n ' en una línea y lo coloca en una nueva línea.

Marco de datos con la columna Nuevo equipo

Salida:

Los Angeles Lakers ------------ Los A ngele s Lak ers