Python | Pandas DataFrame.fillna () para reemplazar los valores nulos ​​en el marco de datos

| | | | | | | | | | | | | | | | | | | | |

A veces, el archivo CSV tiene valores cero, que luego se muestran como NaN en el marco de datos. Similar a cómo el método dropna () de pandas administra y elimina los valores nulos ‚Äã‚Äã de un marco de datos, fillna () administra y permite al usuario reemplazar los valores NaN ‚Äã ‚Äãcon sus propios valores.

Sintaxis:

DataFrame.fillna (valor = Ninguno, método = Ninguno, eje = Ninguno, en el lugar = Falso, límite = Ninguno, downcast = Ninguno , ** kwargs)

Parámetros:

valor: estático, diccionario , matriz, serie o marco de datos para completar en lugar de NaN.
método: El método se usa si el usuario no pasa ningún valor. Pandas tiene diferentes métodos como bfill , backfill o ffill que llena el lugar con valor en el índice Adelante o Anterior / Atrás respectivamente.
eje: el eje toma un valor int o de cadena para filas/columnas. La entrada puede ser 0 o 1 para Integer y `index` o `columns` para String
inplace: Es un booleano que hace los cambios en el marco de datos si es True.
límite: Este es un valor entero que especifica el número máximo de rellenos de valor NaN consecutivos hacia adelante/atrás. . Como Float64 a int64.
** kwargs: Cualquier otro argumento de palabra clave

Para vincular al archivo CSV utilizado en el código, presione aquí .

Ejemplo n.° 1: Reemplazar los valores de NaN ‚Äã‚Äãcon un valor estático.

Antes del reemplazo:


< tr>

# pandas module import

import pandas as pd


# crear un marco de datos desde un archivo CSV

nba = pd.read_csv ( "nba.csv" )


nba

< /td>

Salir:

Después del reemplazo:
En el siguiente ejemplo, todos los valores vacíos ‚Äã‚Äãen la columna" College "han sido reemplazados w Con la cadena "No College"... Primero se importa el marco de datos CSV y luego se selecciona la columna College y el método fillna () es fillna () .


# importar módulo pandas

importar pandas como pd


# crear un marco de datos desde un archivo CSV

nba = pd.read_csv (< /código> "nba. csv " )


# reemplazando los valores universitarios ​​sin universidad

nba [ "College" ].fillna ( "No College" , inplace = Verdadero )


nba

Salir:


Ejemplo n.º 2: Uso del método Parámetro


El siguiente ejemplo establece el método como relleno, y, por lo tanto, el valor en la misma columna reemplaza el valor nulo En este caso, Georgia reemplazó el valor cero en la columna de la universidad en las filas 4 y 5.
Del mismo modo, puede usar los métodos bfill, backfill y pad.


# importar módulo pandas

importar pandas como pd


# crear un marco de datos desde un archivo CSV

nba = pd.read_csv ( "nba.csv" )


# reemplazando valores universitarios ​​sin universidad

nba [ "Colegio" ]. fillna (método = `ff ill` , inplace = Verdadero )


nba

Exit:


Ejemplo n.° 3: Limitar el uso

Este ejemplo establece el método fillna () en un límite de 1 para verificar si la función deja de reemplazar después de un cambio de valor de NaN exitoso o no.

# importación del módulo pandas

importar pandas como pd


# crear fr nombre de datos del archivo CSV

< clase de código = "simple"> nba = pd.read_csv ( "nba.csv" )


# reemplazando los valores universitarios ​​sin universidad

nba [ "College" ]. fillna (método = `rellenar` , límite < clase de código ="palabra clave"> = 1 , en lugar = Verdadero )


nba

Salida:
Como se muestra en la salida, la columna de la universidad 4 -th fila ha sido reemplazada, y la 5th columna — no, ya que el límite se puso en 1.