Python | Сравнение и выбор данных в Pandas

| | | | | | | | | | | | | | |

Самое главное в анализе данных — это сравнение значений ‚Äã‚Äãи выбор данных соответственно. Оператор == также работает с несколькими значениями во фрейме данных Pandas. В следующих двух примерах показано, как сравнивать и извлекать данные из фрейма данных Pandas.

Чтобы загрузить используемый файл CSV, нажмите здесь.

Пример 1. Сравнение данных
В следующем примере фрейм данных создается из файла CSV. В столбце «Пол» есть только 3 типа значений (мужской, женский или NaN). Каждая строка в столбце "Пол" сравнивается с "Мужской", после чего возвращается логическая последовательность.


# import pandas package

import pandas as pd


# создать фрейм данных из файла CSV

data = pd.read_csv ( "employees.csv" )


# сохранение логической строки в новом

new = data [ "Gender" ] = = "Мужской"


# вставляем новую серию во фрейм данных

данные [ "Новый" ] = new


# display
data

Вывод :
Как показано на выходном изображении, для Gender = "Male" значение в New Column равно True, а для "Female" и NaN — False.

Пример # 2: Выбор данные
В следующем примере в данные передается логическая последовательность, и возвращаются только строки с полем = мужской.

# импорт пакета pandas

< класс кода = "ключевое слово"> импорт pandas as pd


# создать фрейм данных из файла CSV

data = pd.read_csv ( "employees.csv" )


# сохранение логической строки в новом один

новый = данные [ "Gender" ]! = " Женский "


# вставить новую серию во фрейм данных

data [ "New" ] = новый


# display
data [new]


# ИЛИ
# data [data[" Пол "] ==" Male"]
# Оба одинаковые

Вывод:
Как показано на выходном изображении, возвращается фрейм данных с Полом = «Мужской» ".

< img src = "http://espressocode.top /images/cravunwitonasi503215.jpg"/>

Примечание. Логическое значение равно False для значений NaN.