पांडा के साथ डेटा का अनुक्रमण और चयन

| | | | | | | | |

आइए पंडों में अनुक्रमण का एक उदाहरण देखें। इस लेख में हम CSV अपलोड करने के लिए "nba.csv ‚" फ़ाइल का उपयोग कर रहे हैं, यहां .

एकाधिक पंक्ति और एकाधिक स्तंभ चयन

आइए कुछ नकली डेटा के साथ डेटाफ़्रेम लेते हैं, अब हम इसे अनुक्रमित कर रहे हैं डेटाफ़्रेम। इसमें, हम डेटाफ़्रेम से कई पंक्तियों और कई स्तंभों का चयन करते हैं। डेटासेट के साथ डेटा फ़्रेम।

मान लीजिए कि हम केवल आयु , कॉलेज और वेतन कॉलम का चयन करना चाहते हैं अमीर जॉनसन और Terry Rozier

हमारा आखिरी DataFrame w इस तरह खराब दिखना:

एकाधिक पंक्तियों और सभी स्तंभों का चयन करें

मान लें कि हम पंक्ति का चयन करना चाहते हैं Amir Jhonson , Terry Rozier और जॉन हॉलैंड डेटाफ़्रेम में सभी कॉलम के साथ।

हमारा आखिरी DataFrame इस तरह दिखेगा:

कुछ कॉलम और सभी पंक्तियों का चयन करना

मान लें कि हम चाहते हैं आयु, ऊंचाई और वेतन कॉलम का चयन करें डेटाफ़्रेम में सभी पंक्तियों के साथ।

हमारा अंतिम डेटाफ़्रेम इस तरह दिखेगा:

< /figure>

[] , का उपयोग करके पांडा को इंडेक्स करना .loc [] , । iloc [] , .loc और .iloc इंडेक्सर्स भी इंडेक्सिंग ऑपरेटर का इस्तेमाल चयन करने के लिए करते हैं। इस इंडेक्स में, स्टेटमेंट df [] को संदर्भित करता है।

एक कॉलम का चयन करना

एक कॉलम का चयन करने के लिए, हम केवल कोष्ठक के बीच कॉलम नाम डालते हैं


<कोड वर्ग = "टिप्पणियां"> # पांडा पैकेज आयात

<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड वर्ग = "स्ट्रिंग"> "एनबीए .csv" , index_col = "नाम" <कोड वर्ग = "सादा">)


<कोड वर्ग = "टिप्पणियां"> # इंडेक्स ऑपरेटर का उपयोग करके कॉलम निकालना कोड>

<कोड क्ल एसएस = "सादा"> प्रथम <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> डेटा [ <कोड वर्ग = "स्ट्रिंग"> "आयु" <कोड वर्ग = "सादा">]



Print (पहला)

बाहर निकलें:

कई कॉलम चुनना

एकाधिक कॉलम चुनने के लिए, हमें इंडेक्सिंग स्टेटमेंट में कॉलम की सूची पास करनी होगी .


<कोड वर्ग = "टिप्पणियां"> # आयात पांडा पैकेज

<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पा n das as pd


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड वर्ग = "स्ट्रिंग"> "nba.csv" कोड> <कोड वर्ग = "सादा">, index_col <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग">" नाम " <कोड वर्ग = "सादा ">)


# इंडेक्स ऑपरेटर का उपयोग करके कई कॉलम प्राप्त करें

<कोड वर्ग = "सादा"> पहला <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> डेटा [[ <कोड वर्ग = "स्ट्रिंग"> "आयु" <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> "कॉलेज" <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> "वेतन" <कोड वर्ग = "सादा">]]



<कोड वर्ग = "अपरिभाषित रिक्त स्थान">
<कोड वर्ग = "सादा"> प्रथम

बाहर निकलें:

आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

data = <कोड वर्ग = "सादा"> pd.read_csv ( "nba.csv" , index_col <कोड क्लास = "कीवर्ड"> = <कोड क्लास = "स्ट्रिंग"> "नाम" <कोड क्लास = "सादा">)


<कोड वर्ग = "टिप्पणियां"> # स्थानीय विधि का उपयोग करके स्ट्रिंग रीडिंग निकालें

<कोड वर्ग = "सादा"> प्रथम <कोड वर्ग = "कीवर्ड"> = < /कोड> <कोड वर्ग s = "सादा"> डेटा .loc [ "Avery Bradley" ]

<कोड वर्ग = "सादा"> दूसरा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> data.loc [ <कोड वर्ग = "स्ट्रिंग"> "आरजे हंटर" <कोड वर्ग = "सादा">]



<कोड वर्ग = "कार्य"> प्रिंट <कोड वर्ग = "सादा"> (पहला, <कोड वर्ग = "स्ट्रिंग"> "" <कोड वर्ग = "सादा">, दूसरा)

code>

आउटपुट:
जैसा कि आउटपुट इमेज में दिखाया गया है, दो सीरीज लौटा दी गई क्योंकि दोनों बार केवल एक ही पैरामीटर था।


इनलाइन-2f0158eb067 edcb74628a का चयन करना एकाधिक पंक्तियाँ

एकाधिक पंक्तियों का चयन करने के लिए, हम सभी पंक्ति लेबलों को एक सूची में रखते हैं और उन्हें फ़ंक्शन . loc .


import पांडा as pd


# CSV फ़ाइल से डेटा फ्रेम बनाएं

data <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड वर्ग = "स्ट्रिंग"> "nba.csv" <कोड वर्ग = "सादा">, index_col <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग"> "नाम" <कोड वर्ग = "सादा">) code>


# loc मेथड का उपयोग करके मल्टीपल लाइन्स प्राप्त करें

first <कोड क्लास एस = "कीवर्ड"> = <कोड क्लास = "सादा"> डेटा.लोक [[ <कोड क्लास = "स्ट्रिंग"> "एवरी ब्रैडली" <कोड class="plain">, " RJ Hunter " ]]

<कोड वर्ग =" अपरिभाषित रिक्त स्थान ">

< कोड वर्ग =" अपरिभाषित स्थान ">

<कोड वर्ग = "कार्य"> प्रिंट <कोड वर्ग = "सादा"> (पहला)

/tr>

आउटपुट:

दो पंक्तियों और तीन स्तंभों का चयन करना

दो पंक्तियों और तीन स्तंभों का चयन करने के लिए, हम दो पंक्तियों का चयन करते हैं हम तीन कॉलम का चयन करना चाहते हैं और इसे इस तरह एक अलग सूची में रखना चाहते हैं:


 Dataframe.loc [["row1", "row2"], ["column1", "column2", "column3"] ] 

import pd as pandas


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

data = pd.read_csv ( "nba.csv" < कोड वर्ग = "सादा">, index_col <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग"> "नाम" <कोड वर्ग = "सादा">)


<कोड वर्ग = "टिप्पणियां"> # निकालने लोक पद्धति का उपयोग करते हुए दो पंक्तियाँ और तीन स्तंभ

प्रथम = data.loc [[ "Avery Bradley" , "आरजे हंटर" <कोड वर्ग = "सादा">],

<कोड वर्ग = "सादा"> [ <कोड वर्ग = "स्ट्रिंग"> "टीम" <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> "संख्या" <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> "स्थिति" <कोड वर्ग = "सादा">]]


<कोड वर्ग = "अपरिभाषित रिक्त स्थान">


Print (पहला)

आउटपुट:


सभी पंक्तियों और कुछ स्तंभों का चयन करना

सभी पंक्तियों और कुछ का चयन करने के लिए कॉलम, हम सभी पंक्तियों का चयन करने के लिए एक एकल कोलन [:], का उपयोग करते हैं और कुछ स्तंभों की सूची का चयन करते हैं जिन्हें हम निम्नानुसार चुनना चाहते हैं:

 Dataframe.loc [[: , ["column1", "column2", "column3"]] 

<टेबल बॉर्डर = "0" सेल पैडिंग = "0" सेलस्पेसिंग = "0"> < tbody>

<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

data = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड वर्ग = "स्ट्रिंग"> "nba.csv" <कोड वर्ग = "सादा">, index_col < /कोड> <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग"> "नाम" <कोड वर्ग = "सादा">)


<कोड c lass = "टिप्पणियां"> # लोक पद्धति का उपयोग करके सभी पंक्तियों और कुछ स्तंभों को प्राप्त करें

first = <कोड वर्ग = "सादा"> data.loc [:, [ <कोड वर्ग = "स्ट्रिंग"> "टीम" <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> "संख्या" <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> "स्थिति" <कोड वर्ग = "सादा" ">]]


<कोड वर्ग = "कार्य"> प्रिंट <कोड वर्ग = "सादा"> ( पहला)

बाहर निकलें:

डेटाफ्रेम का उपयोग करके इंडेक्स करना । iloc [] :
यह फ़ंक्शन हमें स्थिति के अनुसार पंक्तियों और स्तंभों को प्राप्त करने की अनुमति देता है। ऐसा करने के लिए, हमें उन पंक्तियों की स्थिति निर्दिष्ट करने की आवश्यकता है जिनकी हमें आवश्यकता है, साथ ही उन स्तंभों की स्थिति जो हमें चाहिए। df.iloc , df.loc से काफी मिलता-जुलता है, लेकिन चयन के लिए केवल पूर्णांक स्थानों का उपयोग करता है।

सिंगल लाइन चयन

.iloc [] का उपयोग करके एक पंक्ति का चयन करने के लिए, हम .iloc [] को एक पूर्णांक पास कर सकते हैं।

<टेबल बॉर्डर = "0" सेलपैडिंग = "0" सेलस्पेसिंग = "0">

<कोड क्लास = "कीवर्ड" > आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा


<कोड वर्ग = "टिप्पणियां"> # CSV फ़ाइल से डेटा फ़्रेम बनाएँ

<कोड वर्ग = "सादा"> डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( < कोड वर्ग = "स्ट्रिंग"> "nba.csv" <कोड वर्ग = "सादा">, index_col <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग" > "नाम" <कोड वर्ग = "सादा">)


<कोड वर्ग = "अपरिभाषित रिक्त स्थान">
<कोड वर्ग = "टिप्पणियां"> # पंक्तियों का iloc निष्कर्षण

row2 = data.iloc [ <कोड वर्ग = "मान"> 3 <कोड वर्ग = "सादा">]




प्रिंट करें (row2)

बाहर निकलें:


आयात <कोड वर्ग = "सादा"> पांडा के रूप में पीडी


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

< कोड वर्ग = "सादा"> डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड सी lass ="string ">" nba.csv " , index_col = "नाम" )



# iloc मेथड का उपयोग करके कई लाइन्स प्राप्त करना

row2 = data.iloc [[< / कोड> <कोड वर्ग = "मान"> 3 <कोड वर्ग =" सादा ">, <कोड वर्ग = "मान"> 5 <कोड वर्ग = "सादा"> , <कोड वर्ग = "मान"> 7 <कोड वर्ग = "सादा">]]




<कोड वर्ग = "सादा"> पंक्ति 2

बाहर निकलें:


दो पंक्तियों और दो स्तंभों का चयन करना

दो पंक्तियों और दो स्तंभों का चयन करने के लिए, हम स्ट्रिंग के लिए 2 पूर्णांकों की सूची और स्तंभों के लिए 2 पूर्णांकों की सूची बनाते हैं, और फिर फ़ंक्शन .iloc [] पास करते हैं।


< कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा


<कोड वर्ग = "टिप्पणियां"> # से डेटा फ्रेम बनाएं CSV फ़ाइल

<कोड वर्ग = "सादा"> डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( "nba.csv" , index_col = < कोड वर्ग = "स्ट्रिंग"> "नाम" <कोड वर्ग = "सादा">)




<कोड वर्ग = "टिप्पणियां"> # निष्कर्षण iloc पद्धति का उपयोग करते हुए दो पंक्तियों और दो स्तंभों में से

row2 = <कोड वर्ग = "सादा"> data.iloc [[[ <कोड वर्ग = "मान"> 3 <कोड वर्ग = "सादा">, कोड> <कोड वर्ग = "मान"> 4 <कोड वर्ग = "सादा">], [ <कोड वर्ग = "मान"> 1 <कोड वर्ग = "सादा" >, <कोड वर्ग = "मान"> 2 <कोड वर्ग = "सादा">]]

<कोड वर्ग = "अपरिभाषित रिक्त स्थान">

<कोड वर्ग = "फ़ंक्शंस"> प्रिंट <कोड वर्ग = "सादा"> (पंक्ति 2)

बाहर निकलें:

सभी पंक्तियों और कुछ स्तंभों का चयन करें

सभी पंक्तियों का चयन करने के लिए और कुछ कॉलम, हम सभी पंक्तियों का चयन करने के लिए एक एकल कोलन [:], का उपयोग करते हैं, और fo r कॉलम में, हम पूर्णांकों की एक सूची बनाते हैं और फिर फ़ंक्शन .iloc [] पास करते हैं।



आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा


<कोड वर्ग = "टिप्पणियां"> # CSV फ़ाइल से डेटा फ़्रेम बनाएँ

<कोड वर्ग = "सादा"> डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( < कोड वर्ग = "स्ट्रिंग"> "nba.csv" <कोड वर्ग = "सादा">, index_col <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग" > "नाम" <कोड वर्ग = "सादा">)


<कोड वर्ग = "अपरिभाषित डी रिक्त स्थान">
<कोड class ="comments "> # iloc विधि का उपयोग करके सभी पंक्तियों और कुछ स्तंभों का निष्कर्षण

row2 = <कोड वर्ग = "सादा"> data.iloc [:, [ <कोड वर्ग = "मान"> 1 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 2 <कोड वर्ग = "सादा">]]

<कोड वर्ग = "अपरिभाषित रिक्त स्थान">

/code>

Print (row2)

बाहर निकलें:

<आकृति वर्ग = aligncenter amp-wp-inline-4e8e1e962f1c797e7b74b68ccef77cbc>

.ix [] . loc []

एक पंक्ति का चयन करने के लिए, हम फ़ंक्शन में एकल पंक्ति लेबल लगाते हैं। ix । यह फ़ंक्शन .loc की तरह कार्य करता है [] अगर हम फ़ंक्शन के तर्क के रूप में लाइन लेबल पास करते हैं।


<तालिका सीमा = "0" सेलपैडिंग =" 0 "सेलस्पेसिंग =" 0 ">

# import pandas package

import पीडी के रूप में पांडा


<कोड वर्ग = "टिप्पणियां"> # CSV फ़ाइल से डेटा फ़्रेम बनाएं

<कोड वर्ग = "सादा"> डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड वर्ग = "स्ट्रिंग ">" nba.csv " , index_col = "Name" )


# ix मेथड का उपयोग करके एक स्ट्रिंग प्राप्त करना

<कोड वर्ग = "सादा" > प्रथम <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> data.ix [ <कोड वर्ग = " string"> "एवरी ब्रैडली" <कोड वर्ग = "सादा">]




<कोड वर्ग = "कार्य"> प्रिंट (प्रथम)

बाहर निकलें:

। ix [] जैसा # आयात पांडा पैकेज

कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पांडा के रूप में pd


# CSV फ़ाइल से डेटा फ़्रेम बनाएं

डेटा <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> pd.read_csv ( <कोड वर्ग = "स्ट्रिंग"> "nba.csv" कोड> <कोड वर्ग = "सादा">, index_col <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "स्ट्रिंग"> "नाम" <कोड वर्ग = "सादा" ">)


# ix विधि का उपयोग करके एक स्ट्रिंग प्राप्त करना

प्रथम <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> data.ix [ <कोड वर्ग = "मान"> 1 < कोड क्लास ="p lain ">]

<कोड वर्ग ="अपरिभाषित रिक्त स्थान">


<कोड वर्ग = "कार्य"> प्रिंट <कोड वर्ग = "सादा"> (प्रथम) कोड>

बाहर निकलें:

< फिगर क्लास = aligncenter amp-wp-inline-71b6f2deb98f54bf23d07f2b79530929>


डेटाफ़्रेम में अनुक्रमण विधियाँ

<तालिका वर्ग = "numpy-table"> फ़ंक्शन विवरण
Dataframe.head () डेटा फ़्रेम की शीर्ष n पंक्तियां लौटाएं। Dataframe.tail () डेटा फ़्रेम के नीचे n पंक्तियां लौटाएं। Dataframe.at [] एक पंक्ति/स्तंभ लेबल जोड़ी के लिए एकल मान तक पहुंचें। Dataframe.iat [] पूर्णांक स्थिति के आधार पर एक पंक्ति / स्तंभ जोड़ी के लिए एकल मान तक पहुँचें। Dataframe.tail () स्थिति के आधार पर चयन के लिए विशुद्ध रूप से पूर्णांक-स्थान आधारित अनुक्रमण। DataFrame.lookup () DataFrame के लिए लेबल-आधारित "फैंसी इंडेक्सिंग‚" फ़ंक्शन। < /tr> DataFrame .pop () आइटम लौटाएं और फ़्रेम से ड्रॉप करें। DataFrame.xs() DataFrame से एक क्रॉस-सेक्शन (पंक्ति (पंक्ति) या कॉलम (s)) देता है। DataFrame.get () दी गई कुंजी (डेटाफ़्रेम कॉलम, पैनल स्लाइस, आदि) के लिए ऑब्जेक्ट से आइटम प्राप्त करें। DataFrame.isin () बूलियन डेटाफ़्रेम लौटाता है जो दिखाता है कि क्या में प्रत्येक तत्व DataFrame मानों में निहित है। DataFrame.where () स्वयं के समान आकार की वस्तु लौटाएं और जिसकी संगत प्रविष्टियां स्वयं से हैं जहां cond सही है और अन्यथा अन्य से हैं।< /td>

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method