ग्रुपबी — काफी सरल अवधारणा। हम श्रेणियों का एक समूह बना सकते हैं और फ़ंक्शन को श्रेणियों में लागू कर सकते हैं। यह एक सरल अवधारणा है, लेकिन यह एक अत्यंत मूल्यवान तकनीक है जिसका व्यापक रूप से data में उपयोग किया जाता है। विज्ञान. वास्तविक दुनिया के डेटा विज्ञान प्रोजेक्ट में, आप बड़ी मात्रा में काम करेंगे डेटा और चीजों को बार-बार करने की कोशिश कर रहा है, इसलिए दक्षता के लिए हम Groupby अवधारणा का उपयोग करते हैं। Groupby अवधारणा वास्तव में महत्वपूर्ण है क्योंकि यह प्रदर्शन और कोड की मात्रा दोनों के संदर्भ में डेटा को कुशलतापूर्वक संयोजित करने में सक्षम है। समूहीकरण मुख्य रूप से एक या अधिक निम्न चरणों वाली प्रक्रिया को संदर्भित करता है:
- पृथक्करण: एक प्रक्रिया है जिसमें हम डेटासेट पर कुछ शर्तें लागू करके डेटा को समूहों में विभाजित करते हैं .
- आवेदन: एक प्रक्रिया है जिसमें हम स्वतंत्र रूप से प्रत्येक समूह के लिए एक फ़ंक्शन लागू करते हैं
- समेकन: एक प्रक्रिया है जिसमें हम समूहीकरण और परिणामों को एक डेटा संरचना में लागू करने के बाद अलग-अलग डेटासेट को मिलाते हैं
निम्न चित्र आपको Groupby अवधारणा में शामिल प्रक्रिया को समझने में मदद करेगा।
1. "टीम" कॉलम से अद्वितीय मानों को समूहित करें।
2। अब प्रत्येक समूह के लिए एक बकेट है
3. अन्य डेटा को बकेट में डालें
4. प्रत्येक बकेट के वज़न कॉलम में फ़ंक्शन लागू करें।
डेटा को समूहों में विभाजित करना
विभाजन करना — यह एक प्रक्रिया है जिसमें हम डेटासेट पर कुछ शर्तें लागू करके डेटा को समूहों में विभाजित करते हैं। डेटा को अलग करने के लिए, हम डेटासेट पर कुछ शर्तें लागू करते हैं। डेटा को अलग करने के लिए, हम groupby ()
का उपयोग करते हैं इस फ़ंक्शन का उपयोग कुछ मानदंडों के अनुसार डेटा को समूहों में विभाजित करने के लिए किया जाता है . पंडों की वस्तुओं को उनकी किसी भी कुल्हाड़ी में विभाजित किया जा सकता है। समूहीकरण की एक सार परिभाषा समूह के नामों के लिए लेबल की मैपिंग प्रदान करना है। पंडों के डेटासेट को किसी भी ऑब्जेक्ट में विभाजित किया जा सकता है। डेटा को विभाजित करने के कई तरीके हैं, उदाहरण के लिए:
नोट: यहां हम वस्तुओं को कुंजी के रूप में समूहीकृत करते हैं।
डेटा को एक कुंजी के साथ समूहीकृत करना:
डेटा को एक कुंजी के साथ समूहीकृत करने के लिए, हम groupby
फ़ंक्शन।
<कोड वर्ग = "टिप्पणियां"> # पांडा मॉड्यूल आयात
<कोड वर्ग = "कीवर्ड" "> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा
<कोड वर्ग = "टिप्पणियां"> # कर्मचारी डेटा युक्त एक शब्दकोश परिभाषित करें
<कोड वर्ग = "सादा"> डेटा 1 <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> { <कोड वर्ग = "स्ट्रिंग">` नाम` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिन g"> `अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा">,
<कोड वर्ग = "अपरिभाषित रिक्त स्थान"> <कोड वर्ग = "स्ट्रिंग"> `गौरव` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अनुज` <कोड वर्ग = "सादा" >, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अभि` < कोड वर्ग = "सादा">],
<कोड वर्ग = "अपरिभाषित रिक्त स्थान"> वर्ग = "सादा">: [ <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 24 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 22 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 < /कोड> <कोड वर्ग = "सादा">,
<कोड वर्ग = "मान"> 33 <कोड वर्ग = "सादा">, < कोड वर्ग = "मान"> 36 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा">],
<कोड वर्ग = "स्ट्रिंग"> `पता` <कोड वर्ग ="plai n ">: [ ` नागपुर`
,
`कानपुर ` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `इलाहाबाद` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग" > `कन्नूज` ‚Äã‚Äã <कोड वर्ग =" सादा ">,
<कोड वर्ग =" अपरिभाषित रिक्त स्थान "> <कोड वर्ग ="स्ट्रिंग ">` जौनपुर ` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `कानपुर` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `इलाहाबाद` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अलीगढ़` <कोड वर्ग = "सादा">],
<कोड वर्ग = "स्ट्रिंग"> `योग्यता` <कोड वर्ग = "सादा">: [< /कोड> <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमए` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमसीए` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `पीएचडी` कोड> <कोड वर्ग = "सादा">,
<पी> कोड वर्ग = "स्ट्रिंग"> `बी.टेक` <कोड वर्ग = "सादा">, कोड> <कोड वर्ग = "स्ट्रिंग"> `बी.कॉम` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग ="सादा ">,` MA`
]}
< br> # डिक्शनरी को DataFrame में बदलें
df
= कोड> <कोड वर्ग = "सादा"> pd.DataFrame (डेटा1)
<कोड वर्ग = "कार्य"> प्रिंट <कोड वर्ग = "सादा"> (df)
< br>अब हम
groupby ()
फ़ंक्शन का उपयोग करके डेटा नाम
को समूहीकृत करते हैं।
# groupby फंक्शन का इस्तेमाल करके code>
# एक कुंजी के साथ
df.groupby (
`Name`
)
Print
(df.groupby< /a> (
`Name`
)। समूह)
आउटपुट:
अब हम सभी गठित समूहों में पहला रिकॉर्ड प्रिंट करते हैं।
# लागू करें groupby ()
# नाम मान द्वारा समूह डेटा
<कोड वर्ग = "सादा"> gk <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> df.groupby ( `Name`
)
# सभी सृजित समूहों में # पहली प्रविष्टियां प्रिंट करें
#।
gk.first ()
आउटपुट:
एकाधिक कुंजियों के साथ डेटा समूहित करना:
एकाधिक कुंजियों के साथ डेटा समूहीकृत करने के लिए, हम groupby समारोह।
<कोड वर्ग = "टिप्पणियां"> # पांडा मॉड्यूल आयात
<कोड वर्ग = "कीवर्ड "> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा
<कोड वर्ग = "टिप्पणियां"> # कर्मचारी डेटा युक्त एक शब्दकोश परिभाषित करें
<कोड वर्ग = "सादा"> डेटा 1 <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> { <कोड वर्ग = "स्ट्रिंग"> `नाम` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, ` Anuj`
, <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = " सादा">,
कोड वर्ग = "स्ट्रिंग" > `गौरव` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग" >` अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा">, < कोड वर्ग = "स्ट्रिंग"> `अभि` <कोड वर्ग = "सादा">],
<कोड वर्ग = "स्ट्रिंग"> `आयु` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 24 < / कोड> <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 22 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा">,
<कोड वर्ग = "मान"> 33 <कोड वर्ग = "सादा">, कोड> <कोड वर्ग = "मान"> 36 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग ss = "value"> 32 ],
`Address`
: [
` नागपुर`
,
`कानपुर` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `इलाहाबाद` <कोड वर्ग = "सादा">, <कोड वर्ग = " string"> `कन्नुआज` ‚Äã‚Äã
,
`Junpur`
< कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `कानपुर` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग">` इलाहाबाद ` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अलीगढ़` <कोड वर्ग = "सादा">],
<कोड वर्ग = "स्ट्रिंग"> `योग्यता` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमए` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> ` MCA` ,
` Phd`
,
<कोड वर्ग = "स्ट्रिंग"> `बी.टेक` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `बी.कॉम` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `MA` ]}
# डिक्शनरी को DataFrame में बदलें
<कोड वर्ग = "सादा"> df <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> पीडी। DataFrame (data1)
(df)
अब हम नाम और योग्यता डेटा को एक साथ समूहबद्ध करेंगे groupby
फंक्शन में कई कुंजियां काम करती हैं।
<टेबल बॉर्डर = "0" सेलपैडिंग = "0" सेलस्पेसिंग =" 0 ">
#
# groupby () function
df.groupby ([
` Name`
< कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `योग्यता` <कोड वर्ग = "सादा">])
प्रिंट <कोड क्लास ss = "सादा"> (df.groupby ([ `Name` कोड> <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `योग्यता` <कोड वर्ग = "सादा">])। समूह)
उत्पादन:
डेटा को कुंजी सॉर्टिंग द्वारा समूहित करना:
बल्क ऑपरेशन के दौरान समूह कुंजियों को डिफ़ॉल्ट रूप से सॉर्ट किया जाता है। संभावित स्पीडअप के लिए उपयोगकर्ता सॉर्ट = गलत पास कर सकता है।
# पांडा मॉड्यूल आयात
कोड वर्ग = "टिप्पणियां"> # कर्मचारी डेटा वाले शब्दकोश को परिभाषित करें
data1
=
{ <कोड वर्ग = "स्ट्रिंग"> `नाम` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `जय`
,
` Princi`
,
<कोड वर्ग = "स्ट्रिंग"> `गौरव` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग" > `अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा">, < /कोड> <कोड वर्ग = "स्ट्रिंग"> `अभि` <कोड वर्ग = "सादा">],
<कोड वर्ग = "अपरिभाषित रिक्त स्थान"> कोड> <कोड वर्ग = "स्ट्रिंग"> `आयु` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा ">, <कोड वर्ग = "मान"> 24 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 22 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा">,
<कोड वर्ग = "अपरिभाषित रिक्त स्थान" > <कोड वर्ग = "मान"> 33 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 36 <कोड वर्ग = "सादा" ">, <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा"> ],}
# शब्दकोश को DataFrame में बदलें
< कोड वर्ग = "सादा"> df
Print
(df)
अब हम groupby ()
कोई सॉर्टिंग नहीं
# groupby फ़ंक्शन
# बिना सॉर्टिंग का उपयोग किए
< का उपयोग करना /p>
df.groupby ([
`नाम` <कोड वर्ग = "सादा">])।
sum
()
< मजबूत>आउटपुट:
अब हम groupby ()
सॉर्ट का उपयोग करना।
<तालिका सीमा = "0 "सेलपैडिंग =" 0 "सेलस्पेसिंग =" 0 ">
# का उपयोग करके groupby फ़ंक्शन
# सॉर्ट किया गया
df .groupby ([
`Name`
], सॉर्ट करें
=
False
)।
sum
( )
< मजबूत>आउटपुट:
ऑब्जेक्ट विशेषताओं के साथ डेटा समूहीकृत करना:
समूह विशेषता एक शब्दकोश के समान है, जिसकी कुंजी अद्वितीय समूहों की गणना की जाती है, और संबंधित मान ‚Äã‚Äã अक्ष लेबल होते हैं, प्रत्येक समूह से संबंधित होते हैं।
<कोड वर्ग = "टिप्पणियां"> # पांडा मॉड्यूल आयात
<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पांडा के रूप में pd
# कर्मचारी डेटा वाली डिक्शनरी को परिभाषित करें
data1 <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> { <कोड वर्ग = "स्ट्रिंग"> `नाम` <कोड वर्ग =" सादा ">: [ <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अनुज` कोड> <कोड वर्ग ="सादा ">, <कोड वर्ग =" स्ट्रिंग ">` जय ` <कोड वर्ग =" सादा ">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` < /कोड> <कोड वर्ग = "सादा">,
<कोड वर्ग = "स्ट्रिंग"> `गौरव` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा ">, <कोड वर्ग = "स्ट्रिंग"> `अभि` <कोड वर्ग = "सादा">],
<कोड वर्ग = "स्ट्रिंग" > `आयु` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 24 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 22 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा">,
<कोड वर्ग = "मान"> 33 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 36 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा">],
<कोड वर्ग = "अपरिभाषित रिक्त स्थान"> < कोड वर्ग = "स्ट्रिंग"> `पता` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `नागपुर` <कोड वर्ग = "सादा" >, `kanpur`
,
`इलाहाबाद`
< कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `कन्नुआज` ‚Äã‚Äã <कोड वर्ग = "सादा">,
`जौनपुर` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `कानपुर` <कोड वर्ग = "सादा ">, <कोड वर्ग = "स्ट्रिंग"> `इलाहाबाद` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अलीगढ़` ],
`योग्यता`
< कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग = "सादा">, < कोड वर्ग = "स्ट्रिंग"> `एमए` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमसीए` <कोड वर्ग = "सादा"> , ` Phd`
,
`B .Tech`
,
`B.com`
,
<कोड क्लास = "सेंट रिंग">` एमएससी` <कोड क्लास = "प्लेन">, <कोड क्लास = "स्ट्रिंग"> `एमए` <कोड क्लास =" प्लेन ">]}
# डिक्शनरी को DataFrame में बदलें
डीएफ <कोड वर्ग = "कीवर्ड"> = <कोड वर्ग = "सादा"> पीडी। डेटाफ्रेम (डेटा 1)
कोड वर्ग = "फ़ंक्शंस"> प्रिंट <कोड वर्ग = "सादा"> (डीएफ)
अब हम डेटा को समूहबद्ध करते हैं जैसे हम कुंजियों का उपयोग करके शब्दकोश में करते हैं।
# ग्रुपिंग कीज़ का उपयोग करना # data
df.groupby (
` Name`
)। समूह
आउटपुट:
समूहों पर पुनरावृत्ति
प्रति समूह आइटम पर पुनरावृति, हम iterto.ols जैसी किसी वस्तु पर पुनरावृति कर सकते हैं।
# पांडा मॉड्यूल आयात
<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा
<कोड वर्ग = "टिप्पणियां" > # कर्मचारियों के बारे में डेटा वाले शब्दकोश को परिभाषित करें
data1
=
{ <कोड वर्ग = "स्ट्रिंग"> `नाम` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "p lain ">,
` Anuj`
,
`Jai`
> <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा">,
कोड वर्ग = "स्ट्रिंग"> `गौरव` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अनुज` <कोड वर्ग = "सादा"> , ` प्रिंसी`
,
`Abhi`
],
<कोड वर्ग = "अपरिभाषित रिक्त स्थान"> = "सादा">: [ <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 24 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 22 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 कोड> <कोड वर्ग = "सादा">,
<कोड वर्ग = "मान"> 33 <कोड वर्ग = "सादा">, <कोड वर्ग = "मूल्य" ई"> 36 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 27 <कोड वर्ग = "सादा">, <कोड वर्ग = "मान"> 32 <कोड वर्ग = "सादा">],
<कोड वर्ग = "अपरिभाषित रिक्त स्थान"> <कोड वर्ग = "स्ट्रिंग ">` पता ` <कोड वर्ग = "सादा">: [ <कोड वर्ग =" स्ट्रिंग ">` नागपुर ` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `कानपुर` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `इलाहाबाद` <कोड वर्ग = "सादा" ">, <कोड वर्ग =" स्ट्रिंग "> `कन्नुआज` ‚Äã‚Äã <कोड वर्ग =" सादा ">,
कोड वर्ग = "अपरिभाषित रिक्त स्थान"> <कोड वर्ग =" स्ट्रिंग ">` जौनपुर ` <कोड वर्ग =" सादा ">, <कोड वर्ग ="स्ट्रिंग ">` कानपुर ` कोड> <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `इलाहाबाद` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग" >` अलीगढ़` <कोड वर्ग = "सादा">],
<कोड वर्ग = "स्ट्रिंग"> `योग्यता` <कोड वर्ग = "सादा">: [ <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग "> `एमए` <कोड वर्ग = "सादा">, <कोड वर्ग =" स्ट्रिंग ">` एमसीए ` <कोड वर्ग = "सादा">, `Phd`
,
`B.Tech`
,
` B.com`
, <कोड वर्ग = "स्ट्रिंग"> `एमएससी` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `एमए`
]}
# शब्दकोश को डेटाफ़्रेम में बदलें
df
=
pd.DataFrame (data1)
प्रिंट < /कोड> <सी ode वर्ग = "सादा"> (df)
अब हम समूह तत्व को वैसे ही दोहराते हैं जैसे हम itertools.obj में करते हैं।
<कोड वर्ग = "टिप्पणियां"> # तत्व दोहराव
<कोड वर्ग = "टिप्पणियां"> समूह #
<कोड वर्ग = "सादा "> grp =
df.groupby a> (
`Name`
)
<कोड वर्ग = "सादा"> नाम, समूह <कोड वर्ग = "कीवर्ड"> के लिए <कोड वर्ग = "सादा"> जीआरपी:
<कोड वर्ग = "फ़ंक्शंस"> प्रिंट <कोड वर्ग ="सादा "> (नाम)
< कोड वर्ग =" अपरिभाषित रिक्त स्थान "> <कोड वर्ग = "फ़ंक्शंस"> प्रिंट <कोड वर्ग = "सादा"> (समूह)
<कोड वर्ग = "कीव ord"> प्रिंट करें ()
आउटपुट:
अब हम एक समूह तत्व पर पुनरावृति करते हैं एकाधिक कुंजियाँ युक्त
# एलिमेंट रिपीट
# समूह के
# एकाधिक कुंजियाँ
grp
=
df.groupby ([ <कोड वर्ग = "स्ट्रिंग"> `नाम` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `योग्यता` <कोड वर्ग = "सादा">])
<कोड वर्ग = "कीवर्ड"> के लिए <कोड वर्ग = "सादा"> नाम, समूह <कोड वर्ग = "कीवर्ड"> में grp:
<कोड वर्ग = "कार्य"> जनसंपर्क इंट <कोड वर्ग = "सादा"> (नाम)
कोड वर्ग = "कीवर्ड" > प्रिंट <कोड वर्ग = "सादा"> (समूह)
कोड वर्ग = "कार्य"> प्रिंट <कोड वर्ग = "सादा"> ( )
आउटपुट:
जैसा कि आउटपुट में दिखाया गया है, समूह का नाम एक टपल होगा
समूह चयन
एक का चयन करने के लिए समूह, हम GroupBy.get_group ()
का उपयोग करके एक समूह का चयन कर सकते हैं। हम फ़ंक्शन को लागू करके एक समूह का चयन कर सकते हैं GroupBy.get_group
यह फ़ंक्शन एक समूह का चयन करेगा।
# पांडा मॉड्यूल आयात
<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा"> पीडी के रूप में पांडा
<कोड वर्ग = "टिप्पणियां"> # कर्मचारी डेटा वाले शब्दकोश को परिभाषित करें
<कोड वर्ग = "सादा"> डेटा 1 <कोड वर्ग = "कीवर्ड"> = < /कोड> <कोड वर्ग = "सादा"> { <कोड वर्ग = "स्ट्रिंग"> `नाम` <कोड वर्ग = "सादा">: [ <कोड वर्ग = " स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `जय` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `प्रिंसी` <कोड वर्ग = "सादा ">,
`गौरव`
,
`अनुज` <कोड वर्ग = "सादा">, <कोड वर्ग ="string ">` प्रिंसी ` <कोड वर्ग = "सादा">, <कोड वर्ग = "स्ट्रिंग"> `अभि` <कोड वर्ग = "सादा">],
<कोड वर्ग = "अपरिभाषित रिक्त स्थान">प्रिंट <कोड वर्ग = "सादा"> (नाम)
कोड वर्ग = "कीवर्ड"> प्रिंट <कोड क्लास = "सादा"> (समूह)
<कोड क्लास = "फ़ंक्शंस"> प्रिंट <कोड क्लास = " प्लेन"> ()
आउटपुट:
जैसा कि आउटपुट में दिखाया गया है, समूह का नाम होगा a tuple
समूह चयन
एक समूह का चयन करने के लिए, हम GroupBy.get_group ()
का उपयोग करके एक समूह का चयन कर सकते हैं। हम GroupBy.get_group
फ़ंक्शन को लागू करके एक समूह का चयन कर सकते हैं यह फ़ंक्शन एक समूह का चयन करेगा .
<कोड वर्ग = "टिप्पणियां"> # पांडा मॉड्यूल आयात
<कोड वर्ग = "कीवर्ड"> आयात <कोड वर्ग = "सादा "> पांडा पीडी के रूप में