Intervallo interquartile e deviazione quartile utilizzando NumPy e SciPy

| | | |

Algoritmo di ricerca dei quartili:
I quartili vengono calcolati utilizzando la mediana. Se il numero di record è un numero pari, cioè 2n, il primo quartile (Q1) è uguale alla mediana di n record più piccoli e il terzo quartile (Q3) è uguale alla mediana di n record più grandi.

Se il numero di record è dispari, cioè nella forma (2n + 1), allora

  • il primo quartile (Q1) è la mediana di n record più piccoli
  • terzo quartile (Q1) è la mediana di n record più grandi
  • secondo quartile (Q2) è lo stesso, come una normale mediana.

Intervallo: è la differenza tra il valore più grande e il valore più piccolo in un determinato set di dati.
Intervallo interquartile:
Intervallo interquartile (IQR), chiamato anche media o media 50% , o tecnicamente H-spread — è la differenza tra il terzo quartile (Q3) e il primo quartile (Q1). Copre il centro di distribuzione e contiene il 50% delle osservazioni. IQR = Q3 — Q1

Usi :

  • L’intervallo interquartile ha un punto di rottura del 25%, motivo per cui è spesso preferito l’intera gamma.
  • IQR è usato per tracciare box plot, semplici rappresentazioni grafiche di distribuzioni di probabilità.
  • L’IQR può essere utilizzato anche per identificare i valori anomali in un determinato set di dati.
  • IQR fornisce l’andamento centrale dei dati.

Prendi una decisione

  • Il set di dati ha un intervallo interquartile (IQR) più elevato e una maggiore variabilità.
  • È preferibile un set di dati con un intervallo interquartile (IQR) inferiore.

Supponiamo che se abbiamo due dataset e i loro intervalli interquartile sono IR1 e IR2, e se IR1" IR2, si dice che i dati in IR1 hanno una variabilità maggiore rispetto ai dati in IR2 e i dati in IR2 sono preferibili.

Esempio :

  • Di seguito è riportato il numero di candidati iscritti ogni giorno negli ultimi 20 giorni al corso —
    Strutture dati e algoritmi — DSA Online 3 in Python.Engineering
    75, 69, 56, 46, 47, 79, 92, 97, 89, 88, 36, 96, 105, 32, 116, 101, 79, 93, 91, 112
  • Dopo aver ordinato il set di dati sopra:
    32, 36, 46, 47, 56, 69, 75, 79, 79, 88, 89, 91, 92, 93, 96, 97, 101, 105, 112, 116
  • Il numero totale di termini qui è 20.
  • Il secondo quartile (Q2) o mediana dei dati di cui sopra è (88 + 89) / 2 = 88,5
  • Il primo quartile (Q1) è la mediana del primo n, ovvero 10 termini (o n, ovvero 10 valori più piccoli) = 62,5
  • Terzo quartile (Q3) &# 8212; questa è la mediana n, ovvero I 10 valori più grandi (o gli ultimi n, ovvero 10 valori) = 96,5.
  • Allora IQR = Q3 — Q1 = 96,5 — 62,5 = 34,0

Intervallo interquartile utilizzando numpy.median

# Importa la libreria numpy come np

< p> import numpy come np

dati = [ 32 , 36 , 46 , 47 , 56 , 69 , 75 , 79 , 79 , 88 , 89 , 91 , 92 , 93 , 96 , 97 ,

101 , 105 , 112 , 116 ]


# Primo quartile (Q1)

Q1 = np.median (data [: 10 ])


# Terzo quartile (Q3)

Q3 = np.median (data [ 10 :])


# Interquartile range (IQR)

IQR = Q3 - Q1

print (IQR)

  Output:  34.0 

Intervallo interquartile utilizzando numpy.percentile

< tr>

# Importa libreria digitale

import numpy as np

dati < classe codice = "parola chiave"> = [ 32 , 36 , 46 , 47 , 56 , 69 , 75 , 79 , 79 , 88 , 89 , 91 , 92 , 93 , 96 , 97 ,

101 , 105 , 112 , 116 ]


# Primo quartile (Q1)

Q1 = np.percentile (dati, 25 , interpolazione = ’punto medio’ )


# Terzo quartile (Q3)

Q3 = np.percentile (dati, 75 , interpolazione = ’ punto medio’ )


# Inter-apartment range (IQR)

IQR = < classe di codice = "semplice"> Q3 - Q1

< p> print (IQR)

  Output:  34.0 

Intervallo interquartile usando scipy.stats.iqr

< p> # Importa statistiche dalla libreria Scipy

da scipy import statistiche

data = [ 32 , 36 , 46 , 47 , 56 , 69 , 75 , 79 , 79 , 88 , 89 , 91 , 92 , 93 , 96 , 97 ,

101 , 105 , 112 , 116 ]


# Interquartile range (IQR)

IQR = stats.iqr (dati, interpolazione = ’ midpoint’ ) < /p>

print (IQR)

  Output:  34.0 

Deviazione quartile
Deviazione quartile — questa è la metà della differenza tra il terzo quartile (Q3) e il primo quartile (Q1), cioè metà dell’intervallo interquartile (IQR). (Q3 — Q1) / 2 = IQR / 2

Prendi una decisione
Il set di dati con una deviazione del quartile più alta , ha una maggiore volatilità.

Deflessione quartile utilizzando numpy.median

# importa la libreria numpy come np < /p>

importa numpy come np

dati = [ 32 , 36 , 46 code> , 47 , 56 , 69 , 75 , 79 , 79 , 88 , 89 , 91 , 92 , 93 , 96 , 97 ,

101 , 105 , 112 , 116 ]


# Primo quartile (Q1)

Q1 = np.median (da ta [: 10 ])


# Terzo quartile (T3)

T3 = np.median (data [ 10 :])

< br /> # Intervallo interquartile (IQR)

IQR = Q3 - Q1


# Deviazione quartile

qd = IQR / 2

print (qd)

  Uscita:  17,0 

Shop

Learn programming in R: courses

$

Best Python online courses for 2022

$

Best laptop for Fortnite

$

Best laptop for Excel

$

Best laptop for Solidworks

$

Best laptop for Roblox

$

Best computer for crypto mining

$

Best laptop for Sims 4

$

Latest questions

NUMPYNUMPY

psycopg2: insert multiple rows with one query

12 answers

NUMPYNUMPY

How to convert Nonetype to int or string?

12 answers

NUMPYNUMPY

How to specify multiple return types using type-hints

12 answers

NUMPYNUMPY

Javascript Error: IPython is not defined in JupyterLab

12 answers


Wiki

Python OpenCV | cv2.putText () method

numpy.arctan2 () in Python

Python | os.path.realpath () method

Python OpenCV | cv2.circle () method

Python OpenCV cv2.cvtColor () method

Python - Move item to the end of the list

time.perf_counter () function in Python

Check if one list is a subset of another in Python

Python os.path.join () method