해석
- 모든 분위수 점은 x축에서 45도 각도로 직선 위에 있거나 직선 위에 있습니다. 이것은 두 샘플이 유사한 분포를 가지고 있음을 나타냅니다.
그리고 실제로 이러한 100%를 얻는 것은 항상 불가능합니다. 명확한 직선이지만 그래프는 다음과 같습니다. 여기에서 점은 거의 직선에 있습니다. - Y-분위수는 x-분위수 아래에 있습니다. 이것은 y 값이 x 값보다 낮은 경향이 있음을 나타냅니다.
그리고 실제로는 위와 같이 항상 100%를 얻을 수 있는 것은 아니지만 그래프는 아래와 같이 보입니다. 여기에서 대부분의 점이 선 아래에 있고 몇 개의 점이 선 위에 있음을 알 수 있습니다. 따라서 분포가 동일하지 않다고 말할 수 있습니다. - X-quantile은 다음보다 낮습니다. y-분위수. 이는 x 값이 y 값보다 낮은 경향이 있음을 나타냅니다.
- 표시 y 분위수가 x 분위수 아래에 있는 중단점이 있고 이 지점 이후에 y 분위수가 x 분위수보다 높습니다.
분위수 — Python에서 statsmodel
을 사용한 분위수 플롯 —
가져오기
np로 numpy
가져오기
statsmodels.api as sm
가져오기
pylab as py
# np.random은 다른 난수를 생성합니다.
# 코드가 실행될 때마다
# 참고: 동일한 코드를 실행할 때
# 그래프가 아래와 다르게 보입니다.
# 임의의 데이터 포인트 생성
data_points
<코드 클래스 = "키워드"> = < 코드 클래스 = "일반"> np.random.normal ( <코드 클래스 = "값"> 0 <코드 클래스 = " 일반">, <코드 클래스 = "값" > 1 <코드 클래스 = "일반">, <코드 클래스 = "값"> 100 <코드 클래스 = "일반">)
sm.qqplot (data_points, 줄
<코드 클래스 = "키워드"> = <코드 클래스 = "문자열"> `45` <코드 클래스 ="일반 ">)
<코드 클래스 ="일반 "> py.show()
출력: