[Python] 데이터 사이언스 스쿨 - 3.4 기술 통계
Updated:
데이터 사이언스 스쿨 자료를 토대로 공부한 내용입니다.
실습과정에서 필요에 따라 내용의 누락 및 추가, 수정사항이 있습니다.
3.4 기술 통계
이 챕터에선 기술 통계관련 다양한 함수를 확인한다.
import numpy as np
x = np.array([18, 5, 10, 23, 19, -8, 10, 0, 0, 5, 2, 15, 8,
2, 5, 4, 15, -1, 4, -7, -24, 7, 9, -6, 23, -13])
# 데이터의 개수
print("데이터의 개수:", len(x))
# 표본 평균
print("표본 평균:", np.mean(x))
# 표본 분산
print("표본 분산:", np.var(x))
# 표본 표준편차
print("표본 표준편차:", np.std(x))
# 최대값, 최소값
print("최대값:", np.max(x))
print("최소값:", np.min(x))
# 중앙값
print("중앙값:", np.median(x))
# 사분위수
print("최소값:", np.percentile(x,0))
print("1사분위수:", np.percentile(x,25))
print("2사분위수:", np.percentile(x,50))
print("3사분위수:", np.percentile(x,75))
print("최대값:", np.percentile(x,100))
데이터의 개수: 26
표본 평균: 4.8076923076923075
표본 분산: 115.23224852071006
표본 표준편차: 10.734628476137871
최대값: 23
최소값: -24
중앙값: 5.0
최소값: -24.0
1사분위수: 0.0
2사분위수: 5.0
3사분위수: 10.0
최대값: 23.0
Leave a comment