[Python] 데이터 사이언스 스쿨 - 3.4 기술 통계

Updated:

데이터 사이언스 스쿨 자료를 토대로 공부한 내용입니다.

실습과정에서 필요에 따라 내용의 누락 및 추가, 수정사항이 있습니다.


3.4 기술 통계

이 챕터에선 기술 통계관련 다양한 함수를 확인한다.

import numpy as np
x = np.array([18,   5,  10,  23,  19,  -8,  10,   0,   0,   5,   2,  15,   8,
              2,   5,   4,  15,  -1,   4,  -7, -24,   7,   9,  -6,  23, -13])
# 데이터의 개수
print("데이터의 개수:", len(x))

# 표본 평균
print("표본 평균:", np.mean(x))

# 표본 분산
print("표본 분산:", np.var(x))

# 표본 표준편차
print("표본 표준편차:", np.std(x))

# 최대값, 최소값
print("최대값:", np.max(x))
print("최소값:", np.min(x))

# 중앙값
print("중앙값:", np.median(x))

# 사분위수
print("최소값:", np.percentile(x,0))
print("1사분위수:", np.percentile(x,25))
print("2사분위수:", np.percentile(x,50))
print("3사분위수:", np.percentile(x,75))
print("최대값:", np.percentile(x,100))
데이터의 개수: 26
표본 평균: 4.8076923076923075
표본 분산: 115.23224852071006
표본 표준편차: 10.734628476137871
최대값: 23
최소값: -24
중앙값: 5.0
최소값: -24.0
1사분위수: 0.0
2사분위수: 5.0
3사분위수: 10.0
최대값: 23.0

Leave a comment