확률분포(Probability distribution)
확률 변수가 특정한 값을 가질 확률을 나타내는 함수를 의미한다. 확률 분포는 확률 변수가 어떤 종류의 값을 가지는가에 따라서 크게 이산확률분포와 연속확률분포 중 하나에 속하며, 둘 중 어디에도 속하지 않는 경우도 존재한다.
*이산형 변수와 연속형 변수에 대해 궁금하다면?
데이터의 유형
범주형(Categorical) 그룹이나 범주를 나타냄. 예/아니오로 대답할 수 있음 명목형(Nominal) : 순서가 없는 범주형 데이터 (ex. 성별, 종교, 색상 등) 순서형(Ordinal) : 순서가 있는 범주형 데이터 (ex. 사계
rnarnie.tistory.com
1) 이산확률분포(Discrete probability distribution)
이산확률 변수가 가지는 확률 분포를 의미한다. 변수의 값이 이산형일 때 이에 속한다. 즉, 아래와 같이 표현할 수 있다.
이산확률 분포는 확률 질량 함수를 통해 표현 가능하며 누적 분포 함수로 표현할 경우 그 함수는 불연속으로만 증가한다. 이산확률분포의 예는 다음과 같다.
- 이산균등분포
- 이항 분포
- 음의 이항 분포
- 다항 분포
- 포아송 분포
- 베르누이 분포
- 기하 분포
- 초기하 분포
2) 연속확률분포 (Continuous probabilty distribution)
연속확률분포는 확률밀도함수를 이용해 분포를 표현할 수 있는 경우를 의미한다. 연속형 변수의 값을 가질 때 이에 속한다. 아래식과 같이 범위로 표현 가능하다.
연속확률분포의 예는 다음과 같다.
- 정규분포
- 연속균등분포
- Student t-분포
- 카이제곱 분포
- 감마 분포
참고
통계 101 X 데이터 분석, 아베마사토, 2022
유데미, https://www.udemy.com/course/statistics-for-data-science-and-business-analysis/