확률 기초 — 조건부·독립·베이즈 정리

2026-05-03•확률과 통계 마스터 노트

확률과 통계 마스터 노트 시리즈 2편. 동전·주사위·카드로 잡는 확률의 기본부터 — 배반 사건과 비배반 사건이 갈라지는 자리, 독립과 종속 곱셈 법칙의 차이, 그리고 의료 진단·스팸 필터의 핵심인 베이즈 정리까지 손으로 풀어 가는 확률 입문.

이 글은 확률과 통계 마스터 노트 시리즈의 두 번째 편입니다. 1편(기술통계)에서 평균·표준편차로 데이터를 요약하는 법을 잡았다면, 이번엔 확률의 기본기예요. 동전·주사위·카드 — 가장 익숙한 도구로 시작해서 베이즈 정리까지 한 번에 풀어 갑니다.

확률이 통계와 따로 노는 건 아니에요. 통계 결과의 신뢰성을 평가할 때 확률이 등장합니다. "이 결과가 우연일 확률이 5% 미만이다" — 이게 4편(가설 검정)의 핵심 문장인데, 그 5%를 다루는 도구가 이번 편에서 다 나옵니다.

처음 확률이 어렵게 느껴지는 이유

이유는 두 가지예요.

첫째, 공식이 너무 비슷비슷하게 생겼습니다. P(A or B) = P(A) + P(B), P(A and B) = P(A) × P(B), P(A|B) = P(A and B) / P(B) — 셋 다 닮은 모양인데 미묘하게 다른 자리에서 쓰입니다. 한 번 공식을 외워도 며칠 뒤 "이 문제는 어떤 공식이지?"가 안 떠올라요.

둘째, "독립이다" 라는 한 단어 때문에 공식이 두 갈래로 갈라집니다. 독립이면 단순 곱셈, 종속이면 조건부 확률이 들어와요. 그런데 독립인지 아닌지 판단이 모호한 문제가 자주 나옵니다.

해결법은 두 가지예요. 첫째, 모든 확률 문제는 표본공간(가능한 결과 전체)부터 그린다. 이걸 안 그리면 공식 적용이 헷갈려요. 둘째, "이 사건이 다음 사건의 확률을 바꾸는가?" 한 질문으로 독립·종속을 구분합니다. 카드를 뽑고 다시 넣으면(복원) 다음 카드 확률이 그대로 — 독립. 안 넣으면(비복원) 다음 카드 확률이 바뀜 — 종속.

확률의 정의와 범위

기본 공식은 단순합니다.

$$P(\text{사건}) = \frac{\text{원하는 결과의 수}}{\text{전체 가능한 결과의 수}}$$

분자(원하는 결과)와 분모(전체 결과)를 정확히 세는 게 모든 확률 문제의 출발점이에요. 표본공간(Sample Space) 이 분모입니다.

동전: {앞, 뒤} — 표본공간 크기 2
주사위: {1, 2, 3, 4, 5, 6} — 크기 6
카드 한 장: 52가지 — 크기 52

확률 값은 항상 0과 1 사이.

값	의미	예시
P = 0	불가능	주사위에서 9가 나옴
P = 0.5	반반	동전 앞면
P = 1	반드시 일어남	동전 앞 또는 뒤

카드에서 7이 나올 확률을 풀어 봅니다. 7인 카드가 4장(♠♥♦♣ 각 1장), 전체 52장이니까 P(7) = 4/52 = 1/13 ≈ 7.7%.

이론적 확률 vs 실험적 확률 — 대수의 법칙

확률에는 두 종류가 있어요.

이론적 확률: 수학적으로 계산. 동전 앞면 = 1/2.
실험적 확률: 실제 실험으로 측정. 동전 3번 던져 3번 다 앞 → 3/3 = 1.

당장은 둘이 어긋나지만 시행 횟수를 늘릴수록 실험적 확률이 이론적 확률에 수렴합니다. 이걸 대수의 법칙(Law of Large Numbers) 이라고 해요.

여기서 시험 함정이 하나 있어요. "동전을 5번 연속 앞이 나왔으니 다음엔 뒤가 나올 확률이 높다" 는 도박사의 오류입니다. 동전은 기억이 없어요. 다음 던지기 확률은 여전히 50%·50%. 대수의 법칙은 무한 시행 에서 평균이 수렴한다는 뜻이지, 개별 시행의 확률을 보정 한다는 뜻이 아닙니다.

덧셈 법칙 — "또는(or)"

두 사건 중 하나라도 일어날 확률을 구할 때 씁니다.

배반 사건 (Mutually Exclusive)

동시에 일어날 수 없는 두 사건. 주사위에서 2와 4는 동시에 안 나오죠.

$$P(A \text{ or } B) = P(A) + P(B)$$

주사위에서 2 또는 4 = 1/6 + 1/6 = 2/6 = 1/3.

비배반 사건 (Non-mutually Exclusive)

동시에 일어날 수 있는 두 사건. 카드에서 하트와 킹은 동시에 가능(하트 킹 한 장).

$$P(A \text{ or } B) = P(A) + P(B) - P(A \text{ and } B)$$

겹치는 부분(P(A and B))을 한 번 빼줘야 해요. 안 빼면 하트 킹을 두 번 세니까요.

카드 예시 — 하트(13/52) + 킹(4/52) - 하트킹(1/52) = 16/52 = 4/13.

여기서 시험 함정이 하나 있어요. 두 사건이 배반인지 비배반인지 판단을 안 하고 그냥 더하면 답이 어긋납니다. "이 두 사건이 동시에 일어날 수 있나?" — 이 한 질문이 덧셈 법칙의 모든 것입니다.

독립 vs 종속 — "그리고(and)"

이번엔 두 사건이 모두 일어날 확률.

독립 사건 (Independent)

한 사건이 다른 사건에 영향을 안 주는 경우. 동전을 두 번 던지는 게 가장 깔끔한 예시예요. 첫 번째 결과가 두 번째에 아무 영향 없죠.

$$P(A \text{ and } B) = P(A) \times P(B)$$

동전 두 번 모두 뒷면 = 1/2 × 1/2 = 1/4.

자유투 성공률 80%인 선수가 두 번 연속 성공 = 0.8 × 0.8 = 0.64 = 64%.

종속 사건 (Dependent)

이전 결과가 다음 결과의 확률을 바꾸는 경우. 카드를 뽑고 돌려놓지 않을 때 가 대표 예시.

첫 번째 킹 뽑기 = 4/52. 킹을 빼고 나면 51장 남고 킹은 3장. 두 번째 킹 = 3/51.

$$P(A \text{ and } B) = P(A) \times P(B|A)$$

P(B|A)는 "A가 일어난 조건에서 B의 확률"이에요. 이게 조건부 확률.

연속 두 번 킹 (비복원) = 4/52 × 3/51 = 12/2652 = 1/221 ≈ 0.45%.

독립인지 종속인지 어떻게 판단하나

상황	독립/종속
동전 던지기	독립 (매번 새로)
주사위 굴리기	독립
카드 복원 추출 (뽑고 돌려놓음)	독립
카드 비복원 추출 (안 돌려놓음)	종속
가방에서 구슬 비복원	종속

여기서 정말 중요한 시험 함정 — 독립 사건의 기준은 확률의 크기가 아니라 "사건 간 영향 여부" 입니다. 확률이 0.5든 0.99든 상관없어요. 한 사건이 다음 사건에 영향을 주는지 안 주는지가 전부입니다.

조건부 확률 — 정보가 들어왔을 때

조건부 확률 P(A|B)는 "B가 일어났다는 정보가 주어졌을 때 A가 일어날 확률"이에요.

$$P(A|B) = \frac{P(A \text{ and } B)}{P(B)}$$

가방 예시로 풀어 봅니다. 흰 구슬 2개, 빨간 구슬 1개가 있어요. 비복원으로 2개를 뽑을 때 — 첫 번째가 흰색이면, 두 번째도 흰색일 확률은?

첫 번째 흰색을 뽑은 뒤 가방엔 흰 1·빨강 1이 남으니 P(두 번째 흰 | 첫 번째 흰) = 1/2.

여기서 시험 함정이 하나 있어요. A와 B가 조건부로 독립이면 P(A|B) = P(A) 입니다. 즉 B의 정보가 들어와도 A의 확률이 안 바뀐다 — 정의상 독립이라는 뜻이죠. 동전 두 번 던지기에서 P(두 번째 앞 | 첫 번째 앞) = 1/2 = P(두 번째 앞). 정보가 무용지물이에요.

베이즈 정리 — 사전 확률을 갱신하는 도구

베이즈 정리는 새로운 증거(B)가 들어왔을 때 사전 확률(A)을 갱신하는 공식이에요. 의료 진단·스팸 필터·자율주행 — 이 도구가 안 쓰이는 데이터 분야가 거의 없습니다.

$$P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}$$

용어 정리:

용어	의미
P(A)	사전 확률(Prior) — 증거 보기 전 A의 확률
P(B\|A)	우도(Likelihood) — A가 참일 때 B가 보일 확률
P(B)	증거(Evidence) — B의 전체 확률
P(A\|B)	사후 확률(Posterior) — B를 본 뒤 갱신된 A의 확률

주사위 두 개 예시 — 손으로 풀어 보기

설정: 공정한 주사위 1개와 편향된 주사위(50% 확률로 6이 나옴) 1개가 있어요. 둘 중 하나를 무작위로 골라 굴렸더니 6이 나왔습니다. 편향된 주사위를 골랐을 확률은?

먼저 사전 확률은 단순. 두 주사위 중 하나니까 P(편향) = 1/2.

증거 P(6)을 구하려면 전체 확률의 법칙:

$$P(6) = P(6|\text{편향}) \cdot P(\text{편향}) + P(6|\text{공정}) \cdot P(\text{공정})$$

$$= \frac{1}{2} \cdot \frac{1}{2} + \frac{1}{6} \cdot \frac{1}{2} = \frac{1}{4} + \frac{1}{12} = \frac{3}{12} + \frac{1}{12} = \frac{4}{12} = \frac{1}{3}$$

이제 베이즈 정리:

$$P(\text{편향}|6) = \frac{P(6|\text{편향}) \cdot P(\text{편향})}{P(6)} = \frac{(1/2)(1/2)}{1/3} = \frac{1/4}{1/3} = \frac{3}{4} = 75%$$

해석: 6을 봤다는 정보 하나로 편향 확률이 50% → 75%로 뛰었어요. 6이 나오기 쉬운 주사위였다는 증거니까요.

여기서 정말 중요한 시험 함정 — 베이즈 정리에서 가장 자주 틀리는 자리는 P(B), 즉 증거의 전체 확률을 구하는 단계입니다. 위 예시에서 P(6) = 1/2 라고 잘못 쓰는 학생이 정말 많아요. 6이 나올 확률은 어느 주사위를 골랐냐에 따라 다르니, 두 경우를 다 더해야 합니다(전체 확률의 법칙). 이 단계만 정확히 하면 베이즈는 절반 풀린 셈이에요.

수형도(Tree Diagram)로 검증하기

베이즈 계산이 맞는지 직관으로 확인하려면 수형도를 그리면 좋아요.

주사위 종류(편향·공정)를 첫 단계 가지로
각 주사위에서 6이 나오는지 안 나오는지 두 번째 가지로
가지 수를 통일하기 위해 공배수 사용 — 60개 가지로 만든다
- 편향 30개 가지 중 15개가 "편향 + 6"
- 공정 30개 가지 중 5개가 "공정 + 6"
- 6이 나온 가지 = 15 + 5 = 20
6이 나온 20개 중 편향이 15개 → 15/20 = 3/4 = 75% ✓

베이즈 답이 검증됐습니다.

전체 확률의 법칙 — 베이즈의 동반자

베이즈 정리의 분모를 구할 때 항상 따라오는 도구.

$$P(B) = \sum_i P(B|A_i) \cdot P(A_i)$$

말로 풀면 B가 일어나는 모든 경로를 다 더한다예요. 위 주사위 예시에서 6이 나오는 경로가 두 개(편향 → 6, 공정 → 6)였고, 각 경로의 확률을 더해 P(6)을 구했죠.

3개 이상 경우(예: 주사위 3종류)일 때도 똑같이 모든 경로를 합산하면 됩니다.

여사건 — 가끔 더 빠른 길

A가 안 일어날 확률 P(Aᶜ) = 1 - P(A).

카드에서 7이 아닌 카드 = 1 - 1/13 = 12/13 ≈ 92%.

여기서 시험 함정이 하나 있어요. "적어도 하나(at least one)" 류 문제는 여사건이 거의 항상 빠릅니다. "동전 5번 던져 적어도 한 번 앞" = 1 - P(5번 모두 뒤) = 1 - (1/2)⁵ = 31/32 ≈ 97%. 정공법으로 풀면 5가지 경우(앞 1번·2번·…·5번)를 다 합쳐야 하는데, 여사건은 한 번에 끝.

시험 직전 한 번 더 — 자주 헷갈리는 함정 모음

여기까지가 2편의 핵심입니다. 시험 직전 또는 실무에서 헷갈릴 때 다시 펼쳐 볼 수 있게 압축 노트로 마무리할게요.

모든 확률 문제는 표본공간(분모)부터 정확히 세는 게 시작
확률 범위 — 0 ≤ P ≤ 1, 0=불가능, 1=확실
이론적 확률 vs 실험적 확률 — 시행 늘리면 수렴(대수의 법칙)
도박사의 오류 — 동전 5번 앞 → 다음은 뒤? 거짓. 동전은 기억 없음
덧셈 법칙 — "or" — 배반이면 P(A)+P(B), 비배반이면 -P(A and B) 추가
곱셈 법칙 — "and" — 독립이면 P(A)×P(B), 종속이면 P(A)×P(B|A)
독립의 기준 — 확률 크기 아니라 "다음 사건에 영향 주는가"
카드 복원 = 독립 / 카드 비복원 = 종속
조건부 확률 P(A|B) = P(A and B) / P(B)
조건부 독립 → P(A|B) = P(A) (B 정보가 무용지물)
베이즈 정리 P(A|B) = P(B|A)·P(A) / P(B)
베이즈 용어 — Prior(P(A)), Likelihood(P(B|A)), Evidence(P(B)), Posterior(P(A|B))
베이즈에서 가장 자주 틀리는 단계는 P(B) — 전체 확률의 법칙으로 모든 경로 합산
전체 확률의 법칙 — B가 일어나는 모든 경로 P(B|Aᵢ)·P(Aᵢ) 합
여사건 — "적어도 하나" 류는 1 - P(전혀 없음)가 거의 항상 빠름
수형도 — 베이즈 계산 검증할 때 직관적
카드 한 장 — 4 종류 무늬 × 13 숫자 = 52장
두 번 연속 킹(비복원) = 4/52 × 3/51 = 1/221
자유투 80% 두 번 연속 = 0.64 (독립 곱셈)
베이즈 응용 — 의료 진단 (양성 결과 후 실제 환자일 확률), 스팸 필터, 자율주행

시리즈 다른 편

같은 시리즈의 다른 글들도 같은 톤으로 묶어 정리되어 있어요. 이번 편에서 잡은 확률·베이즈 감각이 다음 편 확률 분포에서 그대로 위에 올라갑니다.

공식 문서: Khan Academy 확률 강좌에서 더 많은 베이즈·조건부 확률 연습 문제를 볼 수 있어요.

다음 글(3편)에서는 확률 변수와 확률 분포 — 이항·정규·포아송·기하·베르누이를 풀어 갑니다. 2편의 곱셈 법칙이 이항 분포로, 조건부 확률이 결합 분포로 자연스럽게 확장돼요.

※ 이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.