도박사의 오류 — 왜 우리는 "다음엔 나올 차례"라고 착각하는가
빨강이 5번 연속 나왔으니 이번엔 검정 차례라고 느끼는 직관, 사실은 통계학에서 가장 유명한 오류입니다. 1913년 몬테카를로 카지노 사건부터 로또 번호 선택까지, 도박사의 오류의 정체와 인지심리학적 배경을 설명합니다.
1913년 8월 18일, 모나코 몬테카를로 카지노의 룰렛 테이블에서 사건이 벌어졌다. 룰렛 공이 검정에 26번 연속으로 떨어진 것이다. 처음 몇 번 검정이 나왔을 때만 해도 사람들은 흥미롭게 지켜봤지만, 횟수가 늘어날수록 도박사들은 "이제는 빨강이 나올 차례"라며 빨강에 거액을 베팅하기 시작했다. 그러나 검정은 계속해서 나왔다. 그날 밤 카지노는 수백만 프랑의 수익을 챙겼고, 이 사건은 통계학 교과서에 도박사의 오류(Gambler's Fallacy)의 대표 사례로 남았다.
오류의 정체
도박사의 오류는 다음 두 명제를 무의식적으로 동일시할 때 발생한다.
- 장기적으로 빨강과 검정이 나오는 비율은 거의 같다. (참)
- 따라서 검정이 많이 나왔다면, 가까운 시일 내에 빨강이 더 자주 나와서 균형을 맞출 것이다. (거짓)
2번 명제가 거짓인 이유는 단순하다. 룰렛의 각 회전은 독립 시행이기 때문이다. 룰렛 공은 메모리가 없다. 직전에 검정이 26번 나왔든, 빨강이 100번 나왔든, 다음 회전에서 빨강이 나올 확률은 그대로 약 18/37(유럽식 룰렛 기준)이다.
왜 우리는 이렇게 착각할까
인지심리학자 카너먼과 트버스키는 이 현상을 대표성 휴리스틱(Representativeness Heuristic)으로 설명했다. 사람의 직관은 짧은 표본조차 "모집단의 평균을 대표"하기를 기대한다는 것이다. 동전을 6번 던졌을 때 HHHHHH보다 HTHTHT가 더 "랜덤해 보이는" 이유다. 실제로는 두 시퀀스의 발생 확률은 정확히 같다. 둘 다 (1/2)⁶ = 1/64다.
인간의 뇌는 무작위성에서 패턴을 찾는 데 익숙하다. 진화적으로 보면 이 능력은 매우 유용했다. 풀숲의 사각거림이 바람인지 포식자인지 빠르게 판단해야 했기 때문이다. 그러나 이 패턴 인식 본능이 진정한 무작위 사건 앞에서는 오히려 오류로 작동한다. 무작위에는 패턴이 없는데, 우리는 자꾸 패턴을 만들어낸다.
로또에서의 도박사의 오류
로또에서 이 오류는 두 가지 형태로 나타난다.
- 콜드넘버 신앙: "30번이 50회 동안 한 번도 안 나왔으니, 이제 나올 때가 됐어." → 30번이 다음 주에 나올 확률은 여전히 정확히 7/45다.
- 핫넘버 신앙: "7번이 최근에 자주 나왔으니, 이번 주에도 나올 거야." → 7번이 다음 주에 나올 확률 역시 정확히 7/45다.
두 사고방식은 정반대지만, 둘 다 "과거가 미래를 예측한다"는 같은 잘못된 가정에 기반한다. 자세한 빈도 분석의 한계는 핫넘버·콜드넘버 분석은 의미가 있을까 글에서 다룬다.
독립 시행 vs 종속 시행
모든 확률 사건이 독립 시행은 아니다. 카드 게임에서 한 장을 뽑은 뒤 다시 섞지 않고 두 번째 카드를 뽑는다면, 두 번째 사건은 첫 번째 결과에 영향을 받는다. 이런 경우 "아직 안 나온 카드가 나올 확률이 높아진다"는 직관은 정확히 맞는다. 실제로 카드 카운팅이 작동하는 이유다.
그러나 룰렛, 동전, 주사위, 로또 추첨처럼 매번 조건이 리셋되는 사건에서는 그 직관이 통하지 않는다. 차이를 구분하는 핵심 질문은 단 하나다. "이 시행은 직전 결과를 기억하는가?"
인생에서 만나는 도박사의 오류
이 오류는 카지노 안에서만 나타나는 게 아니다. 일상에서도 우리는 자주 같은 함정에 빠진다.
- "이번 면접은 떨어졌으니까 다음 면접은 붙겠지" → 면접 회사들은 서로 독립적이고, 합격 확률은 직전 결과에 영향받지 않는다.
- "아들만 셋이니 다음은 딸이겠지" → 정자의 성염색체 분포는 매번 50/50에 가깝게 새롭게 결정된다.
- "올해 비행기 사고가 많았으니 내년엔 적을 거야" → 사고는 무작위로 발생하며 "빚"이 쌓이지 않는다.
이 오류를 피하는 단 하나의 질문
"다음 결과가 직전 결과에 의해 영향을 받는가?" 이 질문에 "아니오"라면, 과거 통계가 아무리 인상적이어도 그것은 미래를 알려주지 않는다. 로또에서 이 답은 명확하다. 매주의 추첨은 완전히 독립적이다. 그러므로 어떤 번호 조합을 선택하든, 1등 확률은 정확히 1/8,145,060이다. 이 숫자의 의미가 궁금하다면 여기를 참고하자.
도박사의 오류를 인식하는 것만으로도 우리는 이미 한 단계 더 합리적인 의사결정자가 된다. 무작위는 패턴이 없을 수 있다는 사실을 받아들이는 것이 오히려 가장 어려운 통계 학습이다.
참고 자료 · 데이터 출처
- 동행복권 공식 사이트 — dhlottery.co.kr · 1회차(2002년 12월)부터 최신 회차까지의 당첨 번호, 당첨금, 판매액 데이터 출처
- 조합론 (Combinatorics) — 당첨 확률 계산에 사용되는 수식(
C(n, k) = n! / (k!(n−k)!))의 수학적 근거 - 기획재정부 복권위원회 — 당첨금 세금 구조(3억 원 기준, 기타소득 22% / 33%)의 법적 근거
- 한국도박문제예방치유원 — 상담 전화 1336 (24시간, 무료)
본 글은 당픽 편집팀이 직접 작성한 원본 콘텐츠이며, 인용 시 출처(dangpick.com)를 표기해주세요. 통계 해석에 오류가 있거나 최신 법령/제도 변경이 반영되지 않은 경우 contact@dangpick.com으로 알려주시면 검토 후 반영합니다.