상세 컨텐츠

본문 제목

데이터는 거짓말하지 않는다? 통계가 당신을 속이는 교묘한 방법

이야기로 보는 [수학]

by @Point_B 2026. 4. 14. 08:08

본문

안녕하세요! 혹시 "숫자는 거짓말을 하지 않는다"라는 말을 믿으시나요? 오늘 그 믿음을 완전히 깨버릴 기막힌 수학 이야기를 가져왔습니다.

모든 지표에서 앞섰는데 결과는 패배로 나오는, 말도 안 되는 상황. 데이터 분석가들을 밤잠 설치게 만드는 '심슨의 역설(Simpson's Paradox)'이 오늘의 이야기입니다.


😱 상황 발생: "A 병원이 실력이 더 좋은데, 왜 사망률이 높죠?"

여기 수술 실력으로 소문난 A 병원과 평범한 B 병원이 있습니다. 사람들은 당연히 실력이 좋은 A 병원을 찾아갑니다. 그런데 연말 결산을 해보니 충격적인 결과가 나왔습니다.

  • A 병원 전체 생존율: 70%
  • B 병원 전체 생존율: 85% (B 승!)

"아니, A 병원 실력이 거품이었나?"라고 생각하시겠죠? 하지만 데이터를 뜯어보면 소름 돋는 반전이 숨어 있습니다.


🔍 데이터를 쪼개보니 드러난 '진실'

환자의 상태를 '위급'과 '경증'으로 나누어 다시 계산해 볼까요?

  1. 위급 환자 수술 시:
    • A 병원: 50% (100명 중 50명 살림) 👈 A 승!
    • B 병원: 30% (10명 중 3명 살림)
  2. 경증 환자 수술 시:
    • A 병원: 95% (20명 중 19명 살림) 👈 A 승!
    • B 병원: 90% (100명 중 90명 살림)

보이시나요? 어려운 수술도 A가 잘하고, 쉬운 수술도 A가 더 잘합니다. 그런데 왜 전체 생존율은 B가 높을까요?


💡 범인은 바로 '가중치'라는 녀석입니다

이유는 간단합니다. 실력이 좋은 A 병원은 죽을 확률이 높은 '위급 환자'를 훨씬 많이(100명) 받았기 때문입니다. 반면 B 병원은 대부분 살기 쉬운 '경증 환자' 위주로 수술했죠.

각각의 리그에서는 A가 압승했지만, 전체를 합치면 '난이도'라는 변수가 섞이면서 마치 B가 더 잘하는 것처럼 착시 현상이 일어나는 것. 이것이 바로 심슨의 역설입니다.


🏃‍♂️ 실생활 소름 돋는 예시: "연봉의 마법"

이 현상은 우리 연봉 협상이나 마케팅 데이터에서도 일어납니다.

  • 회사 상황: 대리급 연봉도 오르고, 과장급 연봉도 올랐는데!
  • 통계의 함정: 회사가 연봉이 낮은 신입 사원을 대거 채용하면, 회사 전체의 평균 연봉은 작년보다 낮아지는 기현상이 발생합니다. 사장님은 "우리 회사 평균 연봉 낮아졌으니 허리띠 졸라매자"라고 말할 수 있는 명분이 생기는 거죠.

✅ 결론: 숫자를 '통째로' 믿지 마세요!

심슨의 역설이 우리에게 주는 교훈은 강렬합니다. "데이터를 합치기 전에, 무엇이 섞여 있는지부터 확인하라!"

앞으로 누군가 "전체 평균이 이렇다"라며 당신을 설득하려 한다면, 당당하게 물어보세요.

"혹시 그 안에 '심슨의 역설'이 숨어 있진 않나요?"

 

이전 글

전 세계 언어의 소름 돋는 공통점

 

전 세계 언어의 소름 돋는 공통점

우리가 매일 내뱉는 수만 개의 단어들. 아무 생각 없이 자유롭게 말하는 것 같지만, 사실 우리 입 밖으로 나오는 모든 단어는 '거대한 수학적 감옥'에 갇혀 있다는 사실, 알고 계셨나요?해리포터

tjdgud246.tistory.com

 

관련글 더보기

🎮 Gravity 게임하기 🎮 2048 게임하기 💬 Comming Soon...