LOGO

돋보기

<목요일 오후> 통계의 오류 (2021-09-17 08:58)

우리는 지금 각종 언론매체, 인터넷, SNS 등에서 쏟아내는 엄청난 정보의 홍수 속에 살아가고 있습니다. 결국, 정보를 다루는 기술 자체가 엄청난 경쟁력이 되고 있죠. 정보를 다루는 기술에 가장 유용하게 사용되는 것이 바로 통계입니다. 정보를 수량화해 체계적으로 제시하는 통계는 자료의 효과적인 수집과 분석에 도움이 되는 수단인 동시에 현재 나타나는 상황을 과거나 다른 사람, 산업, 국가 등과 비교할 수 있는 척도로써 활용됩니다.

특히, 중요한 의사 결정과 관련된 논란이 발생할 때 사람들은 자신들의 주장을 정당화하기 위한 객관적인 근거로써 통계 자료를 활용하는 경우가 많죠. 통계는 수많은 데이터를 처리하고 분석해 사회 현상에 관한 객관적인 정보를 제공할 수 있기 때문에 대중들에게 객관화된 설명을 제공할 수 있습니다.

하지만 통계가 사회 현상 전체에 대한 정보를 모두 전달할 수 없습니다. 통계란 결국 일부 표본 대상자를 추출하고, 이들이 관찰에 응하거나 설문에 대답한 정보만을 활용합니다. 따라서 통계 조사의 표본 대상자를 잘못 선정할 경우, 잘못된 결과를 보여줄 수 있습니다. 제대로 된 표본 대상자를 선정했더라도 통계 해석에 문제가 발생할 수도 있습니다. 사회 현상은 자연 현상과 달리 인과 관계가 명확하지 않습니다. 그렇기 때문에 섣불리 인과 관계를 단정 짓지 않아야 합니다. 그런데 실제로는 통계를 해석하는 사람이 자신의 주관을 개입시켜 인과 관계가 명확하지 않음에도 다른 결과로 해석하거나, 인과 관계를 반대로 해석해 버리는 경우가 종종 발생합니다.

예를 들어 어느 시골 마을에 열 명의 농부가 있는데 한 명이 소 40마리를 가지고 있고 아홉 명은 한 마리도 없습니다. 하지만 이를 통계로 내면 이 마을 농부 열 명이 소유한 소의 평균은 네 마리입니다. 이게 맞는 걸까요? 덧셈, 뺄셈만 할 줄 아는 아이들에게 물어봐도 잘못됐다고 얘기할 것입니다. 그런데 이런 계산법을 이용한 통계가 우리 사회에서 흔히 사용됩니다. 대표적인 것이 바로 대기업 노조와 사측의 임금 협상입니다. 회사는 임원의 연봉까지 포함된 평균값을 임금 평균으로 주장하는 반면, 노조는 가장 많은 수의 직원들이 받는 연봉을 평균 임금이라고 맞섭니다. 많은 사람들이 ‘평균’이라면 산술평균(몇 가지 항목의 수치를 합계한 값을 그 항목 수로 나눈 것)을 떠올리지만, 통계학에서 대표값을 정하는 방식은 다양합니다. 산술평균, 기하평균, 중앙값, 최빈값 등에 따라 평균은 주장하는 측의 의도에 따라 각기 다른 의미를 지니게 되는 것이죠.

최근 국내 모 언론에서는 ‘백신 맞고 466명이 사망했는데 코로나19로 죽는 사람보다 더 많다’라는 기사가 나오기도 했습니다. 지난 8월까지 백신 접종이 사망의 원인으로 밝혀진 사례는 2건입니다. 판정 보류 상황인 8건을 더해도, 백신 접종 사망 신고 는 10건입니다. 물론 백신 접종이 증가할수록 이 수치도 늘어나겠죠. 그렇다고 백신 접종 후 사망 신고 사례 466건을 백신 접종 사망으로 발표하는 것은 문제입니다. 백신 접종 후 사망은 말 그대로 선후 관계입니다. 시간상 연속적으로 일어난 일이라는 뜻으로 아직 백신 접종과 사망 사이의 인과 관계가 정확하게 밝혀지지 않았습니다.

최근 언론들이 앞다퉈 보도하고 있는 백신 부작용 의심 신고 사례 건수와 실제로 백신 연관성 이상 반응 건수는 완전히 다릅니다. 질병관리청 코로나19 예방 접종 대응추진단은 ‘코로나19 예방 접종’ 사이트에 예방 접종 현황과 이상 반응 의심 사례 신고 현황을 매일 공개하고 있습니다. 그런데 언론들이 이를 이상 반응 건수로 보도해버리는 것은 명확히 통계적 오류를 범하는 행위이며, 통계 자료에 의도와 주관을 개입시켜 판단하는 것입니다.

1853년 미국에 백신 접종법이 발의됐을 때 백신 거부 운동이 발생했습니다. 당시 백신 거부자들은 “백신 접종이 인체의 중요한 저항력을 낮추고 다른 형태의 질병에 걸리기 쉽게 만들거나, 다른 질병을 도입할 수 있다”며 강력하게 저항했습니다. 당시 이들은 체리피킹(cherry picking)이라고 하는 일종의 편향인, 자신의 견해를 뒷받침하는 것으로 보이는 데이터만을 선택했습니다. 예를 들어 상관관계와 인과 관계 사이의 혼동이라는 방식을 통해 특정 도시에서 홍역으로 인한 사망률이 증가한 것을 백신 접종 탓으로 돌리는 등의 방법을 상용한 것입니다.

여기에는 정치적인 요소도 한몫했습니다. 그런데 이처럼 통계 정보를 잘못 전달하는 동일한 수단들을 현대의 언론들이 그대로 사용하고 있습니다.

통계가 정치, 경제, 문화 등 우리 사회가 발전에 크게 이바지한 것은 사실입니다. 그렇지만 통계를 절대적으로 신뢰해서는 안됩니다. 항상 근본적인 한계를 고려해야 합니다. 통계 속 숫자의 왜곡은 개인에게 치명적인 문제를 일으킬 수 있습니다. 무엇보다 통계 자료에 의도와 주관을 개입시켜 그것이 개인의 혹은 자신이 속한 조직의 이익을 추구하는 것이 아닌지 거짓과 진실을 가려낼 수 있는 안목을 키우기 위한 노력도 필요합니다.   


 
최민호 기자fmnews@fmnews.co.kr

※ 저작권자 ⓒ 한국마케팅신문. 무단 전재-재배포 금지

목록으로

포토뉴스 더보기

해외뉴스 더보기

식약신문

사설/칼럼 더보기

다이렉트셀링

만평 더보기

업계동정 더보기

세모다 스튜디오

세모다 스튜디오 이곳을 클릭하면 더 많은 영상을 감상하실 수 있습니다.

오늘의 날씨

booked.net
+27
°
C
+27°
+22°
서울특별시
목요일, 10
7일 예보 보기