본문 바로가기
정보

인간이 완전히 랜덤한 선택을 하는 것은 가능한가?를 설문 결과로부터 철저히 검증

by WORLDWW 2020. 12. 14.

일체의 규칙성을 배제하고 완전히 랜덤 상태를 만들어내는 것은 매우 어려우며, 트럼프나 루빅 큐브에서는 수학자가 진지하게 임하고 있는 과제이기도 합니다.브리스톨 대학에서 데이터 과학과 계산 통계학을 전문으로 공부하는 박사 과정의 다니엘·윌리엄스씨가, 인터넷상에서 실시한 설문 조사로부터 「인간이 완전하게 랜덤의 선택을 실시하는 것은 가능한가」라고 하는 주제에 대해 검증을 실시하였습니다.

 

How Random are you? | Danny James Williams
https://dannyjameswilliams.co.uk/post/randomchoices/

윌리엄스는 간단한 4개의 문항으로 구성된 설문지를 게시판 사이트 레드dit에 올리고 답변을 집계하는 조사를 실시했습니다. 덧붙여 최종적으로 회답한 참가자는 2190명이었습니다.


아래가 실제로 Reddit에 게시된 Google 폼입니다.출제된 네문제 중에서 첫번째와 네번째는 1에서 10까지의 숫자를 무작위로 고르십시오라고 되어있는데, 첫번째는 1에서 10까지를 선택해서 응답하는 형식으로 되어있고, 네번째는 직접 고른숫자를 입력해서 응답하는 형식으로 되어있습니다. 또 2문제는 1에서 50까지의 숫자를 랜덤으로 골라서 직접 입력하고 응답하는 문제, 3문제는 A에서 Z까지 26종류의 알파벳에서 랜덤으로 1개를 골라서 입력하는 문제가 있습니다.

윌리엄스는 조사 전 예상에서 "첫 번째 문제처럼 나열된 숫자 중에서 고를 때 사람들이 좀 더 중심에 위치한 숫자를 고를 가능성이 높다"고 했었습니다.그러나 1번과 4번 문항의 결과를 비교하면 각 숫자가 선정되는 빈도는 거의 비슷했다는 것.


첫 번째와 네 번째 문제

아래가 1문제(왼쪽)와 4문제(오른쪽)의 결과를 정리한 그래프로, 가로축이 선택한 수, 세로축이 선택한 수입니다.1개의 숫자가 선택될 확률은 10%이므로 이론상으로는 1개의 숫자당 219명(태점선)이 선택하게 됩니다.이 219명이라는 이론치에 대한 실제 인원수의 차이는 1문제든 4문제든 평균 약 2.1%였다는 것을 알 수 있었습니다.

1번에서든 4번에서든 가장 선택되는 빈도가 높았던 숫자는 '4'였어요.올해 8500명을 대상으로 실시한 같은 조사에서는 가장 선정 빈도가 높았던 숫자가 7로 나타나 이번 윌리엄스 씨의 조사 결과는 2019년과 엇갈렸습니다.윌리엄스씨는 "이 조사의 코멘트에는 2019년의 조사를 지적하는 것도 있어 의도적으로 7을 선택하지 않은 사람이 있을 수 있습니다"라고 말합니다.

또, 선택지의 양끝에 오는 「1」과 「10」은 중앙 부근의 숫자보다 선택되는 빈도가 적었다는 것. 윌리엄스는, 「사람은 선택을 강요당했을 때, 선택사항의 양끝에 있는 것은 피해 버리기 십상」이라고 하는 「에지 효과」를 말했습니다.

덧붙여 선택지가 쭉 옆으로 배열된 1문제보다, 직접 숫자를 입력하는 4문제가, 「10」이 선택되는 빈도는 적었다고 합니다.윌리엄스씨는 10이 2자리 숫자이기 때문에 다른 숫자보다 입력에 여분의 노력이 필요하기 때문에 직접 숫자를 입력하는 네 번째 문제에서 10이 선택되는 빈도가 낮아진 것이 아닌가 추측하고 있습니다.

또한 윌리엄스 씨가 첫째와 넷째 문제의 결과로 카이제곱 검정을 실시했더니 P값은 0.0001을 밑돌았습니다.이는 즉 '1문제나 4문제 모두 대답이 고루 분포되어 있지 않다'는 것이 높은 확실성을 가지고 나타났음을 의미합니다.

물어 윌리엄스씨는, 「1」 「5」 「10」이라고 하는 숫자는 「너무 딱 끊어진다」라고 보여 피해 버렸기 때문에 선택된 빈도가 낮을 가능성이 있다고 지적."이번 조사에서는 사람의 완전한 랜덤성을 나타낼 수 없었다"고 논하고 있습니다.


한편, 결과 모두가 이론대로 되지 않았는가 하면, 그렇지는 않습니다.예를 들어, 응답자 전체의 10.1%가 두 문제 모두에서 같은 수를 선택했다는 것을 알 수 있습니다.이론상으로는 두 문제 모두에서 같은 수가 선택될 확률은 10%가 되기 때문에 이 결과는 상당히 이론치에 가까운 숫자입니다.

1문제에서 대답한 숫자를 A, 2문제에서 답한 숫자를 B라고 했을 때, 'A-B'로 표현되는 응답의 차이의 분포를 취한 것이 이하의 그림이다.가로축이 A-B 값을, 세로축이 선택한 사람의 수를 나타냅니다.이 그래프는 이론적으로 예상되는 삼각분포에 가깝기 때문에 '숫자를 두 번 고른다'는 부분에 인간의 랜덤성을 엿볼 수 있다고 윌리엄스씨는 말합니다.

세 번째 문제

세 번째 문제의 결과는 다음과 같다.가로축이 선택한 문자로 세로축이 선택한 인원입니다.이론적으로는 한 글자에 대해 약 84명(태점선)이 선택해야 하는데 그래프를 보면 글자에 따라 선택한 인원에 차이가 있음을 알 수 있습니다.

26개의 알파벳 중에서 무작위로 뽑는 세 번째 문제는 다른 문제와 달리 숫자가 아닌 문자를 고르는 시스템입니다.1번과 4번 문제의 결과로 나타난 「엣지 효과」가 확실하다면 A와 Z의 빈도는 다른 문자보다 적어질 것입니다만, 전혀 그렇지 않고, 3번 문제의 결과에는 엣지 효과가 인정되지 않는 것처럼 보입니다.

다음은 영어 중 그 알파벳이 등장하는 빈도(가로축)와 실제 조사에서 알파벳이 선택된 빈도(세로축)를 정리한 그래프이다.가장 영어에 등장하는 빈도가 높은 「E」는, 앙케이트에서는 그다지 인기가 없었습니다.한편, 「J」 「K」 「F」 「G」 「H」라고 하는 문자는 영어에서의 등장 빈도는 그렇게까지 높지 않지만, 앙케이트에서는 인기가 높은 것을 알 수 있습니다.

윌리엄스는 이 인기에는 키보드 배열이 큰 영향을 미쳤다고 논합니다.실제로 키보드의 QWERTY 배열 상에 설문 조사에서 선택된 빈도를 나타낸 히트맵이 이하.분명히 중앙 키 입력이 다른 키보다 높은 것을 알 수 있습니다.즉, 키보드 입력 상에서는 에지 효과가 명확하게 나타나고 있는 것입니다.

또 Q, A, Z라는 부분도 인기가 많은 이유는 사람은 PC로 조작할 때 오른손으로 마우스를 잡고 왼손은 키보드 왼쪽에 놓기 때문이라고 윌리엄스 씨는 설명합니다.윌리엄스씨는 「대부분의 사람은 이미 손을 놓고 있는 장소를 누르기만 하면 됩니다.우리가 무작위로 선택할 수 없는 게 아니라 그냥 게으르기만 하는 건 아닐까요?라고 댓글을 달았다.


두 번째 문제

자, 그럼 '1부터 50까지를 랜덤으로 선택한다'라는 두 번째 문제의 결과가 어떻게 되었는가 하는 것이 아래 그래프.가로축이 선택한 숫자로 세로축은 선택한 인원수를 나타내고 있습니다.2문제는 다른 문제보다 선택지가 크게 넓기 때문에 에지 효과가 나타나기 어려운 것이 아닐까 하고 윌리엄스씨는 추측했습니다.

이론상으로는 1개의 숫자에 대해 2190÷50= 약 44명(점선)이 선택하게 됩니다만, 실제로는 꽤 빈도에 차이가 있는 것을 알 수 있습니다.덧붙여 가장 선택되는 빈도가 낮았던 것은, 전체의 0.5%밖에 선택되지 않았던 「30」으로, 가장 선택되는 빈도가 높았던 것은 「37」로, 선택한 사람은 전체의 5.8%였습니다.

「1」에서 「50」 가운데, 「10」 「20」 「30」 「40」 「50」을 선택한 사람을 합치면, 이론상으로는 전체의 10%가 되어야 했지만, 실제로는 4.3%였습니다.또, 「7」 「17」 「27」 「37」 「47」을 선택한 사람은, 전체의 18.7%였습니다.윌리엄스씨는, 아마 10의 배수가 너무 고르지 않다고 생각해 피한 사람이 많은 것은 아닐까 예상.그런데 어떤 이유로든 '7'을 포함한 숫자를 고르는 것은 굉장히 흥미로운 결과라고 했어요.에지 효과는 없기는 하지만, 「균형이 좋은 숫자를 피하기 쉽상」이라고 하는 것은 1문제·4문제에서도 볼 수 있던 경향입니다.


정리

윌리엄스는 "예상했던 대로 난수발생기로서 보면 인간은 정확도가 낮아 무작위로 아이템을 선택하는 것은 상당히 어려운 것으로 나타났다"고 말합니다.또 이번 설문에서는 문자나 숫자 등 규칙성 있는 선택지가 이용됐는데 윌리엄스씨는 코, 캘린더, 사람, 개, 정치 등 전혀 관련성이 없는 선택지를 선택한 경우에 랜덤하게 선택될까요? 아니오, 아마 선택지가 표시되는 순서에 따라서 랜덤성은 없어질 것이라고 생각합니다.복수의 아이템을 일반적으로 해도, 처음과 마지막에 늘어선 선택사항이 선택되는 빈도는 다른 선택사항보다 훨씬 적을 것입니다」라고 예상하고 있습니다.

댓글