뷰페이지

[박형주 세상 속 수학] 오스카상의 수학

[박형주 세상 속 수학] 오스카상의 수학

입력 2016-05-17 18:14
업데이트 2016-05-17 19:03
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14
이미지 확대
박형주 국가수리과학연구소장·아주대 석좌교수
박형주 국가수리과학연구소장·아주대 석좌교수
매년 초가 되면 누가 오스카상을 받을지 설왕설래가 오가고 시상식은 축제처럼 진행된다. 시상식장을 채운 배우들의 화려함은 눈을 즐겁게 하고, 수상작의 면면을 통해 보이는 영화 산업의 흐름은 시대의 흐름을 읽는 단초가 된다. 개인의 영예를 넘어서 수상자가 더 나은 환경에서 자신의 작업을 계속하는 힘이 됨은 물론이다. 영화뿐이랴. 비범한 업적에 상을 주고 격려하는 노벨상의 계절이 되면 같은 이유로 온 세계가 발표에 귀 기울이지 않는가.

호사가들의 예측 경쟁 속에 오스카상은 시상식 당일에 깜짝 발표된다. 올해 하버드대 수학과를 졸업한 벤 자우즈머는 대학 입학 후 매년 오스카 예측을 해서 항상 75% 이상의 정확도를 보였다. 지난해엔 물이 올라서 24개 범주에서 21개를 맞히며 88%의 적중률을 기록했다. 심사위원들의 성향을 분석하는 걸까, 아니면 어떤 선정의 법칙이 있는 걸까.

그는 개인적인 견해나 ‘감’을 일절 사용하지 않고 데이터와 통계만을 사용했다. 먼저 범주별로 역대 오스카에서 영향을 끼친 요소들을 찾는다. 평론가의 평점이나 타 영화상 수상 여부 같은 건데 예상인자라고 부른다. 그러고는 이 요소들이 예전 오스카상에서 어느 정도의 무게를 발휘했는지, 즉 어떤 예상인자가 더 중요하고 덜 중요한지를 숫자로 쓴다.

적중률이 높았던 지난해에도 24개 중에서 3개는 못 맞혀 편집상과 음악상 및 장편 애니메이션 작품상에서는 2위로 예측된 후보가 수상을 했다. 그래서 빅데이터 방식의 미래 예측은 패턴과 확률 예측이지 점쟁이가 미래를 확언하는 것과는 다르다. 물론 앞으로 예상인자에 관한 데이터가 더 쌓이면 정확도는 더 올라갈 것이다.

오스카상의 분야별 후보들을 조합하면 다양한 시상식이 연출된다. 작품상에 빅버드, 감독상에 인터스텔라 같은 식으로 21개의 상마다 후보 하나를 추측하면 하나의 시상식이 되는데, 후보들을 이리저리 조합해 보면 다른 시상식 시나리오들이 생긴다. 그런데 그 경우의 수가 상상을 초월한다. 각 상별로 후보가 5개씩 있다고 하면 21개상을 수여하는 오스카에서 470조개 정도의 가능한 시나리오가 생긴다. 그러고는 시나리오별로 예상인자들이 어떻게 분포할 거라는 걸 계산해 내고, 실제로 조사한 데이터가 어떤 분포에 가장 가까운지를 수학의 최적화 이론으로 계산한다. 이렇게 계산해 낸 ‘가장 유사한 시나리오’가 밖에 나타나기는 마술 같은 예언으로 보인다.

아무리 요즘 컴퓨터가 빠르다지만 470조개를 다 고려해 실제 조사한 데이터와 가장 가까운 시나리오를 찾는다는 게 가능할까. 물론 슈퍼컴퓨터도 불가능하다. 고작 오스카상 예측에 이런 방대한 계산을 해야 하는데 선거 예측이나, 새로운 상품 개발에 참고할 만한 소비자 선호도 예측 같은 것은 어떨까. 생체 데이터를 모아서 암에 걸렸는지 판단하는 무인 의료진단 같은 건 아예 딴 세상 얘기다.

이렇게 불가능에 가까운 복잡한 계산을 해내는 것, 그게 현대 수학의 힘이다. 데이터만 쌓아 둔다고 되는 게 아니다. 최적화 이론이란 게 예전에는 미적분을 주로 사용했는데, 조합론적 최적화라는 분야가 등장했다. 가능성 없는 시나리오를 파악해 없애 버리기도 하는데, 무작위로 일부만 뽑고 고려해 시나리오를 줄이는 몬테카를로 방식이나 기계학습이 주효하다.

이런 방식이 놀랍긴 하지만, 그래도 좋아하는 후보가 선정되길 응원하는 즐거움을 포기할 수 없음은 물론이다.
2016-05-18 30면

많이 본 뉴스

  • 4.10 총선
저출생 왜 점점 심해질까?
저출생 문제가 시간이 갈수록 심화하고 있습니다. ‘인구 소멸’이라는 우려까지 나옵니다. 저출생이 심화하는 이유가 무엇이라고 생각하시나요.
자녀 양육 경제적 부담과 지원 부족
취업·고용 불안정 등 소득 불안
집값 등 과도한 주거 비용
출산·육아 등 여성의 경력단절
기타
광고삭제
위로