데이터 수집은 궁극의 공익이다

KamiPhuc, flickr (CC BY)

우리는 앞으로 데이터를 읽고 분석할 수 있어야 한다

워싱턴포스트의 <Larry Summers: Data collection is the ultimate public good>를 번역한 글입니다.


지난 수요일, 나는 세계은행 컨퍼런스에서 물가 통계(price statistics)에 대해 이야기했습니다. 일반적으로 물가 통계는 사람들이 흥미로워할 주제는 아닙니다. 하지만 나는 이번 발표를 준비하면서 커다란 만족을 느꼈습니다. 그 이유 중 하나는 국가간 물가 비교가 세상을 떠난 내 아버지 로버트 서머스의 연구주제였기 때문입니다. 그리고 다른 이유는 데이터야말로 궁극의 공익이라는 사실을 확인했으며, 또 우리는 앞으로 점점 더 많은 데이터를 가지게 될 것임을 알게 되었기 때문입니다.

나는 다음 네 가지를 발견했습니다.

첫째, 과학적 진보는 점점 더 과거의 가설 설정과 검정보다 새로운 도구와 관찰결과에 의지하게 될 것입니다. 몇 가지 예를 들 수 있습니다. 목성이 위성을 가지고 있음이 관측되었을 때 이 사실은 모든 별이 지구를 중심으로 돈다는 천동설을 심각하게 위협했습니다. 현미경이 만들어지자 우리는 세포를 관찰할 수 있었습니다. 가속기는 원자의 구조를 밝혔습니다.

둘째, 수학이 경성과학의 여왕이라면 통계학은 사회과학의 여왕입니다. 아주 간단한 데이터 분석도 매우 큰 힘을 가질 수 있습니다. 운동이 건강에 좋다는 사실은 1940년대, 버스 안내양이 버스 운전수보다 사망률이 더 낮다는 사실에서 처음 드러났습니다. 흡연이 사망률을 높인다는 사실도 구체적인 이유에 앞서 데이터를 통해 먼저 알려졌습니다. 잘 알려진 이야기인 “머니 볼”은 통계가 어떻게 스포츠를 바꾸었는지 보여줍니다.

셋째, 나는 “숫자가 중요하다”는 말을 강조하고 싶으며, 또한 더 완벽한 데이터가 적절한 때에 있어야 한다고 생각합니다. 지속가능한 발전(Sustainable Development)이라는 목표를 위해서는 적절한 때에 통계수치들이 발표되어야 합니다. 현재 빈곤에 관한 통계들은 6년 뒤에야 발표됩니다. 미국이 세계 제 2차대전을 이기는 데 3년 반밖에 걸리지 않았다는 사실을 생각해보십시오.

넷째, 나는 모든 성인들은 곧 자신의 스마트폰을 가지게 될 것이라고 생각합니다. 이런 다양한 데이터 수집과 거의 무제한에 가까운 데이터 처리능력이 결합할 경우 우리는 지금까지 알려져 있지 않던 새로운 상관관계들을 발견할 수 있을 것입니다. 우리는 기근이나 태풍, 혁명을 예측할 수 있게 될 겁니다. 통신 기술은 정책결정자들에게 정책의 효과를 더 빠르게, 더 신뢰할 수 있는 방법으로 보여줄 것입니다. 또한 우리는 역사를 통해, 지금은 상상할 수 없지만 그 때에는 그것이 없이는 살아갈 수 없게 될 그런 새로운 차원을 우리가 다룰 수 있게 될 것임을 알려줍니다.

이를 이루는 것은 정부와 기업에게 모두 주어진 숙제입니다. 정부의 노력 없이는 데이터를 궁극적인 공익으로 활용하는 것이 불가능합니다. 또한 스마트폰, 드론, 위성, 슈퍼컴퓨터와 같은 새로운 기기와 방법들을 무시하고 전통적인 데이터 수집방법만을 고수해서도 안됩니다. 이 점이 매일 그 날의 가격 정보를 제공하는 MIT 의 “빌리언 프라이스 프로젝트(Billion Prices Project)”가 중요한 이유입니다. 또한 내가 스마트폰을 이용해 자기 동네의 음식 가격과 같은 일상의 정보를 수집해 분석하는 데이터회사인 프레미스(Premise)의 이사로 기쁘게 참여한 이유이기도 합니다. 그리고 환경의 변화를 측정하고 관찰하는 플래닛 랩스(Planet Labs)같은 회사가 혁신적인 이유입니다.