'데이터"란 무엇인가? 책의 저자들은 "거의 모든 분야에서 우리를 둘러싸고 있는 데이터 중심의 알고리즘에 기반한 의사결정 시스템의 축약어"라고 정의한다. 저자들은 어떻게 데이터가 창조되고 활용되었는지와 더불어 그런 데이터를 활용해 사람들의 삶, 아이디어, 사회, 군대 운영 및 경제에 이바지하기 위해 어떻게 새로운 수학 및 계산 기법들이 경쟁적으로 개발되었는지를 탐구한다. 그리고 데이터 핵심에는 기술과 수학이 있지만 그 뒷면에는 궁극적으로 데이터의 생성과 분류/분석, 해석과 판단 그리고 활용을 둘러싼 국가, 기업 및 시민사회간의 불안정한 권력 게임에 관한 이야기이다.
책의 1부에서는 국정운영을 위한 데이터를 시작으로, 사회개선을 위한 데이터 사용을 거쳐 수리통계학이라는 새로운 학문 분야의 탄생과 함께 데이터가 수학의 세례를 받게 되는 과정을 살펴본다. 2부에서는 제2차 세계대전 때 암호해독을 위해 데이터를 군사적으로 적용한 데에서 시작된 디지털 연산의 탄생 과정에서 부터 영국 블레츨리 파크와 미국의 벨 연구소, 그리고 제2차 세계대전 이후로 기업과 기술 분야에 데이터를 적용한 사례들을 추적한다. 디지털화된 개인정보 기록이 프라이버시, 특히 1970년대에 지배적인 국가권력으로부터 개인을 보호하기 위한 수단으로서 프라이버시를 둘러싼 이해관계들, 그리고 인공지능 분야가 탄생하고 사그라들었다가 빅데이터의 출현과 함께 기계학습이라는 형태로 다시 부활하게된 과정 등을 살펴본다. 3부에서는 데이터의 역사를 바탕으로 우리의 현재 및 미래와 연결하여 어떻게 데이터와 권력이 국가의 관심사에서 기업의 관심사로 옮겨갔는지를 논의한다. 그리고 소수의 거대 기업이 데이터를 독점하면서 발생하는 다양한 문제들에 대한 윤리적 이슈들에 대해서 살펴본다.
** 책을 통해 얻게 된 Insight :
"데이터는 발견되는 것이 아니라 만들어지는 것이다" 라는 명제. 이는 저자들이 서문에서 이야기하듯이 데이터를 둘러싼 권력과 역사를 이해하는 핵심 열쇠이다. 데이터는 우리와 상관없이 그 자체로 존재하는 것이 아니라, 특정 목적에 의해 만들어지고 분류되고 해석되는 대상이다. 데이터와 뗄래야 뗄 수 없는 통계학의 기원에서 알 수 있듯이 이는 국가 운영과 자원배분의 의사결정의 문제이다. 데이터를 둘러싼 다양하고 난해한 학문적 이론과 기법들, 뉴럴네트워크니 기계학습이니, 인공지능 등의 기술적 도구와 인프라들은 데이터를 둘러싸고 벌어지는 인간들의 욕망과 권력 관계의 외피일 뿐이다. 중요한 것은 기술적인 문제가 아니라 국가나 기업들이 데이터를 어떤 목적과 용도로 활용하는지, 그것으로 인한 결과의 부정적 효과와 윤리적 딜리마들에 대해 사전에 점검하고 예상되는 문제들을 어떻게 풀어나갈지 끊임없이 문제 제기하고 해법을 찾아나가는 과정이 중요하다고 본다.
No comments:
Post a Comment