[다독가들]은 독서가 한 개인의 인생에 끼친 영향에 대한 질문을 통해 독서의 중요성, 책과의 관계 등을 흥미롭게 풀어가는 전문가 인터뷰 코너이다.
책 이외에도 인터뷰이의 전공이나 관심사에 관한 질문 또한 추가된다.
이은조 데이터 과학자의 추천 도서 다섯 권 ⓒ이은조
Q 게임 상에서 겪었던 일들 중 가장 기억에 남는 일이 있다면 무엇인가.
A 내가 처음 접한 MMORPG가 〈아이온〉이었다. 기존에는 혼자 플레이하는 패키지 게임만 하다가 여러 사람이 한 공간에서 플레이하는 게임은 처음 한 건데, 사람들이 게임 속 마을에서 캐릭터의 외형이나 의상을 뽐내거나 서로 결투를 벌이며 누가 더 강한지 실력을 겨루고 채팅으로 농담 따먹기를 하는 등 게임의 목적과 상관없이 노는 모습이 정말 신선했다.
어느 날은 마을에 100명 가까운 사람들이 모여서 일정 시간 동안 괴물 모습으로 외형을 바꿔주는 ‘변신 캔디’라는 아이템을 사용해 ‘얼어붙은 어그린트’라는 나무형 몬스터로 변신하더니 다 같이 줄지어서 마을을 행진하고, 그 모습을 캡처한 후기 글이 게임 커뮤니티 게시판에 올라오더라. 당시 사회적으로 유행하던 ‘플래시 몹’을 게임 속에서 흉내 낸 거다. 뭔가 게임에서 제공하는 어떤 목표를 달성해나가는 과정에서 재미를 느끼는 것에만 익숙해 있던 나에게 큰 충격을 주는 사건이었다. ‘아, 게임도 여러 사람이 모이면 이런 식의 사회적 유희 활동이 가능한 거구나······’ 하는 깨달음을 얻은 경험이라 기억에 남는다.
Q 데이터 과학만의 독특한 매력은 무엇인가.
A 〈셜록〉이나 〈닥터 하우스〉 같은 드라마를 보면, 주인공이 여러 가지 관찰 결과나 증거들을 쭉 늘어놓고 그것들 간의 관계나 행간에 담긴 정보를 찾아 숨은 의미를 파악하는 장면들이 자주 나온다. 아무래도 드라마이다 보니 극적인 재미를 위해 과장이 많이 들어가 있긴 하지만, 데이터 분석을 하다 보면 약간 비슷한 경험을 할 때가 있다. 그럴 때면 짜릿한 쾌감이 든다. 이런 게 데이터 과학의 매력인 것 같다.
수집된 데이터 속에서 변수 간의 숨겨진 관계를 찾고 이를 논리적으로 조합해 하나의 모델로 만들거나 결론을 내는 과정이 대개는 지난하지만, 그래도 하나로 귀결될 때 느끼는 감정이 중독성이 있어 지금까지 이 일을 해올 수 있었던 것 같다.
Q 인디 게임을 만들어본다면 어떤 형태의 게임을 만들고 싶은가.
A 예전에 회사에서 직원을 대상으로 아이디어 공모를 한 적이 있는데, 그때 이런 게임을 기획해봤다. ‘어몽 어스(Among Us)’ 류의 게임인데(다만 내가 기획할 때는 어몽 어스가 나오기 전이었다), 인간과 AI가 대결하면서 우리 편에 있는 스파이를 맞히는 게임이다. 사람 플레이어 중 한 명은 AI 팀에 몰래 들어가서 플레이하고, 반대로 AI 쪽에서는 스파이 하나가 인간 팀에 들어가서 활동하는 거다. 기존 게임과 가장 다른 점은 게임 유저가 인간 팀에서 직접 플레이를 할 수도 있고, 본인이 만든 AI 모듈을 등록해 AI 팀에서 활동하게 만들 수도 있다는 점이다. 즉, AI 개발 자체도 게임화(Gamification) 시키는 거다.
게임이 시작되면 여러 가지 미션을 수행하게 되는데, 각 미션이 끝날 때마다 인간 팀에서는 자기 팀 사람들과 채팅을 해서 누가 AI 스파이인지 맞히고, 반대로 AI는 플레이 기록을 분석해서 자기 팀에 있는 사람 스파이를 맞혀서 각각 팀에서 한 명씩 퇴출시켜 나가는 방식이다.
요즘 인공지능이 빠르게 발전하고 있기도 하고 기존에 비해 채팅이나 이미지 인식 같은 AI 만드는 것이 점점 쉬워지고 있어서 개발은 충분히 가능할 것 같다. 다만 공모전에 참가하면 본인이 직접 게임 개발에 참여해야 하는데, 내가 게임 개발보다는 분석하는 게 더 좋기도 하고 게으르기도 해서 그냥 머릿속 상상으로만 그쳤다.
Q 수많은 데이터들을 해석할 아이디어는 주로 어디서 얻는 편인가.
A 엄밀히 말하자면, 데이터를 해석하는 것은 사용하는 기법마다 대체로 정해진 방식이 있다. 어떤 가설을 수립할지, 그리고 그 가설을 입증하기 위해선 데이터를 어떻게 가공해서 어떤 기법을 사용하는 게 좋을지 정할 때 분석가의 경험과 아이디어가 필요한 거다. 이게 정해지고 나면 만들어진 모델에 대한 해석은 정해진 이론에 맞게 진행할 수 있다. 암튼, 이렇게 어떤 기법을 언제 적용할지에 대해서는 기존에 알려진 여러 가지 사례를 통해 아이디어를 얻는다.
사실 세상에는 수많은 분석 사례나 좋은 기법들이 넘치도록 많다. 그래서 이렇게 이미 알려진 사례나 기법을 적절히 응용하면 된다. 이런 측면에서 보면, 분석가에게 필요한 능력은 새로운 걸 창조하는 능력이 아니라 기존에 있는 것들을 내 상황에 맞게 적절하게 응용할 수 있는 능력이다.
가령, 예전에 내가 게임 내 불법 행위를 탐지하기 위해 네트워크 분석 기법을 이용했는데, 당시에 회사에서 획기적인 성과로 인정받았지만 나는 그저 웹 검색이나 웜 바이러스 탐지 분야에서 이미 알려진 기법들을 응용한 것이었다.
게다가 요즘은 데이터 과학이나 기계학습 분야가 인기를 끌고 있다 보니 인터넷에 수많은 정보가 넘쳐난다. 정보가 없어서 문제가 아니라 너무 많아서 소화불량이 되는 게 문제다. 그래서 평소에 데이터 분석과 관련한 괜찮은 글을 발견하면 제목과 URL 주소, 간략한 내용을 구글 스프레드시트에 정리해놓는다. 이렇게 해놓고 가끔 시간이 여유로울 때 기존에 정리해놓은 글을 다시 보다 보면 그때는 미처 생각하지 못했던 걸 깨닫게 된다. 지금 고민하고 있는 문제에 실마리를 얻을 수 있는 정보가 눈에 들어올 때도 많다.
이은조 데이터 과학자의 개인 서재 ⓒ이은조
Q 가장 좋아하는 단어와 싫어하는 단어를 하나씩 꼽아본다면?
A 평소에 생각하고 있던 건 아닌데, 이 질문을 받고 ‘내가 좋아하는 단어가 뭐가 있지?’ 하고 생각해보니 딱 ‘꿈’ 이라는 단어가 떠오른다. 어감 자체도 귀에 착 감기고, 의미 자체도 좋고. 앙드레 말로의 명언으로 잘 알려진, ‘오랫동안 꿈을 그리는 사람은 그 꿈을 닮아간다’라는 말도 내가 좋아하는 말 중 하나다. 심지어 난 잠을 잘 때 꿈을 많이 꾸기도 하고 꿈꾸는 걸 좋아한다. 보통 수면 관련 글을 보면 꿈이 기억나지 않아야 깊이 잠드는 거라고 하던데, 오히려 난 꿈이 기억 안 나면 뭔가 잠을 제대로 못 잔 거 같아서 아쉽더라.
반면 ‘절대’, ‘결코’, ‘확실’과 같은 단정적인 표현을 싫어한다. 일종의 직업병이라고 할 수 있는데, 데이터 분석의 기본인 통계학의 경우 대개 확률적으로 결과를 얻기 때문에 확정적인 결론을 내리지 않는다. ‘이러이러할 가능성이 높다’, ‘가설이 맞다고 가정할 경우 이런 결과를 관측할 확률이 낮다’, ‘이런 추세를 보인다’ 같은 식이다. 그렇다 보니 단정적인 표현으로 하는 주장에 대해선 오히려 의심이 들고 거부감이 생긴다.
그런데 보통 사람들은 확신에 찬 주장에 더 끌리잖나. 그리고 데이터 분석가의 이런 모호한 표현이 마치 책임을 지지 않으려는 방어적인 자세라고 생각한다. 그래서인지 타 부서 사람들은 우리가 분석한 결과에 대해 좀 답답하게 느끼는 경향이 있다. 뭐 그 마음이 이해는 간다.
Q 데이터 과학자가 되고 싶은 이들을 위해 추천해주는 책이 있나.
A 두 권의 책을 추천한다.
첫번째는 루돌프 카르납의 《과학 철학 입문》이다. 보통 데이터 분석을 ‘데이터 과학’이라고 부르는데, 막상 데이터 과학자가 되고 싶어하는 사람들이 통계학이나 머신러닝 쪽 공부만 생각하지 대체 ‘과학’이란 게 무엇인지에 대해서는 깊게 고민하는 경우가 드문 것 같다. 어떤 이들은 ‘데이터 과학’이라는 말을 그저 통계학이나 데이터 분석 분야를 겉으로만 번지르르하게 보이려고 포장한 용어일 뿐이라고 비난하기도 한다.
물론 나도 지나치게 데이터 분석 분야를 포장하는 건 못마땅하지만 그렇다고 ‘과학’이라는 용어를 사용하는 것이 크게 잘못되었다고 생각하진 않는다. 실상 분석을 할 때는 통계나 기계학습 지식 못지않게 과학적 사고도 중요하니까. 그런 측면에서 난 이 책을 읽고서 과학이란 학문에 대해 새로운 시각을 얻었고, 이 경험이 데이터 분석을 할 때 도움이 되고 있다.
또 하나는 이대열 교수님이 쓴 《지능의 탄생》이다. 요즘 인공지능에 대한 관심이 무척 뜨거운데, 인공지능을 제대로 이해하려면 ‘지능’이란 게 대체 무엇인지에 대해 먼저 알아야 하지 않을까 싶다. 그런데 보통 인공지능이라고 하면 기계학습, 특히 요즘엔 딥 러닝만을 얘기한다. 하지만 지능이 꼭 ‘학습’만을 의미하는 건 아니지 않나? 게다가 학습이란 것 또한 딥 러닝과 같은 최적화 알고리즘만 있는 것도 아니고.
이 책은 우리가 지능이라고 부를 수 있는 것들에 대해 가장 단순한 형태인 ‘반사’에서부터 메타 인지나 사회적 지능과 같은 가장 고차원적 형태에 이르기까지, 거의 대부분의 지능의 종류를 체계적이고 친절하게 설명하고 있다. 인공지능을 공부하는 사람이라면 꼭 읽어보면 좋겠다.
Q 글쓰기와 관련해 욕심나는 것이 있나.
A SF 소설을 쓰는 게 로망이다. 보통 SF 소설들은 우주나 AI를 소재로 하는 경우가 많은데, 난 통계학 이론을 소재로 하면 재밌을 것 같다. 통계나 확률 관련 이론을 보면 사람의 직관으로는 잘 이해가 안 가는, 그래서 때론 신비로운 느낌이 드는 것들이 있다 보니······.
한 가지 예를 들면, 통계학에는 ‘큰 수의 법칙’이란 게 있다. 동전 던지기를 생각해보자. 평범한 동전이라면 아마 동전 던지기를 했을 때 앞/뒷면이 나올 확률은 각각 50퍼센트일 거다. 하지만 그렇다고 해서 동전을 열 번 던졌을 때 앞/뒷면이 똑같이 다섯 번씩 나오는 경우는 드물다. 보통은 어느 한쪽 면이 좀 더 많이 나온다. 하지만 큰 수의 법칙에 의하면 동전을 계속 던질수록 앞/뒷면이 나오는 비율은 ‘50 : 50’으로 점점 수렴한다.
그런데 만약 내가 동전을 열 번 던졌는데 모두 앞면만 나왔다고 생각해보자. 이 상황에서 다음 번 동전을 던질 때 앞/뒷면이 나올 확률은 어떻게 될까? 앞서 설명한 큰 수의 법칙에 의하면 두 면이 나온 비율이 50 : 50으로 수렴해야 하기 때문에 이 비율에 조금이라도 더 가까워지려면 다음번에는 뒷면이 나와줘야 할 것 같다. 하지만 동전을 던지는 행위는 이전에 던졌던 결과와는 아무런 관련이 없다. 즉, 각각이 독립된 사건이다. 따라서 앞/뒷면이 나올 확률은 처음 던질 때와 동일하게 각각 50퍼센트다.
이런 것이 사람의 직관으로는 이해하기 쉽지 않다. 마치 동전에 어떤 의지가 있는 것처럼, 혹은 무언가 초자연적인 존재가 비율을 조정하려는 움직임이 있는 것처럼 느껴지니까. 이렇게 직관과는 다른 통계의 신기한 현상을 소재로 약간 음모론 느낌의 소설을 써보면 재밌을 것 같다.
Q 어렸을 때 읽었던 책 중 가장 기억에 남는 책은 무엇인가.
A 아주 어릴 때 부모님께서 《어깨동무》라는 월간지를 사주셨다. 만화와 기사, 연재소설 같은 게 있는 어린이 종합잡지였다. 매월 25일 경에 나왔던 걸로 기억하는데, 그때가 되면 부모님께 돈을 받아 문방구로 달려갔다. 내가 책을 사오면 형, 누나와 함께 돌아가며 읽었다.
잡지에 실리는 기사들은 보통 UFO나 초능력, 버뮤다 삼각지대 같은, 꼬맹이들이 좋아할 만한 신비한 사건이나 흥미로운 초자연 현상 같은 거였는데 어린 마음에 정말 진지하게 읽었다. 그때 잡지에서 많이 다뤘던 내용 중 하나가 ‘기’에 대한 것이었다. 거기 소개된 복식호흡이나 명상 같은 기 수련법을 나름 진지하게 따라했던 기억이 난다.
Q 게임과 관련한 추억 하나만 이야기해달라.
A 학창시절에 〈삼국지〉라는 PC게임이 엄청나게 인기를 끌었다. 얼마나 인기가 많았는지 심지어 선생님들도 반에 컴퓨터 좀 잘 다룬다고 알려진 학생들에게 플로피 디스크를 주면서 게임 좀 복사해 달라고 부탁할 정도였다. 나도 담임선생님에게 게임과 함께 PC 잡지에서 복사한 매뉴얼을 갖다 바쳤다. 심지어 자율학습 시간에 감독 선생님이 넌지시 내 자리에 와서 게임 공략법을 묻는 경우도 있었다. 돌이켜보면 PC 게임이 선생님과 학생 사이에 은근한 동질감을 형성해주는 역할을 했던 것 같다.
커피 한 잔과 책 ⓒ 이은조
Q 독서를 할 때 주로 찾는 장소가 있나.
A 딱히 독서를 위해 찾는 장소는 없다. 다만 경험상 집보다는 카페가 좀 더 책이 잘 읽히는 것 같다. 그래서 COVID-19가 유행하기 전까지는 주말 오전에 아내와 카페에 가서 커피를 마시며 두세 시간 정도 책을 같이 읽는 시간을 갖는 게 소소한 행복이었다.
요즘은 휴대폰에 e북 리더기를 설치해서 책을 읽는데, 대중교통을 이용할 때나 혼자 밥을 먹을 때 틈틈이 읽기 좋은 것 같다. 하지만 내가 구시대 사람이어서 그런지 확실히 실제 책에 비해 소위 손맛은 없더라. 그래서 집에서 여유 시간이 많을 때는 종이책을 선호한다. 그렇다 보니 보통 e북으로는 단편소설이나 잡지같이 짧은 호흡의 책을 주로 읽고, 집에서는 좀 더 긴 호흡으로 읽어야 하는 책을 읽는다.
Q ‘나를 변화시킨 책’이 있다면 어떤 책인가.
A 특정 책을 하나 꼽는 게 가능할지 모르겠다. 살아오면서 지금껏 읽어온 대다수의 책이 나를 점진적으로 변화시켜 지금의 나를 만든 것이 아닐까?
Q 데이터 과학자로서 ‘아름다움’을 느끼는 순간들이 있다면 언제인가.
A 학문적으로 볼 때 ‘아름다움’이란, 단순하면서도 군더더기 없이 명료한 설명이나 이론에 대해서 가질 수 있는 감정이라 생각한다. 그런 측면에서 볼 때 아직까지 데이터 분석에서 아름다움을 느낀 적은 없다.
내가 보기에 데이터 과학은 수학이나 물리학 같은 분야와 비교했을 때 ‘아름다움’을 언급할 정도의 수준에 다다르지 못했다고 생각한다. 여러 가지 측면에서 아직 미숙한 아이와 같은 상태다. 좋게 보면 그래서 아직 성장 가능성이 높다고 할 수도 있을 것이다. 하지만 역시 ‘아름다움’을 논하기에는 부족한 점이 많은 것 같다. 사람들에게 널리 알려진 유명 사례들도 자세히 살펴보면, 대부분 우연한 결과나 단기적인 성과를 과장했거나 혹은 꿈보다 해몽 식으로 포장한 경우다.
그래도 언젠가는 정말 아름다운 분석을 해볼 수 있지 않을까 하는 로망을 마음속에 품고 있다.
이은조가 추천하는 책 다섯 권
《삼체》(류츠신)
설정 자체도 무척 참신하고 스토리도 재밌었지만, 무엇보다 지금까지 내가 읽은 SF 중에 상상력의 스케일이 가장 큰 소설이다. 비교적 최근에 읽은 책임에도 불구하고 개인적으로 최고의 SF로 손꼽을 수 있다. 원래 SF 작가 중에 테드 창을 가장 좋아했는데, 이 책으로 인해 테드 창을 향한 팬심이 흔들리고 있다. SF를 좋아하는 사람에게 ‘강추’하고 싶은, 정말 엄청난 소설이다.
《칼의 노래》(김훈)
꽤 오래 전에 우연히 한 TV 프로에서 김훈 작가의 인터뷰를 본 적이 있다. 아마 《칼의 노래》를 출간한 지 얼마 안 된 때였던 것 같은데, 문장을 쓸 때 ‘~는’이라고 쓸지 ‘~가’라고 쓸지 조사 하나를 쓸 때도 고민한다는 말이 무척 인상적이어서 바로 구매했다. 책을 읽고 정말 충격을 받았다. ‘와 이렇게 글을 간결하면서도 깊이 있게 쓸 수 있구나’ 싶었다. 그 전에는 이문열 작가가 글을 가장 잘 쓴다고 생각했는데, 마치 이문열의 글은 화려한 초식을 보여주는 성룡의 무술 액션 같았다면 김훈의 글은 한 칼에 목을 베는 검객 같았다. 간혹 주변에서 내가 쓴 글이 군더더기가 없어서 좋다는 평을 해주시는 분들이 있는데, 아마 김훈 작가의 글을 흉내 내고 싶은 마음이 은연중에 영향을 준 게 아닌가 싶다. 그 이후 김훈 작가의 소설은 대부분 찾아 읽고 있는데, 역시 《칼의 노래》를 처음 읽었을 때의 충격이 가장 큰 것 같다.
《이기적 유전자》(리처드 도킨스)
사실 《이기적 유전자》가 지나치게 우리나라에서 과대평가를 받는 측면도 있고, 심지어 요즘은 너무 이 책만 대중의 편애를 받는 바람에 오히려 욕을 먹는 경향도 있어서 이 책을 언급할까 말까 망설였다. 하지만 곰곰이 생각해봐도 역시 나에게 가장 큰 영향을 준 책 중 하나라는 점은 무시할 수 없는 사실이다. 내용적인 측면에서는 다소 오래되었지만 과학적인 글쓰기 측면에서는 여전히 배울 점이 많은 책이라 생각한다. 개인적으로는 과학 도서에 대한 관심이 커지게 된 계기이기도 했고, 특히 진화의 기본 단위를 개체나 집단이 아니라 유전자 단위로 설명한다는 점에서 환원주의 사고를 갖게 하는 데 큰 도움이 된 책이었다.
《링크》(알버트 라슬로 바라바시)
앞서 소개한 《이기적 유전자》가 환원주의 사고의 대표적인 책이라면, 이 책은 반대로 환원주의의 오류를 깨는 데 도움이 된 책이다. 보통 데이터 분석을 하다 보면 개체를 점점 작은 단위의 특징으로 쪼개는 데 치중하기 쉽다. 그러면 자칫 소위 숲을 보지 못하는 오류를 범할 수 있다. 이 책에서 소개하는 ‘네트워크’는 개체 간의 관계를 분석함으로써 개체 단위에서는 알 수 없는 패턴을 찾는 전체주의적 사고가 얼마나 중요한지 알려준다.
나는 이 책을 통해 네트워크에 흥미를 갖게 되면서 가장 관련이 높은 웹 검색 분야에서 일하고 싶다는 생각을 갖게 됐다. 마침 그때 검색 서비스를 만든다는 엔씨소프트의 모집 공고를 보고 지원하면서 이렇게 회사에 들어와 일하게 되었다. 게다가 네트워크 분석은 내가 회사에서 즐겨 사용하는 기법 중 하나이기도 하다. 이런 측면에서 생각해보면, 지금의 내가 되는 데 가장 영향을 준 책인 것 같다.
《부의 기원》(에릭 바인하커)
기존의 경제학은 사람들이 합리적인 선택을 통해 점차 균형과 안정을 향해 나아간다는 가정을 기반으로 이론이 구축되어왔다. 학창시절에 배운 ‘수요 공급 법칙’이나 ‘보이지 않는 손’ 같은 게 대표적인 예다. 그런데 2000년대 들어 사람들의 비합리적 사고 체계가 밝혀지면서 행동경제학이 탄생했고, 아예 주식시장처럼 시스템적으로 작은 변동이 증폭되며 불안정한 변동을 반복하는 특성이 있다는 점을 주장하는 복잡계 경제학이 등장했다. 이 책은 이렇게 기존 경제학에 대한 사람들의 오해를 깨는 여러 가지 연구 사례를 소개하고 있다. 내용 자체도 지적인 자극을 주는 흥미로운 내용이 가득할 뿐만 아니라, 개인적으로는 경제학에 대한 관심을 갖는 계기가 된 책이어서 더 애착이 간다.
이은조_데이터 과학자, 작가
엔씨소프트에서 데이터 과학자로 근무하고 있다. 게임을 하는 것보다 게임을 하는 사람들의 데이터를 보는 것이 더 재미있어서 일을 하다 보니 어느덧 햇수로 15년이 넘은 고인물이 되고 말았다. 쓴 책으로 《게임의 사회학》 《데이터 과학자의 일》(공저)이 있다.
물건에 치여 사는 삶, 왜 문제인가?지금까지 2천 개의 집을 바꾼 대한민국 최고의 정리 컨설턴트 정희숙의 똑똑한 정리 노하우 대공개!MBC 나 혼자 산다 스페셜 출연, 그리고 화제의 유튜브 채널 ‘정희숙의 똑똑한 정리’를 운영중인 정희숙. 그녀가 들려주는 집 정리의 기본 원칙, 특히 책 정리의 노하우와 집 정리에 담긴 애틋한 사연도 들어본다. 정리를 마
[다독가들]은 독서가 한 개인의 인생에 끼친 영향에 대한 질문을 통해 독서의 중요성, 책과의 관계 등을 흥미롭게 풀어가는 전문가 인터뷰 코너이다. 책 이외에도 인터뷰이의 전공이나 관심사에 관한 질문 또한 추가된다. Q 쓰기와 읽기, 그리고 일을 병행하는 노하우는 무엇인가.A 읽기는 특별히 정해 놓은 시간이 따로 있지 않다. 언제 어디서나 읽을 수 있게 여
예술고등학교 문창과에 진학하지 않더라도, 책을 좋아하고 글쓰기를 좋아하며 나아가 작가가 되고 싶어하는 청소년들이 적지 않다. 남산도서관이 2011년부터 운영해온 남산문학아카데미는 이런 학생들을 위해 문학교육의 충실한 장이 되고 있다. 남산문학아카데미를 통해 예비작가 지망생으로서 꿈을 키우고 있는 학생들을 만나보았다. Q 학창시절 남산도서관 ‘남산문학아카