[해외 사서 칼럼] 인공지능은 인간의 학습을 어떻게 바꾸고 있는가? ⑥ 지식의 생성과 보존 과정에서 행위주체로서의 인간
최유진_The University of Texas at Austin 정보학 박사과정
2026-05-2110:00
지난 3월 시애틀에서 열린 ‘CHIIR(ACM SIGIR Conference on Human Information Interaction and Retrieval) 2026’ 학회에 다녀왔다. 올해는 생성형 인공지능이 정보 검색 환경을 어떻게 바꾸고 있는지에 대한 발표와 토론이 주를 이뤄 사흘 내내 이어졌다. 마지막 날 폐회 세션에서, 학회 의장을 맡은 워싱턴대학교의 치라그 샤(Chirag Shah) 교수가 자신의 관점 논문(perspective paper)을 발표했다. 핵심 주장은 이렇다. 인간의 정보 탐색 행동과 인공지능 에이전트의 작동 방식은 단순히 다른 접근법이 아니라, 근본적으로 양립하기 어려운 패러다임이라는 것이다. 인공지능 에이전트는 점점 더 능숙해지고 있으며, 정보 환경 전반에 자리 잡고 있다. 이런 흐름 앞에서 우리는 선택해야 한다. 정보와 관계 맺는 방식 자체가 인공지능 중심으로 재편되도록 할 것인지, 아니면 인간의 정보 탐색을 가능하게 해온 인지적 여지들을 일부러라도 남겨 둘 것인지. 이러한 결정은 결국 인간의 지적 생활 전체에 큰 영향을 미치게 될 것이다(Shah, 2026).
샤 교수의 논의는 세 가지 차원에서 이 양립 불가능성을 짚었다. 인식론적 차원에서, 인간의 정보 탐색은 자신의 불확실성을 해소하고 정신적 모형을 구성하기 위한 활동인 반면, 인공지능은 통계적 패턴을 재생산할 뿐 어떤 인식 상태도 경험하지 않는다. 시간적 차원에서, 인간의 검색은 질문을 다듬고, 결과를 살피고, 다시 질문을 고치는 ‘과정’으로 펼쳐지는 반면, 인공지능은 그 모든 과정을 즉각적인 응답으로 압축한다. 행위적 차원에서, 인간은 ‘이것을 알아야 한다’는 내재적 필요에서 출발하지만, 인공지능은 외부에서 주어진 과제를 수행할 뿐 어떤 필요도 가지지 않는다. 이러한 차이를 근거로, 그는 정보 시스템의 사용자를 ‘인공지능이 제공하는 정보의 수동적 수신자’가 아니라 ‘자기 인식을 책임지는 인식론적 행위주체(epistemic agent)’로 다시 자리매김할 것을 제안했다.
이 시리즈를 마무리하며, 양립 불가능성과 인식론적 행위주체라는 두 개념을 길잡이 삼아, 지식이 만들어지고 검증되며 보존되는 과정 전반에서 인간의 주체성이 어디에 어떻게 자리해야 하는지 함께 짚어보고 싶다. 지식을 생성하는 저자, 그리고 그 결과물이 모이는 자리인 도서관, 이 두 자리에서 지금 어떤 일이 일어나고 있는지를 차례대로 살펴보려 한다.
ⒸUnsplash.com
지식이 만들어지는 자리에서의 책임
최근 소셜미디어를 보면 연구자들도 인공지능 에이전트를 통해 연구 과정의 일부를 자동화하고, 그것을 일종의 생산성 노하우로 공유하는 모습이 종종 목격된다. 문헌 탐색과 정리를 인공지능에게 맡기고 그 요약을 받아 글을 구성하는 식의 활용이 그 예다. 보조적으로 활용하는 것은 충분히 합리적이지만, 어디까지가 허용되는 범위인지가 모호하다 보니 보기에 따라서는 과하게 의지하는 비중도 늘어나는 듯하다. 연구의 질문 설정도, 분야에 따라서는 연구의 실행도, 글쓰기도, 선행 연구의 분석도, 급기야 원문을 직접 읽지 않은 채 인공지능의 요약만으로 인용을 결정하거나 글을 구성하는 단계까지, 일종의 ‘효율적인’ 방법으로서 공유되는 경우를 어렵지 않게 만난다.
필자도 잘 안다고 자부하는 좁은 영역에 한해 여러 인공지능 도구를 시험 삼아 사용해보았고, 이와 관련해 박사과정 학생 또는 박사학위를 받은 연구자를 대상으로 연구 초기 과정에서의 인공지능과 지적소유권(intellectual ownership)에 관한 연구도 진행했다. 결과는 대체로 비슷했다. 표면적으로는 그럴듯하지만 핵심 논점을 비껴가거나, 분야의 주요 갈래를 잘못 묶거나, 정작 가장 중요한 저자들의 논문을 빠뜨리는 식이었다. 인용 가능한 자료를 함께 찾아준다는 도구들도 마찬가지였다. 어떤 알고리즘으로 무엇을 선별해 보여주는지가 불투명했고, 깊이도 폭도 분야의 기준에서 보면 매우 얕았다. 이러한 결과물을 가려낼 눈이 없었다면, 꽤나 그럴싸한 말이 되는 결과물을 어딘가에 제출하며 인공지능을 잘 활용했다고 생각했을지도 모를 일이다. 따라서 인공지능에 지나치게 의존하여 결과물을 빨리 만들어내는 흐름에 대해 아직은 회의적이다.
이 흐름이 학계 전체로 어떤 결과를 만들어내고 있는지는 이미 여러 사례에서 드러나고 있다. 특정한 예시를 들지 않을 정도로, IF(impact factor)가 높은 저널에서도 인공지능으로 생성된 실험 결과와 맞지 않는 이미지가 실린다든지, 인공지능이 만들어낸 가짜 논문을 인용한다든지, 누군가 잘못 인용한 논문을 무심코 재인용한다든지 하는 일들이 드물지 않게 일어나고 있다. 한번 출판된 잘못된 결과는 그 자체에 머무르지 않고, 다른 연구의 인용을 통해 또 다른 지식의 토대로 자리잡는다. 그것을 바로잡는 일에 들어가는 자원, 그리고 그 과정에서 분야 전체가 떠안게 되는 신뢰의 손실은 결과물 하나의 문제로 환산되지 않는다.
이 부담은 동료 심사 시스템에도 그대로 옮겨간다. 한 분석에 따르면 NeurIPS의 한 해 제출 논문 수는 2014년 1,678편에서 2024년 17,491편으로 약 10배 증가했고(Wei et al., 2025), 한 의학 분야 학술지의 편집자는 두 명의 리뷰어를 확보하기 위해 35명의 동료에게 초청 메일을 보내야 했다고 보고하기도 했다(Emanuele & Minoretti, 2025). 여기에 일부 리뷰어들이 인공지능에게 리뷰를 맡기는 정황까지 더해지면서, 검증 시스템이 점점 현재 상황을 지탱하지 못하고 있다는 우려가 커지고 있다. 어떤 결과물이 의미 있는지 가려내는 데 드는 비용은 늘어나는데, 자원봉사에 가까운 리뷰어 풀에 의지하는 시스템에서 한정된 인력에게 인공지능으로 늘어나는 제출물을 모두 읽어내라고 요구하기는 어렵다. 심사 과정의 피로도는 빠르게 누적되고 있다.
쏟아지는 출판물, 그것은 정말 더 많은 지식인가
이쯤에서 한 가지 질문을 던지지 않을 수 없다. 인공지능을 활용해 더 많은 결과물이 쏟아지는 것이 분야에 정말 더 의미 있는 담론을 가져오고 있는가? 더 많은 출판물이 곧 더 많은 지식이라는 말은 직관적으로는 맞는 말 같지만, 한 번 더 생각해봐야 한다. 지식은 양으로만 측정되지 않는다. 하나의 통찰이 어떤 질문을 새롭게 열어주는가, 어떤 후속 작업을 가능하게 하는가, 어떤 해석을 제공하는가 역시 고려해야 한다. 이런 의미에서 보면, 일정 수준 이상의 그럴듯한 결과물이 빠르게 누적되는 환경이 반드시 분야의 깊이나 폭을 더해주는 것은 아닐 수 있다.
그리고 이 흐름은 학술 출판계에만 국한되지 않는다. 인공지능이 작성한 일반 단행본의 양도 한국과 미국 모두에서 빠르게 늘고 있고, 이를 도서관이 어떻게 다룰 것인가에 대한 논의가 도서관계의 새로운 화두로 떠오르고 있다. 미국 도서관계에서는 사서 닉 탄지(Nick Tanzi)가 디지털 큐레이터들을 위해 운영하는 블로그 ‘The Digital Librarian’에서 이 문제를 다룬 바 있다(Tanzi, 2025). 그가 인용한 미디어의 보도에 따르면, 이미 미국의 공공도서관 디지털 플랫폼 컬렉션 안으로 인공지능이 양산한 저품질 도서들이 들어와 있다. 특히 한 플랫폼의 경우, 도서관이 직접 골라 사는 것이 아니라, 플랫폼이 미리 묶어 놓은 패키지를 이용할 권한을 산다. 그리고 이용자가 자료를 빌릴 때마다 도서관이 추가 비용을 지불한다. 그래서 도서관의 수서 기준에 미치지 못하는 자료에도 예산이 쓰이게 되고, 그 결과 한정된 예산이 낭비되는 경우가 늘고 있다는 것이다. 탄지는 또한 한 사서가 다른 플랫폼에서 인공지능 내레이터가 낭독한 책을 우연히 발견한 뒤 같은 플랫폼에 같은 방식으로 만들어진 오디오북이 100여 종에 달한다는 사실을 확인한 사례도 소개했다.
그는 다음의 질문들을 던졌다. 장서 개발 정책(policy)의 목적은 무엇인가? 품질 관리인가? 출처 표기인가? 전면 금지인가? 기존의 장서 개발 정책 안에서 다룰 수 있는 문제인가? 아니면 새 정책이 필요한가? 그 정책은 실제로 시행 가능한가? 탄지가 소개한 미국 공공도서관들의 대응은 흥미로울 만큼 다양하다. 인디애나의 한 공공도서관은 인공지능이 ‘주로 작성하거나 저술한’ 도서를 구매·기증·인수 대상에서 제외한다는 명문 조항을 두었고, 로드아일랜드의 한 도서관은 “전적으로 인공지능에 의해 쓰이거나 낭송된 작품은 컬렉션에 포함하지 않는다”고 짧게 못 박았다. 워싱턴주의 한 도서관 시스템은 조금 다른 입장을 취한다. 인공지능이 ‘생성’한 자료는 가능한 한 들이지 않되, 이미 들어온 경우 카탈로그에 그 사실을 표시할 뿐 무조건 폐기하지는 않으며, 인간이 쓴 글을 인공지능 도구로 ‘교정·다듬은’ 자료는 일반 자료와 같은 기준으로 다룬다는 방식이다. 정책의 출발점은 비슷해도 어디에 선을 긋고 어디까지 허용할지에 대한 판단은 도서관마다 다르며, 탄지는 이 모든 결정이 결국 ‘도서관이 자신의 사명에 비추어 무엇을 지키려 하는가’에 대한 답이라고 정리한다.
한국에서는 이 문제가 납본 제도라는 또 다른 결의 문제로 드러나고 있다. 2025년 한 해 동안 9천여 권의 전자책을 인공지능으로 양산한 출판사가 등장하면서 이른바 ‘딸깍 출판’이라는 표현이 언론에 등장했고, 국립중앙도서관은 이 출판사가 신청한 전자책 395건에 대해 ‘분량 미달, 공개 자료 편집물, 내용 반복’ 등을 이유로 납본 제외 결정을 내렸다(이재용, 2026). 국회도서관도 비슷한 시기 인공지능 출판물 42종에 대해 납본을 거부했다. 최근 2년간 국립중앙도서관이 납본을 반려한 전자책은 1만 1,651건에 달한다고 보고되었다(최다원, 2026, 02). 납본 제도가 ‘당대의 모든 출판물을 후대에 전승한다’는 취지로 설계된 만큼 국립도서관이 자료 선별에 직접 개입하는 일은 이례적이지만, 인공지능을 활용한 무분별한 양산이 납본 보상금 제도와 결합하면서 공적 자원의 누수와 지식 보존 체계의 신뢰가 동시에 흔들리는 상황을 더 두고 보기 어려워진 것이다. 2026년 3월에는 국회 문화체육관광위원회가 인공지능 출판물을 도서관자료심의위원회 심의를 거쳐 납본 대상에서 제외할 수 있도록 한 도서관법 개정안을 의결했다(주재현, 2026). 어느 곳이든 사서와 도서관이 ‘무엇을 들이고 무엇을 들이지 않을 것인가’를 다시 정의해야 한다는 요구는 일어나고 있다.
ⒸUnsplash.com
행위주체로서의 도서관, 그리고 사서
도서관은 오랫동안 지식을 ‘쌓는 일’과 ‘가려내는 일’ 모두를 다루어 온 기관이다. 납본 제도를 통해 출판물을 폭넓게 보존하는 국립중앙도서관과 같은 기관도 있고, 한정된 예산과 공간 안에서 어떤 자료를 들이고 어떤 자료를 보존하지 않을지 끊임없이 판단해야 하는 대학·공공도서관도 있다. 이 두 흐름은 서로 다른 원리로 작동하지만, 공통적으로 ‘지식의 풍경 전체를 책임 있게 다룬다’는 점에서 닮았다. 결과물이 폭증하는 시대에 이 두 가지 일은 모두 새로운 도전 앞에 놓여 있다. 보존을 책임지는 도서관은 무엇을 어디까지 보존할 것인지에 대한 새로운 기준의 마련과, 선별을 책임지는 도서관은 그럴듯해 보이는 결과물의 홍수 속에서 어떤 자료가 분야의 담론에 의미 있게 기여하는지를 판단할 수 있는 절차가 과제로 놓여 있다. 인공지능이 작성했음을 표기한 자료는 거를 수 있지만 표기하지 않은 자료를 가려낼 기술적 수단은 아직 충분하지 않고, 인간이 쓴 글을 인공지능으로 다듬은 경우는 또 다른 판단을 요구한다.
샤 교수가 정보시스템 사용자에게 제안한 ‘인식론적 행위주체’라는 개념을 도서관의 일에 옮겨보면, 사서 또한 ‘자료를 안내하는 사람’을 넘어, 어떤 결과물이 분야의 지식 풍경에서 어떤 자리를 차지하는지를 판단하고 그 판단의 근거를 공동체와 공유하는 ‘인식론적 행위주체’로 다시 보일 수 있다. 한 권의 책을 컬렉션에 들이는 결정은 단순한 구매 행위가 아니라 분야의 흐름을 읽고 이용자 공동체의 필요를 가늠하는 판단이고, 그 판단의 누적이 곧 한 도서관의 정체성을 만든다. 인공지능이 양적인 검색과 추천을 빠르게 처리할수록 어떤 자료가 어떤 맥락에서 가치 있는가에 대한 사람의 판단은 더 귀해진다. 그 판단을 떠받쳐 온 전문성을 어떻게 가시화하고 공유할 것인지, 그리고 그 전문성을 다음 세대 사서에게 어떻게 잇게 할 것인지에 대한 논의가 기대된다.
여섯 회에 걸쳐 인공지능이 학습에 미치는 영향에 대해 여러 각도에서 짚어왔다. 마지막 글에서는, 우리가 마주한 변화가 개별 학습자의 사고력 문제를 넘어 지식이 만들어지고 검증되며 보존되는 시스템 전체에 대해 생각해보았다. 더 많은 결과물이 쏟아지는 시대일수록 그 결과물이 어떤 무게를 갖는지 묻는 일은 더 미루기 어렵다. 이 질문을 가장 오래, 가장 책임감 있게 다루어온 기관이 도서관이라는 사실이 새삼 중요하게 다가온다. 인공지능이 결과물의 양과 속도를 빠르게 늘려가는 동안, 어떤 자리를 사람의 시간과 판단으로 남겨둘 것인지에 대한 결정은 결국 우리 자신의 몫이다.
최유진_The University of Texas at Austin 정보학 박사과정
텍사스대학교 오스틴(The University of Texas at Austin, UT Austin) 정보학 박사과정 4년 차에 있다. 주요 연구 분야는 사람들의 학습 과정(특히 흥미 개발과 창의성 지원)을 돕는 AI 기반 정보 시스템이다. 인공지능과 도서관의 역할을 다루는 미국 박물관·도서관 서비스 연구소(The Institute of Museum and Library Services, IMLS) 지원 프로젝트에 펠로우로 참여 중이다.
최근 교육 현장과 일상에서 인공지능 기술이 활용되는 방식을 살펴보면, 배움의 방식이 조용히 재편되는 전환점을 지나고 있다고 느낀다. 생성형 인공지능, 대표적으로 챗지피티(ChatGPT)의 등장은 단순한 기술 혁신을 넘어 학습의 본질을 다시 묻게 만든다. 당초 많은 사람들은 인공지능이 등장하면 계산 업무, 자료 입력, 일정 관리처럼 단순하고 반복적인 업무가
지난 11월 미국 버지니아에서 열린 ASIS&T(Association for Information Science and Technology) Annual Meeting에 연구 발표차 다녀왔다. 올해 컨퍼런스의 주제는 ‘Difficult Conversations: The Role of Information Science in the Age of Hum
흰 바탕에 흰 글씨, 인공지능의 조작“이러다 연구자도 필요 없겠어.” 인공지능(AI)에게 자리를 빼앗길지도 모른다는 농담 반, 우려 반의 말들이 종종 들려온다. 그 말들에 크게 흔들리지는 않는다. 결과물에 대한 책임은 여전히 인간에게 있고, 생성형 인공지능의 윤리적 활용에 대한 논의도 활발히 진행되고 있다. 그러나 짧은 시간 안에 ‘그럴듯한 결과물’을 손쉽