인공지능(AI)이라는 거대한 파도는 정보 생태계의 근본을 뒤흔들고 있다. AI 기반 추천 시스템과 콘텐츠 자동 생성 기술은 정보 생산과 유통 속도를 비약적으로 향상시켰고, 이용자 맞춤형 서비스의 정밀도도 높아지고 있다. 동시에 이런 기술은 정보 접근과 해석 과정에 알고리즘을 매개로 한 새로운 중개 구조를 형성한다. 정보는 더 이상 단순히 검색으로 획득할 수 있는 대상이 아니라 플랫폼의 추천과 데이터 분석을 거쳐 선별과 배열을 마친 결과물에 가깝다. 이 과정에서 디지털 접근 역량과 데이터 이해 능력이 부족한 집단은 정보 흐름의 중심에서 점차 주변부로 밀려난다. 편리한 기술의 확대는 이를 효과적으로 활용할 수 있는 집단과 그렇지 못한 집단의 격차를 심화시킨다. 결국 AI는 정보 접근성을 확장하는 동시에, 새로운 형태의 정보 격차를 재생산하는 이중성을 드러낸다.
'공공 AI 접근권'이 중요한 이유와 법적·정책적 토대
도서관의 존립 근거 중 하나는 모두에게 평등한 정보 접근권 제공에 있다. AI 시대에 이 가치는 ‘공공 AI 접근권’으로 확대해야 한다. 이는 경제적·신체적·지역적 차이에 상관없이 모든 국민이 AI 기술의 편익을 누릴 수 있도록 해야 함을 의미한다. 우리나라의 경우는 AI를 넘어서 디지털 기술 전체를 대상으로 한 디지털 포용법([시행 2026. 1. 22.][법률 제20672호, 2025. 1. 21., 제정])을 시행하고 있다. 이 법은 장애인과 고령자뿐만 아니라 디지털 사용에 어려움을 느끼는 전 국민을 포용의 대상으로 정의하고 있다. 특히 공공기관이 지능정보 서비스를 도입할 때 사전에 취약계층의 소외 가능성을 점검하는 ‘디지털 포용 영향 평가’를 의무화하고 있다는 점에서 의의가 크다. OECD(2024)가 ‘권리 중심의 디지털 전환 형성(Shaping a rights-oriented digital transformation)’ 정책 보고서에서 강조한 내용과 일치한다. 이 보고서는 정책 입안자들이 디지털 전환을 형성할 때 사람을 중심에 두어야(puts people at the centre) 함을 강조했다.
공공 AI 접근성이 마련된 도서관, chat gpt 이미지 생성
빅테크 독점 대응을 위해 필요한 공공 LLM 인프라
특히, 현재 디지털 기술의 정점에 있다고 할 수 있는 AI, 그중에서도 거대언어모델(LLM)은 소수 빅테크 기업의 전유물처럼 보인다. 하지만 상용 모델에만 의존하는 구조는 공공 지식 정보의 독립성을 심각하게 위협할 수 있다. 상용 모델은 높은 이용 비용과 데이터 외부 유출이라는 보안 리스크를 안고 있다. 특히 다양한 사회에 존재하는 고유한 문화적 맥락이나 공공 서비스의 복잡한 절차를 충분히 이해하지 못하는 경우가 있을 수 있다(한국지능정보사회진흥원, 2025).
따라서 우리는 모두에게 공평하게 접근 가능하고 신뢰할 수 있는 데이터와 서비스를 보장하는 공적 AI 인프라가 필요하다. 이런 인프라, 즉 공공 LLM 생태계 구축은 전담 기관과 별도 특화 서비스를 구성하는 것도 가능하다. 하지만 이런 식의 접근이 지속성을 보장할 수 있는가는 한번 고려해볼 필요가 있다.
여기서 우리는 도서관 생태계를 다시 생각해볼 필요가 있다. 도서관은 이미 공정한 정보 접근권을 제도적으로 보장해온 대표적인 공적 인프라이며, 장서와 데이터베이스, 디지털 콘텐츠, 지역 아카이브 등 다양한 지식정보 자원을 장기적으로 수집·조직·보존·제공해온 축적된 운영 체계를 갖추고 있다. 또한 도서관은 상업적 이해관계로부터 상대적으로 독립된 공공기관으로서, 정보의 신뢰성과 중립성을 유지하기 위한 규범과 전문성을 오랫동안 발전시켜왔다. 이런 제도적 기반과 전문 인력, 그리고 전국적 네트워크는 단순한 서비스 플랫폼을 넘어 지속 가능한 공공 AI 인프라의 토대이다. 공공 LLM 생태계를 별도의 전담 기관이나 단기 프로젝트 형태로 구축하는 방안도 고려할 수 있으나, 장기적 안정성과 사회적 신뢰를 확보하기 위해서는 이미 공적 책임과 운영 경험을 축적해온 도서관 체계와의 연계 속에서 그 가능성을 모색하는 것이 보다 현실적인 접근일 수 있다.
도서관 중심의 공공 AI 생태계 모델과 국내외 사례
도서관이 인공지능 시대에 발맞춰 진화하는 모습은 다양한 방식으로 나타나고 있다. 이들 사례는 크게 세 가지 유형으로 구분할 수 있다. 첫째는 국가 차원의 공공 AI 데이터·LLM 인프라 구축형 모델, 둘째는 도서관 기반의 AI 서비스 혁신형 모델, 셋째는 연구·학술 협력형 AI 활용 모델이다. 이러한 유형화는 공공 LLM 생태계가 단일 모델 개발을 넘어, 데이터 수집·개방·서비스·연구를 포괄하는 다층적 구조임을 보여준다.
가장 먼저 주목할 것은 국가 단위에서 공공 AI 학습 인프라를 구축하려는 시도이다. 국립중앙도서관은 ‘2026년 주요 업무 추진 계획’을 통해 미래형 도서관으로의 대전환을 선언했다. 가장 주목할 부분은 저작권 문제가 없는 방대한 지식 자원을 ‘고품질 AI 학습용 데이터’로 구축해 국가적 AI 모델 개발을 지원하고, 이를 누리집 내 ‘공유 서재’를 통해 국민에게 개방하는 전략이다(국립중앙도서관, 2026). 이는 도서관이 단순한 자료 제공 기관을 넘어, 국가 AI 생태계의 기초 데이터 인프라를 담당하는 기관으로 역할을 확장하고 있음을 보여준다.
해외에서도 유사한 흐름이 나타난다. 프랑스 정부는 ‘compar:IA’라는 공공 LLM 플랫폼을 운영하고 있다. 이는 기존 거대언어모델(LLM)의 학습 및 인간 선호도 데이터가 지나치게 영어에 편중되어 있어, 타 언어 환경에서 발생하는 성능 저하와 문화적 편향 문제를 극복하기 위해 만들어졌다. 주로 프랑스어 사용자를 대상으로 대규모의 프롬프트 및 인간 선호도 데이터를 수집해 AI 생태계에 개방하는 것을 목표로 한다(compar:IA, 2026). 이 사례는 공공이 데이터 수집과 모델 개선 과정에 직접 개입함으로써 언어적·문화적 주권을 확보하려는 시도라는 점에서 의미를 갖는다.
이 두 사례는 공공 LLM 생태계의 기반이 ‘공공 데이터 인프라’임을 분명히 보여준다. 모델의 성능은 학습 데이터의 질과 범위에 좌우되며, 도서관과 국가 기관은 그 데이터의 공공성을 담보할 수 있는 제도적 기반을 이미 갖추고 있다.
두 번째 유형은 도서관이 AI를 활용해 이용자 경험을 재구성하는 서비스 혁신 사례이다. 국립중앙도서관이 추진 중인 ‘책에서 답을 찾는 인공지능 검색’ 서비스는 이용자가 질문하면 도서의 본문 내용에서 정확한 근거를 찾아 답변을 제공하는 방식으로 정보 탐색의 패러다임을 변화시키고 있다. 이는 단순한 챗봇 서비스가 아니라, 도서관 소장 자원을 기반으로 한 신뢰 가능한 응답 체계를 구축하려는 시도라는 점에서 의미가 있다.
싱가포르 국립도서관위원회(NLB)는 생성형 AI를 고전문학 게임과 결합한 ‘플레이브러리(Playbrary)’를 통해 디지털 세대에게 독서의 즐거움을 전파하고 있다(National Library Board, 2024). 이 서비스는 AI를 단순한 정보 제공 도구로 사용하는 데 그치지 않고, 독서 참여와 문화 경험을 확장하는 매개로 활용한다는 점에서 주목할 만하다.
이러한 사례들은 공공 LLM 생태계가 반드시 거대 모델 자체를 직접 개발하는 것만을 의미하지 않음을 보여준다. 도서관은 이미 보유한 자원과 결합해, 공공 데이터에 기반한 신뢰 가능한 AI 응답 환경을 설계할 수 있다.
세 번째 유형은 도서관이 연구 기관으로서 AI를 활용해 학술적 분석의 지평을 확장하는 사례이다. 영국국립도서관은 사서의 안목과 머신러닝을 결합한 ‘Living with Machines’ 프로젝트를 통해 역사 사료 분석의 새로운 가능성을 모색하고 있다(Ridge, 2024). 이 프로젝트는 인간 전문가의 해석과 알고리즘 분석을 결합하는 방식으로, 디지털 인문학 연구의 새로운 모델을 제시한다.
이 사례는 공공 LLM 생태계가 단지 서비스 차원을 넘어 지식 생산 과정 자체에 개입할 수 있음을 보여준다. 도서관은 오랫동안 자료의 수집과 보존을 담당해왔지만, 이제는 데이터 기반 연구를 촉진하는 지식 허브로 기능할 수 있다.
AI 시대 사서의 역할, 그리고 정보 민주주의를 실현할 장으로서의 도서관
기술이 아무리 고도화되어도 지식의 가치를 판단하고 윤리적 균형을 잡는 것은 결국 인간의 몫이다. IFLA(2025)는 도서관이 AI 서비스 개발부터 리터러시 교육, 정책 옹호에 이르기까지 6단계의 영향력을 행사해야 한다고 강조한다(Cox & De Brasdefer, 2025). 필자는 이 과정에서 사서의 역할이 ‘데이터 큐레이터’이자 ‘알고리즘의 감시자’로 재정의되어야 한다고 믿는다. 사서는 단순히 책을 찾아주는 것을 넘어, 인공지능이 학습하는 데이터가 얼마나 공정하고 대표성을 갖는지 감시해야 한다. 또한 이용자들이 인공지능의 화려한 답변 속에 숨겨진 편향성을 읽어낼 수 있도록 돕는 ‘비판적 가이드’가 되어야 한다. 도서관 전문직으로서 우리가 지켜야 할 가치는 ‘효율성’ 그 자체가 아니라, 그 효율성이 ‘공공의 선’을 향하게 만드는 지혜이기 때문이다.
공공 AI 접근권은 단순히 누구나 AI를 사용할 수 있게 하는 문제가 아니다. 이는 AI 학습 데이터, 작동 알고리즘, 제공 서비스의 방향이 공공의 가치로 통제하고 설명할 수 있는가에 대한 문제이다. 앞서 살펴본 것처럼 공공 LLM 생태계는 공공 데이터 인프라의 구축, 도서관 기반 서비스 혁신, 그리고 연구·학술 협력의 확장이라는 다층적 구조 속에서 존재한다. 이 세 층위는 각각 독립적이 아니라 공공성이 제도화되는 서로 다른 접점으로 볼 필요가 있다.
이 점에서 공공 LLM 생태계란 ‘공공이 소유한 모델’을 의미하지 않는다. 그것은 공공이 데이터 생산과 관리에 참여하고, 서비스 설계의 원칙을 정하며, 알고리즘의 작동 방식을 감시할 수 있는 지능 체계를 뜻한다. 도서관은 오랫동안 지식의 수집 기관이었지만, 이제는 지식 형성 과정에 개입하는 기관으로 변모해야 한다. 어떤 데이터를 학습에 포함시키고 어떤 정보를 우선적으로 노출할 것인지에 대한 판단은 기술 문제가 아니라 공공성의 문제이기 때문이다.
결국 질문은 단순하다. 우리는 AI를 소비할 것인가, 아니면 설계할 것인가. 공공 AI 접근권을 선언하는 사회는 후자를 선택해야 한다. 그리고 공공 데이터 인프라의 관리자로서, 신뢰 가능한 서비스 설계자로서, 연구 협력의 허브로서 도서관이 그 중심에 설 때, AI는 비로소 정보 민주주의의 기반 위에서 작동할 수 있다.
박진호_한성대 크리에이티브인문대학 지식정보문화트랙 교수
한성대 크리에이티브인문대학 지식정보문화트랙에서 교수로 재직중이다. 한국예술종합학교와 국립중앙도서관에서 사서로 근무했다. 주요 연구 관심사는 오픈 데이터와 시맨틱 웹이며, 정보기술 관련 주제 강의를 진행하고 있다.
새로운 시대의 거점이 왜 도서관이어야 하는가?The Liverary는 2025년 6월 4일 새정부 출범을 기해 새정부에 바라는 도서관 정책, 도서관 인들이 향후 논의해야 할 이슈와 아젠더를 제안하는 전문가 칼럼 코너를 마련하였다. 문헌정보학자, 현직 도서관 사서, 협회장 등 총 네 분의 필자가 참여하는 이 칼럼을 통해 도서관이 AI 시대 지식정보의 허브
LLM 시대, 텍스트의 외형적 설득력과 내용의 진실성은 별개대규모 언어모델(LLM, Large Language Model)의 등장은 인간이 언어를 기반으로 지식을 구성해온 방식에 근본적인 질문을 던지고 있다. 전통적으로 언어는 지식 전달의 매개이자 세계를 이해하는 창구로 인식되었다. 그러나 오늘날의 LLM은 언어를 이해하기보다는, 수많은 텍스트에서 추출된
예술 분야의 AI 활용2022년 미국 콜로라도주 박람회 미술대회에서 AI가 생성한 그림이 1등상을 수상했다. 제이슨 앨런이라는 참가자가 ‘미드저니(Midjourney)’라는 AI 프로그램으로 만들어낸 디지털 회화 작품 〈스페이스 오페라 극장〉이 그 주인공이다. 이 작품의 우승 소식이 알려지자 예술가들과 대중 사이에서는 ‘예술의 죽음’, ‘창작 일자리의