01 一个没人注意的图书馆幕后
图书馆的AI,大部分人都以为是那个在官网和你聊天的机器人。
不是的。
真正改变图书馆运转效率的AI,藏在读者看不到的地方。
广东省立中山图书馆每年采购新书约30万册。这个数字意味着什么?意味着每天近822本新书要经过分类、编目、贴标签、上架——16道工序,才能到达读者手里。
在传统模式下,人工日均处理量不足300册。一本书从到馆到上架,读者要等3周。
3周是什么概念?一本5月1日上市的新书,读者5月22日才能借到。热点图书的黄金阅读期就这么错过了。
2025年4月23日,央视《朝闻天下》报道了一个数据:广东省立中山图书馆的”采编图灵”系统,将2000册图书的上架时间从20天压缩到了10分钟。
10分钟。20天。2880倍的效率提升。
这个数字,比任何口号都有说服力。
02 “采编图灵”是谁?
“采编图灵”,全称”图书采分编全流程智能作业系统”,英文名 Library Turing。
它的”生日”是2021年5月。但构想早在2019年10月就开始了。
为什么叫”图灵”?致敬艾伦·图灵——计算机科学之父、人工智能概念的奠基人。取名”图灵”,意图很明显:这套系统要做图书馆界的AI里程碑。
“采编图灵”由三个子系统构成:
第一,图书自动化加工系统。 新书到馆后,封面扫描、信息录入、标签打印和粘贴,全部由机器完成。传统需要馆员一本一本地操作,现在流水线自动跑。
第二,图书编目无纸化系统。 这是核心中的核心。编目是图书馆最专业、最耗时的环节——一本书要确定分类号、主题词、著录信息。传统编目员一天处理几十本已经是高效率。系统接手后,通过OCR识别封面信息、自然语言处理提取关键词、自动匹配中图法分类号,整个流程从小时级压缩到秒级。
第三,图书典藏加工及馆藏自动分拣系统。 编目完成后,书需要分配到各个馆藏地点。系统根据预设规则自动分拣,贴好馆藏地标签,送到对应书车。
这三个子系统不是简单的”用机器替代人工”,而是把一条原本需要馆员在各个工位间传递的流水线,变成了全自动的智能产线。
03 四年攻坚,三期建设
“采编图灵”的研发路径很清晰:2019年提出构想,2021年5月一期系统上线,2022年4月第二代系统上线,2023年8月系统全面成熟。
这个节奏说明一件事——它不是一次性交付的成品,而是一个持续迭代的产品。
一期(2021年):实现了图书自动化加工的核心流程。封面扫描、标签打印和粘贴、基础信息录入。这个阶段的目标是”把机械劳动自动化”。
二期(2022年):上线编目无纸化系统和典藏加工系统。编目环节实现数字化,馆员不再需要手写编目卡片、手动录入MARC数据。系统自动抓取书目信息,馆员只需审核确认。
三期(2023年):系统全面整合,馆藏自动分拣系统上线。从新书到馆到自动分拣到对应书车,全流程打通。2000册书10分钟完成的成绩,就是这个阶段的成果。
每一期建设都对应着一个明确的问题:一期解决”慢”,二期解决”乱”,三期解决”通”。
04 技术栈解剖
“采编图灵”背后的技术,不是单一的AI模型,而是一套组合拳。
机器视觉(Computer Vision): 图书封面扫描和信息提取。系统通过高清摄像头捕捉封面图像,利用OCR技术识别书名、作者、出版社等元数据。传统编目员需要逐字录入的信息,机器看一眼就完成了。
自然语言处理(NLP): 核心引擎之一是BERT-BiLSTM-CRF混合模型。BERT负责理解语义上下文,BiLSTM捕捉序列特征,CRF做序列标注。这套组合拳用于提取书名中的主题词、判断图书所属学科类别、匹配中图法分类号。
工业自动化: 系统不是纯软件,而是软硬一体。自动传送带、机械臂贴标、自动分拣线——这些工业自动化设备与AI软件系统集成,构成了完整的智能产线。
知识图谱: 编目完成后,图书信息进入馆藏知识图谱。后续的馆藏AI检索服务(2025年7月上线)可以基于知识图谱做关联推荐和思维导图生成。
这个技术架构的核心逻辑是:机器视觉做感知,NLP做理解,工业自动化做执行,知识图谱做连接。
05 数据对比:AI到底省了多少?
说概念不如看数字。以下是基于公开报道整理的数据对比:
| 指标 | 传统模式 | 采编图灵 | 提升幅度 |
|——|———|———|———|
| 日均处理量 | <300册 | 数千册 | 10倍+ |
| 2000册上架周期 | 20天 | 10分钟 | 2880倍 |
| 年采购量 | 30万册 | 30万册 | — |
| 编目工序 | 16道人工 | 全自动 | — |
| 人工介入 | 每本需馆员操作 | 仅审核异常 | 减少90%+ |
注意,这个数据是央视2025年4月报道的。2880倍的效率提升不是实验室数据,是日常运行的实际表现。
广东省立中山图书馆副馆长吴昊在《图书馆论坛》2024年第4期发表的文章中,将”采编图灵”定位为”填补了图书馆文献资源建设领域智慧化应用的空白”。
06 为什么值得关注?
国内图书馆的AI应用,大部分集中在读者服务端:AI馆员问答、智能导览、个性化推荐。这些当然重要,但图书馆的”后台”——采编、典藏、分拣——才是真正的效率瓶颈。
采编是图书馆的”供应链”。一本书能不能快速到达读者手中,取决于采编效率。传统图书馆的采编流程和30年前几乎没有区别:馆员拆包、人工录入、手写分类、逐本贴标。这种模式下,年采购量越大,效率越低。
“采编图灵”的价值不在于”用了AI”,而在于把图书馆的供应链从手工业时代推到了工业时代。
这个意义不亚于电商的智能仓储系统。京东的”亚洲一号”仓库让包裹从下单到出库缩短到分钟级,采编图灵让新书从到馆到上架缩短到分钟级。本质上是同一件事。
07 局限与挑战
当然,”采编图灵”不是万能的。
首先,它处理的是标准化出版物。古籍、地方文献、非书资料——这些需要专业鉴定的资源,仍然依赖人工。广东省立中山图书馆的古籍数字化项目(2025年9月启动),AI只做扫描和初步标引,版本鉴定和价值判断仍由古籍专家完成。
其次,系统对编目数据质量有要求。如果出版社提供的书目数据不完整或不准确,AI的匹配准确率会下降。吴昊在文章中坦言,编目数据质量控制仍是系统运行的难点。
第三,成本问题。软硬一体化的智能产线,初始投入不低。对于年采购量小的地方图书馆,投资回报率未必划算。这也是”采编图灵”目前主要在省级大型图书馆推广的原因。
最后,人的转型。系统上线后,编目员的角色从”操作者”变成了”审核者”。这对馆员的技能要求发生了变化——不是不需要人了,是需要不同能力的人。
08 更大的图景
“采编图灵”只是广东省立中山图书馆AI布局的一部分。
2025年4月,图书馆与超星集团成立了”AI应用联合实验室”。2025年7月,”馆藏AI检索”服务上线,采用了BERT-BiLSTM-CRF混合模型,支持自然语言检索、AI书评、知识图谱推荐。2025年9月,古籍数字化项目启动,AI辅助完成古籍的全文识别和内容标引。
2025年世界读书日,央视报道”采编图灵”时,同期报道了国家图书馆牵头的”全国智慧图书馆体系建设”——全国公共文化数字资源互相联通。
从编目自动化到馆藏AI检索,从古籍数字化到全国资源互联,广东省立中山图书馆的AI路径,展示了一个传统公共图书馆如何系统性拥抱AI的全景。
这套路径的核心不是”用AI替代人”,而是”用AI重构流程”。
2000册书10分钟上架,不是馆员变少了,是馆员不用再做机械劳动了。
这才是AI在图书馆的真正价值。
数据来源:央视《朝闻天下》2025年4月23日报道、光明网2025年9月18日报道、南方+2025年7月21日报道、《图书馆论坛》2024年第44卷第4期
铁三角团队 · 峰哥 | write | tech
共同成长 💪

峰网博客