在人工智能(AI)深刻重塑知识生产与组织方式的时代,图书馆界面临着一场前所未有的变革。各类AI工具正以前所未有的速度渗透到元数据创建的各个环节,然而,业界普遍缺乏一个统一的、体系化的框架来评估、部署和管理人机协作的复杂模式。这种理论的缺失导致实践中的探索往往是零散的、缺乏战略指导的。为应对这一挑战,本文提出一个名为“图书馆元数据创建量表”(Library Metadata Creation Scale - LMCS)的全新概念模型,旨在为这场变革提供一个清晰的分析坐标。
生成式人工智能(Generative AI)的崛起,给图书馆元数据领域带来了范式级的冲击。它既预示着前所未有的效率提升与服务创新的可能性,也同时引发了业界对于元数据质量、学术诚信及专业角色定位的深刻忧虑。在实践中,围绕AI工具的讨论往往迅速陷入一种两极化的困境:要么是坚守传统、拒绝任何AI介入的“全手动”模式,要么是拥抱技术、追求极致效率的“全自动”愿景。这种非此即彼的二元对立,不仅无助于解决现实问题,反而加剧了从业者的焦虑与决策的混乱。
“图书馆元数据创建量表”(LMCS)正是在这一背景下被构想和提出的。其核心目的在于超越“允许或禁止”的简单化论断,为图书馆界提供一个更精细、更具操作性的结构化框架。该框架旨在为管理者、编目员和技术开发者提供一种通用语言,用以清晰地定义和沟通在不同场景下人机协作的边界、模式与责任。其理论构建主要基于以下几点考量:
综上所述,LMCS旨在成为一个集诊断、规划与沟通功能于一体的战略工具。它不仅为当下的实践提供指导,更重要的是,它试图将关于AI的讨论从一种以“威胁”和“替代”为核心的防御性话语,重塑为一种以“协同”、“增强”和“职业演进”为核心的建设性对话。
该量表将元数据创建中的人机协作模式,从完全依赖人类智力到完全由机器自主运行,划分为五个递进的等级。
| 等级 (Level) | 名称 (Name) | 核心描述 (Core Description) | 关键要求与编目员责任 (Key Requirements & Librarian's Responsibility) | 典型应用场景 (Typical Application Scenarios) |
|---|---|---|---|---|
| 1 | 人工原始编目 (Original Cataloging) | 元数据记录完全由编目员手动创建,不使用任何AI生成工具。编目员依赖RDA、MARC21、LCSH等传统工具和标准。 | 编目员对记录的每一个字段的准确性、完整性和合规性负全部责任。 这是传统编目工作的基准。 | - 为独特馆藏(如手稿、档案、学位论文)进行原始编目。 - 创建国家书目或权威机构的高标准“黄金”记录。 - 培训新编目员掌握编目基础规则和思维。 |
| 2 | AI辅助建议 (AI-Assisted Suggestion) | AI作为咨询工具,为特定字段提供建议或选项,但不直接生成完整记录。 | 编目员负责批判性地评估所有AI建议,做出最终选择,并手动完成记录。 AI是辅助思考的工具,编目员仍是记录的唯一创作者。 | - AI根据题名、摘要或全文推荐主题词(LCSH/FAST)或分类号(DDC/LCC)。 - AI从文本中提取可能的关键词或实体(人名、地名)。 - AI建议适用的MARC字段标签。 |
| 3 | AI辅助增强与清理 (AI-Assisted Enhancement & Cleanup) | AI对一个已存在的、不完整的或低质量的记录(如供应商记录、简编记录)进行增强、修正或格式化。 | 编目员提供初始记录,并必须审查AI的所有修改,确保其准确性、未改变核心语义,并符合本地政策。 编目员的角色是“编辑”和“校对者”。 | - 自动校正MARC记录中的标点符号和子字段代码。 - 根据权威文档(如VIAF)自动规范化人名、团体名称。 - 自动将缩写词展开或将摘要翻译成另一种语言。 - 丰富记录,如根据内容自动添加内容附注(505字段)。 |
| 4 | 机器生成记录,人工审核 (Machine-Generated Record, Human Review) | AI根据资源本身(如扫描的文本、PDF文件、音视频)自动生成一个完整的、待审核的元数据记录。 | 编目员的核心职责从“创建”转变为“审核与验证”。 必须仔细检查AI生成的初步记录,修正错误、补充遗漏,并最终批准。这是人机协作的主要模式。 | - 对大批量电子书或期刊文章进行快速编目,AI自动提取作者、标题、ISBN、摘要等。 - 为数字化图像集合自动生成描述性元数据(如识别图像内容、提取EXIF数据)。 - 将非结构化的书目信息(如参考文献列表)转换为结构化的MARC记录。 |
| 5 | 全自动元数据生成 (Fully Automated Metadata Generation) | AI自主完成元数据的创建、验证和入库流程,仅在遇到无法处理的异常或置信度低的情况时才触发人工干预。 | 编目员的角色转变为“系统管理者”和“质量监控者”。 负责配置AI规则、监控系统整体性能、定期抽样审计记录质量,并处理AI上报的疑难问题。 | - 实时处理大规模的出版商数据流或开放获取资源库,自动生成元数据并加载到发现系统。 - 为机构知识库中的提交内容(如预印本)自动创建元数据记录。 - 对用户生成内容(如照片、视频)进行自动标签和分类。 |
LMCS的价值远不止于其作为操作指南的实用性,更在于它是一个理论棱镜,折射并试图调和图书馆专业内部长期存在的根本性张力,并由此推导出一条逻辑严谨的职业重塑路径。
LMCS的五个等级,并非简单的技术阶梯,而是对图书馆编目史上核心理论辩论的系统化编码与回应。这场辩论的核心,始终围绕着“规范理想”与“效率现实”之间的张力。
“规范理想”的传承与限定:LMCS的1-2级,是查尔斯·阿米·卡特(Charles Ammi Cutter)“书目对象”(Bibliographic Objectives)原则在当代的直接体现。它追求为每一份资源创造一份尽善尽美的记录,强调人类智力在语义理解、知识关联和权威控制中的核心作用。这种“工匠精神”是图书馆专业性的基石,确保了核心馆藏和高价值知识资产的深度揭示。然而,LMCS框架也清醒地认识到,将此理想应用于所有资源,在信息爆炸时代既不现实也无必要。它通过将这种模式限定在特定场景(如珍本、手稿),从而保护了其价值,避免了其被无限泛化而导致的体系崩溃。
“效率现实”的整合与升华:LMCS的3-5级,则吸收并发展了档案馆界“多产出,少流程”(More Product, Less Process, MPLP)的现实主义思想。MPLP承认,对于海量积压的馆藏,“足够好”的元数据远胜于没有元数据。LMCS将这一原则从一种应对积压的权宜之计,提升为一种主动的、分级的战略选择。它不再是“完美”的对立面,而是构成了一个与“完美”互补的、服务于不同信息发现需求的策略组合。
更重要的是,LMCS标志着一个根本性的理论转变:从“书目控制”(Bibliographic Control)走向“书目治理”(Bibliographic Governance)。传统的“书目控制”强调的是一种中心化的、由机构主导的、对单条记录的权威性生产与把关。而在LMCS框架下,图书馆的角色转变为一个元数据生态系统的“治理者”。“治理”意味着:图书馆不再是所有元数据的唯一生产者,而是人、机器、供应商、甚至是用户生成内容等多元生产主体的协调者。其核心任务从“创建”转变为设计和监督一个可信的、质量可控的、人机协同的元数据生产体系。这是一种更高维度的控制,一种基于规则、策略和质量审计的系统性治理。
基于上述理论辨析,LMCS为图书馆员的职业演进描绘了一条清晰的实践路径,其本质是一场深刻的“专业管辖权”(Professional Jurisdiction)转移,并可能催生组织形态与服务范式的变革。
这种演进预示着技术服务部门的组织变革,即从一个基于任务同质化的“生产线”模式,转变为一个基于LMCS等级和资源类型的“项目组合管理”(Portfolio Management)模式。不同的团队将专注于不同的LMCS层级,形成一个由“特藏编目专家”(1-2级)、“数据增强与质量控制团队”(3-4级)和“元数据策略与系统分析师”(5级)组成的、功能互补的专业生态。
作为一个理论模型,LMCS的优雅简洁背后也潜藏着值得警惕的风险。一种批判性的审视揭示了其在实践中可能面临的四大核心挑战。
“图书馆元数据创建量表”(LMCS)为我们提供了一个审视和导航AI时代元数据实践的有力工具。但它更重要的意义在于,它迫使我们直面行业的核心矛盾,并重新思考图书馆员的专业价值。
未来的道路并非在“全手动”和“全自动”之间做出二元选择。真正的挑战在于,图书馆员能否超越单纯的规则执行者,成为人机协同系统的批判性设计者和伦理守护者。这意味着,我们既要拥抱自动化带来的效率,更要捍卫深思熟虑的人类判断、维护知识表述的公平性,并确保专业智慧在新的技术生态中得以传承和升华。唯有如此,我们才能在智能时代,真正驾驭技术,而非被技术所定义。