在数字信息以前所未有的速度扩张的时代,图书馆学正面临一场深刻的身份危机。长期以来,我们专业的基石是 " 聚合 " 的艺术——通过标准化的元数据,将纷繁复杂的知识资源整合进一个有序、可检索的宇宙中。然而,Philip Schreur 在其近期的论述中,通过对链接数据与人工智能前沿实践的剖析,无意中揭示了一个更具颠覆性的可能性。这并非简单的技术升级,而是一场潜在的认识论断裂:我们是否正从一个追求普遍化聚合的时代,走向一个致力于特殊化激活的未来?本文认为,一个名为 " 数据反聚合 "(Data Disaggregation)的概念,正是这场断裂的核心标志,它迫使我们重新审视图书馆的权力、实践与伦理根基。
图书馆的聚合传统,源于启蒙运动对普适分类体系的信念。从杜威的十进分类法到资源描述与检索(RDA)的复杂规则,其核心驱动力始终是构建一种能够容纳并组织所有人类知识的 " 元叙事 "。这种模式通过创造标准化的 " 文献替代物 "(bibliographic surrogates)——如图书卡片或 MARC 记录——来简化资源,使其能够被统一管理和发现。
然而,这种看似中立的技术实践,背后隐含着深刻的权力运作。正如福柯所揭示的,任何知识组织系统都是一种权力形式,它通过定义、分类和命名来建构现实,不可避免地划分出中心与边缘。批判性图书馆学(Critical Librarianship)的先驱们早已指出,标准化的主题词表等工具,在追求普遍性的同时,往往会压制、扭曲或直接抹除边缘群体的经验与声音。在聚合的宏大工程中,特殊性常常被视为需要被 " 规范化 " 的噪音。
" 数据反聚合 " 正是对这一传统的直接挑战。它主张将知识单元从其文献载体中释放出来,关注更细颗粒度的 " 事实 " 与 " 声音 ",而非仅仅是文献本身。斯坦福大学的 Black@Stanford 项目便是一个激进的例证。该项目通过训练一个专门聚焦于特定档案语料库的聊天机器人,实现了对 " 声音 " 的彻底反聚合。它不再试图将这份档案整合进一个更大的、由主流叙事主导的知识体系中,而是选择让这份档案直接、独立地 " 为自己发声 "。这标志着一种根本性的转变:从 " 为边缘群体编目 " 转向 " 让边缘群体言说 "。
这一认识论上的断裂,必然引发图书馆实践的剧烈震动。如果 " 激活特殊性 " 成为我们的新使命,那么传统的角色定位与技术架构都将面临重构。
元数据馆员的角色,可能将从 " 规则的守护者 " 转变为 " 语境的建筑师 "。其核心价值不再是精准地应用一套复杂的著录规则,而是进行一种更具创造性和批判性的智力劳动。他们需要审视资源,并追问:这份资源内部最重要的知识节点是什么?这些节点如何与外部知识连接,从而揭示一种被传统分类法所遮蔽的深层关系?——正如斯坦福的另一个项目 " 了解系统性种族主义 "(KSR)所做的那样,它通过链接警察手册、法律文本和新闻报道中的数据点,构建了一个揭示制度性问题的知识图谱。语境建筑师的任务,正是要设计和构建这样的知识网络,通过激活数据间的关联来产生新的洞见。
相应的,支撑图书馆工作的技术系统也需要重新想象。现有的图书馆管理系统(ILS/LSP)本质上是为管理 " 文献替代物 " 的聚合而设计的。未来的系统,则更可能是一个知识图谱与人工智能模型的孵化器,它赋能馆员从数字化馆藏中提取实体、定义关系,并快速部署能够与特定知识领域深度对话的智能服务。
然而,拥抱 " 数据反聚合 " 的范式,也意味着必须直面其带来的全新且更隐蔽的伦理挑战。
首先,是 " 去语境化 " 的风险。将数据从其原始文献中抽离,虽然能够实现灵活的重组与连接,但也可能使其脱离必要的上下文,导致误读甚至被恶意操纵。当我们将不同来源的数据点拼接成一张知识图谱时,如何确保这种连接是负责任的、有依据的,而非一种误导性的 " 数字拼贴谬误 "?这要求我们为知识图谱的构建建立一种兼顾灵活性与语境完整性的新伦理框架。
其次,是 " 真实性 " 的幻觉与算法中介的崛起。AI 聊天机器人创造了一种与档案直接对话的沉浸式体验,但这是一种经过算法中介的 " 真实 "。用户交互的对象,并非原始档案本身,而是大型语言模型对该档案的 " 理解 " 与 " 重述 "。算法的内在偏见、模型的潜在错误(如 " 幻觉 ")构成了一个新的、不透明的权力中介。这就提出了一个严峻的问题:在用算法中介取代传统馆员中介的过程中,图书馆如何确保算法的透明度和信息来源的可追溯性,以维系其作为社会信任基石的核心地位?
最后,是加剧新的 " 数字鸿沟 " 的可能性。构建精细的知识图谱和训练专门的 AI 模型需要巨大的技术与人力投入。这是否意味着只有资源雄厚的顶尖机构才能 " 激活 " 其馆藏,而广大中小型图书馆的资源将继续在旧范式中沉睡,从而在知识网络中变得更加边缘化?开发低成本、可扩展的工具与方法,实现新范式的普惠化,将是决定这场变革能否真正促进信息公平的关键。
结论而言," 数据反聚合 " 不仅是一个技术转向,更是一面镜子,映照出图书馆学专业深层的哲学假设与社会责任。它迫使我们告别那个试图用单一框架容纳一切的旧梦,转而投身于一个更复杂、更具挑战,也更充满可能性的新征程。在这条路上,我们的任务不再是完善一个封闭的体系,而是在一个开放的知识网络中,审慎地、有意识地探索并建立属于未来的知识组织伦理与实践。
Meaningful and Inclusive Access to Information: the Challenges Brought by the Brisbane Declaration to Standardized Metadata in the Context of Linked Data and AI