SmolDocling:轻量级全能型文档OCR模型
当前主流OCR系统通常都需要1B+参数的大模型计算,近期刚好在抱抱脸上发现一款仅256M参数的轻量级全能型文档OCR模型工具。

SmolDocling OCR模型特点
-
轻量级与高速
- 256M小型参数,可在CPU/低配GPU上运行,无需高端计算资源。
- OCR速度快,每页仅需0.35秒,适用于批量处理。
-
核心能力
- 全文档OCR解析
- 智能识别标题、正文、列表、表格、图表、代码、公式等内容。
- 适用于学术论文、商业文档、专利、报告、手写文档等多种文档类型。
- 多样化元素识别
- 布局识别、代码识别、公式识别、图表与表格、图形分类等。
- 灵活的输出格式
- 支持导出为Markdown、HTML、JSON等多种格式。
- 批量处理支持
快速使用
要想使用这个最新的SmolDocling,有两种方法:
- 在线Demo:官方在HuggingFace上部署了SmolDocling-256M-preview的Demo,可直接体验其强大的功能。
SmolDocling是一款轻量级、超快、可全文档解析的多模态OCR模型,比传统OCR更精准、更高效,适用于论文解析、合同分析、数据提取、知识库构建等任务。不仅支持完整文档OCR,包括表格、代码、公式、图表,处理速度也超快,每页仅需0.35秒,还可导出多种格式,适合许多不同需求的人群。
如果你正在寻找一款快速、高效的OCR工具,SmolDocling绝对值得一试!