xChar

SmolDocling:轻量级全能型文档OCR模型

当前主流OCR系统通常都需要1B+参数的大模型计算,近期刚好在抱抱脸上发现一款仅256M参数的轻量级全能型文档OCR模型工具。

image

SmolDocling OCR模型特点

  • 轻量级与高速

    • 256M小型参数,可在CPU/低配GPU上运行,无需高端计算资源。
    • OCR速度快,每页仅需0.35秒,适用于批量处理。
  • 核心能力

    1. 全文档OCR解析
      • 智能识别标题、正文、列表、表格、图表、代码、公式等内容。
      • 适用于学术论文、商业文档、专利、报告、手写文档等多种文档类型。
    2. 多样化元素识别
      • 布局识别、代码识别、公式识别、图表与表格、图形分类等。
    3. 灵活的输出格式
      • 支持导出为Markdown、HTML、JSON等多种格式。
    4. 批量处理支持
      • 可一次性处理多个文档,适合大规模数据转换。

快速使用

要想使用这个最新的SmolDocling,有两种方法:

  • 在线Demo:官方在HuggingFace上部署了SmolDocling-256M-preview的Demo,可直接体验其强大的功能。

SmolDocling是一款轻量级、超快、可全文档解析的多模态OCR模型,比传统OCR更精准、更高效,适用于论文解析、合同分析、数据提取、知识库构建等任务。不仅支持完整文档OCR,包括表格、代码、公式、图表,处理速度也超快,每页仅需0.35秒,还可导出多种格式,适合许多不同需求的人群。

如果你正在寻找一款快速、高效的OCR工具,SmolDocling绝对值得一试!

Loading comments...