olmOCR 又一ocr神器来了
发布时间:2025-08-12 11:03:30
olmOCR 又一ocr神器来了
一个将 PDF 和其他基于图像的文档格式转换为干净、可读的纯文本格式的工具包
功能:
将基于 PDF、PNG 和 JPEG 的文档转换为干净的 Markdown
支持公式、表格、手写内容和复杂格式
自动移除页眉和页脚
转换为具有自然阅读顺序的文本,即使存在图表、多栏布局和嵌入内容也是如此
高效,每百万页转换费用不到 200 美元
基于一个 7B 参数的 VLM(因此需要 GPU)