Mistral AI 推出 Mistral OCR API：宣称最快最准光学字符识别，千页 1 美元

3月7日发布 /正在检测是否收录...

0 64 11

3 月 7 日消息，Mistral AI 当地时间 6 日宣布推出 Mistral OCR API，并宣称该 API 在 OCR 光学字符识别领域具有最佳表现。

▲ 左为原文件，右为识别结果

Mistral AI 表示这一 API 具备优秀的多模态文档处理能力，能从 PDF、幻灯片、数学表达式、LaTeX 学术文档等复杂文档元素中提取文本内容，所得结果将以 Markdown 文件的形式清晰呈现。

Mistral OCR 模型可解析、理解和转录数千种脚本、字体和语言。根据 Mistral AI 给出的数据，该模型现有版本在识别中的表现优于谷歌 Document AI、微软 Azure OCR、OpenAI GPT-4o 等一系列竞争者。

▲ 左为原文件，右为识别结果

Mistral AI 已将 Mistral OCR 作为其 Le Chat 聊天机器人的默认文档理解模型，该 API 的定价为每千页 1 美元（备注：当前约 7.2 元人民币），单节点每分钟可处理 2000 页，这一模型已被用于历史文化遗产保护等场景。

该内容转自IT之家

本文共 243 个字数,平均阅读时长 ≈ 1分钟

喜欢就支持一下吧

本站为个人博客，博客所发布的一切破解补丁、注册机和注册信息及软件的文章仅限用于学习和研究目的。

不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。

本站信息来自网络，版权争议与本站无关，您必须在下载后的24个小时之内从您的电脑中彻底删除上述内容。

访问和下载本站内容，说明您已同意上述条款。

本站不贩卖软件，所有内容不作为商业行为。如果有侵犯您的权益请点击“关于”联系WFXL，核实后会及时删除