🖼 功能:
- 支持纯文本、格式化文本、细粒度、多裁剪和多页OCR
- 识别非文本数据:图表、表格、数学公式、乐谱和几何图形
- 实现了0.972的BLEU文本识别得分
✨ 亮点:
- 统一模型处理多样的OCR任务(文本、公式、音乐等)
- 体积紧凑(1.43GB)且表现达到业界顶尖水平
- 支持动态分辨率和交互式OCR功能
🚀 资源:
📖 博客:点击访问博文详情
免费体验:[Hugging Face Space]
代码仓库:[GitHub]
模型下载:[Hugging Face 模型]
💡 描述:
GOT-OCR 2.0是一个前沿的OCR框架,旨在处理从传统文本到复杂非文本数据的广泛识别任务。凭借其统一的架构和先进的功能,该框架提供了杰出的准确性和效率,是开发者和研究人员的多功能工具。该模型是开源的,并经过优化以便于实际部署。
📢 频道 ✈️ 群聊 📬 投稿 💵 商务
via AI绘画|AI视频 | AI音乐 - Telegram Channel