AI 绘图 | AI 视频 | AI 音乐

分享AI绘画、AI视频相关资源与技巧。同时也会分享图像处理与视频处理相关的资源与技巧。

🎯 名称: GOT-OCR 2.0 - 统一的端到端OCR框架

2025-02-05

🎯 名称: GOT-OCR 2.0 - 统一的端到端OCR框架

🎯 名称: GOT-OCR 2.0 - 统一的端到端OCR框架

🖼 功能:
- 支持纯文本、格式化文本、细粒度、多裁剪和多页OCR
- 识别非文本数据:图表、表格、数学公式、乐谱和几何图形
- 实现了0.972的BLEU文本识别得分

✨ 亮点:
- 统一模型处理多样的OCR任务(文本、公式、音乐等)
- 体积紧凑(1.43GB)且表现达到业界顶尖水平
- 支持动态分辨率和交互式OCR功能

🚀 资源:
📖 博客:点击访问博文详情
免费体验:[Hugging Face Space]
代码仓库:[GitHub]
模型下载:[Hugging Face 模型]

💡 描述:
GOT-OCR 2.0是一个前沿的OCR框架,旨在处理从传统文本到复杂非文本数据的广泛识别任务。凭借其统一的架构和先进的功能,该框架提供了杰出的准确性和效率,是开发者和研究人员的多功能工具。该模型是开源的,并经过优化以便于实际部署。