Open
Description
主要更新要点
- 发布
rapidocr
库,整合onnxruntime
、openvino
、torch
和paddlepaddle
四个推理引擎,大家可按需安装对应的推理引擎来使用。 - 支持torch版本作为推理引擎
- 与PaddleOCR参数部分对齐
- 整理模型到modelscope,纳入版本管理,相应模型自动下载对齐
- 图像缩放策略统一梳理
- 开放文本检测、文本识别和分类的接口,可以依次batch调用
- 支持json输出
- 采用dataclass类来封装函数返回值,简化使用
- 优化输入配置文件,保证可以通过配置文件使用,便于分享参数设置
- 文档添加版本管理
更新主要想法
- 考虑到终端命令行使用有限,且维护有些繁琐,新版本会弱化终端部分代码,仅保留快速验证代码。
进度:
- 2025-02-18: 整理pytorch版本到rapidocr中;添加自动下载字体文件功能;添加对命令行执行的单元测试
- 2025-02-14: 完善各个引擎下模型自动下载并调用功能
- 2025-02-13: 优化logger,解决重复输出问题
- 2025-02-12: 添加已有模型的自动下载功能
- 2025-02-11: 优化初始化RapidOCR传参问题
- 2025-02-10: 采用抽象基类,统一四个推理引擎代码接口
- 2025-02-08:
- 将PP-OCRv4所有模型均转换并托管在modelscope上
- 将推理引擎部分单独出来,声明基类,统一不同模态间的调用方式
现有更新分支:develop
欢迎参与进来。
Activity