文本检测漏行问题 #14460
Replies: 2 comments
-
看上去是字体有部分歪曲和模糊,可以通过预处理(比如二值化,图像缩放和归一化、图像增强)或者标注数据再训练的方式提高识别精度 |
Beta Was this translation helpful? Give feedback.
-
根据问题描述,您遇到了在使用 PaddleOCR 进行文本检测时漏掉某些行(例如顶部的“APP 金东纸业……”)的问题。这种情况在复杂布局或者文本区域较小的图片中较为常见。以下是一些可能的解决方案和优化建议: 1. 调整检测模型参数PaddleOCR 提供了多个参数来调整检测效果,您可以尝试以下方法:
2. 使用更强大的检测算法PaddleOCR 支持多种检测算法,例如
3. 图片预处理图片质量对 OCR 的检测效果有很大影响,尝试以下操作:
4. 启用角度分类器角度分类器可以帮助更好地识别倾斜文本。如果未启用,请确保设置 paddleocr = PaddleOCR(
lang='ch',
use_angle_cls=True, # 启用角度分类器
det_model_dir='../weights/ch_PP-OCRv4_det_infer',
rec_model_dir='../weights/ch_PP-OCRv4_rec_infer'
) 5. 检查图片分辨率PaddleOCR 默认的 paddleocr = PaddleOCR(
lang='ch',
det_limit_side_len=1920 # 增大图片限制长度
) 6. 参考社区讨论在 PaddleOCR Discussions 中,有用户反馈了类似的“文本漏检”问题,建议您参考以下解决方案:
总结根据您的描述,漏检可能是由于默认参数设置不适合您的具体场景。建议依次尝试以下方法:
如果仍有问题,欢迎在 PaddleOCR Issues 提交详细的反馈。 Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
-
🔎 Search before asking
🐛 Bug (问题描述)
例如上图,不管是用v3还是v4的文本检测里会漏掉最上面的“APP 金东纸业。。。”那一行
🏃♂️ Environment (运行环境)
paddleocr=2.9.2
paddlepaddle=3.0.0b1
🌰 Minimal Reproducible Example (最小可复现问题的Demo)
初始化 PaddleOCR
paddleocr = PaddleOCR(lang='ch', use_angle_cls=False, show_log=True,
det_model_dir='../weights/ch_PP-OCRv4_det_infer',
rec_model_dir='../weights/ch_PP-OCRv4_rec_infer'
)
Beta Was this translation helpful? Give feedback.
All reactions