paddleocr如何支持返回单个字以及单个字的坐标？ #13857

qianliyx · 2024-09-12T06:05:06Z

qianliyx
Sep 12, 2024

Name: paddleocr
Version: 2.8.1

Sep 12, 2024

设置：return_word_box = True时，返回：
[[[26.0, 37.0], [304.0, 37.0], [304.0, 73.0], [26.0, 73.0]], ('纯臻营养护发素', 0.9946897625923157, [46.085826210826205, [['纯', '臻', '营', '养', '护', '发', '素']], [[3, 10, 16, 23, 30, 36, 43]], ['cn']])]

请问这个返回怎么使用，有没有说明，怎么根据这个返回获取单字具体坐标呢？

View full answer

GreatV · 2024-09-12T06:16:54Z

GreatV
Sep 12, 2024
Maintainer

文字识别后返回单字识别坐标 #10377

1 reply

qianliyx Sep 12, 2024
Author

设置：return_word_box = True时，返回：
[[[26.0, 37.0], [304.0, 37.0], [304.0, 73.0], [26.0, 73.0]], ('纯臻营养护发素', 0.9946897625923157, [46.085826210826205, [['纯', '臻', '营', '养', '护', '发', '素']], [[3, 10, 16, 23, 30, 36, 43]], ['cn']])]

请问这个返回怎么使用，有没有说明，怎么根据这个返回获取单字具体坐标呢？

Answer selected by qianliyx

759325100 · 2024-11-27T07:38:08Z

759325100
Nov 27, 2024

使用 #10377 的方案并不能很好的解决这个问题。如场景是影印版本的pdf，这个效果定位会更加不准确。下图是我将CTC返回的col位置索引 * cellWh (cellWh = box-width / col-len）得到的每个字符的初识坐标，不管在中文、符号或数字的情况下，都并未呈现出某种一致的规律，请问CTC返回的这个所谓的位置，底层到底是什么样的逻辑～

1 reply

759325100 Nov 27, 2024

@GreatV 期待您的答复。

SWHL · 2024-12-06T01:19:36Z

SWHL
Dec 6, 2024
Maintainer

可以试试我们在RapidOCR中集成的PaddleOCR单字坐标：https://github.com/RapidAI/RapidOCR/releases/tag/v1.4.0

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

paddleocr如何支持返回单个字以及单个字的坐标？ #13857

{{title}}

Replies: 3 comments 2 replies

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

paddleocr如何支持返回单个字以及单个字的坐标？ #13857

qianliyx Sep 12, 2024

Replies: 3 comments · 2 replies

GreatV Sep 12, 2024 Maintainer

qianliyx Sep 12, 2024 Author

759325100 Nov 27, 2024

759325100 Nov 27, 2024

SWHL Dec 6, 2024 Maintainer

qianliyx
Sep 12, 2024

Replies: 3 comments 2 replies

GreatV
Sep 12, 2024
Maintainer

qianliyx Sep 12, 2024
Author

759325100
Nov 27, 2024

SWHL
Dec 6, 2024
Maintainer