Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

语种检测准确率很差 #3323

Open
wqw547243068 opened this issue Dec 11, 2024 · 5 comments
Open

语种检测准确率很差 #3323

wqw547243068 opened this issue Dec 11, 2024 · 5 comments
Assignees

Comments

@wqw547243068
Copy link

wqw547243068 commented Dec 11, 2024

语种识别准确率很低,是用错了吗?

issues/3317 里提到用

系统

  • windows 10, 64位
  • Python 3.11
  • CPU only

工具包

  • paddleclas 2.6.0
  • paddleocr 2.9.1
  • paddlepaddle 2.6.2

功能:

  • 输入图片,识别语种

代码:

import paddleclas

file_name = r"E:\ocr\data\hand\3.jpg"

lang_model = paddleclas.PaddleClas(model_name="language_classification")
result = lang_model.predict(input_data=file_name)
result = list(result)
lang_type = result[0][0]['label_names'][0]
print('语言类型为:',lang_type)

随机检测5-6张图片,语种识别准确率很差,只有1个识别正确

中文截图被识别为 cyrillic 和 日文

a

[[{'class_ids': [2, 4], 'scores': [0.20747, 0.1695], 'label_names': ['cyrillic', 'japan'], 'filename': 'E:\\ocr\\data\\a.png'}]]

英文影印版截图识别成了 中文繁体、韩文

  • scan
result=[[{'class_ids': [1, 6], 'scores': [0.91424, 0.01366], 'label_names': ['chinese_cht', 'korean'], 'filename': 'E:\\ocr\\data\\OCR_e2e_img\\scan.png'}]]

中文手写体识别成了 拉丁文、阿拉伯文

01

result=[[{'class_ids': [9, 0], 'scores': [0.3635, 0.1387], 'label_names': ['latin', 'arabic'], 'filename': 'E:\\ocr\\data\\hand\\1.jpg'}]]

多语种图片(中英日法德)被识别成韩文、拉拉丁文

all

[{'class_ids': [6, 9], 'scores': [0.55042, 0.14912], 'label_names': ['korean', 'latin'], 'filename': 'E:\\ocr\\data\\all.jpg'}]
@SWHL
Copy link

SWHL commented Dec 12, 2024

猜测,你这里测试的有问题。输入图像应该是一条条的文本行,而不是整个图像。类似下面这样:

image

@wqw547243068
Copy link
Author

猜测,你这里测试的有问题。输入图像应该是一条条的文本行,而不是整个图像。类似下面这样:

image

对输入图像还有限制?那实用性相当受限了

@SWHL
Copy link

SWHL commented Dec 13, 2024

没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。

@wqw547243068
Copy link
Author

没有啊,这个的输入是文本检测模型的输出。输入一张图像,先过文本检测模型,就得到一条条的文本行图像,再送入这个模型来区分具体语种。

啊,这么用的?那语种检测的意义不大了,更加实用的场景是直接对图片进行语种预判

@SWHL
Copy link

SWHL commented Dec 22, 2024

一张图像中存在多种语言的呢?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants