首页 文章详情

Easyocr | 3行代码识别图片中的任意语言文字

大邓和他的Python | 519 2021-12-18 19:42 0 0 0
UniSMS (合一短信)

模块easyocr支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。

https://github.com/JaidedAI/EasyOCR


安装

!pip3 install easyocr==1.4.1

快速上手

首次使用easyocr识别图片,会自动从网络中下载预训练模型。下载耗时较长,而且大概率遇到URLError错误,推荐下载模型文件,手动放置于指定位置。

- Windows:  C:\Users\用户名.EasyOCR\model
- Linux&Mac: ~/.EasyOCR/model

easyocr_model.zip链接:https://pan.baidu.com/s/1uZS7SZTDWno0arTLk2G3Bg  密码:wn7q

下载easyocr_model.zip解压, 内部有三个文件。将其复制粘贴于model(上面的路径)中。操作如图

下图是测试图片,含中英文


import easyocr
reader = easyocr.Reader(['ch_sim''en'], 
                        gpu=False
                        download_enabled=False# this needs to run only once to load the model into memory

result = reader.readtext('examples/chinese.jpg')
result

Run

[([[86, 80], [134, 80], [134, 128], [86, 128]], '西', 0.6629583033293649),
([[189, 75], [469, 75], [469, 165], [189, 165]], '愚园路', 0.9623039316627005),
([[517, 81], [565, 81], [565, 123], [517, 123]], '东', 0.9932548686089291),
([[78, 126], [136, 126], [136, 156], [78, 156]], '315', 0.999992910975279),
([[514, 126], [574, 126], [574, 156], [514, 156]], '309', 0.9999620084121807),
([[79, 173], [125, 173], [125, 213], [79, 213]], 'W', 0.2336996358372403),
([[226, 170], [414, 170], [414, 220], [226, 220]],
'Yuyuan Rd。',
0.8949630587435853),
([[529, 173], [569, 173], [569, 213], [529, 213]], 'E', 0.5179032005942332)]

注意

  • Note-1: ['ch_sim','en'] 是需要导入的语言识别模型,可以传入多个语言模型,其中英语模型en可以与其他语言共同使用。
  • Note-2: 图片可以传入图片路径、也可以传入图片链接。但推荐传入图片路径,会提高识别速度。
  • Note-3: 代码reader = easyocr.Reader(['ch_sim','en'])首次运行耗时特别久,时间主要消耗在下载与导入。后续调用reader时就不会这么慢了。
  • Note-4: 设置detail=0可以简化输出结果

result2 = reader.readtext('examples/chinese.jpg', detail=0)
result2

Run

['西', '愚园路', '东', '315', '309', 'W', 'Yuyuan Rd。', 'E']


近期文章

视频专栏课 | Python网络爬虫与文本分析

如何在DataFrame中使用If-Else条件语句创建新列

BERTopic 主题建模库 | 建议收藏

Top2Vec | 主题建模和语义搜索库

案例实战 | 企业信息数据采集

KeyBERT库 | 自动挖掘文本中的关键词

SmartScraper | 简单、自动、快捷的Python网络爬虫

SHAP | 机器学习模型解释库

ashares库 | A股市场历史行情数据

Backtrader库 | 均线买入卖出策略实现

读完本文你就了解什么是文本分析

文本分析在经管领域中的应用概述

综述:文本分析在市场营销研究中的应用

在会计研究中使用Python进行文本分析

文本分析方法在《管理世界》(2021.5)中的应用

hiResearch 定义自己的科研首页

SciencePlots | 科研样式绘图库

Wow~70G上市公司定期报告数据集

漂亮~pandas可以无缝衔接Bokeh  

YelpDaset: 酒店管理类数据集10+G

good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter