如何快速运行一个OCR文字识别AI应用

Aidlux快速运行OCR文字识别AI应用示例


文字识别( Optical Character Recognition,OCR )即对图像中的文字进行特征提取和分析,将其转化为数字信号,与预定义字库对比后找出最匹配的字符,最终将识别出的字符组合成文本,需涉及到图像预处理、字符分割、特征提取、分类识别和后处理等繁琐步骤。
使用AidLux平台,开发者只要简单几步就可以快速运行ocr文字识别,示例文章中将提供源码包供开发者下载,完整的案例代码可以在test.py中查看


一、导入模型文件


开源代码:OCR文字识别 [点击链接即可下载]

首先,在设备上下载源代码,并记住源代码所在位置。
此示例中,我们将文件存放在设备内存下,其文件路径为sdcard/Download/Browser

然后回到AidLux,打开终端,cd到sdcard/Download/Browser(文件所在的路径地址)
由于AidLux终端的默认路径在“home”,需输入:

cd .. 
#回到上级目录

再切到源代码所在位置

cd /sdcard/Download/Browser

然后将代码包解压

unzip ocr.zip
# ls查看包名,根据对应包名解压,若提示解压工具,可命令行apt install unzip进行安装(需要密码则是:aidlux)

二、运行模型


通过指令运行测试代码:

cd ocr
python3 test.py
# cd到存放模型和测试示例的目录下,运行测试代码

运行后生成结果图(示例)

1 个赞