当前位置 博文首页 > python PaddleOCR库用法及知识点详解

    python PaddleOCR库用法及知识点详解

    作者:小妮浅浅 时间:2021-08-03 18:09

    说明

    1、PaddleOCR是基于深度学习的ocr识别库,中文识别精度相当还不错,能够应对大多数文字提取需求。

    2、需要依次安装三个依赖库,shapely库可能会受到系统的影响,出现安装错误。

    安装命令

    pip install paddlepaddle
    pip install shapely
    pip install paddleocr

    代码实现

     ocr = PaddleOCR(use_angle_cls=True,)
    # 输入待识别图片路径
    img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png"
    # 输出结果保存路径
    result = ocr.ocr(img_path, cls=True)
        for line in result:
            print(line)
     
    from PIL import Image
    image = Image.open(img_path).convert('RGB')
    boxes = [line[0] for line in result]
    txts = [line[1][0] for line in result]
    scores = [line[1][1] for line in result]
    im_show = draw_ocr(image, boxes, txts, scores)
    im_show = Image.fromarray(im_show)
    im_show.show()

    内容扩展:

    简介

    PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。

    近期更新

    • 2020.8.26 更新OCR相关的84个常见问题及解答,具体参考FAQ
    • 2020.8.24 支持通过whl包安装使用PaddleOCR,具体参考Paddleocr Package使用说明
    • 2020.8.21 更新8月18日B站直播课回放和PPT,课节2,易学易用的OCR工具大礼包,获取地址
    • 2020.8.16 开源文本检测算法SAST和文本识别算法SRN
    • 2020.7.23 发布7月21日B站直播课回放和PPT,课节1,PaddleOCR开源大礼包全面解读,获取地址
    • 2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO,支持iOS和Android系统

    特性

    • 超轻量级中文OCR模型,总模型仅8.6M
    • 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
    • 检测模型DB(4.1M)+识别模型CRNN(4.5M)
    • 实用通用中文OCR模型
    • 多种预测推理部署方案,包括服务部署和端侧部署
    • 多种文本检测训练算法,EAST、DB、SAST
    • 多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE、SRN
    • 可运行于Linux、Windows、MacOS等多种系统
    jsjbwy
    下一篇:没有了