个人中心

联系我们

搜索
搜索 登录 免费注册
界面美化
业务优化
开发工具
图像管理
文档管理
Parasoft

新闻资讯

关注工具软件产品最新动态,了解软件开发行业新趋势。

Aspose 使用教程:用 Python 进行护照 OCR 识别和文本阅读

原创
软件开发
来源:Aspose
Aspose
python
OCR
识别组件
字符识别
光学识别组件
光学标记
API
2024-05-10
Aspose
python
OCR
识别组件
字符识别
光学识别组件
光学标记
API


光学字符识别(OCR)技术允许用户从图像和文件中提取文本,是执行阅读护照等任务的强大工具。在护照上执行 OCR 可以简化从护照中阅读和提取信息的过程。在本文中,我们将学习如何使用 Python 对护照进行 OCR 识别并读取护照文本。


本文涵盖以下主题:


  • Python 中的护照 OCR API

  • 用 Python OCR 护照

  • 提取并保存护照文本


Python 中的护照 OCR API

我们将使用 Aspose.OCR for Python 对护照图像执行 OCR 并从图像中读取护照文本。Aspose.OCR for Python 是一个功能强大的光学字符识别 (OCR) API,可让您为 Python 应用程序添加 OCR 功能。简单地说,它可以帮助您从图像、PDF 和其他文件中提取文本。


请在控制台中使用以下 pip 命令从 PyPI 下载软件包或安装 API:

pip install aspose-ocr-python-net


OCR 护照 - 用 Python 阅读护照文本

我们可以通过以下步骤对护照图像执行 OCR 并读取识别出的文本:


  1. 创建 AsposeOcr 类的实例。

  2. 使用 PreprocessingFilter 类对象添加过滤器。

  3. 创建 OcrInput 类实例。

  4. 使用 add() 方法添加护照图像。

  5. 初始化 PassportRecognitionSettings 类对象。

  6. 然后,使用 recognize_passport() 方法运行识别过程。

  7. 最后,显示已识别的文本。

以下示例代码展示了如何使用 Python 对护照进行 OCR 识别并读取护照文本。

import aspose.ocr as ocr
# initialize OCR enginer
api = ocr.AsposeOcr()
# add filters
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# initialize image collection and put images into it
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# change recognition options
settings = ocr.PassportRecognitionSettings()
# run recognition
res = api.recognize_passport(passport, settings)
# print result
for result in res:
    print(result.recognition_text)


用 Python 提取和保存护照文本

我们可以按照前面提到的步骤对护照执行 OCR 并保存识别出的文本。不过,我们只需使用 save_multipage_document() 方法保存结果即可。该方法将输出文件路径、输出文件格式和识别结果对象作为参数。


下面的示例代码展示了如何在 Python 中对护照进行 OCR 并保存识别出的文本。

import aspose.ocr as ocr
# initialize OCR enginer
api = ocr.AsposeOcr()
# add filters
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
# initialize image collection and put images into it
passport = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
passport.add("passport.jpg")
# change recognition options
settings = ocr.PassportRecognitionSettings()
# run recognition
res = api.recognize_passport(passport, settings)
# print("# Save the corrected text")
api.save_multipage_document("sample_out.txt", ocr.SaveFormat.TEXT, res)


获取免费评估许可证

您可以获得免费的临时许可证,在没有评估限制的情况下试用程序库。


结论

在本文中,我们学习了如何在 Python 中对护照执行 OCR 并读取护照文本。通过在 Python 项目中加入 OCR 护照功能,您可以自动读取护照信息,从而节省时间和精力。这对于护照验证、旅行预订系统和边境控制流程等应用尤其有用。如有任何不清楚的地方,请随时联系我们


联系我们

周一至周日 8:00-23:00

免费热线

023-62585653

张经理:13082556879

罗经理:17558866126

许经理:13057566525

开发外包

ERP-一体化

小程序

企业微信客服

版权所有:重庆庚乾信息科技有限公司 ©2025 Gengqian Information Technology Co., Ltd. 渝ICP备2022008063号-2 渝公网安备50010702505508

版权所有:重庆庚乾信息科技有限公司

©2025 Gengqian Information Technology Co., Ltd. 渝ICP备2022008063号-2 渝公网安备50010702505508