文章 2025-04-06 来自:开发者社区

【工具教程】批量PDF和图片OCR识别指定区域文字自动改图片名字,多个区域一次性批量识别改名批量重命名

应用场景企业档案管理:企业或机构的档案管理中,常常会有大量扫描后的图片格式档案,如合同、文件等。这些档案图片中包含着关键的信息,如合同编号、文件标题等,需要根据这些信息对图片进行重命名以便于管理和查找。医院病历管理:医院的病历、检查报告等可能以图片型PDF形式存在。通过识别这些文件中的文字信息,如诊...

【工具教程】批量PDF和图片OCR识别指定区域文字自动改图片名字,多个区域一次性批量识别改名批量重命名
文章 2025-03-23 来自:开发者社区

1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!

嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法 Kreuzberg 是一个基于 Python 的文本提取库,支持从 PDF、图像、Office 文档等 20+ 格式中提取文本内容。采用 MIT 开源协议,具备本地处理、异步架构、智...

1.6K star!这个开源文本提取神器,5分钟搞定PDF/图片/Office文档!
问答 2025-02-24 来自:开发者社区

在宜搭普通表单里面,怎么实现pdf转换成图片,同时保留pdf文件,

在宜搭普通表单里面,怎么实现pdf转换成图片,同时保留pdf文件,此功能主要是想实现pdf在线预览而不是跳转页面,

文章 2025-01-21 来自:开发者社区

Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能:支持零样本OCR识别,兼容PDF、DOCX、图片等多种格式文件。 技术:基于GPT-4o-mini模型,能够处理复杂布局文档,输出Markdown格式...

Zerox:AI驱动的万能OCR工具,精准识别复杂布局并输出Markdown格式,支持PDF、DOCX、图片等多种文件格式
文章 2024-12-03 来自:开发者社区

用PDF转换图片的方式弥补通义千问在扫描版PDF支持方面的缺失

当前通义千问web版在处理扫描版PDF时是直接提示异常的,这个很不make sense;如图所示: 本地版的qwen-VL也不能直接处理扫描版的PDF。但是在生产环境实际应用中,业务又有大量的扫描PDF需要提交给AI来OCR,这个时候咋搞呢? 想起Python似乎有个库,可以将PDF分...

用PDF转换图片的方式弥补通义千问在扫描版PDF支持方面的缺失
问答 2024-10-09 来自:开发者社区

宜搭PDF组件怎么样转化成图片。

宜搭PDF组件怎么样转化成图片。

文章 2024-09-28 来自:开发者社区

Python办公自动化:提取pdf文件中的图片

本期文章,我们用python实现对pdf文件中图片的复制,比如在wps中,这个功能是要收费的,如下图: 要会员,两年198元,呵呵呵。但在python中不存在,哈哈哈。我们来提取一下下面一个pdf中的图片。 ...

Python办公自动化:提取pdf文件中的图片
文章 2024-08-28 来自:开发者社区

三种方法,Python轻松提取PDF中全部图片

基于 fitz 库和正则搜索 fitz 是 pymupdf 的子模块,需要先用命令行安装 pymupdf: pip install pymupdf ...

三种方法,Python轻松提取PDF中全部图片
问答 2024-08-16 来自:开发者社区

图片转pdf可以设置保持图片默认居中,页面尺寸比例使用默认的吗?

图片转pdf可以设置保持图片默认居中,页面尺寸比例使用默认的吗?

文章 2024-08-14 来自:开发者社区

JAVA PDF 截取N页,生成新文件,转图片,多个PDF 合并

JAVA PDF 截取N页,生成新文件,转图片,多个PDF 合并 <dependency> <groupId>com.itextpdf</groupId> <artifactId>itextpdf</artifact...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注