文章 2024-12-18 来自:开发者社区

MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日跟你分享最新的 AI 资讯和开源应用,也会不定期分享自己的想法和开源实例,欢迎关注我哦! 微信公众号|搜一搜:蚝油菜花 快速阅读 功能:支持多种文件格式转换为 Markdown,包括 PDF、Office 文档、图像和音频等。 技术:具备 OCR 文字识别、语音转文字和元数据提取等技术。 应用:适用于文...

MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
文章 2022-05-30 来自:开发者社区

将 PDF 转换为音频文件

  非常有用的 Python 自动化脚本。  将 PDF 转换为音频文件  脚本可以将 pdf 转换为音频文件,原理也很简单,首先用 PyPDF 提取 pdf 中的文本,然后用 Pyttsx3 将文本转语音。关于文本转语音,你还可以看这篇文章FastAPI:快速开发一个文本转语音的接口。  代码如下:  import pyttsx3,PyPDF2  pdfreader = PyPDF2.PdfF....

文章 2022-05-25 来自:开发者社区

小工具随手记:使用Python中的pyttsx3包将PDF文档转为MP3音频

         今天不想看文档了,搞了个简易版本的朗读PDF程序,效果一般般,和microsoft自带的那个朗读功能一样。需要安装pyttsx3和PyPDF2:如需配置国内镜像源请参考:Pycharm配置镜像源(长期有效)_蓝多多的小仓库-CSDN博客代码如下:import pyttsx3,PyPDF2 # 打开需要读取的PDF pdfread....

小工具随手记:使用Python中的pyttsx3包将PDF文档转为MP3音频

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

开发与运维

集结各类场景实战经验,助你开发运维畅行无忧

+关注