您的位置:首页 > 财经 > 金融 > 网页制作动画怎么做_泰州专业网站建设公司_搜索引擎优化是免费的吗_网站设计培训

网页制作动画怎么做_泰州专业网站建设公司_搜索引擎优化是免费的吗_网站设计培训

2024/12/28 12:48:07 来源:https://blog.csdn.net/make_progress/article/details/144332076  浏览:    关键词:网页制作动画怎么做_泰州专业网站建设公司_搜索引擎优化是免费的吗_网站设计培训
网页制作动画怎么做_泰州专业网站建设公司_搜索引擎优化是免费的吗_网站设计培训

将pdf文件转化为img

1 简介

将pdf转化为img方法比较多,本文介绍一下pdf2image和PyMuPDF,使用pdf2image依赖poppler才能够实现转化pdf,由于安装配置poppler比较麻烦(Poppler 是用于处理 PDF 文档的开源库。它可以对pdf文件进行页面提取、文本提取、注释和书签等了一系列高级功能),因此选择了PyMuPDF库。

# 安装pymupdf
pip install pymupdf# 安装pymupdf4llm
pip install pymupdf4llm

2 使用PyMuPDF

import pathlib
import pymupdf4llm
import pymupdfdef pdf_to_md():# 转化为mark downmd_text = pymupdf4llm.to_markdown("E:/test/tes2.pdf")# 存储markdownpathlib.Path("E:/test/tes2.md").write_bytes(md_text.encode())def pdf_to_img():# 打开文档pdf = pymupdf.open("E:/test/tes2.pdf")# 读取每页pdf文件for page in pdf:# 设置分辨率# 不设置分辨率,dpi默认96pix = page.get_pixmap(dpi=300)# 转化为pngpix.save("E:/test/img/page-%i.png" % page.number)def pdf_to_other():# 打开文档pdf = pymupdf.open("E:/test/tes2.pdf")# 查看文档的基本信息meta_data = pdf.metadataprint(meta_data)# 查找特定页面page = pdf.load_page(1)print(page)# 显示文本中的大纲标题# 返回值元素:[大纲级别, 大纲名称 , 大纲所在位置]toc = pdf.get_toc()print(toc)if __name__ == '__main__':pdf_to_md()pdf_to_img()pdf_to_other()

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com