您的位置:首页 > 财经 > 金融 > 如何将confluence页面的内容保存为markdown格式

如何将confluence页面的内容保存为markdown格式

2024/12/23 9:52:25 来源:https://blog.csdn.net/m0_61864577/article/details/139507861  浏览:    关键词:如何将confluence页面的内容保存为markdown格式

如何将confluence页面的内容保存为markdown格式

  • 一.将网页另存为mhtml格式
  • 二.转换脚本(GPT-4O自动生成)

本文介绍了如何将confluence页面的内容保存为markdown格式

一.将网页另存为mhtml格式

二.转换脚本(GPT-4O自动生成)

import email
from bs4 import BeautifulSoup
import html2textdef extract_wiki_content_from_mhtml(filepath):# 读取 mhtml 文件内容with open(filepath, 'rb') as file:msg = email.message_from_binary_file(file)# 初始化 HTML 内容content = ""# 获取邮件的主要部分,并找到 HTML 内容for part in msg.walk():if part.get_content_type() == "text/html":content = part.get_payload(decode=True)breakif not content:raise ValueError('No HTML content found in the mhtml file.')# 使用 BeautifulSoup 解析 HTML 内容soup = BeautifulSoup(content, 'html.parser')# 提取 <div class="wiki-content"> 的内容wiki_content_div = soup.find('div', class_='wiki-content')if not wiki_content_div:raise ValueError('No <div class="wiki-content"> found in the mhtml file.')# 将提取的 HTML 内容转换为 Markdown 格式html_content = str(wiki_content_div)markdown_content = html2text.html2text(html_content)return markdown_contentfilepath = 'Ascend训练软件栈了解.mhtml'
markdown_content = extract_wiki_content_from_mhtml(filepath)
print(markdown_content)with open("Ascend训练软件栈了解.md", 'w', encoding='utf-8') as file:file.write(markdown_content)

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com