1000 Stars 127 Forks 10 Issues 0 贡献者 Apache-2.0 License Python 语言
代码: GitHub - lamm-mit/PDF2Audio
更多AI开源软件:AI开源 - 小众AI
PDF2Audio,它将彻底改变我们阅读和理解 PDF 文件的方式。我们不再需要盯着屏幕,而是让信息以声音的形式流淌进你的耳朵,无论是在通勤的路上、健身时,还是任何需要解放双手的场合。
主要功能
- 支持处理多个 PDF 文件
- 支持选择不同的指令模板(播客、讲座、摘要等)
- 自定义文本生成和音频模型
- 支持为演讲者选择不同的声音
- 对文稿的编辑和对模型的具体反馈进行草稿迭代改进
快速使用
- 克隆仓库
git clone https://github.com/lamm-mit/PDF2Audio.git
cd PDF2Audio
- 创建 Conda 环境
conda create -n pdf2audio python=3.9
- 激活已创建的 Conda 环境
conda activate pdf2audio
- 安装依赖
pip install -r requirements.txt
- 创建 .env 文件,配置 OpenAI Key
OPENAI_API_KEY=your_api_key_here
- 运行 app.py 启动应用
python app.py