AI Media2Doc
AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。
安装次数
点赞
应用评论
催更次数
桌面端




应用描述
✅ 完全开源:MIT 协议授权,支持本地部署。 🔒 隐私保护:无需登录注册,任务记录保存在本地 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。 🎬 支持字幕导出: 结果一键导出为字幕文件。 🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。 🎨 支持自定义 Prompt:支持在前端自定义配置 prompt。 🐳 一键部署:支持 Docker 一键部署。 🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。
相关攻略

AI-Media2Doc使用攻略:如何获取火山引擎API Key
商店里很多AI类应用都需要配置相关的API 密钥,比如AI-Media2Doc、One API等等。 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.ai-media2doc AI Media2Doc 启动后要填一堆变量:  本文介绍如何获取这些API,流程同样适用于其他应用。 进入火山引擎https://console.volcengine.com/ 进入开通管理, 选择开通一个大语言模型  推荐使用这个,点右边的开通服务  复制它的模型id:doubao-1-5-pro-32k-250115  在 API Key 管理中创建一个 API Key 你就得到了 ARK_API_KEY 的值。  搜索 对象存储,或者点击这里,开通服务   创建一个 bucket 桶, 创建完毕之后进入该 bucket。  点击左侧权限管理, 找到跨域访问设置, 新建一条跨域访问规则   点击概览 你会看到一个访问域名, TOS_ENDPOINT 的值就是红框框里面那个,不同的区域 TOS_ENDPOINT 的值可能不一样。   TOS_BUCKET 的值就是你创建的 bucket 的名称。 TOS_REGION 的值就是你创建的 bucket 的区域, 例如 cn-beijing。  进入 IAM控制台https://console.volcengine.com/iam/keymanage 创建一个访问密钥, 你就得到了 TOS_ACCESS_KEY 和 TOS_SECRET_KEY 的值   火山方舟每个音频识别大模型都提供了 20 个小时的试用额度, 可以轮流试用。 登录录音文件识别大模型控制台(https://console.volcengine.com/speech/service), 点击右侧语音识别->录音文件识别(注意不是录音文件识别大模型), 创建一个应用,   你就得到了 AUC_APP_ID 和 AUC_ACCESS_TOKEN 和 AUC_CLUSTER_ID 的值。  将上面的值都填好之后,就能正常进入使用了。 

AI-Media2Doc 实用指南:视频音频转文档神器
## 写在前面 你是不是也有这样的困扰:看了一堆教程视频,想做笔记却要一边播放一边敲字?听了个讲座录音,想整理成文档却要反复暂停?或者你是个内容创作者,想把视频内容改成小红书笔记、公众号文章,却觉得重新写太费时间? **AI-Media2Doc** 就是专门解决这些问题的。简单说就是:扔个视频/音频进去,自动帮你生成各种风格的文档。 ### 主要功能一览 - **一键转换**:视频、音频直接变成文字文档 - **多种风格**:小红书笔记、公众号文章、知识笔记、思维导图、视频字幕 - **AI 对话**:可以基于视频内容进行二次问答 - **智能截图**:自动从视频中截取关键画面插入文章 - **完全本地**:不用注册账号,数据不上传到第三方平台 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.ai-media2doc ## 快速上手指南 应用安装后, 可以参考这篇文档,去配置相关的key https://playground.lazycat.cloud/#/guideline/1129 进入首页  上传一个视频,点击知识笔记,开始处理  不同场景用不同格式效果更好: - **学习笔记**:选择"知识笔记"格式,结构清晰,便于复习 - **社交媒体**:选择"小红书"格式,语言活泼,容易传播 - **正式文档**:选择"公众号文章"格式,语言严谨,逻辑性强 - **快速理解**:选择"思维导图"格式,一目了然抓住重点 可以看到进度  等到处理成功后,可以看到中间部分是具体总结,右侧是字幕,可以导出  转换完成后,可以继续和 AI 对话: - "帮我总结一下核心观点" - "这个概念能否举个更简单的例子?" - "有哪些内容可以做成短视频?"  如果默认效果不满意,可以自定义 Prompt: 点击"自定义设置"  在 Prompt 框中输入你的要求  ## 总结 AI-Media2Doc 是一个真正实用的工具,特别适合需要经常处理音视频内容的朋友。 虽然配置花时间,但一旦搭建好了,就能大大提升工作效率。 如果你经常需要整理音视频内容,这个工具绝对值得试试。作者还在持续更新,相信会越来越好用!
懒猫评分/评论
0.0
0 条评论
应用信息
新功能
版本历史记录"修复网络请求问题"
此 App 尚未收到足够的评分或评论,无法显示评论列表。