打开 “懒猫微服客户端” 下载应用

AI Media2Doc

AI 视频图文创作助手是一款 Web 工具, 基于 AI 大模型, 一键将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。

25 次下载
1 次点赞
0 条评论
0 次催更
25

安装次数

1

点赞

0

应用评论

0

催更次数

桌面端

应用描述

✅ 完全开源:MIT 协议授权,支持本地部署。 🔒 隐私保护:无需登录注册,任务记录保存在本地 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。 🎬 支持字幕导出: 结果一键导出为字幕文件。 🖼️ 智能截图: 基于字幕信息智能截图并插入文章, 无需视觉大模型, 实现真正的图文并茂。 🎨 支持自定义 Prompt:支持在前端自定义配置 prompt。 🐳 一键部署:支持 Docker 一键部署。 🔒 支持设置访问密码: 后端设置访问密码之后, 前端用户需要填写该密码才可以正常使用。

相关攻略

AI-Media2Doc使用攻略:如何获取火山引擎API Key

商店里很多AI类应用都需要配置相关的API 密钥,比如AI-Media2Doc、One API等等。 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.ai-media2doc AI Media2Doc 启动后要填一堆变量: ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/d6b7857e-e36e-4c5b-85d6-339ab1d71dde.png "image.png") 本文介绍如何获取这些API,流程同样适用于其他应用。 进入火山引擎https://console.volcengine.com/ 进入开通管理, 选择开通一个大语言模型 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/e7c125fb-5d69-4de5-b290-795c343c7ba4.png "image.png") 推荐使用这个,点右边的开通服务 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/22c7ae66-132b-4f66-9219-fac98ae3698c.png "image.png") 复制它的模型id:doubao-1-5-pro-32k-250115 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/3ef99968-da43-4f8c-a451-59678eaa6ede.png "image.png") 在 API Key 管理中创建一个 API Key 你就得到了 ARK_API_KEY 的值。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/4800d0df-1c6f-4c02-8690-a99fa68280ee.png "image.png") 搜索 对象存储,或者点击这里,开通服务 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/2b533650-936a-4b27-a96c-1aa520bc38a6.png "image.png") ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/4b17fc17-f5ce-4663-b884-ce2403ee9fd1.png "image.png") 创建一个 bucket 桶, 创建完毕之后进入该 bucket。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/8e486222-4252-4db0-bc69-8e0717aa9f4d.png "image.png") 点击左侧权限管理, 找到跨域访问设置, 新建一条跨域访问规则 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/814e915b-5bc4-4d33-b41b-980f1a6f881d.png "image.png") ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/a3953c7c-4ab4-4fa2-b9c1-4eace59c6fe0.png "image.png") 点击概览 你会看到一个访问域名, TOS_ENDPOINT 的值就是红框框里面那个,不同的区域 TOS_ENDPOINT 的值可能不一样。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/db08160f-8bb9-49e0-b01d-d6edbedde4d7.png "image.png") ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/81bebff8-3a69-46ee-8428-7992a820dd8c.png "image.png") TOS_BUCKET 的值就是你创建的 bucket 的名称。 TOS_REGION 的值就是你创建的 bucket 的区域, 例如 cn-beijing。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/34b1de06-3faa-4ce5-adff-311dea521051.png "image.png") 进入 IAM控制台https://console.volcengine.com/iam/keymanage 创建一个访问密钥, 你就得到了 TOS_ACCESS_KEY 和 TOS_SECRET_KEY 的值 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/60d1ae63-a69f-478f-bdec-b9476b1546f9.png "image.png") ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/0c97e625-5688-4086-b319-9d9de9e9300e.png "image.png") 火山方舟每个音频识别大模型都提供了 20 个小时的试用额度, 可以轮流试用。 登录录音文件识别大模型控制台(https://console.volcengine.com/speech/service), 点击右侧语音识别->录音文件识别(注意不是录音文件识别大模型), 创建一个应用, ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/2db954ff-cfde-4143-a22d-2deedebb8c73.png "image.png") ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/a190c8f1-0712-4770-a9dc-b8dc8763241b.png "image.png") 你就得到了 AUC_APP_ID 和 AUC_ACCESS_TOKEN 和 AUC_CLUSTER_ID 的值。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/c47bd3b5-3e24-4368-a6cc-7fed131bf24e.png "image.png") 将上面的值都填好之后,就能正常进入使用了。 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/6a30d24a-c678-4993-9663-415ea320a4aa.png "image.png")

AI-Media2Doc 实用指南:视频音频转文档神器

## 写在前面 你是不是也有这样的困扰:看了一堆教程视频,想做笔记却要一边播放一边敲字?听了个讲座录音,想整理成文档却要反复暂停?或者你是个内容创作者,想把视频内容改成小红书笔记、公众号文章,却觉得重新写太费时间? **AI-Media2Doc** 就是专门解决这些问题的。简单说就是:扔个视频/音频进去,自动帮你生成各种风格的文档。 ### 主要功能一览 - **一键转换**:视频、音频直接变成文字文档 - **多种风格**:小红书笔记、公众号文章、知识笔记、思维导图、视频字幕 - **AI 对话**:可以基于视频内容进行二次问答 - **智能截图**:自动从视频中截取关键画面插入文章 - **完全本地**:不用注册账号,数据不上传到第三方平台 https://appstore.lazycat.cloud/#/shop/detail/cloud.lazycat.app.ai-media2doc ## 快速上手指南 应用安装后, 可以参考这篇文档,去配置相关的key https://playground.lazycat.cloud/#/guideline/1129 进入首页 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/60c9ae71-20f3-48b8-94dd-f61b3fc61036.png "image.png") 上传一个视频,点击知识笔记,开始处理 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/4d067b16-f63b-44fa-8e99-7868a232731d.png "image.png") 不同场景用不同格式效果更好: - **学习笔记**:选择"知识笔记"格式,结构清晰,便于复习 - **社交媒体**:选择"小红书"格式,语言活泼,容易传播 - **正式文档**:选择"公众号文章"格式,语言严谨,逻辑性强 - **快速理解**:选择"思维导图"格式,一目了然抓住重点 可以看到进度 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/60dcfe05-af0a-405f-939d-de30eba1efaa.png "image.png") 等到处理成功后,可以看到中间部分是具体总结,右侧是字幕,可以导出 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/1f9b2176-3388-4a7b-ab35-dc65a1bf6ce1.png "image.png") 转换完成后,可以继续和 AI 对话: - "帮我总结一下核心观点" - "这个概念能否举个更简单的例子?" - "有哪些内容可以做成短视频?" ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/6e198946-7257-4f57-83ac-7d40c7a41282.png "image.png") 如果默认效果不满意,可以自定义 Prompt: 点击"自定义设置" ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/72e0d56f-0ebe-4929-87ff-558ad53ea1b2.png "image.png") 在 Prompt 框中输入你的要求 ![image.png](https://lzc-playground-1301583638.cos.ap-chengdu.myqcloud.com/guidelines/496/be7bbc4b-051e-408d-b68a-81a4d4b61a4b.png "image.png") ## 总结 AI-Media2Doc 是一个真正实用的工具,特别适合需要经常处理音视频内容的朋友。 虽然配置花时间,但一旦搭建好了,就能大大提升工作效率。 如果你经常需要整理音视频内容,这个工具绝对值得试试。作者还在持续更新,相信会越来越好用!

懒猫评分/评论

0.0

0 条评论

此 App 尚未收到足够的评分或评论,无法显示评论列表。

应用信息

最新版本

0.0.1

更新日期

7/11/2025

预估安装占用

363.6 MB

不支持平台

--

提供者

u00679477

兼容性

可在此设备上使用

"修复网络请求问题"