各位大佬们,最近想学习下,但不想一个个花费大量时间看视频,哪家的 AI 能自己看视频,输出视频的文字笔记的。
gemini 和 youtube 整合的好
同求一个能看 b 站的
我也有类似的需求。不过发现大部分都是语音转文字,一旦你的视频画面有大量语音没法覆盖的信息,基本上效果很差。
定制的多模态 agent 服务应该可以把画面和文字脚本结合的更好,等一个回复。
登录后可发帖和回复
gemini 和 youtube 整合的好