GoForum🌐 V2EX

AI 开发了个《武林外传》全台词检索对应截图网站

hugo2233 · 2026-02-06 11:42 · 0 次点赞 · 1 条回复

https://wulinwaizhuan.hugo2233.dpdns.org/ 文本提取:PaddleOCR (PaddlePaddle 引擎) 暴力破解硬字幕。 数据归档:构建台词-时间戳-图片路径的索引。 抽帧处理:FFmpeg 获取关键帧。 图像预处理:OpenCV + NumPy 提高识别率。

难题攻克: 针对 TV 录制版没有软字幕的问题,OCR 是唯一解。通过批量推理,将 80 集海量素材转化为可检索的 JSON 文件

一开始 win 直接运行代码好慢 80min 一集 现在在 wsl 上运行 5-8min 一集舒服了

参考项目 github 的 Cicada000/VV 感谢指导

1 条回复
duuu · 2026-02-06 11:42
#1

厉害~学习了

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: hugo2233
发布: 2026-02-06
点赞: 0
回复: 0