视频语音文字识别转换 (视频翻译和配音工具)
一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。
主要用途和使用方式
####
- 【翻译视频并配音】根据需要设置各个选项,自由配置组合,实现翻译和配音、自动加减速、合并等
- 【识别字幕不翻译】选择视频文件,选择视频源语言,则从视频【语音中识别出文字】并自动导出字幕文件到目标文件夹
- 【提取字幕并翻译】选择视频文件,选择视频源语言,设置想翻译到的目标语言,则从【视频语音中识别出文字】并翻译为目标语言,然后导出双语字幕文件到目标文件夹
- 【字幕和视频合并】选择视频,然后将已有的字幕文件拖拽到右侧字幕区,将源语言和目标语言都设为字幕所用语言、然后选择配音类型和角色,开始执行
- 【为字幕创建配音】将本地的字幕文件拖拽到右侧字幕编辑器,然后选择目标语言、配音类型和角色,将生成配音后的音频文件到目标文件夹
- 【音视频识别文字】将视频或音频拖拽到识别窗口,将识别出文字并导出为srt字幕格式
- 【将文字合成语音】将一段文字或者字幕,使用指定的配音角色生成配音
- 【从视频分离音频】将视频文件分离为音频文件和无声视频
- 【音视频字幕合并】音频文件、视频文件、字幕文件合并为一个视频文件
- 【音视频格式转换】各种格式之间的相互转换
- 【文字字幕翻译】将文字或srt字幕文件翻译为其他语言
- 【人声背景乐分离】将视频中的人声和背景音乐分别分离出来,生成2个音频文件
- 【下载油管视频】可从youtube上下载视频
离线语音转文字方案:
- openai-whisper
- faster-whisper
openai-whisper 使用
####
windows 下有配套的工具使用
- 下载客户端 : https://github.com/TutuBinary/Whisper
- 下载模型:https://huggingface.co/ggerganov/whisper.cpp (模型越大,越准确,越慢, 电脑配置要求越高, 可以选中配模型)
使用
- 加载下载好的模型
- 选择GPU,点OK
- 选择需要转换的语言, chinese
- 选择音频
- 选择输出格式
- 选择输出路径
- 点击
Transcribe
开始转换
实测 ggml-medium.bin
和 ggml-large-v1.bin
两个模型还可以
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 小石头的博客!