
🎙️✨ AsrTools:智能语音转字幕文本工具
对比 Github 目前多数的音频转换文字项目(通过调用 Wishper 等模型),本项目最大区别和优势就是无需 GPU 和繁琐的本地配置。
欢迎为项目给上一个 Star。
- 🚀 无需复杂配置:无需 GPU 和繁琐的本地配置,小白也能轻松使用。
- 🖥️ 高颜值界面:基于 PyQt5 和 qfluentwidgets,界面美观且用户友好。
- ⚡ 效率超人:多线程并发 + 批量处理,文字转换快如闪电。
- 📄 多格式支持:支持生成
.srt
和.txt
字幕文件,满足不同需求。
- 🎥 视频直接处理:支持输入视频文件自动转换为音频文件,无需用户手动转换为mp3等音频格式。
- 📄 多样化输出:增加输出格式选择,提供更多字幕格式选项,满足不同用户需求。
- 🔀 一键字幕视频:增加视频自动加字幕功能,一键完成从视频到带字幕视频的全流程。
- 🔗 API 集成:提供 API 接口,允许开发者将 AsrTools 集成到自己的工作流程中。
- ✏️ 字幕编辑器:集成一个简单的字幕编辑界面,允许用户直接修改、调整时间轴和校正识别错误。
主界面截图示例
- 启动应用:运行下载的可执行文件或通过命令行启动 GUI 界面。
- 选择 ASR 引擎:在下拉菜单中选择你需要使用的 ASR 引擎。
- 添加文件:点击“选择文件”按钮或将文件/文件夹拖拽到指定区域。
- 开始处理:点击“开始处理”按钮,程序将自动开始转换,并在完成后在原音频目录生成
.srt
或.txt
字幕文件。(默认保持 3 个线程运行)
我为 Windows 用户提供了打包好的Release版本,下载后解压即可直接使用,无需配置环境。
或者从网盘下载: https://wwwm.lanzoue.com/iUJYZ2clk7xg
运行解压后的 AsrTools.exe
,即可启动 GUI 界面。
项目的依赖仅仅为 requests
。
如果您需要 GUI 界面,请额外安装 PyQt5
, qfluentwidgets
。
如果您想从源码运行,请按照以下步骤操作:
-
克隆仓库并进入项目目录
git clone https://github.com/WEIFENG2333/AsrTools.git cd AsrTools
-
安装依赖并运行
-
启动 GUI 界面
pip install -r requirements.txt python asr_gui.py
-
纯代码调用示例
pip install requests python example.py
-
数据统计
数据评估
关于AsrTools特别声明
本站哆咪虾提供的AsrTools都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由哆咪虾实际控制,在2024-10-16 下午2:02收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,哆咪虾不承担任何责任。
相关导航

FineVoice是一种人工智能数字语音解决方案,可以帮助用户增强声音,并实时改变声音。它配有实时变声器,无限的音频和声音效果,录音室质量的录音机,文本到语音,语音到文本。

Lovo
LOVO AI是一款AI语音生成器和文字转语音平台,可为创作者节省90%的时间和预算。它使用领先的AI技术提供优质的结果。随着语音AI发展的速度,可能性是无限的。LOVO AI总部位于加州伯

FineVoice
Fineshare FineVoice 是一个多功能的 AI 语音工作室,可以帮助您快速创建高质量的配音,声音自然且独特。

Filme
AI 文字转语音生成器和语音克隆

VideoLingo
VideoLingo 是一站式视频翻译本地化配音工具,旨在生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的配音,让全世界的知识能够跨越语言的障碍共享。通过直观的 Streamlit 网页界面,只需点击两下就能完成从视频链接到内嵌高质量双语字幕甚至带上配音的整个流程,轻松创建 Netflix 品质的本地化视频。

Rask.ai
Rask.ai人工智能配音工具提供了翻译和配音您的视频的机会。

Azure AI
一种 AI 语音功能,可将文本转换为逼真的语音。生成自然发音的应用和服务。通过自定义真实 AI 语音生成器让你的品牌独具特色,并使用具有不同说话风格和情感语调的语音来搭配你的用例(从文本阅读器和讲述者到客户支持聊天机器人)。

Audyo
Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。用户可以使用谷歌登录开始使用。
暂无评论...