琴叶空间
琴叶姐妹同好会
琴叶空间

WhisperDesktop1.8本地音频转文字软件【免费开源】

转载自知乎,原作者:richens
原链接:WhisperDesktop1.8本地音频转文字软件【免费开源】

可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)

特征

  • 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
  • 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
  • 比 OpenAI 的实现快得多。
  • 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(–color-accent-fg)]需要缓冲区 的支持R16_FLOAT
  • 内置性能分析器,可测量单个计算着色器的执行时间
  • 内存使用率低
  • 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(–color-accent-fg)]。
  • 用于音频捕获的语音活动检测。

使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型

https://pic4.zhimg.com/80/v2-7ed6ca5e96fe9c34d7b2e088b42c7cf3_1440w.webp

加载完成后,就可以进行语音转文了

https://pic3.zhimg.com/80/v2-3b4a2e4cb1253f734e9aff53f1ce4c5a_1440w.webp

转换的过程如下图:

https://pic3.zhimg.com/80/v2-90e0b3488e38dfaf79e61e414043d1aa_1440w.webp
https://pic1.zhimg.com/80/v2-ea9938549508acb275f8f638f661a95c_1440w.webp

结果以文本格式输入。

另外一个功能是允许从麦克风捕获和转录或翻译实时音频

https://pic2.zhimg.com/80/v2-22b860ec4c95d1be6cde410da9980f45_1440w.webp


ggml-medium 语音模型(官方):ggerganov/whisper.cpp at main

作者推荐ggml-medium.bin(大小为 1.42GB)
链接:https://pan.baidu.com/s/1vszwzTdPOfmd041ywbAFHQ?pwd=xnbc

蓝奏下载(最小的体验包):https://wwnn.lanzoue.com/iZVcM0wq5lvg 密码:7go1
Whisper :开源项目(官方):https://github.com/Const-me/Whisper
蓝奏下载 :https://wwnn.lanzoue.com/iDT010wq4q6f 密码:57ko

没有标签
首页      装备      其他      WhisperDesktop1.8本地音频转文字软件【免费开源】

发表回复

textsms
account_circle
email

琴叶空间

WhisperDesktop1.8本地音频转文字软件【免费开源】
转载自知乎,原作者:richens原链接:WhisperDesktop1.8本地音频转文字软件【免费开源】 可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux(目前界面只有英…
扫描二维码继续阅读
2024-02-17