Whisper AI 影片轉文字 語音轉文字

Whisper

從該儲存庫的「Releases」部分下載 WhisperDesktop.zip,解壓縮 ZIP,然後執行WhisperDesktop.exe。

https://github.com/Const-me/Whisper

在第一個畫面上,它會要求您下載模型。推薦 ggml-medium.bin(1.4GB)。
放在同一個資料夾中
都放在C底下也可

https://huggingface.co/ggerganov/whisper.cpp/blob/main/ggml-medium.bin

所有模型在這頁

https://huggingface.co/ggerganov/whisper.cpp/tree/main

有一個 ggml-large-v3.bin (2.88GB)

直接下載不行後來先下 Git LFS但也無法順利安裝
去另外一台電腦解決ESET關掉windows內建防毒後可下上面URL

Git LFS Details

SHA256: 64d182b440b98d5203c4f9bd541544d84c605196c4f7b845dfa11fb23594d1e2
Pointer size: 135 Bytes
Size of remote file: 3.1 GB
Xet backed hash: 766d11cebbdf5a67c179c5774e2642b609e35e1a30240e7b559d5647c655b0a4

 


Windows 7 X64 不行


Windows 10 X64

HP 主機  Nvidia GeForce GT710 跑一半中途會沒有反應 當掉

ACER 主機  Nvidia GeForce GT730 剛執行時會跑出一個畫面
說要麻離開 要嘛繼續 (忘抓圖)
選擇繼續後看似沒問題但在運作程式中跑很久沒有進度條
看起來可能不支援使用

這張買全新可以用:
【Inno3D 映眾】GT 1030 2GB GDDR5 顯示卡 靜音版

DELL 主機 Nvidia GeForce GT1030 (2G 記憶體) .可轉出.
影片VS 轉出時間感覺差不多

AMD Radeon R7 200系列. 1GB記憶體
發布日期, 2013年10月. 代號, Volcanic Islands. 顯示卡. 可轉.
中文影片5分鐘
轉出時間14分鐘
relative processing speed: 0.35


使用 Nvidia GeForce GTX 730。有 2GB 显存。
运行“基础”模型时没有问题,但“小型”模型启动时却出现了错误信息:

torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 2.00 GiB total capacity; 1.32 GiB already allocated; 0 bytes free; 1.40 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

小模型比基础模型更大,因此需要更多显存。2GB 根本不够处理更大的模型。
可以在 CPU 上运行它,使用 CPU 是个选择,但耗时太长。

可能可以在 Colab 中运行。

 


transcribed the audio 轉錄音訊 : 可用MP4直接轉出
media duration 媒體時長 : 整個檔案原有長度
processing time 處理時間 : 轉出耗費時程
relative processing speed 相對處理速度 : 不同GPU影響

wave 音波
reshape 重塑
shaders 著色器
matrix multiply 矩陣乘法
reshape some tensors 重塑一些張量

 


 


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注