在同样选择 large 模型的情况下,Buzz 采用 i9-14900K 处理器渲染,最终转写速度为 3 分 08 秒左右,Whisper Desktop 采用影驰 GeForce RTX 4070 Ti SUPER 星曜 OC 显卡渲染,转写速度为 26 秒,Whisper Desktop 仅用了 Buzz 软件 1/6 不到的时间便完成转写,由此可见自带 Transformer 引擎的显卡对于 Wisper 的效率提升是巨大的。

转写排版上 Buzz 和 Whisper Desktop 在不选择时间戳文本类型的 TXT 文件格式下,势均力敌,基本都能做到按照一句完整语音进行换行断句。


不过,在识别结果的字数上,两者竟然并不相同。Buzz 的转写字数为 910 字,而 Whisper Desktop 的转写字数为 933 字。识别准确性上,Buzz 识别错误 27 个字 / 词,准确率为 97%,Whisper Desktop 识别错误 9 个字 / 词,准确率 99%。为了不被偶然性影响,我们连续测试三次,基本都是这个比例。


