我觉得闪电说是非常好用的。首先它是本地的端测模型,所以它速度非常的快。然后他也支持你接入API去做AI纠正。我目前是用下来用doubao-1.6flassh效果是最好的。GLM-4.5-X跟GLM-4.6,我觉得效果相对差一些。然后我其实之前用的是wispr flow。我觉得对于语音输入法来说,速度真的非常重要。我之前用 wispr flow,虽然我是付费会员,但他有时候实在是转写太慢了,所以我用的频率也不是很高。
其实我同一时间还在测试Typeless的效果。它是要付费的,就免费30天。转写的准确率比闪电说要好,对于普通话不是很标准的人来说,还是希望有一个更好的转写准确率。
闪电说不开AI纠正效果也还可以,追求准确率的话,还是要开一下,虽然牺牲了一点速度,但准确率会更好一点。就我觉得准确率这方面还是要跟Typeless看齐,他的准确率就非常的高。而且我发现现在所有的语音输入法,在关于中英文混合的情况下,识别率是会有一点降低的。特别是我的英语发音也不是很标准,所以它英语单词的识别就会有一点问题。
还有就是用户词典自学习这方面因为单靠我自己去填写我的用户词典,我其实有点懒,我只能现在写的也基本都是那几个我发音的英文单词,他老是识别错了。还有就是其实他好像不怎么做那种分点的格式优化,这个跟prompt也有关系。如果可以提供更多的那个prompt模板,或者说会效果更好一点,大家按需选择。
以上其实就是用闪电说加上Typeless来输入的,所以我才能说这么多话。我相信语音输入肯定是未来一个非常重要的交互方式,所以现在也在适应。
现在的趋势看大家也很喜欢用语音输入法做vibe coding,因为这样你可以说的内容跟细节都会更多。因为大部分人打字还是比较慢的。我觉得语音输入可以极大地激发所有人的表达欲。但这个其实可能在办公室就不太适合,因为会有噪音怕尴尬什么的。但是我觉得普通场景下语音输入都是一个应该优先考虑的交互方式。