噢,非常好。这是我在使用闪电说自己的文本转模型,给闪电说写评价。这是我第一次尝试使用语音来写评价,我这个人比较喜欢讲故事。
我之前是 Whisper Flow 的用户,当然现在也是。之前是因为在 lenny's newsletter 有会员,他们送了一个 Whisper Flow 的年费。我尝试过使用一段时间,或者说几次,它的效果并不好,或者说我不满意。不满意在什么地方呢?它对中文的兼容不太好。也可能是我的使用方式不对,但结果就是这样,它不够让我满意。
我没有什么要使用英文输入的需求。此外,假如让它作为一个系统级的自启动的助手驻留在后台可以录音,好像没有什么存在感,我会觉得有点奇怪。毕竟一个能录音的东西,它没有什么存在感,而你又用不到它。
但不得不说,这个 App 是比较优雅的。它没有什么时候会突然弹出一个窗口,或者右上角系统显示有 App 正在录音。我没有发现这种恶意的行为或者奇怪的行为。
但它是付费的,而且联网,而且我不太确定它是不是会把我的数据上传给云端的 API。那我就会觉得,不仅我用不到,而且我也不太想用,而且我也不太敢用。关于 Whisper Flow 大概就是这样。
这一次接触到闪电说,是因为观察 11 月的这个活动。我看到了闪电说这么一个 App,它让我有点好奇,因为它有 9.0 的评分。那我就想一下它是干什么用的,发现它是作为 Whisper Flow 的替代。我就试了一下,感觉还不错。
整个安装过程和使用的过程,包括它的官网描述,都有在强调为了隐私和安全。我很喜欢这一点。同时它使用的是本地语言模型,这也会是一个让我觉得比较好的点。
此外,它还能够调用自定义的 AI 来做优化。那我就可以发挥我自己的 Prompt Engineering 的特长,把我的语言直接转化成文本的结果,甚至是 Markdown 的结果,我觉得非常好。
这是以上的优点。
当然,不够好的地方还是有一些的。比如说第一个就是语音悬浮窗。我现在在录这段音频的时候,我没有看到那一个语音悬浮的小窗口,就是左边是叉号,右边是勾号,中间是音频波动的那么一个小小的悬浮窗。我没有看到它。我记得有的时候它是会出现的。如果我采用的是那一个按一下之后开始录音,最长录 5 分钟的那个功能的话,我现在能观察到的就是我的右上角显示麦克风正在录音。(因为没有这个显示窗口,录音到此结束了而我还没注意到,导致我后面的吐槽都没录下来,怀疑是监听到吐槽闪电说就紧急停止 bushi)
补充一下其他没录进来的内容:
1. 展示录音状态的语音悬浮窗,建议固定在页面的某个位置,这样会有一种“我知道是不是在录音”的安全感。见图一,我今天看B站视频的时候不知道为啥这个录音就开始了,直到看到自己的历史记录
2. 虽然配置自动保存,但是缺少了那个“save”的按钮,让我觉得总像是配置没保存一样
3. 虽然存档了日志和语音,但是如果我启用了AI优化的话,语音转文本对应的那个原始内容就丢掉了,如果AI的优化效果或者数据丢了,或者内容被截断,我是不会想说第二遍的
4. 按一下录音为什么只有5分钟?不能增加长度或者自由调节?
5. 其实我还是没看懂这个保留剪切板原内容的设置是什么意思
以上