对于语音输入法,我是长期的尝鲜者,历史甚至可以追溯到二十多年前的IBM语音输入。

所以这些年,从早期的搜狗手机语音输入、豆包手机语音输入法、微信语音输入,还有闪电说、GLM,出一个,总要试用一个。

虽然认真写稿时(比如此时),我依然偏爱键盘输入,可以更好地思考,但是平时很多简单的文字输入,语音输入的确在速度和便捷性上,有着极大的优势。

在手机上,自打豆包语音输入法解决了iPhone跳转的问题后,就是毫无疑问的王者。但电脑上,macOS的王者还待定。

豆包的macOS版输入法已经在内测,但是不支持双拼,就让我望而却步了。所以此前是以微信macOS版内置的语音输入作为主力——直到千问macOS版内置的语音输入功能出笼。

之所以千问一出语音输入法就勇于尝试,只是因为快捷键这么一个小但又极其重要的设置

目前,主流的语音输入法,都遵循macOS的缺省,占据Fn按钮来唤醒语音输入。

如果你使用的是MacBook笔记本,或者在台式机上使用的是Mac原装妙控键盘(类似下面这种),那体验是没问题的。

alt text

但是!

我的主力机是iMac,虽然有妙控键盘,但主力键盘却是全布局人体工程学的罗技K860。

alt text

罗技家的键盘,在Fn键上,有一个很神奇的处理,它的Fn是键盘电路上内部处理的,你单独按下Fn,macOS是不会收到信号的,它只能收到Fn+其他按键后转义的键值,所以单独在罗技的键盘上按下Fn,是无法唤醒macOS上的语音输入功能的。

其实我也想过启用其他的按键。在键盘上,其实右侧的Cmd、右侧的Ctrl,都是长期闲置几乎不用的(至少对我而言如此),本来是设定为语音输入快捷键的最佳选择,但很可惜,微信的语音输入法也不支持将这两个按键设置为快捷键。

正因此,我在微信的语音输入时,只能用两个按键组合,比如左Ctrl+右Ctrl组合来唤醒。

但是,千问的语音输入,竟然缺省就是使用右Cmd作为快捷键,这个对我这样的罗技用户,就太友好了。

alt text

当然,在具体语音输入的体验上,千问和微信、豆包还是略有不同。

微信和豆包是一边输入,对应的汉字就出现在待输入区域,属于实时转义;但千问则是要全部语音念完,才会一次性转换,还有一个转换的过程,这种体验,多多少少会带来一定的不确定性,当然这或许与千问使用的是非实时ASR模型有关。

从输入体验角度,我个人还是喜欢微信、豆包这样的,能实时反馈,心中更安定。

是的,千问的语音输入远谈不上完美。非实时转换带来的那一两秒空白,对于习惯了即时反馈的人来说,多少有点悬心。但一个右Cmd键的快捷键设置,就足以让我把主力从微信切过来——至少先用一阵子。

说到底,输入法这种东西,决定体验上限的是识别能力,决定你愿不愿意用的,往往就是这么一个小到不起眼的设置。千问的产品经理,大概自己用的也不是苹果原配的妙控键盘吧。