放弃自制输入法[失败的project]

发布于 2015-05-02  397 次阅读


本想搞一个输入法的,码表词库什么的也已经收集了很多,最终也是搞了出来,支持中文输入,英文输入,甚至还支持日文输入,基本的输入法功能也具备了,另外还有一些比较极客的功能,能够用输入法来操控电脑进行一些简易的操作,只需要输入设定好的字母就调用一些程序什么的,虽然有一个不符合大众习惯的缺点——不支持语句流输入,无法智能组句。如果支持语句流的话,词库根本就无需精简了。

一切都已经搞好了,就只差调教了,因为用的是开源词库,所以有非常之多的垃圾词语,我只能一边使用一边进行调教,将那些垃圾词语或者那些不常用的词语删去,保证候选项至多只有10个。这样可以极大的减少选词所造成的不爽。不过这项工程实在太大了,对于我来说,需要处理的词库量是20万左右,时间上实在是耗不起,所以最后还是决定放弃。

不过通过这次的挖坑,对输入法的理解也加深了,认识到不少的中文输入方式,只不过这些可能是很优秀的输入法,因为种种原因的关系无法得到好的发展,只能小众使用。

处理大量词库的时候也领悟到了不少数据处理简便方法,通过excel和自带的记事本也能做到很多处理,之前我还没料想到这excel和记事本还能有这样的用法,实在是大开眼界。

自制输入法注意事项

这里记录点小技巧,以后要是有人想做输入法的可以参考下,不至于像我那样走了很多弯路。

1、中文转拼音的技术并不完善,需要一个超大型的数据库才可能解决,因为它有个多音字问题。所以不要走这个方向。

2、建议使用开源词库。商业词库可能会有后遗症,要是自己玩玩还可以,否则找个开源词库吧!全拼的开源词库还是有的。

3、我采用的是双拼加形方案,也就是所谓的“音形输入”,类似五笔的是形码输入法,类似全拼/双拼是拼音输入法,两者结合就是“音形”。我用C#自己编写了个控制台应用程序,方便将全拼词库转换成双拼词库。技术有限,极其简单,还要配合excel使用才能完美。如有必要我可以将其发到网上。

自制耗时,调教快捷。现在我是选择了调教现成的输入法了,要是你想要制作一个专属的输入法,千万要想清楚了,别像我那样浪费时间。