有幸碰到同样在探索中文 API 的同行,参考了之前插件中标识符翻译的部分,实现并在 pypi 发布了包含相似功能的 Python API:en2cn​

在 Mac 的 Python 控制台下试用的几个 API 都没有问题,顺便发现 tab 还是可以出补全的。

插件已有一段时间没有改进。像之前的翻译质量改进只是刚开了头,牵涉到机器翻译,可以说是个无底洞,各种改进可以吃掉很多功夫,更不用说还有不少硬 bug。

在交流中还想到,如果 VSC 插件能够 import 外部库的话,也许应该将这部分翻译功能提取到单独库(比如 npm),以便公用。但这恐怕也要从长计议了。

在开发插件时,主要的考虑是,标识符的翻译相对于普通机器翻译来说,应该会简单不少,因为几乎不牵涉句式翻译,绝大多数都是单词或者简单短语,而且标识符命名的特性决定了,几乎不大出现难以决定的歧义和非常用词义。从后来的测试中,这几点也基本验证了。

当然,就像普通机器翻译,往往从 90% 到 95 % 的那 5% 需要花 95% 以上的精力。个人精力所限,止步于最浅显的一些改进。

这样衍生出的 API 就意味着有更多人可能试用、参与到改进中,是大好事。