汉化了十数个编译器的前辈的心得体会
@竹闲 的原文在【图片】回复:有筒子想用中文写汇编吗?_汇编吧_百度贴吧 63楼. 特此转载, 并向所有勇于探索的前辈们致敬!
他汉化的十余个编译器: 竹闲:一般编程语言都是英文的,大家对中文编程有什么样的看法,中文编程有哪些优劣势?
1)论点:应否「建立新的中文编程语言」,慎思之。
2)理由:
2.1)旧编程语言的优点(代价)。
2.2)新编程语言的立足点。
2.3)旧径:绕过上述困难,直接沿用旧编程语言。
仅「令其函数名、过程名、变量名均可用汉字」即可。
3)致敬。
2.1)
旧的编程语言,仍在使用当中,未受淘汰。
且拥有庞大的用户群体,
多年的历史沉淀、技术支持,
出版的各种入门图书、文档、丰富详尽的函数手册,
繁杂全面的网络帮助与代码用例,
以及若干系列的测试工具(微秒级的各函数耗时百分比时间分析、
符号级\源代码级别调试器、内存检查器、svn代码上传……),
全球多层面、多场合、多语言的产品测试,
完善的售後服务,
不断的根据用户反馈或硬件改革而进行软件升级,
保证20年後该产品\本公司依然存在。
个人的作品与品牌公司在此得到最明显的对比:
个人\小工作室\普通公司 难以提供上述任何一项,无法与之竞争。
而且即令是完成了上述所有项的大公司,例如宝兰(borland)公司,
全球320万用户,21年(1987~2008)的悠久历史,无数的测试工具……
仍落得被易博龙收购的下场。所以新的编程语言,一开始就得做好亏本的打算。
2.2)
周思博有云,新技术若都用来解决一些「旧技术能解决的问题」,
则新技术必受诟病。老周此话原是揶揄微软,但换在编程语言身上,依然适合。
D语言与c–对于c来说,则患此弊。
甚至连ruby等新语言,亦因此被王垠将之与lisp相提并论,被批得烂额焦头。
所以一旦摒弃旧编程语言,则用户会循(2.1)为准 来要求新中文编程语言,
间中还夹杂着不少对中文的偏见(中国编程员对中文市场的敌视,天下知名。
无论规格书、说明书、函数手册……能不写汉字就决不用中文。
汉人学得胡儿语,却向城头骂汉人。今古皆然,不足为怪)。因而新语言的崛起,
纵不是一枝独秀、出类拔萃,也得解决一些「旧技术不能解决的问题」。
即使是内存自动回收、网络函数、反射、函数式编程……等等,都是题中
应有之义,而非亮点了。
此事并非苛求,因为既是一门全新的编程语言,众人当然认为作者是一位
开宗立派的大师,按《春秋》责备贤者的传统,臧否这位宗匠级别的作品而已。
当然,作者可以把新编程语言抛到网站上,然後撒手远飏。
通常众人亦会权当作者交了一趟作业、完成了一趟导师的论文答辩。
例如 Fabrice Bellard 的tiny cc,欠缺维护,现已少人问津了
(顺便说一句,把他的 libtcc.c\LIBTCCAPI TCCState *tcc_new(void)内
inline的preprocess_new()改一下,即可支持中文的标识符。
即令不改源代码、不重新编译,只把他的 libtcc.dll 相应改四十个字节,
也有同样效果)。
但退一步而言,如(2.1)所说,要作者熬廿年的苦日子,自费出版各种手册,
墙内墙外都租用服务器,为各国各族人民提供多语言技术支持,随时改bug,
不断推出新版本,而且这廿年很可能颗粒无收。太过强人所难了。
2.3)综上所述:
另起炉灶後,压力之大,无以复加;赢利之微,几乎倒贴。所以大部分人都蝇附骥尾,仅让
「旧编译器在吃进中文程序时,能辨认出中文标识符,从而正常编译连接,不致报错」,
就经已心满意足。
在读秀或万方上搜索,可窥见众前贤的旧迹,谨录部分于下:
王其宏《用汉字标识符的PASCAL编译程序》,载诸《长春邮电学院学报》1987年02期,
李京 《PASCAL编译程序的改造》,载诸《计算机工程与应用》1987年09期,
苗庆斌《PASCAL语言汉化的设计与实现》,载诸《计算机工程与设计》1990年03期,
章继三《中文汇编语言编程》,载诸《软件世界》1994年06期,
黄志勇《Foxpro2.5的汉化方法》,载诸《电脑》1995年12期,
阙建军《在FOXBASE下使用汉字变量名及字段名》,载诸《中国金融电脑》1996年05期
……
甚至连新人亦沿此旧径,例如aogo的masmplus,鼎龙的中文C++,竹闲的汉化各编译器。
藉旧编程语言之势,让其函数名、过程名、变量名均可使用汉字(在此强调:均可≠均须!)。
如此则旧的程序文档、编程员、代码用例……均纹风不动。
此举虽有狐假虎威之嫌、鹊巢鸠占之喻,但终究算是把(2.1)的压力尽数卸开。
然後他山之石,攻我之玉。自此,中文编程即可。终于可以不写
“render_hexagon(last_descending_point)”,改为“_填6边形(_最近降点)”了。
而且连接lib\跑lua虚拟机\正常运行python\……效果一切如常,简直有百利而无一害。
有一害:编译器每出一趟新版本,上述工作者就须配合一版汉化包,跟游戏汉化者发行
汉化包毫无区别。我这番话对游戏汉化者并无半分嘲讽之意:编译器是程序,游戏也是程序;
编译器的用户(编程员)是人,游戏的用户(玩家)也是人;而且後者的市场还大些。
而两厢的汉化者都在免费工作,都追赶在版本号後面而疲于奔命。
「疲于奔命」是巫臣的原话,但汉化者的奔命何止七次,就因为他们的辛勤工作
故意被原编译器作者所忽视(台面规则是编译器得支持unicode,潜规则却是欧美国家毋需
理睬中文市场,例如以前 go语言组对导出中文函数名的争论,
https://groups.google.com/forum/#!msg/golang-china/h_vxbPHaIvw/wFRw1Myrm3AJ
该链接在墙外,不知是否失效了),就因为他们的劳动免费而不足挂齿。
于是,总有人厌倦,就出手打造自己的中文编译器了。
3)在此,向所有披荆斩棘的中文编程员致敬:
例如(以下并非全集,且排名不分先後):O语言的作者,标天软件的BtAsm团队,
易语言的吴涛,Python的周蟒,法国的WinDev……
毋论他们在商业上是胜是败,但始终他们都为中文编程作出了自己的贡献,
默默耕耘,未必收获。全凭有他们,也纔能映照出中文编程之路,何等曲折,何等漫长,
虽是一脉如丝,仍是缕缕不断。
勉之矣,任重而道远。