-
Unicode编码中的简繁中文互转
现在简繁中文的转换已经不像从前那样,是gbk/ big5两种文字编码之间的转换,而是在同一个编码,Unicode,当中不同编码的映射。当然,简繁中文绝对不是简单的一一对应关系,有一对多的个别情况,例如简体的“后” 对应繁体的 “后”和“後”。行业词汇也有差别,例如大陆说“宽带”,而港台说“寬頻”;大陆说“操作系统”,而港台说“作業系統” 等等。 因此当我决定用Python程序将森海塞尔简体中文网站转换为繁体中文网站时,我的计划分三个步骤: 提取行业高频关键字,找到简体和繁体的对应,编成词典 利用现有的Python中文本地化工具包,将关键字之外的文字转换 请港台Freelancer人工校对,确保本土化 第一步,我的词典替换程序在此: 第二步,我利用的是pyzh中文工具包中的fanjian.py完成。特别感谢pyzh项目组的全部成员和fanjian.py程序作者ne.manman和zsp007! 下面就交给香港的朋友了,希望不会累坏他:) 顺便说,Songbird很不错,有点山寨iTunes,那又怎样呢?毕竟Linux下面还没iTunes。 Songbird
-
Foxmail 6 beta5与UTF-8的问题
这是我这几天遇到的问题: 邮件地址一般是 “姓名”<[email protected]> 但是如果姓名部分是中文,而且是UTF-8编码的,那么Foxmail beta5收到后就变成 [email protected]> ?部分是全部或部分乱码,但是这样的地址由于格式混乱已经无法回复了,只能重写。而我们并不是每次发Email都看一遍收件人地址对吧。一不小心发出去,就会给退回来,而普通用户肯定会被一堆出错信息弄晕的。 感觉这几年Foxmail有点不思进取了,不过还是希望Foxmail Team尽快加强对UTF-8的支持!