存档
-
基于字频分析的字符编码检查方案
语义分析太难,但基于常用字/生僻字字频分析的方法应该还是可行的。 因为如果生僻字的出现频率太高,有很高概率文本 […]
5,360 次浏览 | 没有评论2015年4月9日 | 归档于 技术 -
新一代通用字符转换环境
用过Unicue或者Ansi2Unicode的童鞋或许会留意到程序目录下有一个叫charmaps的文件夹,没错 […]
9,653 次浏览 | 7 条评论标签: Ansi2Unicode, big-endian, BIG5, c4-lib, GBK, little-endian, Shift-JIS, unicode, Unicode補完計畫, UniCue, UTF-16, utf-8 -
Chinese Converter – 简繁繁简转换程序
稍微花了一点时间写了这个简繁繁简字符转换程序。主要为了验证通用库的扩展能力,程序功能不是目的,因此以后基本不会 […]
6,631 次浏览 | 2 条评论 -
猜猜看:哪一种转换方法最快
蛋疼写了三种UTF-16到UTF-8的转换方法。其中一个不出所料果然很慢,但另外的两个测试结果让余跌了一下眼镜 […]
14,447 次浏览 | 2 条评论 -
UniCue 1.3beta6 – 一个编码转换工具
名字来由:Uni代表Unicode,Cue为cuesheet,意为将各种编码的cue文件转换到unicode编 […]
21,682 次浏览 | 8 条评论 -
ANSI2Unicode 1.0.3正式版发布
ANSI2Unicode是开源项目UniCue的组成部分。ANSI2Unicode致力于文档编码的转换,通过自 […]
18,382 次浏览 | 5 条评论2010年9月11日 | 归档于 程序 -
tinyXml处理UTF-8编码详解——写入和读取
以前写过一篇博文介绍tinyXml输出utf-8文档。 tinyXml的特点是不对xml节点内容的具体编码处理 […]
16,904 次浏览 | 没有评论 -
GBK、Shift-JIS、BIG5编码检测算法
字符串的编码检测需要使用自定义的映射表,使用系统自带的Codepage是不大可能有准确率的,系统Codepag […]
14,159 次浏览 | 1 条评论2010年6月8日 | 归档于 程序 -
UTF-8到Unicode的转换以及UTF-8编码的检测
UTF-8到Unicode的转换和UTF-8编码的检测思路是一样的,转换是一个不完全的检测,而检测则是一遇到错 […]
4,711 次浏览 | 没有评论2010年6月6日 | 归档于 程序 -
Ansi to Unicode 1.0发布
一个可用的版本终于出来了。 完成Shift-JIS、GBK、Big5到Unicode的自定义映射表,可以实现这 […]
4,820 次浏览 | 没有评论2010年6月6日 | 归档于 程序
评论