2007年6月12日 星期二

Unicode到底是什麼?

The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

上面是一篇Joel的文章, 用淺顯易懂的文字說明Unicode的原理。不知道UTF-7, UTF-8, UTF-16, UTF-32嗎?看一下這篇文章吧......還有, wchar_t這個type在UNIX/LINUX上的GCC是4個byte, 在Windows是佔2個byte, programmer一定要注意到這個。
一般來說, unicode的implementation依平台不同, 甚至依compiler而不同, 如果想要避免這種implementation的差異, 可以用現在最portable的unicode支援 - ICU。ICU支援C/C++和Java, .NET好像沒有, 不過.NET有一個System.Text.Encoding, 這個也能支援unicode不同格式之間的互轉。

沒有留言: