字元編碼 Encoding
- 每個軟體開發者都絕對一定要會的Unicode及字元集必備知識
- 字符,字符集,字符編碼
- ASCII (1 bytes)
- 亂碼問題
- Unicode
- UTF-32 每個字元都是 4 bytes,浪費空間
- UTF-16 (2 或 4 bytes,中文為 4 bytes),是許多程式語言內部儲存的方式 (Ruby 除外)
- UTF-8 (不定長度 1~4 bytes,中文用 3 bytes),ASCII 是 UTF-8 的子集,因此廣泛應用在 HTML 上
- Comparison of Unicode encodings
- W3C: Choosing & applying a character encoding
- Big5 (2 bytes) 過時了
- BOM 標記不建議 UTF-8 使用,造成的問題比當初想要解決的還要多