关于计算机编码的笔记
生活随笔
收集整理的這篇文章主要介紹了
关于计算机编码的笔记
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
一直對于字符編碼不是很清晰,今天各種百度百科刷一下,最后看到一篇文章:
https://www.zhihu.com/question/23374078寫的實在太好了,以上總結(jié)就是 ASCII => GB2312 => GBK =>? Unicode。
unicode跟utf-8、utf -16、utf-32有什么關(guān)系呢?
Unicode 是「字符集」 UTF-8 是「編碼規(guī)則」 字符集:為每一個「字符」分配一個唯一的 ID(學(xué)名為碼位 / 碼點 / Code Point) 編碼規(guī)則:將「碼位」轉(zhuǎn)換為字節(jié)序列的規(guī)則(編碼/解碼 可以理解為 加密/解密 的過程) 轉(zhuǎn)載自:https://www.zhihu.com/question/23374078unicode,gbk和大五碼就是編碼的值,而utf-8,uft-16之類就是這個值的表現(xiàn)形式。 utf的推出也是為了解決unicode在不同機器之中的傳輸差異問題、以及內(nèi)存浪費的問題,比如2個8bit傳輸一個英文字母,那么高位字節(jié)就全是0000而浪費了一倍的內(nèi)存。 所以utf-8代表的unicode碼,對于ASCII就能表示的字符,內(nèi)存是浪費的,因為有個字節(jié)是空的。utf比gbk是更加浪費內(nèi)存的。 utf8\16\32是unicode的三套編碼方式,utf-8之中字符是以8位序列來編碼的,16、32同理。考慮到最初的目的,通常說的unicode編碼指的是utf-16 (unicode的最初目標是用1個16位的編碼來為超過65000個字符提供映射,但仍然不能覆蓋歷史上所有文字以及不能解決傳輸上的問題)。
為什么所有網(wǎng)站更鐘情于utf-8呢?
UTF-8 的幾個優(yōu)勢1. 亂碼不會擴散, GB2312 在丟失一字節(jié)等情況下會造成后續(xù)所有文字變成亂碼2. 不會產(chǎn)生錯誤的搜索結(jié)果, GB2312 在搜索的時候相鄰兩個中文會拼出一個新的字符,導(dǎo)致出現(xiàn)錯誤的搜索結(jié)果3. 更大的字符集4. 很多語言直接支持 UTF-8,部分語言存儲字符串到內(nèi)存時直接使用 UTF-8編碼。5. 與 GB2312/GB18030 相比, UTF-8是一個通用解決方案6. Unicode 一直有人維護,而 GB18030 下一次更新不知道會是什么時候了。 另 對于中文, UTF-8 和 GB2312 在 gzip 壓縮后都差不多,所以用來做網(wǎng)頁對帶寬影響很小作者:李道兵 鏈接:https://www.zhihu.com/question/19817672/answer/20527784 來源:知乎 著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。?
GB2312、GBK、GB18030 這幾種字符集的主要區(qū)別是什么?
http://www.cnblogs.com/malecrab/p/5300497.html?
創(chuàng)建數(shù)據(jù)庫的時候眾多字符編碼、排序規(guī)則又該如何選擇呢、
?
?sublime的常用設(shè)置
?
{// 配色選擇"color_scheme": "Packages/Color Scheme - Default/Monokai.tmTheme",// 字體大小"font_size": 11,"ignored_packages":["Vintage"],// 顯示編碼"show_encoding": true,"show_line_endings": true,//把 tab 轉(zhuǎn)換成4個空格"tab_size": 4,//把tab 轉(zhuǎn)換成 空格"translate_tabs_to_spaces": true ,//主題選擇 "theme": "Adaptive.sublime-theme" }?
推薦書籍:
蔣本珊 -《計算機組成原理》
?
轉(zhuǎn)載于:https://www.cnblogs.com/xuweiqiang/p/8449957.html
總結(jié)
以上是生活随笔為你收集整理的关于计算机编码的笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 将用户名保存至cookie中
- 下一篇: 一个简单IOC与DI示例