了解 unicode 编码 与 utf-8 一语道破 乱码的实本质
概念原理
知道下面这些点,应该就明了了吧电脑中只能存储二进制数据,电脑操作的最小单位是 byte字节,一个字节是 8bit(8位)。字符的存储:电脑只能存储数字,所以要将字符转为对应的数字进行存储。各种编码(unicode,ascii,gbk等等):功能就是字符与数字的对应关系,所以每种编码会有对应的编码表utf-8 : 是unicode编码实现的一种方式: 就是按照编码表,将字符以怎样的方式在电脑中进行存取。也就是用几个 byte 来存储字符对应的数字。为什么会出现乱码?其实很简单啦。由于编码方案众多,交叉使用编码方案就会乱码。譬如: 我们中文可以用 gbk,utf-8 ,如果我们用 gbk 进行存,... ...
阅读全文
位运算基础 计算机原码,反码,补码
概念原理
一. 概念1. 机器数一个数在计算机中的表现形式叫做机器数,这个数有正负之分,在计算机中用一个数的最高位(符号位)用来表示它的正负,其中0 表示正数,1 表示负数。例如:正数 7,在计算机中用一个8位的二进制数来表示,是 00000111,负数 -7,则用 10000111 表示,这里的 00000111 和 10000111 是机器数2. 真数计算机中的机器数对应的真实的值就是真数,对最高位(符号位)后面的二进制数转换成 10进制,并根据最高位来确定这个数的正负。对于上面的 00000111 和 10000111 来说,对最高位后面的二进制数转换成10进制是7,在结合最高位的值,得出对应的真... ...
阅读全文