本文解答:JS如何按自定义格式拼接二进制串?如何解析二进制串?
什么是二进制串?
当你要存一些数据时,可以用自定义格式存下来,这样最节约空间。
例如,你想存这些数据:
- ID(范围0-16)
- 是否VIP(范围0-1)
- 星座(范围0-11)
- 年龄(范围0-127)
那么你可以规定这种自定义格式的二进制串:dddddddc cccbaaaa
其中d c b a都是代表0或1,我们用最后4位(aaaa)表示“ID”,用b表示“是否VIP”,用ccc表示“星座”,用dddd表示年龄。
本来你可能会用uint32的数组来存这些,占4*32=128位,但是现在,我们只用了16位,2个uint8就存下了。非常节约存储空间。这就是一种自定义格式的二进制串。
注意:当今存储确实不贵,但是如果你希望把信息存放到URL中,那么你的空间越小,URL就越短。这时候价值就非常大了。例如我之前开发象棋小游戏,把棋局信息(包括当前棋盘状态、所有回合操作记录)都存到了URL中,就能非常方便的保存、分享游戏对局,方便大家复盘。详见文章《保存象棋棋盘信息,需要多少比特?我只用139-167位二进制》
在JS中,对应的数据类型是Uint8Array。
拼接自定义格式二进制串
代码语言:typescript复制function concatBits(current: number, offset: number, bits: number, bitsLength: number) {
let newCurrent = current;
let newOffset = offset;
const newUint8: number[] = [];
if (offset bitsLength < 8) {
newCurrent |= bits << (8 - bitsLength - offset);
newOffset = bitsLength;
} else if (offset bitsLength === 8) {
newUint8.push(current | bits);
newCurrent = 0;
newOffset = 0;
} else {
newCurrent |= bits >> (offset - 8 bitsLength);
newUint8.push(newCurrent);
newCurrent = (bits << (16 - offset - bitsLength)) & 0xff;
newOffset = offset - 8 bitsLength;
}
return [newCurrent, newOffset, newUint8];
}
当然这还是有个限制:bitsLength必须小于等于8。如果超过8,可能一个bits要覆盖3个uint8,这种情况没考虑在内。
如果你需要拓展,欢迎继续完善它!
解析自定义格式二进制串
代码语言:typescript复制function readBits(array: Uint8Array, bitsOffset: number, bitsLength: number) {
const offset = bitsOffset % 8;
const index = Math.floor(bitsOffset / 8);
if ((offset bitsLength > 8 && index 1 >= array.length) || offset bitsLength <= 8 && index >= array.length) {
throw new Error('readBitsError');
}
let number = offset bitsLength <= 8 ? array[index] : (array[index] << 8) | array[index 1];
const length = offset bitsLength <= 8 ? 8 : 16;
number >>= (length - bitsLength - offset);
number &= ([0, 1, 3, 7, 15, 31, 63][bitsLength]);
return [number, bitsOffset bitsLength];
}
decode难点
相比encode,decode其实是更难的事情。
因为encode时,你只需要无脑往一个字节串后面补充就好。而decode需要你非常清楚,每一位的作用,并理解他们的含义。你需要有高超的位运算技巧,才能轻易完成。
如何知道一共有多少项目
设计数据结构时,我们没有把项目数作为一个变量,所以数组长度是未知的。
也就是说,我们必须不断循环,直到这个字节串没有内容了,我们就终止。
如何读取制定长度bit位的内容
我们封装一个函数readBits
,用于读取某个字节串,从第x位开始、长度为n的内容。
因此,需要3个参数:
- 字节串
array
- 位偏移量
bitsOffset
- 要读取的长度
bitsLength
返回值主要是对应的内容(可以用一个uint8来表示),此外,读取后还需要更新一下调用者的位偏移量bitsOffset
,方便持续调用,所以我们顺便把新的位偏移量bitsOffset
返回,作为返回值第二项。
解释
在本文场景下,要读取的长度bitsLength
不超过8,所以我们要关注的数据量,只会来自1个uint8或者某连续2个uint8。
计算index
就是为了判断第一个关键的uint8的位置。
计算offset
,知道应该从index
的第几位开始算数。
然后通过比较offset bitsLength
和8
的大小,就知道我们需要关注1个uint8即可、还是需要关注连续2个uint8。
我们把需要关注的uint8赋值给number
,用length
表示我们关注8位还是16位。
例如number二进制是10110000
,我们需要取从2开始的长度为2的内容(即11
)。该怎么做呢?
只需要把它右移4位(用于删除不需要的后缀),再跟二进制11
做个与操作(用于删除不需要的前缀),即可。
因此代码会这样写:number >>= (length - bitsLength - offset);
number &= ([0, 1, 3, 7, 15, 31, 63][bitsLength]);
。
其中0 1 3 7 15 31 63,对应二进制分别是0 1 11 111 1111 11111 111111。都是为了删除前缀。
这里因为我需要的bitsLength有限,所以我用这种方式偷懒了。如果你要做的更通用,可能要这样写:2 ** bitsLength - 1
,目的是获取位长度为bitsLength的全是1的数字,用于删除number不需要的前缀。
readBits
开发完毕,以后可以这样调用:
let current;
let bitsOffset = 0;
[current, bitsOffset] = readBits(array, bitsOffset, 4);
这会读取字节串array的从第0位开始、长度为4个bit位的内容,赋值给current变量。
写在最后
我是HullQin,公众号线下聚会游戏的作者(欢迎关注我,交个朋友)。转发本文前需获得作者HullQin授权。我独立开发了《联机桌游合集》,是个网页,可以很方便的跟朋友联机玩UNO、飞行棋、斗地主、五子棋、一夜狼、狼人杀、象棋、德国心脏病、达芬奇密码等游戏,不收费无广告。还开发了《Dice Crush》参加Game Jam 2022。喜欢可以关注我噢~我有空了会分享做游戏的相关技术,会在这个专栏里分享:《教你做小游戏》。