本文简述了 Base64 编码的一些知识
简介
在一些 支持可打印字符(而不(完善)支持其他字符) 的开发场景下(譬如原始的电子邮件中),为了能够传输存储二进制数据(广义上的非打印字符),我们需要一种将二进制数据转换为可打印字符的编码方式, Base64 就是这么一种编码方式.
基础
Base64 编码的步骤如下:
- 将待转换的字节数组(即二进制数据)按每 3 个字节分为一组(共 3 x 8 = 24 bit(二进制位))
- 将上述 24 bit 按每 6 bit 一组重新分为 4 组
- 分别计算上面 4 组的索引值(6 bit 一组)
- 根据编码对照表完成转换
Base64 选用 ‘A-Z’ ‘a-z’ ‘0-9’ ‘ ’ ‘/’ 这 64 个可打印字符作为编码字符,外加 ‘=’ 作为填充字符,具体的编码对照表如下所示:
数值 | 字符 | 数值 | 字符 | 数值 | 字符 | 数值 | 字符 |
---|---|---|---|---|---|---|---|
0 | A | 16 | Q | 32 | g | 48 | w |
1 | B | 17 | R | 33 | h | 49 | x |
2 | C | 18 | S | 34 | i | 50 | y |
3 | D | 19 | T | 35 | j | 51 | z |
4 | E | 20 | U | 36 | k | 52 | 0 |
5 | F | 21 | V | 37 | l | 53 | 1 |
6 | G | 22 | W | 38 | m | 54 | 2 |
7 | H | 23 | X | 39 | n | 55 | 3 |
8 | I | 24 | Y | 40 | o | 56 | 4 |
9 | J | 25 | Z | 41 | p | 57 | 5 |
10 | K | 26 | a | 42 | q | 58 | 6 |
11 | L | 27 | b | 43 | r | 59 | 7 |
12 | M | 28 | c | 44 | s | 60 | 8 |
13 | N | 29 | d | 45 | t | 61 | 9 |
14 | O | 30 | e | 46 | u | 62 |
|
15 | P | 31 | f | 47 | v | 63 | / |
示例
现在我们来对二进制数据(如果用 ASCII 码表示的话就是字符串 ABC)进行 Base64 编码
010000010100001001000011 ( A B C ) 010000010100001001000011(ABC) 010000010100001001000011(ABC)
转换过程如下表所示:
文本 | A | B | C | |||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ASCII编码 | 65 | 66 | 67 | |||||||||||||||||||||
二进制位 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 |
索引 | 16 | 20 | 9 | 3 | ||||||||||||||||||||
Base64编码 | Q | U | J | D |
Base64 按 3个字节 分组编码,对于字节数组长度不是 3 字节倍数的情况,我们需要进行填充: 先使用 0 字节值在末尾补足,使字节数组长度能够被 3 整除,然后再进行 Base64 编码,最后在编码后的 Base64 文本后加上一个或两个 ‘=’ 号, 用以代表补足的字节数.
下面的示例展示了以下二进制数据的转换过程:
01000001 ( A ) 0100001001000011 ( B C ) 01000001(A) \ 0100001001000011(BC) 01000001(A)0100001001000011(BC)
文本 | A | |||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ASCII编码 | 65 | |||||||||||||||||||||||
二进制位 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | ||||||||||||||||
二进制位(补0) | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
索引 | 16 | 16 | ||||||||||||||||||||||
Base64编码 | Q | Q | = | = | ||||||||||||||||||||
文本 | B | C | ||||||||||||||||||||||
ASCII编码 | 66 | 67 | ||||||||||||||||||||||
二进制位 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | ||||||||
二进制位(补0) | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
索引 | 16 | 36 | 12 | |||||||||||||||||||||
Base64编码 | Q | k | M | = |
参考资料
- Base64 wiki
- 一篇文章彻底弄懂Base64编码原理