编程小知识 之 Base64 编码

2021-02-04 09:58:13 浏览数 (1)

本文简述了 Base64 编码的一些知识

简介

在一些 支持可打印字符(而不(完善)支持其他字符) 的开发场景下(譬如原始的电子邮件中),为了能够传输存储二进制数据(广义上的非打印字符),我们需要一种将二进制数据转换为可打印字符的编码方式, Base64 就是这么一种编码方式.

基础

Base64 编码的步骤如下:

  • 将待转换的字节数组(即二进制数据)按每 3 个字节分为一组(共 3 x 8 = 24 bit(二进制位))
  • 将上述 24 bit 按每 6 bit 一组重新分为 4 组
  • 分别计算上面 4 组的索引值(6 bit 一组)
  • 根据编码对照表完成转换

Base64 选用 ‘A-Z’ ‘a-z’ ‘0-9’ ‘ ’ ‘/’ 这 64 个可打印字符作为编码字符,外加 ‘=’ 作为填充字符,具体的编码对照表如下所示:

数值

字符

数值

字符

数值

字符

数值

字符

0

A

16

Q

32

g

48

w

1

B

17

R

33

h

49

x

2

C

18

S

34

i

50

y

3

D

19

T

35

j

51

z

4

E

20

U

36

k

52

0

5

F

21

V

37

l

53

1

6

G

22

W

38

m

54

2

7

H

23

X

39

n

55

3

8

I

24

Y

40

o

56

4

9

J

25

Z

41

p

57

5

10

K

26

a

42

q

58

6

11

L

27

b

43

r

59

7

12

M

28

c

44

s

60

8

13

N

29

d

45

t

61

9

14

O

30

e

46

u

62

15

P

31

f

47

v

63

/

示例

现在我们来对二进制数据(如果用 ASCII 码表示的话就是字符串 ABC)进行 Base64 编码

010000010100001001000011 ( A B C ) 010000010100001001000011(ABC) 010000010100001001000011(ABC)

转换过程如下表所示:

文本

A

B

C

ASCII编码

65

66

67

二进制位

0

1

0

0

0

0

0

1

0

1

0

0

0

0

1

0

0

1

0

0

0

0

1

1

索引

16

20

9

3

Base64编码

Q

U

J

D

Base64 按 3个字节 分组编码,对于字节数组长度不是 3 字节倍数的情况,我们需要进行填充: 先使用 0 字节值在末尾补足,使字节数组长度能够被 3 整除,然后再进行 Base64 编码,最后在编码后的 Base64 文本后加上一个或两个 ‘=’ 号, 用以代表补足的字节数.

下面的示例展示了以下二进制数据的转换过程:

01000001 ( A ) 0100001001000011 ( B C ) 01000001(A) \ 0100001001000011(BC) 01000001(A)0100001001000011(BC)

文本

A

ASCII编码

65

二进制位

0

1

0

0

0

0

0

1

二进制位(补0)

0

1

0

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

索引

16

16

Base64编码

Q

Q

=

=

文本

B

C

ASCII编码

66

67

二进制位

0

1

0

0

0

0

1

0

0

1

0

0

0

0

1

1

二进制位(补0)

0

1

0

0

0

0

1

0

0

1

0

0

0

0

1

1

0

0

0

0

0

0

0

0

索引

16

36

12

Base64编码

Q

k

M

=

参考资料
  • Base64 wiki
  • 一篇文章彻底弄懂Base64编码原理

0 人点赞