Python入门教程笔记（一）简介、变量及基本数据类型

一简介

优点：

面向对象、解释型的编程语言
吉多·范罗苏姆于1989年发明
使用缩进作为逻辑层次
简单明了、容易上手、功能强大
社区活跃、用户基数大、开发效率高
入门难度低

缺点：

运行效率低

二、Python基础数据类型

整数

整数和我们生活中定义的整数是一个概念，例如：1,2,3,10,100,1000,-1000 等等，都是整数，Python可以处理任意大小的整数。

对于整数，除了生活中常用的十进制以外，计算机由于使用二进制，所以，在计算机中也常用二进制或者十六进制表示整数。相比十进制数，在Python中使用以下方式表示二进制数和十六进制数。

二进制数只使用数字0、1表示，在Python中，二进制整数使用前缀0b表示，比如：0b0110，0b1100。

十六进制数除了0~9十个数字以外，还使用a、b、c、d、e、f，在Python中，十六进制使用前缀0x，比如：0x12ef，0xde2431af。

浮点数

浮点数对应我们生活的是小数，例如：0.1,0.5, 12.34, 3.1415926等，都是浮点数。

为什么小数在计算机领域被称为浮点数呢？这是因为按照科学记数法表示时，一个浮点数的小数点位置是可变的（浮动的），比如，1.23x109和12.3x108是相等的，因此称为浮点数。

浮点数可以用数学写法，如1.23，3.14，-9.01。但是对于很大或很小的浮点数，就必须用科学计数法表示，在Python中，把10用e替代，比如：1.23x10^9就是1.23e9，或者12.3e8，0.000012可以写成1.2e-5。

这里有必要提醒一点就是，整数和浮点数在计算机内部存储的方式是不同的，整数运算永远是精确的，而浮点数运算则可能会有四舍五入的误差，如何检验，可以在Python终端中输入以下内容0.1 0.2，看看可以得到你期望的结果0.3吗？真实结果可能让你失望了。

字符串

字符串对应生活中的就是非数字类型的内容，比如一个句子，一段话，在Python中就是字符串，在Python中，字符串是以''或""括起来的任意文本，比如'abc'，"xyz"等等。请注意，''或""本身只是一种表示方式，不是字符串的一部分，因此，字符串'abc'只有a，b，c这3个字符。

布尔值

布尔值对应于生活中的就是对和错，在计算机的世界里，大部分判断都是非错则对的，布尔值和布尔代数的表示完全一致，一个布尔值只有True、False两种值，要么是True，要么是False，在Python中，可以直接用True、False表示布尔值（请注意大小写，不需要使用字符串符号括起来），也可以通过布尔运算计算出来。

布尔值可以用and、or和not运算（注意and,or,not都是Python语言本身的关键字）。

and运算是与运算，只有所有都为 True，and运算结果才是 True。

or运算是或运算，只要其中有一个为 True，or 运算结果就是 True。

not运算是非运算，它是一个单目运算符，把 True 变成 False，False 变成 True。

空值

空值是Python里一个特殊的值，用None表示。

注意，None和0是不一样的，None不能理解为0，因为0是有意义的，比如我有0个苹果表示我没有苹果，0表达的是数值0的意思，而不能表示为我有None个苹果，None是一个特殊的空值。

三、变量

合法的变量名

只是在计算机程序中，变量不仅可以是数字，还可以是任意数据类型（字符串、布尔值、空值、字典等）。在Python中，定义一个变量需要遵循一定的约束，否则，Python可能识别不出它是一个变量。

变量名由大小写英文字母、数字和下划线_组成
变量不能用数字开头
变量尽量不要和Python关键字重合（比如前面学习过的：and、or、not，否则可能导致Python原有关键字发挥不出作用）

以下这些变量的定义都是合法的:

代码语言：javascript复制

num, count, _none, min_value

他们都满足上面的三个条件。

以下这些变量的定义都是不合法的:

代码语言：javascript复制

1num, 666, 1_cd, and

定义变量

定义变量的方式很简单，通过变量名 =数据，即可定义一个变量。

举个例子：

代码语言：javascript复制

a = 1

在这个例子里面，a就是变量，它的值是一个整数1。

代码语言：javascript复制

hello = 'Hello'

在这个例子里面，hello就是变量，它的值是一个字符串'Hello'。

在Python里面，一个变量可以先后存储多种不同类型的数据。

代码语言：javascript复制

a = 1 # 这个时候a存储的是整数类型
print(a)
a = 'ABC' # 这个时候a存储的是字符串类型
print(a)

这是Python这类语言特有的特性，我们称之为动态语言，与之对应的是静态语言，Python、Javascript等等都是动态语言，Java、C、C 等等属于静态语言。

四、整数与浮点数

在Python中，整数和浮点数虽然属于不同的数值类型，但是在运算上是可以一起运算的，这从生活经验出发，也是可以理解的。

四则运算

整数、浮点数可以直接进行四则运算。

代码语言：javascript复制

# 加法
num1 = 10
num2 = 0.5
result = num1   num2
print(result) # ==> 10.5
# 减法
result = num1 - num2
print(result) # ==> 9.5
# 乘法
result = num1 * num2
print(result) # ==> 5.0
# 除法
result = num1 / num2
print(result) # ==>20.0

从上面可以发现一个规律，整数和浮点数运算后，得到的结果不管小数点后是否有值，结果都变成浮点数了，这是合理的，浮点数可以表达整数的结果，但是整数不能表达浮点数的结果。

注意：在Python2使用除法可能和Python3得到不一样的结果

代码语言：javascript复制

# python2
num1 = 10
num2 = 3
result = num1 / num2
print(result) # ==> 3
# python3
num1 = 10
num2 = 3
result = num1 / num2
print(result) # ==> 3.3333333333333335

可以看到在python2，得到的是一个整数的结果，这是因为除数和被除数都是整数时，得到的结果也默认保存为整数了，这是非常不科学的，因此在python3，改进了这一点。

取模运算

Python数字支持取模运算，使用百分号%表示取模。

代码语言：javascript复制

print(3 % 2) # ==> 1
print(33 % 10) # ==> 3
print(99 % 30) # ==> 9

恰当使用取模运算，可以判断一个数是否为偶数，当一个数对2取模结果为0时，则这个数为偶数，否则为奇数。

代码语言：javascript复制

print(3 % 2) # ==> 1 因此3为奇数
print(33 % 2) # ==> 1 因此33为奇数
print(100 % 2) # ==> 0 因此100为偶数

地板除

Python除了普通除法以外，还有一个特殊的除法被称为地板除，对于地板除，得到的结果会忽略纯小数的部分，得到整数的部分，地板除使用//进行。

代码语言：javascript复制

10//4 # ==> 2
10//2.5 # ==> 4.0
10//3 # ==> 3

小数点位数

使用Python计算小数的时候，经常需要保留小数点后若干位，可以使用round()函数来处理，这里先了解round的调用方式，使用两个参数，第一个是需要保留小数点位数的数值，第二个是保留的位数。

代码语言：javascript复制

num = 10 / 3
print(num) # ==> 3.3333333333333335
# 使用round保留两位小数
round(num, 2) # ==> 3.33

五、布尔类型

布尔类型是Python的基础数据类型，布尔类型只有True和False两种值，本节课我们学习布尔类型的集中运算。

与运算

只有两个布尔值都为 True 时，计算结果才为 True。

代码语言：javascript复制

True and True # ==> True
True and False # ==> False
False and True # ==> False
False and False # ==> False

或运算

只要有一个布尔值为 True，计算结果就是 True。

代码语言：javascript复制

True or True # ==> True
True or False # ==> True
False or True # ==> True
False or False # ==> False

非运算

把True变为False，或者把False变为True：

代码语言：javascript复制

not True # ==> False
not False # ==> True

这些运算有什么用呢？计算机程序是由无数的逻辑分支组成的，通过布尔运算，可以在计算机中实现条件判断，根据计算结果为True或者False，计算机可以自动执行不同的后续代码，因此学习布尔运算也是非常有必要的。

在Python中，布尔类型还可以与其他数据类型（字符串，数字等）做 and、or和not运算，请看下面的代码：

代码语言：javascript复制

a = True
print(a and 0 or 99) # ==> 99

得到的计算结果不是布尔类型，而是数字99，这是为什么呢？

因为Python把0、空字符串和None看成False，其他数值和非空字符串都看成True，所以：

True and 0计算结果是0 继续计算0 or 99计算结果是 99 因此，结果是99。需要注意的是，not计算的优先级是高于and和or的。

代码语言：javascript复制

True and not False # ==> True

在上述布尔计算中，先计算not False = True，然后再计算True and True，因此得到True的结果。

短路计算

在计算a and b时，如果 a 是 False，则根据与运算法则，整个结果必定为 False，因此返回 a；如果 a 是 True，则整个计算结果必定取决与 b，因此返回 b。

在计算a or b时，如果 a 是 True，则根据或运算法则，整个计算结果必定为 True，因此返回 a；如果 a 是 False，则整个计算结果必定取决于 b，因此返回 b。

所以Python解释器在做布尔运算时，只要能提前确定计算结果，它就不会往后算了，直接返回结果。

六、字符串

前面我们讲解了什么是字符串。字符串可以用' '或者" "括起来表示。

如果字符串本身包含'怎么办？比如我们要表示字符串 I'm OK ，这时，可以用" "括起来表示：

代码语言：javascript复制

"I'm OK"

类似的，如果字符串包含"，我们就可以用' '括起来表示：

代码语言：javascript复制

'Learn "Python" in imooc'

但是，如果字符串既包含'又包含"怎么办？

这个时候，就需要对字符串中的某些特殊字符进行“转义”，Python字符串用进行转义。

要表示字符串Bob said "I'm OK"

由于'和"会引起歧义，因此，我们在它前面插入一个表示这是一个普通字符，不代表字符串的起始，因此，这个字符串又可以表示为

代码语言：javascript复制

'Bob said "I'm OK".'

注意：转义字符不计入字符串的内容中。

常用的转义字符还有： n 表示换行 t 表示一个制表符 \ 表示字符本身

七、raw字符串与多行字符串

如果一个字符串包含很多需要转义的字符，对每一个字符都进行转义会很麻烦。为了避免这种情况，我们可以在字符串前面加个前缀r，表示这是一个 raw 字符串，里面的字符就不需要转义了。例如：

代码语言：javascript复制

r'(~_~)/ (~_~)/'

但是r'...'表示法不能表示多行字符串，也不能表示包含'和 "的字符串。

如果要表示多行字符串，可以用'''...'''表示：

代码语言：javascript复制

'''Line 1
Line 2
Line 3'''

上面这个字符串的表示方法和下面的是完全一样的：

代码语言：javascript复制

'Line 1nLine 2nLine 3'

还可以在多行字符串前面添加r，把这个多行字符串也变成一个raw字符串：

代码语言：javascript复制

r'''Python is created by "Guido".
It is free and easy to learn.
Let's start learn Python in imooc!'''

八、字符串format

字符串是Python程序重要的数据类型，到目前为止，我们输出的字符串的内容都是固定的，但有时候通过字符串输出的内容不是固定的，这个时候需要使用format来处理字符串，输出不固定的内容。

字符串format由两个部分组成，字符串模板和模板数据内容组成，通过大括号{}，就可以把模板数据内容嵌到字符串模板对应的位置。

代码语言：javascript复制

# 字符串模板
template = 'Hello {}'
# 模板数据内容
world = 'World'
result = template.format(world)
print(result) # ==> Hello World

如果模板中{}比较多，则容易错乱，那么在format的时候也可以指定模板数据内容的顺序。

代码语言：javascript复制

# 指定顺序
template = 'Hello {0}, Hello {1}, Hello {2}, Hello {3}.'
result = template.format('World', 'China', 'Beijing', 'imooc')
print(result) # ==> Hello World, Hello China, Hello Beijing, Hello imooc.
# 调整顺序
template = 'Hello {3}, Hello {2}, Hello {1}, Hello {0}.'
result = template.format('World', 'China', 'Beijing', 'imooc')
print(result) # ==> Hello imooc, Hello Beijing, Hello China, Hello World.

除了使用顺序，还可以指定对应的名字，使得在format过程更加清晰。

代码语言：javascript复制

# 指定{}的名字w,c,b,i
template = 'Hello {w}, Hello {c}, Hello {b}, Hello {i}.'
world = 'World'
china = 'China'
beijing = 'Beijing'
imooc = 'imooc'
# 指定名字对应的模板数据内容
result = template.format(w = world, c = china, b = beijing, i = imooc)
print(result) # ==> Hello World, Hello China, Hello Beijing, Hello imooc.

九、字符串编码

在python2中，字符串的编码问题是使用python2必经历的门槛，所幸到了python3，python3从编程语言的层面就减少了很多编码的问题，但是学习字符串编码还是很有必要的。

为什么有编码问题

因为计算机只能处理数字，如果要处理文本，就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特（bit）作为一个字节（byte），所以，一个字节能表示的最大的整数就是255（二进制11111111=十进制255），0 - 255被用来表示大小写英文字母、数字和一些符号，这种编码方式被称为ASCII编码，比如大写字母 A 的编码是65，小写字母 z 的编码是122。

如果要表示中文，显然一个字节是不够的，至少需要两个字节，而且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，用来把中文编进去。类似的，日文和韩文等其他语言也有这个问题。为了统一所有文字的编码，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode通常用两个字节表示一个字符，原有的英文编码从单字节变成双字节，只需要把高字节全部填为0就可以。

python3的编码

在python3中，默认使用UTF-8 Unicode来进行编码，因此我们可以在python中输入任意形式的Unicode字符串，都不会遇到像python2中遇到的问题（在python2中，需要显式指明该字符串是Unicode字符串），如果没有了解过python2，则完全可以忽略这一点，python3提供了更加简单易懂的编码方式。

代码语言：javascript复制

s1 = '这是中文字符串'
s2 = 'this is an English string'
print(s1)
print(s2)

在python3中，中文字符串和英文字符串无异。

十、字符串切片

字符串由一个个字符组成，每一个字符都有一个唯一的位置。比如字符串'ABC'，第一个字符是A，第二个字符是B，第三个字符是C。

因此我们可以使用位置的方式取出字符串中特定位置的字符，按照位置取字符串的方式使用中括号[]访问，这个时候可以把字符串看作是一个列表（一种新的数据类型，在后面会继续学习），不过需要注意的是，在程序的世界中，计数是从0开始的，使用0来表示第一个。

代码语言：javascript复制

s = 'ABC'
a = s[0] # 第一个
b = s[1] # 第二个
c = s[2] # 第三个
print(a) # ==> A
print(b) # ==> B
print(c) # ==> C

有时候，我们会想获取字符串的一部分（子串），这个时候我们采取切片的方式获取，切片需要在中括号[]中填入两个数字，中间用冒号分开，表示子串的开始位置和结束位置，并且这是半闭半开区间，不包括最后的位置。

代码语言：javascript复制

ab = s[0:2] # 取字符串s中的第一个字符到第三个字符，不包括第三个字符
print(ab) # ==> AB

我们定义一个更长的字符串，了解切片更多的细节。

代码语言：javascript复制

s = 'ABCDEFGHIJK'
abcd = s[0:4] # 取字符串s中的第一个字符到第五个字符，不包括第五个字符
print(abcd) # ==> ABCD
cdef = s[2:6] # 取字符串s中的第三个字符到第七个字符，不包括第七个字符
print(cdef) # ==> CDEF

编程算法 unicode python

0 人点赞

Python入门教程笔记（一）简介、变量及基本数据类型

一 简介

二、Python基础数据类型

整数

浮点数

字符串

布尔值

空值

三、变量

合法的变量名

定义变量

四、整数与浮点数

四则运算

取模运算

地板除

小数点位数

五、布尔类型

与运算

或运算

非运算

短路计算

六、字符串

七、raw字符串与多行字符串

八、字符串format

九、字符串编码

为什么有编码问题

python3的编码

十、字符串切片

一简介