python之day3(文件操作、字符转

2020-01-10 01:01:25 浏览数 (1)

文件操作

f=open(“yesterday”,”r”,encoding=”utf-8”)  #以只读模式打开文件

data=f.read()                             #读取所有内容

data2=f.read()                       #读取所有内容

print(data)                          #再次读取所有内容

print(“--------------data2--------------------”)

print(data2)          #此时无内容,因为读一次完毕后,光标已经移到最后

f.close()                             #关闭文件

f=open(“yesterday”,”w”,encoding=”utf-8”)  #以写模式创建一个文件,如果文件存在则清空

f.write(“我爱北京天安门,n”)

f.write(“天安门前太阳升”)

f.close()

f=open(“yesterday”,”a”,encoding=”utf-8”)#以追加的方式打开文件,内容增加到结尾,不能读

f.write(“我爱北京天安门,n”)

f.write(“天安门前太阳升”)

f.readline()    #逐行读取文件信息

for i inrange(5):       #打印前五行

  print(f.readline())

f.readlines()  #把文件中的每一行读取出来作为元素,组成一个大的列表

for linein f.readlines():   #打印文件中的所有内容

  print(line.strip())

forindex,line in enumerate(f.readlines()): #判断第十行打印分隔线

  if index==9:

print(“------------我是分隔线-----------------”)

continu

  print(line.strip())

当文件很大时,readlines()是一次性把所有内容读取到内存中,这种情况下内存不够使用,所以只适合读小文件。大文件的处理办法是,一行一行读取,内存中只保存一行

for linein f:   #一行一行读,内存中只保留一行

  print(line)

count =0     #高效方法

for linein f:

  count =1

  if count ==10:

print(“--------------我是分隔符---------------------”)

continue

print(line)

文件操作之增删改查

f.tell()   #光标位置,按照字符的个数计数

f.read(5)  #只读5个字符

f.seek(0) #回到文件初始位置

f.detach()     #文件编辑过程中,从一种编码转换成另一种编码

f.encoding()   #文件编码

f.name()  #打印文件名字

f.flush()  #刷新,默认是内存满了才写到文件中,用该命令会强制刷新直接写入

比如在DOS界面下执行以下命令可进行验证

 f=open(“test.text”,”w”,encoding=”utf-8”)

  f.write(“The first line.n”)   #此时打开该文件发现并没有写进去

 f.flush()       #执行刷新命令后,内容立刻写入文件

 f.write(“The second line.n”)    #再次写入内容,打开文件仍然没有第二行内容

 f.flush()      #执行刷新命令后,内容立刻写入文件

有趣的程序,进度条

import sys,time    #导入模块

for i in range(50)

sys.stdout.write(“#”)      #标准输出

sys.stdout.flush()        #标准输出刷新

time.sleep(0.1)         #间隔0.1秒输出#

f.truncate()  #什么都不写,表示清空文件

f.truncate(10)  #表示从头开始截取10个字符,与seek到什么位置无关

f=open(“yesterday”,”r ”,encoding=”utf-8”)  #以读写(确切的说是读和追加)模式打开文件

f.readline()

f.readline()   #光标到第二行

f.write(“I am coming.”)   #光标虽然已经移动到第二行,但写入的内容增加到结尾部分

f=open(“yesterday”,”w ”,encoding=”utf-8”)  #以写读模式打开文件

f.readline()

f.readline()   #先读两行,此时读不出内容,因为先以写模式打开,此时会清空文件

f.write(“I am coming.”)   #再写入文件,写入成功,但写入的内容也会加到结尾部分

注:以上的模式都无法完成对原文件插入内容,写的内容均会写入文件的结尾部分

f=open(“yesterday”,”a ”,encoding=”utf-8”)  #以追加写读模式打开文件

f=open(“yesterday”,”rb”,encoding=”utf-8”)  #二进制文件,以读模式打开,不需要加encoding,3.0网络传输(socket)只能用二进制,下载的视频文件是二进制文件

f=open(“yesterday”,”wb”,encoding=”utf-8”)  #二进制文件,以写模式打开

f.wirte(“hello binary.”)   #此时会报错,不能写入字符类型的

f.wirte(“hello binary”.encode())   #转换成字节类型,写入成功

U表示在读取时,可以将rn n自动转换成n(可以结合使用rU或r U)

文件修改,可以把内容先写入另外一个文件

with语句:当with代码块执行完毕时,内部会自动关闭释放文件资源

with open(“log”,”r”) as f1 , open(“log1”,”r”)as f2:

  forline in f1:

   print(line)

字符转编码操作

utf-8(unicode的扩展集,为可变长的):英文字符按照ascii的方式存储占用一个字节,中文统一占用三个字节

Unicode(万国编码集):中文和英文统一占用两个字节,不同编码转换必须经过unicode

ascii码:只能存储英文和特殊字符,并统一占用一个字节

python3中默认为unicode

#-*-coding:utf-8-*-

importsys                #打印系统默认编码

print(sys.getdefaultencoding())

在电脑的python2的环境下(DOS界面直接运行 )

>>>a="你好"

>>>import sys

>>>print(sys.getdefaultencoding())  #打印默认编码

ascii

>>>a_to_unicode=a.encode("utf-8")  #对a自动解码,解码时使用默认编码即ascii

Traceback(most recent call last):

  File "<stdin>", line 1, in<module>

UnicodeDecodeError:'ascii' codec can't decode byte 0xc4 in position 0: ordinal not in range(128)

>>>a_to_unicode=a.decode("utf-8")  #指定使用utf-8解码,报错

Traceback(most recent call last):

  File "<stdin>", line 1, in<module>

  File "C:Python27libencodingsutf_8.py",line 16, in decode

    return codecs.utf_8_decode(input, errors,True)

UnicodeDecodeError:'utf8' codec can't decode byte 0xc4 in position 0: invalid continuation byte

>>>a_to_unicode=a.decode("gbk")     #指定GBK解码成功,说明不指定编码集使用系统默认编码

>>>print(type(a_to_unicode))

<type'unicode'>

>>>a_to_utf8=a.decode("gbk").encode("utf-8")

>>>print(a_to_utf8)   #已经转化成utf-8,但显示的时候使用的是GBK,所以会乱码

浣犲ソ

>>> 

python3中默认是unicode

import sys print(sys.getdefaultencoding())         #打印显示utf-8 a="你好" a_to_gbk=a.encode("gbk")               #因为默认是unicode,直接encode即可 print(a_to_gbk) a_to_utf8=a.encode("utf-8")     #也可以写成a.encode() print(a_to_utf8)

函数

1、 函数是逻辑结构化和过程化的一种编程方法,主要有以下几种方式:

  • 面向对象:类----class
  • 面向过程:过程----def
  • 函数式编程:函数----def

2、 过程与函数(无明显界限)

def func1():       #定义函数 '''print func1''' print("this is func1.") return 0 def func2():     #定义过程,无返回值(python默认返回none) """printfunc2""" print("this is func2") func1()          #调用 func2()

3、 面向过程

import time def log():     time_format='%Y-%m-%d %X' time_current=time.strftime(time_format) with open("logging.txt","a") as f:         f.write("%s write alert in logging.n" %time_current) def func1(): print("in the func1.")     log() def func2(): print("in the func2.")     log() def func3(): print("in the func3.")     log() func1() func2() func3()

4、 为什么要使用函数

  • 代码重复利用
  • 保持一致性
  • 可扩展性

5、 函数的返回值

代码语言:javascript复制
def test1():
    print("in the test1.")
    return 0
    print("end of function.")   #return后面无论什么语句都不执行
test1()
代码语言:javascript复制
#运行结果正常不报错,只打印了“in the test1.”

返回值任意类型:

代码语言:javascript复制
def test1():
    print("in the test1.")
def test2():
    print("in the test2.")
    return 0
def test3():
    print("in the test3.")
    return 1,"hello",['tone',123],{"name":"tone"}
x=test1()
y=test2()
z=test3()
print(x)
print(y)
print(z)

运行结果:

None

0

(1, 'hello', ['tone',123], {'name': 'tone'})

为什么要有返回值:整个函数执行的结果,根据结果判断执行下面不同的程序。

返回值为另一个函数(高阶函数)

6、 函数的参数与调用

  • 位置参数(实参和形参要一一对应,不能多也不能少):
代码语言:javascript复制
def test(x,y)   #x,y为形参,如果不调用,xy不会占用空间
    print(x)
    print(y)
test(1,2)  #1,2为实参,内存中真实存在
  • 关键字调用:
代码语言:javascript复制
def test(x,y)
    print(x)
    print(y)
test(y=1,x=2)

注意:关键字参数不能在位置参数前面:不能写成test(x=2,4)

  • 默认参数(调用参数的时候,默认参数非必要传递):
代码语言:javascript复制
def test(x,y=2)
    print(x)
    print(y)
test(1)    
代码语言:javascript复制
#test(1,y=3)
代码语言:javascript复制
#test(4,3)

用途:指定软件安装的默认路径

  • 参数组(实参数目不固定)

位置参数:把N个位置参数转换为元组

代码语言:javascript复制
def test(*args):
    print(args)
test(1,3,4,3,4)   #与test(*[1,3,4,3,4])一样,可以传递个数实参

混合使用:

代码语言:javascript复制
def test(x,*args):
    print(x)
    print(args)
test(1,[3,4],4,3,4)

字典参数:把N个关键字参数转换为字典

代码语言:javascript复制
 def test(**kwargs):
    print(kwargs)
    print(kwargs["name"])
    print(kwargs["age"])
test(name="tone",age=23)
test(**{"name":"tone","age":23})

大混合模式:

代码语言:javascript复制
def test(name,age,height=120,*args,**kwargs):
    print(name)
    print(age)
    print(height)
    print(args)
    print(kwargs)
test("tone",23,height=180,sex="M",hobby="basketball")

7、 作用域、局部变量和全局变量

程序是按顺序执行的,所以定义的函数、过程最好放在最前面

例子程序1:

定义的函数中可以调用全局变量。

def change_name(name): print("before change ",name)     name="Alex"     #name为局部变量,只在函数中生效即作用域为本函数体 print("after change",name) name="alex"       #name为全局变量,整个程序中都生效 change_name(name) print(name)   #打印的结果仍为全局变量的值

执行结果:

C:Python35python3.exe D:/python_file/day3/test1.py

before change  alex

after change Alex

alex

局部变量默认无法改全局变量的内容,除非使用global强制声明,如:globalname

例子程序2:

列表、字典、集合、类在子程序即函数中修改局部变量就会影响全局变量,如:

def change_name(name): print("inside function ",name)     name[0]="Alex" names=["alex","tone","tom"] change_name(names) print(names)

执行结果:

C:Python35python3.exe D:/python_file/day3/test1.py

inside function  ['alex', 'tone','tom']

['Alex', 'tone', 'tom']

当全局变量与局部变量重名时,在定义局部变量的子程序内,局部变量起作用,在其他程序中全局变量起作用。

8、 递归:在函数内部,可以调用其它函数,如果一个函数在内部调用自身,这个函数就是递归函数。

递归函数的特性:

  • 必须要有一个明确的结束条件;(否则是死循环,程序默认保护机制循环999,然后报错)
  • 每次进入更深一层递归时,问题规模相比上次递归都应有所减少;
  • 递归效率不够,递归层次过多会导致栈溢出;

def calc(n): print(n) if int(n)>1: return calc(int(n/2)) print("---->",n) calc(10)

9、 eo

函数式编程介绍

python对函数式编程只支持一部分

函数式编程语言有:erlanglisphashshell

函数式编程举例,想要实现(1 2)*3-4,函数式编程:

varresult=subtract(multiply(add(1,2),3),4)

高阶函数

变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就叫高阶函数。

abs是内置函数,取一个数的绝对值:

def add(x,y,f): return f(x) f(y) res=add(3,-6,abs) print(res)

0 人点赞