0

0

Python文件处理方法、os模块和glob模块怎么使用

PHPz

PHPz

发布时间:2023-05-13 10:19:05

|

1115人浏览过

|

来源于亿速云

转载

    一、文件基本的操作

    1、open() 打开文件

    open() 方法用于打开一个文件,并返回file文件对象,在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会抛出 oserror。

    注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。

    open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。

    open(file, mode='r')

    完整的语法格式为:

    open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

    2、read() 读文件

    f = open(r'/Users/mac/desktop/jupyter/pythonCourseware/32.txt', mode='r')# read模式打开文件
    data = f.read() # 读取文件内容,向操作系统发起读请求,会被操作系统转成具体的硬盘操作,将内容由硬盘读入内存
    print(data)
    # 由于Python的垃圾回收机制只回收引用计数为0的变量,但是打开文件还占用操作系统的资源,所以我们需要回收操作系统的资源资源
    # del f 只是回收变量f
    f.close()

    3、write()写文件:

    # write模式打开文件
    f = open(r'/Users/mac/desktop/jupyter/pythonCourseware/32.txt', mode='w')
    f.write("""name = 'nick'
    pwd = '123'""")
    f.close()

    4、with open()方法

    with open()方法不仅提供自动释放操作系统占用资源的方法,并且with open可以使用逗号分隔,一次性打开多个文件,实现文件的快速拷贝。

    立即学习Python免费学习笔记(深入)”;

    with open('32.txt', 'rt', encoding='utf8') as f:
        print(f.read())
    
    with open('32.txt', 'rb') as fr, \
            open('35r.txt', 'wb') as fw:
        f.write(f.read())

    二、文件的打开模式

    文件操作的基础模式有四种

    • r模式:(默认)只读模式,只能读不能写,文件的指针将会放在文件的开头,文件不存在时报错。

    • w模式:覆盖写模式,文件不存在则创建, 并从开头开始编辑,即原有内容会被删除,即完全覆盖。

    • a模式:追加写模式:文件不存在则创建,存在则在文件最后追加内容,就是说,新的内容将会被写入到已有内容之后。

    文件读写内容的格式有两种

    • t模式为text (默认):文本模式

    • b模式为bytes:字节模式。

    需要注意的是:t、b这两种模式均不能单独使用,都需要与r/w/a之一连用。

    1、文件r打开模式

    1、读文本
    # rt: read by text
    # windows的操作系统默认编码为gbk,因此需要使用utf8编码
    f = open('32.txt', mode='rt', encoding='utf8')
    data = f.read()
    print(data) # nick最帅吗
    print(type(data)} # 
    f.close()
    2、读字节
    # rb: read by bytes
    f = open('32.txt', mode='rb')
    data = f.read()
    print(data) # b'aaa\nbbb\nccc\nnick\xe6\x9c\x80\xe5\xb8\x85\xe5\x90\x97'
    print(type(data)) # 
    f.close()
    3、for逐行读取,相当于readline。
    fname = input("请输入要打开的文件名称:")
    fo = open(fname, "r")
    print(type(fo))  # 
    for line in fo:
        print(line)
    fo.close()
    4、读方法:
    • read(size):一次性读取文件的所有内容,如果给出参数,读入前size长度。

    • readline(size):读入一行内容,包括换行符为 '\n'。如果给出参数,读入该行前size长度。下次可以接着上次读完的地方继续读。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。

    • readlines([sizeint]):读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。

    f = open('32.txt', mode='rt', encoding='utf8')
    print(f.readable())  #True 判断文件是否可读
    data1 = f.readline()
    data2 = f.readlines()
    print(data1) # aaa
    print(data2) # ['bbb\n', 'ccc\n', 'nick最帅吗']
    f.close()

    2、文件W打开模式

    只能写,不能读,文件存在的时候回清空文件后再写入内容;文件不存在的时候会创建文件后写入内容。

    1、文本模式
    f = open('34w.txt', mode='wt', encoding='utf8')
    print(f"f.readable(): {f.readable()}") #False
    f.write('nick 真帅呀\n')  # '\n'是换行符
    f.write('nick,nick, you drop, I drop.')
    f.write('nick 帅的我五体投地')
    f.flush()  # 立刻将文件内容从内存刷到硬盘
    f.close()
    2、字节模式
    f = open('34a.txt', mode='wb')
    f.write('nick 帅的我五体投地'.encode('unicode_escape') )  # 编码成bytes类型再写入
    print(type('nick 帅的我五体投地'.encode('unicode_escape'))) #
    f.close()

    注意:b模式是通用的模式,因为所有的文件在硬盘中都是以二进制的形式存储的。

    需要注意的是:b模式读写文件,一定不能加上encoding参数,因为二进制无法再编码。

    try:
        import requests
    
        response = requests.get( 'https://cache.yisu.com/upload/information/20220528/112/3002.jpg')
        data = response.content
    
        f = open('mv.jpg', 'wb')
        f.write(data)
        print('done...')
        f.close()
    except Exception as e:
        print(e, '报错了,那就算了吧,以后爬虫处会详细介绍')
    3、写方法:
    • write(s):将字符串写入文件,返回的是写入的字符长度。

    • writelines(lines):向文件写入一个多行字符串列表,如果需要换行则要自己加入每行的换行符。

    • flush():刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。

    3、文件a打开模式

    a: 可以追加。文件存在,则在文件的末端写入内容;文件不存在的时候会创建文件后写入内容。

    # at
    f = open('34a.txt', mode='at', encoding='utf8')
    print(f.readable()) # False
    f.write('nick 真帅呀\n')  # '\n'是换行符
    f.write('nick,nick, you drop, I drop.')
    f.write('nick 帅的我五体投地')
    f.close()

    4、+可读、可写

    • r+ :可读、可写。文件指针将会放在文件的开头。

    • rb+: 可读、可写二进制格式

    • w+: 可写、可读。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

    • wb+: 可写、可读 二进制格式

    • a+: 可追加、可读。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。

    • ab+: 可追加、可读二进制格式

    # r+t
    with open('32.txt', 'r+', encoding='utf-8') as fr:
        print(fr.readable())  # True
        print(fr.writable())  # True

    三、文件指针操作

    但凡涉及文件指针的都是字节个数。

    1、seek(offset, from_what) :改变当前文件操作指针的位置

    from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:

    • seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符

    • seek(x,1) : 表示从当前位置往后移动x个字符

    • seek(-x,2):表示从文件的结尾往前移动x个字符

    from_what 值为默认为0,即文件开头。

    f.seek(0) # 回到文件开头

    下面给出一个完整的例子:

    f = open('32.txt', 'rb+')
    print(f.write(b'0123456789abcdef')) # 16
    print(f.seek(5))  # 移动到文件的第六个字节 # 5
    print(f.read(1))  # b'5'
    print(f.seek(-3, 2))  # 移动到文件的倒数第三字节 # 13
    print(f.read(1)) # b'd'

    2、tell():告诉文件当前位置。

    每次统计都是从文件开头到当前指针所在位置

    with open('32.txt', 'rb') as fr:
        fr.seek(4, 0)
        print(fr.tell() )  # 4

    3、truncate([size]):截断

    从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;

    截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。

    文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate()要在r+或a或a+等模式下测试效果。它的参照物永远是文件头。

    truncate()不加参数,相当于清空文件。

    with open('32.txt', 'ab') as fr:
        fr.truncate(2)  # 截断2个字节后的所有字符,如果3个字节一个字符,只能截断2/3个字符,还会遗留1/3个字符,会造成乱码

    四、文件修改的两种方式

    以读的方式打开原文件,以写的方式打开一个新的文件,把原文件的内容进行修改(一行一行的修改或者全部修改),然后写入新文件,之后利用os模块的方法,把原文件删除,重命名新文件为原文件名,达到以假乱真的目的。

    方式1、将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)。

    import os
    
    with open('37r.txt') as fr, open('37r_swap.txt', 'w') as fw:
        data = fr.read()  # 全部读入内存,如果文件很大,会很卡
        data = data.replace('tank', 'tankSB')  # 在内存中完成修改
    
        fw.write(data)  # 新文件一次性写入原文件内容
    
    # 删除原文件
    os.remove('37r.txt')
    # 重命名新文件名为原文件名
    os.rename('37r_swap.txt', '37r.txt')

    方式2、将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件。

    import os
    
    with open('37r.txt') as fr, open('37r_swap.txt', 'w') as fw:
         for line in fr: # 循环读取文件内容,逐行修改
            line = line.replace('jason', 'jasonSB')
            fw.write(line)  # 新文件写入原文件修改后内容
    
    os.remove('37r.txt')
    os.rename('37r_swap.txt', '37r.txt')

    五、os文件处理模块

    os模块负责程序与操作系统的交互,提供了访问操作系统底层的接口,多用于文件处理。

    import os

    1、os模块

    • os.getcwd():获取当前工作目录,即当前python脚本工作的目录路径

    • os.chdir("dirname"):改变当前工作目录;相当于shell下cd

      a0.dev
      a0.dev

      专为移动端应用开发设计的AI编程平台

      下载
    • os.curdir:返回当前目录: ('.')

    • os.pardir:获取当前目录的父目录字符串名:('..')

    • os.listdir('dirname'):列出指定目录下的所有文件和子目录,包括隐藏文件,并以列表方式打印

    • os.chmod(path, mode):更改权限

    • os.mkdir('dirname'):生成单级目录;相当于shell中mkdir dirname

    • os.makedirs('dirname1/dirname2'):可生成多层递归目录

    • os.remove(path):删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。

    • os.removedirs('dirname1'):若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推

    • os.rmdir('dirname'):删除单级空目录,若目录不为空则无法删除,报错;相当于shell中rmdir dirname

    • os.rename("oldname","newname"):重命名文件/目录

    • os.renames(old, new):递归地对目录进行更名,也可以对文件进行更名。

    • os.stat('path/filename'):获取文件/目录信息

    • os.sep:输出操作系统特定的路径分隔符,win下为"\",Linux下为"/"

    • os.linesep:输出当前平台使用的行终止符,win下为"\t\n",Linux下为"\n"

    • os.pathsep:输出用于分割文件路径的字符串 win下为;,Linux下为:

    • os.name:输出字符串指示当前使用平台。win->'nt'; Linux->'posix'

    • os.system("bash command"):运行shell命令,直接显示

    • os.environ:获取系统环境变量

    2、os.path 模块

    主要用于获取文件的属性。

    以下是 os.path 模块的几种常用方法:

    • os.path.abspath(path):返回path规范化的绝对路径

    • os.path.split(path):将path分割成目录和文件名二元组返回

    • os.path.splitdrive(path):一般用在 windows 下,返回驱动器名和路径组成的

    • os.path.splitext(path):分割路径,返回路径名和文件扩展名的元组

    • os.path.dirname(path):返回path的目录名。其实就是os.path.split(path)的第一个元素

    • os.path.basename(path):返回path最后的文件名。如何path以/或\结尾,那么就会返回空值。即os.path.split(path)的第二个元素

    • os.path.exists(path):如果path存在,返回True;如果path不存在,返回False

    • os.path.isabs(path):如果path是绝对路径,返回True

    • os.path.isfile(path):如果path是一个存在的文件,返回True。否则返回False

    • os.path.isdir(path):如果path是一个存在的目录,则返回True。否则返回False

    • os.path.join(path2[, path3[, ...]]):将多个路径组合后返回,第一个绝对路径之前的参数将被忽略

    • os.path.getatime(path):返回path所指向的文件或者目录的最后存取时间

    • os.path.getmtime(path):返回path所指向的文件或者目录的最后修改时间

    • os.path.getsize(path): 返回文件大小,如果文件不存在就返回错误

    3、实例:

    1、获取指定目录及其子目录下的 py 文件

    import os
    import os.path
    
    """获取指定目录及其子目录下的 py 文件路径说明:l 用于存储找到的 py 文件路径 get_py 函数,递归查找并存储 py 文件路径于 l"""
    l = []
    
    
    def get_py(path, l):
        file_list = os.listdir(path)  # 获取path目录下所有文件
        for filename in file_list:
            path_tmp = os.path.join(path, filename)  # 获取path与filename组合后的路径
            if os.path.isdir(path_tmp):  # 如果是目录
                get_py(path_tmp, l)  # 则递归查找
            elif filename[-3:].upper() == '.PY':  # 不是目录,则比较后缀名
                l.append(path_tmp)
    
    
    path = input('请输入路径:').strip()
    get_py(path, l)
    print('在%s目录及其子目录下找到%d个py文件\n分别为:\n' % (path, len(l)))
    for filepath in l:
        print(filepath + '\n')

    2、显示所有视频格式文件,mp4,avi,rmvb

    import os
    
    vedio_list = []
    
    def search_file(start_dir, target) :
        os.chdir(start_dir)
        
        for each_file in os.listdir(os.curdir) :
            ext = os.path.splitext(each_file)[1]
            if ext in target :
                vedio_list.append(os.getcwd() + os.sep + each_file + os.linesep) 
            if os.path.isdir(each_file) :
                search_file(each_file, target) # 递归调用
                os.chdir(os.pardir) # 递归调用后切记返回上一层目录
    
    start_dir = input('请输入待查找的初始目录:')
    program_dir = os.getcwd()
    
    target = ['.mp4', '.avi', '.rmvb']
    
    search_file(start_dir, target)
    
    f = open(program_dir + os.sep + 'vedioList.txt', 'w')
    f.writelines(vedio_list)
    f.close()

    3、批量修改文件名

    import os
    
    path = input('请输入文件路径(结尾加上/):')
    
    # 获取该目录下所有文件,存入列表中
    fileList = os.listdir(path)
    
    n = 0
    for i in fileList:
        # 设置旧文件名(就是路径+文件名)
        oldname = path + os.sep + fileList[n]  # os.sep添加系统分隔符
    
        # 设置新文件名
        newname1 = path + os.sep + 'a' + str(n + 1) + '.JPG'
    
        os.rename(oldname, newname1)  # 用os模块中的rename方法对文件改名c:\
        print(oldname, '======>', newname1)
    
        n += 1

    七、glob模块:使用通配符查找文件

    用它可以查找符合特定规则的文件路径名。跟使用windows下的文件搜索差不多。

    查找文件只用到三个匹配符:“*”, “?”, “[]”。

    • “*”:匹配0个或多个字符;

    • “?”:匹配单个字符;

    • “[]”:匹配指定范围内的字符,如:[0-9]匹配数字。

    1、glob.glob:返回所有匹配的文件路径列表。

    它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。

    输出:类型是list型,然后就是输出相关的文件路径了

    import glob
    
    file = glob.glob(r'C:\工具\*\*\pan*.exe')
    print(type(file))  # 
    print(file)  # ['C:\\工具\\PanDownload_v2.1.3\\PanDownload\\PanDownload.exe']
    
    #获取上级目录的所有.py文件
    print (glob.glob(r'../*.py')) #相对路径

    2、glob.iglob:获取一个可遍历对象,使用它可以逐个获取匹配的文件路径名。

    与glob.glob()的区别是:glob.glob同时获取所有的匹配路径,而glob.iglob一次只获取一个匹配路径。

    下面是一个简单的例子:

    import glob
    
    #父目录中的.py文件
    f = glob.iglob(r'../*.py')
    print ( f ) # 
    for py in f:
       print  (py)

    相关文章

    python速学教程(入门到精通)
    python速学教程(入门到精通)

    python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

    下载

    相关标签:

    本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

    相关专题

    更多
    Golang gRPC 服务开发与Protobuf实战
    Golang gRPC 服务开发与Protobuf实战

    本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

    8

    2026.01.15

    公务员递补名单公布时间 公务员递补要求
    公务员递补名单公布时间 公务员递补要求

    公务员递补名单公布时间不固定,通常在面试前,由招录单位(如国家知识产权局、海关等)发布,依据是原入围考生放弃资格,会按笔试成绩从高到低递补,递补考生需按公告要求限时确认并提交材料,及时参加面试/体检等后续环节。要求核心是按招录单位公告及时响应、提交材料(确认书、资格复审材料)并准时参加面试。

    44

    2026.01.15

    公务员调剂条件 2026调剂公告时间
    公务员调剂条件 2026调剂公告时间

    (一)符合拟调剂职位所要求的资格条件。 (二)公共科目笔试成绩同时达到拟调剂职位和原报考职位的合格分数线,且考试类别相同。 拟调剂职位设置了专业科目笔试条件的,专业科目笔试成绩还须同时达到合格分数线,且考试类别相同。 (三)未进入原报考职位面试人员名单。

    58

    2026.01.15

    国考成绩查询入口 国考分数公布时间2026
    国考成绩查询入口 国考分数公布时间2026

    笔试成绩查询入口已开通,考生可登录国家公务员局中央机关及其直属机构2026年度考试录用公务员专题网站http://bm.scs.gov.cn/pp/gkweb/core/web/ui/business/examResult/written_result.html,查询笔试成绩和合格分数线,点击“笔试成绩查询”按钮,凭借身份证及准考证进行查询。

    11

    2026.01.15

    Java 桌面应用开发(JavaFX 实战)
    Java 桌面应用开发(JavaFX 实战)

    本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

    65

    2026.01.14

    php与html混编教程大全
    php与html混编教程大全

    本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

    36

    2026.01.13

    PHP 高性能
    PHP 高性能

    本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

    75

    2026.01.13

    MySQL数据库报错常见问题及解决方法大全
    MySQL数据库报错常见问题及解决方法大全

    本专题整合了MySQL数据库报错常见问题及解决方法,阅读专题下面的文章了解更多详细内容。

    21

    2026.01.13

    PHP 文件上传
    PHP 文件上传

    本专题整合了PHP实现文件上传相关教程,阅读专题下面的文章了解更多详细内容。

    35

    2026.01.13

    热门下载

    更多
    网站特效
    /
    网站源码
    /
    网站素材
    /
    前端模板

    精品课程

    更多
    相关推荐
    /
    热门推荐
    /
    最新课程
    最新Python教程 从入门到精通
    最新Python教程 从入门到精通

    共4课时 | 0.7万人学习

    Django 教程
    Django 教程

    共28课时 | 3.1万人学习

    SciPy 教程
    SciPy 教程

    共10课时 | 1.1万人学习

    关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
    php中文网:公益在线php培训,帮助PHP学习者快速成长!
    关注服务号 技术交流群
    PHP中文网订阅号
    每天精选资源文章推送

    Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号