在实际应用中,我们有时需要获取文件的状态信息,如下所示:
- 文件的类型:普通文件、目录、符号链接、设备文件或管道(一般在Linux上);
- 文件的访问权限:一般为读、写、执行,3个权限;
- 文件的最后的访问时间(对应read操作)、最后的修改时间(对应write操作)、最后的节点状态更改时间(对应的chang_move、chang_name的操作)
- 获取文件的大小,也就是字节数;
在Python中,我们可以使用os模块的 state() 和os.path模块来获取文件的状态信息。
标准库os模块下的三个系统调用:stat、fstat、lstat,获取文件状态
这三个方法都可以获取文件状态,基本上是一样的。下面说一下细微的差别:
stat和lstat的差异表现在对符号链接文件的操作,os.lstat('x.txt')返回符号链接x.txt文件的状态;而os.stat('x.txt'):返回的是a.txt文件的状态,因为stat,要跟随符号链接,指向a.txt文件。
这里科普一下链接文件,在linux系统中可以通过 `ln` 创建软连接,当我们需要在不同目录中使用相同的文件时,不需要在每个目录中都放置一个相同的文件,只需在某个固定目录中存放该文件,并在其他目录中使用 `ln` 命令链接该文件即可,不会重复占用磁盘空间。
fstat和stat功能一样,差异是 os.fstat() 操作的是文件的描述符(fileno),不是文件路径;
import os
s = os.stat('b.txt')
print(s.st_size)
得到结果:os.stat_result(st_mode=33206, st_ino=1688849861701466, st_dev=570835157, st_nlink=1, st_uid=0, st_gid=0, st_size=0, st_atime=1726048532, st_mtime=1726048532, st_ctime=1726044657)
属性 | 解释 |
st_mode | 权限模式 |
st_ino | inode 节点号 |
st_dev | inode 驻留的设备 |
st_nlink | inode 的链接数, |
st_uid | 所有者的用户ID |
st_gid | 所有者的组ID |
st_size | 普通文件以字节为单位的大小 |
st_atime | 最后一次访问的时间 |
st_mtime | 最后一次修改的时间 |
st_ctime | 文件创建时间 |
如果想要访问文件的相关信息,则可直接通过点语法获取。
python中定义了一个 state 模块,os.stat是将文件的相关属性读出来,然后用stat模块来处理
下面认识一下 state 模块的一些标识符,注意是 state 模块,不是 os.state()
stat.S_ISUID: Set user ID on execution. 不常用stat.S_ISGID: Set group ID on execution. 不常用stat.S_ENFMT: Record locking enforced. 不常用stat.S_ISVTX: Save text image after execution. 在执行之后保存文字和图片stat.S_IREAD: Read by owner. 对于拥有者读的权限stat.S_IWRITE: Write by owner. 对于拥有者写的权限stat.S_IEXEC: Execute by owner. 对于拥有者执行的权限stat.S_IRWXU: Read, write, and execute by owner. 对于拥有者读写执行的权限stat.S_IRUSR: Read by owner. 对于拥有者读的权限stat.S_IWUSR: Write by owner. 对于拥有者写的权限stat.S_IXUSR: Execute by owner. 对于拥有者执行的权限stat.S_IRWXG: Read, write, and execute by group. 对于同组的人读写执行的权限stat.S_IRGRP: Read by group. 对于同组读的权限stat.S_IWGRP: Write by group. 对于同组写的权限stat.S_IXGRP: Execute by group. 对于同组执行的权限stat.S_IRWXO: Read, write, and execute by others. 对于其他组读写执行的权限stat.S_IROTH: Read by others. 对于其他组读的权限stat.S_IWOTH: Write by others. 对于其他组写的权限stat.S_IXOTH: Execute by others. 对于其他组执行的权限
import os
import stat
s = os.stat('b.txt')
print(stat.S_ISDIR(s.st_mode)) #是不是目录:False
print(stat.S_ISREG(s.st_mode)) #是不是文件:True
看上面这个例子,通过这种方式我们就可以获取一些文件的状态信息了。
除了系统调用的方式,我们还可以通过标准库中os.path下的一些方法,去获取文件状态信息。
这些 os.path 下的函数,其实底层也是系统调用,但是操作起来会更加快捷一点。下面介绍一些常用函数:
方法 | 说明 |
os.path.abspath(path) | 返回绝对路径 |
os.path.basename(path) | 返回文件名 |
os.path.commonprefix(list) | 返回list(多个路径)中,所有path共有的最长的路径 |
os.path.dirname(path) | 返回文件路径 |
os.path.exists(path) | 如果路径 path 存在,返回 True;如果路径 path 不存在,返回 False。 |
os.path.lexists | 路径存在则返回True,路径损坏也返回True |
os.path.expanduser(path) | 把path中包含的"~"和"~user"转换成用户目录 |
os.path.expandvars(path) | 根据环境变量的值替换path中包含的"$name"和"${name}" |
os.path.getatime(path) | 返回最近访问时间(浮点型秒数) |
os.path.getmtime(path) | 返回最近文件修改时间 |
os.path.getctime(path) | 返回文件 path 创建时间 |
os.path.getsize(path) | 返回文件大小,如果文件不存在就返回错误 |
os.path.isabs(path) | 判断是否为绝对路径 |
os.path.isfile(path) | 判断路径是否为文件 |
os.path.isdir(path) | 判断路径是否为目录 |
os.path.islink(path) | 判断路径是否为链接 |
os.path.ismount(path) | 判断路径是否为挂载点 |
os.path.join(path1[,path2[,...]]) | 把目录和文件名合成一个路径 |
os.path.normcase(path) | 转换path的大小写和斜杠 |
os.path.normpath(path) | 规范path字符串形式 |
os.path.realpath(path) | 返回path的真实路径 |
os.path.relpath(path[, start]) | 从start开始计算相对路径 |
os.path.samefile(path1, path2) | 判断目录或文件是否相同 |
os.path.sameopenfile(fp1, fp2) | 判断fp1和fp2是否指向同一文件 |
os.path.samestat(stat1, stat2) | 判断stat tuple stat1和stat2是否指向同一个文件 |
os.path.split(path) | 把路径分割成 dirname 和 basename,返回一个元组 |
os.path.splitdrive(path) | 一般用在 windows 下,返回驱动器名和路径组成的元组 |
os.path.splitext(path) | 分割路径,返回路径名和文件扩展名的元组 |
os.path.splitunc(path) | 把路径分割为加载点与文件 |
os.path.walk(path, visit, arg) | 遍历path,进入每个目录都调用visit函数,visit函数必须有3个参数(arg, dirname, names),dirname表示当前目录的目录名,names代表当前目录下的所有文件名,args则为walk的第三个参数 |
os.path.supports_unicode_filenames | 设置是否支持unicode路径名 |