os
模块是 Python 中非常基础和重要的模块之一,常用于文件系统操作和环境变量管理。
head()
方法默认返回前五行,你也可以指定你想要查看的行数,例如df.head(10)
会返回前十行。如果你想要查看更多的行,只需要更改括号内的数字即可。
在Python字符串中,反斜杠\
是一个特殊字符,用于表示转义字符。例如,\n
表示换行,\t
表示制表符。当你在字符串中使用单个反斜杠时,Python会尝试将其解释为转义字符的开始。
-
使用原始字符串(raw string),在字符串前加上
r
,这样反斜杠就不会被当作转义字符:python
folder_path = r'C:\Users\yhshi\Desktop\python\test'
将每个反斜杠替换为双反斜杠,这样Python就会将其视为普通字符:
-
folder_path = 'C:\\Users\\yhshi\\Desktop\\python\\test'
-
使用正斜杠
/
,Python在Windows中也支持这种方式:python复制
folder_path = 'C:/Users/yhshi/Desktop/python/test'
- 遍历指定文件夹中的所有CSV文件。
-
for filename in os.listdir(folder_path):if filename.endswith('.csv'): # 确保是CSV文件# 构建完整的文件路径file_path = os.path.join(folder_path, filename)# 读取CSV文件df = pd.read_csv(file_path)# 提取前六行topSixRows = df.head(6)# 构建新文件的路径(在同一文件夹下)new_file_path = os.path.join(folder_path, f'new_{filename}')# 保存为新的CSV文件topSixRows.to_csv(new_file_path, index=False) # index=False表示不保存行索引
pd.concat()
是 pandas 库中的一个函数,用于将多个 pandas 对象(如 Series 或 DataFrame)沿一个轴合并
dfs.clear() # 清空列表
# 或者
dfs = [] # 将列表重新设置为一个新的空列表
merged_df = pd.DataFrame() # 创建一个新的空的 DataFrame
-
重置索引: 如果你想要为 DataFrame 创建一个新的从 0 开始的整数索引,可以使用
reset_index()
方法。python
merged_df = merged_df.reset_index(drop=True)
这里的
drop=True
参数意味着不将旧的索引添加为 DataFrame 的一个列。