如何将目录下的所有 Excel 文件读取为 Pandas DataFrame?


若要读取目录中的所有 Excel 文件,请使用 Glob 模块和 read_excel() 方法。

假设目录中包含以下 Excel 文件 −

Sales1.xlsx

Sales2.xlsx

首先,设置包含所有 Excel 文件的路径。获取 Excel 文件并使用 glob 读取它们 −

path = "C:\Users\amit_\Desktop\"

filenames = glob.glob(path + "\*.xlsx")
print('File names:', filenames)

接下来,使用 for 循环迭代并在特定目录中读取所有 Excel 文件。我们还在使用 read_excel() −

for file in filenames:
   print("Reading file = ",file)
   print(pd.read_excel(file))

示例

以下是完整的代码 −

import pandas as pd
import glob

# getting excel files from Directory Desktop
path = "C:\Users\amit_\Desktop\"

# read all the files with extension .xlsx i.e. excel 
filenames = glob.glob(path + "\*.xlsx")
print('File names:', filenames)

# for loop to iterate all excel files 
for file in filenames:
   # reading excel files
   print("Reading file = ",file)
   print(pd.read_excel(file))

输出

此代码将生成以下输出 −

File names:['C:\Users\amit_\Desktop\Sales1.xlsx','C:\Users\amit_\Desktop\Sales2.xlsx']

Reading file = C:\Users\amit_\Desktop\Sales1.xlsx
          Car      Place   UnitsSold
0        Audi  Bangalore          80
1     Porsche     Mumbai         110
2  RollsRoyce       Pune         100

Reading file = C:\Users\amit_\Desktop\Sales2.xlsx
          Car      Place   UnitsSold
0         BMW      Delhi         95
1    Mercedes  Hyderabad         80
2  Lamborgini Chandigarh         80

更新于: 2021 年 9 月 27 日

11K+ 浏览量

职业起步

完成该课程以获得认证

开始
广告