- Python Pandas 教程
- Python Pandas - 首页
- Python Pandas - 简介
- Python Pandas - 环境设置
- Python Pandas - 基础
- Python Pandas - 数据结构简介
- Python Pandas - 索引对象
- Python Pandas - 面板
- Python Pandas - 基本功能
- Python Pandas - 索引和数据选择
- Python Pandas - Series
- Python Pandas - Series
- Python Pandas - 切片 Series 对象
- Python Pandas - Series 对象的属性
- Python Pandas - Series 对象上的算术运算
- Python Pandas - 将 Series 转换为其他对象
- Python Pandas - DataFrame
- Python Pandas - DataFrame
- Python Pandas - 访问 DataFrame
- Python Pandas - 切片 DataFrame 对象
- Python Pandas - 修改 DataFrame
- Python Pandas - 从 DataFrame 中删除行
- Python Pandas - DataFrame 上的算术运算
- Python Pandas - I/O 工具
- Python Pandas - I/O 工具
- Python Pandas - 使用 CSV 格式
- Python Pandas - 读取和写入 JSON 文件
- Python Pandas - 从 Excel 文件读取数据
- Python Pandas - 将数据写入 Excel 文件
- Python Pandas - 使用 HTML 数据
- Python Pandas - 剪贴板
- Python Pandas - 使用 HDF5 格式
- Python Pandas - 与 SQL 的比较
- Python Pandas - 数据处理
- Python Pandas - 排序
- Python Pandas - 重新索引
- Python Pandas - 迭代
- Python Pandas - 连接
- Python Pandas - 统计函数
- Python Pandas - 描述性统计
- Python Pandas - 使用文本数据
- Python Pandas - 函数应用
- Python Pandas - 选项和自定义
- Python Pandas - 窗口函数
- Python Pandas - 聚合
- Python Pandas - 合并/连接
- Python Pandas - 多级索引
- Python Pandas - 多级索引基础
- Python Pandas - 使用多级索引索引
- Python Pandas - 使用多级索引的高级重新索引
- Python Pandas - 重命名多级索引标签
- Python Pandas - 对多级索引排序
- Python Pandas - 二元运算
- Python Pandas - 二元比较运算
- Python Pandas - 布尔索引
- Python Pandas - 布尔掩码
- Python Pandas - 数据重塑和透视
- Python Pandas - 透视
- Python Pandas - 堆叠和取消堆叠
- Python Pandas - 熔化
- Python Pandas - 计算虚拟变量
- Python Pandas - 分类数据
- Python Pandas - 分类数据
- Python Pandas - 分类数据的排序和排序
- Python Pandas - 比较分类数据
- Python Pandas - 处理缺失数据
- Python Pandas - 缺失数据
- Python Pandas - 填充缺失数据
- Python Pandas - 缺失值的插值
- Python Pandas - 删除缺失数据
- Python Pandas - 使用缺失数据进行计算
- Python Pandas - 处理重复项
- Python Pandas - 重复数据
- Python Pandas - 计数和检索唯一元素
- Python Pandas - 重复标签
- Python Pandas - 分组和聚合
- Python Pandas - GroupBy
- Python Pandas - 时间序列数据
- Python Pandas - 日期功能
- Python Pandas - Timedelta
- Python Pandas - 稀疏数据结构
- Python Pandas - 稀疏数据
- Python Pandas - 可视化
- Python Pandas - 可视化
- Python Pandas - 其他概念
- Python Pandas - 注意事项和陷阱
- Python Pandas 有用资源
- Python Pandas - 快速指南
- Python Pandas - 有用资源
- Python Pandas - 讨论
Python Pandas - 从 Excel 文件读取数据
Pandas 库提供了强大的数据操作和分析工具。它提供的关键功能之一是能够读取和写入 Excel 文件中的数据。Pandas 提供了 **read_excel()** 方法来读取 Excel 文件并将数据加载到 Pandas DataFrame 中。该函数支持来自本地文件系统或 URL 的 **xls** 和 **xlsx** 文件扩展名,并且需要 **xlrd** 和 **openpyxl** 包才能运行。
Pandas 中支持的 Excel 文件格式
**pandas.read_excel()** 方法可以使用不同的模块读取各种 Excel 文件格式 -
**Excel 2007+ (.xlsx)** 文件可以使用 **openpyxl** Python 模块读取。
**Excel 2003 (.xls)** 文件可以使用 **xlrd** 模块读取。
**二进制 Excel (.xlsb)** 文件可以使用 **pyxlsb** 模块读取。
所有格式都可以使用 calamine 引擎读取。
在本教程中,我们将学习如何使用 **pandas.read_excel()** 方法从 Excel 文件读取数据,涵盖不同的场景,例如加载单个工作表、特定工作表和多个工作表。
在 Pandas 中读取 Excel 文件
**pandas.read_excel()** 方法用于读取或加载 Excel 文件到 Pandas DataFrame 中。此方法支持多种 Excel 文件格式,例如 **.xls**、**.xlsx**、**.xlsm** 等,来自本地文件系统或 URL。
注意:请确保您已在系统中安装了所需的包(xlrd 和 openpyxl)。如果没有,请使用以下命令安装 -
pip install openpyxl或
pip install xlrd
示例
这是一个使用 **pd.read_excel()** 方法将本地系统 Excel 文件读取到 DataFrame 中的简单示例,方法是指定文件路径。
import pandas as pd
# Read an Excel file
df = pd.read_excel('data.xlsx')
# Print the DataFrame
print('Output DataFrame:')
print(df)
以下是上述代码的输出 -
Output DataFrame:
| Sr.no | Name | Gender | Age | |
|---|---|---|---|---|
| 0 | 1 | Braund | female | 38 |
| 1 | 2 | Cumings | male | 22 |
| 2 | 3 | Heikkin | female | 35 |
| 3 | 4 | Futrelle | female | 26 |
从 Excel 文件读取特定工作表
Excel 文件可能包含多个具有不同名称的工作表。要将特定工作表加载到 Pandas DataFrame 中,您可以将工作表名称或索引指定到 **pd.read_excel()** 方法的 **sheet_name** 参数。
示例
以下是从 Excel 文件中使用 **pd.read_excel()** 方法将特定工作表读取到 Pandas DataFrame 中的示例。
import pandas as pd
# Read a specific sheet
df = pd.read_excel('data.xlsx', sheet_name="Sheet_2")
# Print the DataFrame
print('Output DataFrame:')
print(df)
以下是上述代码的输出 -
Output DataFrame:
| Name | Value | |
|---|---|---|
| 0 | string1 | 1 |
| 1 | string2 | 3 |
| 2 | Comment | 5 |
将多个工作表读取到 DataFrame 中
如果 Excel 文件包含多个工作表,并且您需要将其中一些工作表读取到 Pandas DataFrame 中,则可以通过将工作表名称或索引列表传递到 **pd.read_excel()** 方法的 **sheet_name** 参数来实现。
示例
此示例使用 **pd.read_excel()** 方法将 Excel 文件中的多个工作表读取到 DataFrame 字典中。
import pandas as pd
# Read multiple sheets
df = pd.read_excel('data.xlsx', sheet_name=[0, 1])
# Print the DataFrame
print('Output Dict of DataFrames:')
print(df)
以下是上述代码的输出 -
Output Dict of DataFrames:
{0: Sr.no Name Gender Age
0 1 Braund female 38
1 2 Cumings male 22
2 3 Heikkin female 35
3 4 Futrelle female 26, 1: Name Value
0 string1 1
1 string2 3
2 Comment 5}