741 次浏览
介绍Pandas 具有双重选择功能,可以使用索引位置或索引标签选择数据子集。在这篇文章中,我将向您展示如何使用索引标签“选择使用索引标签的数据子集”。请记住,Python 字典和列表是内置数据结构,它们通过使用索引标签或索引位置来选择其数据。字典的键必须是字符串、整数或元组,而列表必须使用整数(位置)或切片对象进行选择。Pandas 有 .loc 和 .iloc 属性,可用于以其独特的方式执行索引操作。 ... 阅读更多
1K+ 次浏览
在这篇文章中,我们将介绍使用 Pandas 处理大型 CSV 文件的选项。CSV 文件是常见的数据容器,如果您有一个大型 CSV 文件想要使用 pandas 有效地处理,您可以选择以下几种方法。Pandas 是一个内存工具您需要能够将数据放入内存中才能使用 pandas 处理它。如果您一次可以处理一部分数据,则可以将其读入块并处理每个块。或者,如果您知道您有足够的内存来加载文件,则有一些提示可以 ... 阅读更多
在本教程中,我们将学习使用 pandas 库合并、连接和串联 DataFrame。我认为您已经熟悉 DataFrame 和 pandas 库。让我们逐一查看这三个操作。合并我们有一个名为 pandas.merge() 的方法,它合并 DataFrame,类似于数据库连接操作。按照以下步骤获得所需的输出。合并方法使用公共列进行合并操作。初始化 DataFrame。使用三个参数 DataFrame、how(定义数据库连接操作)、on(DataFrame 的公共字段)调用方法 pandas.merge()。示例让我们看一个示例。# 导入 pandas 库 import pandas # 创建 DataFrame ... 阅读更多
2K+ 次浏览
Pandas 是一个 Python 库,它提供了许多用于数据分析的功能,这些功能在 Python 标准库中是不可用的。其中一项功能是使用 DataFrame。它们是表示列和行的矩形网格。在创建 DataFrame 时,我们决定列的名称并在后续数据操作中引用它们。但是,在创建 DataFrame 后,我们可能需要更改列的名称。在本文中,我们将了解如何实现这一点。使用 rename()这是最常用的方法,因为我们可以同时更改 ... 阅读更多
布尔索引帮助我们使用布尔向量从 DataFrame 中选择数据。我们需要一个具有布尔索引的 DataFrame 才能使用布尔索引。让我们看看如何实现布尔索引。创建一个数据字典。将其转换为具有布尔索引作为向量的 DataFrame 对象。现在,使用布尔索引访问数据。请参阅下面的示例以了解。示例import pandas as pd # 数据 data = { 'Name': ['Hafeez', 'Srikanth', 'Rakesh'], 'Age': [19, 20, 19] } # 创建一个具有布尔索引向量的 DataFrame data_frame = pd.DataFrame(data, index = [True, False, True]) ... 阅读更多
Pandas Data Frame 是一种二维数据结构,即数据以表格形式排列在行和列中。它可以使用 python dict、list 和 series 等创建。在本文中,我们将了解如何向现有 DataFrame 添加新列。因此,首先让我们使用 pandas series 创建一个 DataFrame。在下面的示例中,我们将 pandas series 转换为一列的 DataFrame,并为其命名为 Month_no。示例import pandas as pd s = pd.Series([6, 8, 3, 1, 12]) df = pd.DataFrame(s, columns=['Month_No']) print (df)输出运行以上代码将给出 ... 阅读更多
10K+ 次浏览
Pandas series 是一种一维带标签的数组,能够保存任何类型的数据(整数、字符串、浮点数、python 对象等)。可以使用多种方法访问 pandas series 的元素。让我们首先创建一个 pandas series,然后访问其元素。创建 Pandas Series可以使用各种形式的数据(如 ndarray、list、常量)和索引值来创建 pandas series,这些索引值必须是唯一的且可散列的。下面给出一个示例。示例import pandas as pd s = pd.Series([11, 8, 6, 14, 25], index = ['a', 'b', 'c', 'd', 'e']) print s输出运行以上代码将给出以下结果 ... 阅读更多