找到关于 Pandas 的507 篇文章

如何在 Pandas DataFrame 中检查是否有任何值为 NaN?

Rishikesh Kumar Rishi
更新于 2021-08-30 11:49:21

851 次浏览

要检查 Pandas DataFrame 中是否有任何值为 NaN,我们可以使用 isnull().values.any() 方法。步骤创建一个序列 s,一个具有轴标签(包括时间序列)的一维 ndarray。打印序列 s。检查 NaN 是否存在。创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。检查 NaN 是否存在。示例 实时演示import pandas as pd import numpy as np s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3]) print "输入序列为:", s present = s.isnull().values.any() print "序列中存在 NaN:", present df = pd.DataFrame(    {       "x": [5, ... 阅读更多

如何在 Pandas 中重置分层索引?

Rishikesh Kumar Rishi
更新于 2021-08-30 11:47:12

296 次浏览

要在 Pandas 中重置分层索引,我们可以使用 reset_index() 方法。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。使用 groupby 获取分层索引的不同级别并进行计数。打印多分层索引 DataFrame。使用 df.reset_index() 重置多分层索引 DataFrame。打印新的更新后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame({"x": [5, 2, 1, 9], "y": [4, 1, 5, 10]}) print "输入 DataFrame 为:", df df1 = df.groupby(["x", "y"]).count() print "输入 DataFrame 的分层索引为:", df1 df2 = df1.reset_index() print "重置后:", df2输出输入 DataFrame 为:    x  y 0  5   ... 阅读更多

如何在 Pandas 中创建多索引?

Rishikesh Kumar Rishi
更新于 2021-08-30 10:11:46

263 次浏览

要在 Pandas 中创建多索引,我们可以使用列列表的 groupby。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。打印 DataFrame 计数的索引。使用 groupby 获取分层索引的不同级别并进行计数。打印步骤 4 中设置的多索引。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print "输入 DataFrame 为:", df print "默认索引:", df.count().index df1 = df.groupby(["x", "y"]).count() ... 阅读更多

将 Pandas DataFrame 转换为 NumPy 数组

Rishikesh Kumar Rishi
更新于 2021-08-30 10:02:39

626 次浏览

要将 Pandas DataFrame 转换为 NumPy 数组,我们可以使用 to_numpy()。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。使用 df.to_numpy() 打印给定数组的 NumPy 数组。使用 df['x'].to_numpy() 打印给定数组特定列的 NumPy 数组。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print "输入 DataFrame 为:", df print "DataFrame 转换为 numpy 为:", df.to_numpy() print "DataFrame 转换为 numpy 为:", df['x'].to_numpy()输出输入 ... 阅读更多

如何在 Python Pandas DataFrame 的列中统计 NaN 值?

Rishikesh Kumar Rishi
更新于 2021-08-30 09:57:44

2K+ 次浏览

要在 Pandas DataFrame 的列中统计 NaN 值,我们可以使用 isna() 方法和 sum。步骤创建一个序列 s,一个具有轴标签(包括时间序列)的一维 ndarray。打印序列 s。统计序列中 NaN 的数量。创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。按列查找 NaN 计数。打印计数 DataFrame。示例 实时演示import pandas as pd import numpy as np s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3]) print "输入序列为:", s count = s.isna().sum() print "序列中 NaN 计数:", count df = pd.DataFrame(   ... 阅读更多

基于列值删除 Python Pandas 中的 DataFrame 行

Rishikesh Kumar Rishi
更新于 2021-08-30 09:45:30

3K+ 次浏览

要基于列值删除 Pandas 中的 DataFrame 行,我们可以执行以下步骤:步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。在这里,我们将删除 DataFrame 中 Z 列包含 0 的行,使用 df=df[df.z != 0]打印更新后的 DataFrame,删除基于列值的行的结果。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print "输入 DataFrame 为:", df df ... 阅读更多

Python Pandas 中 iloc 和 loc 有什么区别?

Rishikesh Kumar Rishi
更新于 2021-08-30 09:42:42

265 次浏览

让我们举个例子来理解 iloc 和 loc 之间的区别。基本上 loc[0] 返回 0 索引处的值,而 iloc[0] 返回序列第一个位置的值。步骤创建一个具有轴标签(包括时间序列)的一维 ndarray。打印输入序列。使用 loc[0] 打印 0 索引处的值。使用 iloc[0] 打印序列表第一个位置的值。示例 实时演示import pandas as pd s = pd.Series(list("AEIOU"), index=[2, 1, 0, 5, 8]) print "输入序列为:", s print "索引=0 处的值:", s.loc[0] print "序列第一个位置的值:", ... 阅读更多

将 Pandas DataFrame 写入 CSV 文件

Rishikesh Kumar Rishi
更新于 2021-08-30 09:39:48

4K+ 次浏览

要将 Pandas DataFrame 写入 CSV 文件,我们可以执行以下步骤:步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。使用 df.to_csv 将 DataFrame 的值保存到 CSV(逗号分隔值)文件。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print "输入 DataFrame 为:", df df.to_csv("test.csv", sep='\t')输出输入 DataFrame 为:    x   y  z 0  5  4  4 1  2  1  1 2  1  5  5 3  9 10  0它将创建一个新文件("test.csv")并在其中保存 DataFrame 的值。

使用值列表从 Pandas DataFrame 中选择行

Rishikesh Kumar Rishi
更新于 2021-08-30 09:36:20

2K+ 次浏览

要基于输入值从 Pandas DataFrame 中选择行,我们可以使用 isin() 方法。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。创建一个用于选择行的值列表。打印具有给定值的选定行。接下来,打印未选定的行。示例 实时演示import pandas as pd df = pd.DataFrame(    {       "x": [5, 2, 1, 9],       "y": [4, 1, 5, 10],       "z": [4, 1, 5, 0]    } ) print "输入 DataFrame:", df values = [1, 2] print "选定的行:", ... 阅读更多

通过一次追加一行来创建 Pandas Dataframe

Rishikesh Kumar Rishi
更新于 2021-08-30 09:34:34

4K+ 次浏览

要通过一次追加一行来创建 Pandas DataFrame,我们可以迭代一个范围并在其中添加多列数据。步骤创建一个二维、大小可变的、可能异构的表格数据 df。打印输入 DataFrame。迭代范围 10。为不同索引分配数字值。打印创建的 DataFrame。示例 实时演示import pandas as pd import random df = pd.DataFrame(    {       "x": [],       "y": [],       "z": []    } ) print "输入 DataFrame:", df for i in range(10):    df.loc[i] = [i, random.randint(1, 10), random.randint(1, 10)] print "之后 ... 阅读更多

广告