找到关于 Pandas 的 507 篇文章
898 次浏览
要对 Pandas DataFrame 的多列进行排序,可以使用 sort_values() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。初始化一个变量 col 来排序列。打印排序后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 7, 0], "y": [4, 7, 5, 1], "z": [9, 3, 5, 1] } ) print "输入 DataFrame 为:", df col = ["x", "y"] df = df.sort_values(col, ascending=[False, True]) print "排序列 ", col, "后 DataFrame 为:", df输出输入 DataFrame 为: x y z 0 5 4 9 1 2 7 3 2 7 5 5 3 0 1 1 排序列 ['x', 'y'] 后 DataFrame 为: x y z 2 7 5 5 0 5 4 9 1 2 7 3 3 0 1 1
374 次浏览
要对 Pandas DataFrame 中的一列进行排序,可以使用 sort_values() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。初始化一个变量 col 来排序列。打印排序后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 7, 0], "y": [4, 10, 5, 1], `"z": [9, 3, 5, 1] } ) print "输入 DataFrame 为:", df col = "x" df = df[col].sort_values(ascending=False) print "排序列 ", col, "后 DataFrame 为:", df输出输入 DataFrame 为: x y z 0 5 4 9 1 2 10 3 2 7 5 5 3 0 1 1 排序列 x 后 DataFrame 为: 2 7 0 5 1 2 3 0 Name: x, dtype: int64
16K+ 次浏览
可以使用 lambda 表达式在 DataFrame 的列上使用 apply() 函数。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。使用 lambda x: x*2 表达式通过 apply() 方法覆盖列 x。打印修改后的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 5], "y": [4, 10, 5, 10], "z": [1, 1, 5, 1] } ) print "输入 DataFrame 为:", df df['x'] = df['x'].apply(lambda x: x * 2) print "应用乘以 2 后 DataFrame 为:", df输出输入 DataFrame 为: x y z 0 5 4 1 1 2 10 1 2 1 5 5 3 5 10 1 应用乘以 2 后 DataFrame 为: x y z 0 10 4 1 1 4 10 1 2 2 5 5 3 10 10 1
4K+ 次浏览
要计算 Pandas 中 DataFrame 列中值的频率,可以使用 df.groupby(列名).size() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。打印列 x 的频率。打印列 y 的频率。打印列 z 的频率。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 5], "y": [4, 10, 5, 10], "z": [1, 1, 5, 1] } ) print "输入 DataFrame 为:", df col = "x" count = df.groupby('x').size() print "列 ", col, "中值的频率,… 阅读更多
9K+ 次浏览
要检查 Pandas DataFrame 中是否存在列,可以执行以下步骤:步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。用列名初始化一个 col 变量。创建一个用户定义的函数 check() 来检查 DataFrame 中是否存在列。用有效的列名调用 check() 方法。用无效的列名调用 check() 方法。示例 实时演示import pandas as pd def check(col): if col in df: print "列", col, "存在于 DataFrame 中。" else: print "列", col, "不存在于 DataFrame 中。" df = pd.DataFrame( ... 阅读更多
34K+ 次浏览
要在 Pandas DataFrame 中选择除一列之外的所有列,可以使用 df.loc[:, df.columns != ]。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。用要排除的列名初始化一个变量 col。使用 df.loc[:, df.columns != col] 创建另一个不包含特定列的 DataFrame。打印不包含 col 列的 DataFrame。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print("输入 DataFrame 为:", df) col ... 阅读更多
36K+ 次浏览
要从 DataFrame 的单元格中获取值,可以使用索引和 col 变量。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。初始化索引变量。初始化 col 变量。获取对应于索引和 col 变量的单元格值。打印单元格值。示例 实时演示import pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print("输入 DataFrame 为:", df) index = 2 col = "y" cell_val = df.iloc[index][col] print ... 阅读更多
606 次浏览
要将 Pandas DataFrame 列中的 NaN 值替换为零或其他值,可以使用 df.fillna() 方法。步骤:创建一个二维的、大小可变的、可能异构的表格数据 df。打印输入 DataFrame df。使用 df.fillna(0) 将 DataFrame 中的 NaN 替换为值 0。同样,使用 df.fillna(5) 和 df.fillna(7) 将 DataFrame 中的 NaN 分别替换为 5 和 7。打印替换 NaN 后的 DataFrame。示例 实时演示import pandas as pd import numpy as np df = pd.DataFrame( { "x": [5, np.nan, 1, np.nan], "y": [np.nan, 1, np.nan, 10], "z": [np.nan, 1, np.nan, np.nan] } ... 阅读更多
819 次浏览
为了用零或其他值替换 Pandas Series 列中的 NaN 值,我们可以使用 s.fillna() 方法。步骤创建一个具有轴标签(包括时间序列)的一维 ndarray。打印输入序列。使用 s.fillna(0) 将序列中的 NaN 替换为值 0。类似地,使用 s.fillna(5) 和 s.fillna(7) 将序列中的 NaN 分别替换为值 5 和 7。打印替换后的 NaN 序列。示例 在线演示导入 pandas as pd 导入 numpy as np s = pd.Series([1, np.nan, 3, np.nan, 3, np.nan, 7, np.nan, 3]) print "输入序列为:", s print "替换 NaN 为 0 后:", s.fillna(0) print "替换 NaN 为 5 后:", s.fillna(5) ... 阅读更多
2K+ 次浏览
要创建一个带有某些索引的 DataFrame,我们可以传递一个值列表并将它们分配到 DataFrame 类中的索引中。步骤创建一个二维、大小可变的、可能是非同质的表格数据 df。在 DataFrame 类的索引中放入一个索引列表。打印具有自定义索引的 DataFrame。示例 在线演示导入 pandas as pd df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] } ) print "输入 DataFrame 为:", df df = pd.DataFrame( { "x": [5, 2, 1, 9], "y": [4, 1, 5, 10], "z": [4, 1, 5, 0] }, index=["John", "Jacob", "Ally", "Simon"] ) print "带有自定义索引: ", df输出输入 DataFrame 为: x y z 0 5 4 4 1 2 1 1 2 1 5 5 3 9 10 0 带有自定义索引: x y z John 5 4 4 Jacob 2 1 1 Ally 1 5 5 Simon 9 10 0