找到关于 Pandas 的 507 篇文章
127 次浏览
假设您有一个时间序列,并且前三天和后三天的结果如下所示:前三天:2020-01-01 Chennai 2020-01-03 Delhi Freq: 2D, dtype: object 后三天:2020-01-07 Pune 2020-01-09 Kolkata Freq: 2D, dtype: object 为了解决这个问题,我们将遵循以下步骤 -解决方案 定义一个序列并将其存储为数据。使用 pd.date_range() 函数,起始日期为“2020-01-01”,周期为 5,频率为“2D”,并将其保存为 time_series time_series = pd.date_range('2020-01-01', periods = 5, freq ='2D') 设置 date.index = time_series 打印前三天,使用 data.first(’3D’) 并将其保存… 阅读更多
86 次浏览
生成数据框中每一行最大值与最小值的比值的结果为:0 43.000000 1 1.911111 2 2.405405 3 20.000000 4 7.727273 5 6.333333 为了解决这个问题,我们将遵循以下步骤 -解决方案 1 定义一个大小为 30 的数据框,包含 1 到 100 之间的随机元素,并将数组重塑为 (6, 5) 以更改为二维数组 df = pd.DataFrame(np.random.randint(1, 100, 30).reshape(6, 5)) 创建 df.apply 函数,在 lambda 方法内计算 np.max(x)/np.min(x),轴为 1,并保存为 max_of_min。其定义如下: max_of_min = df.apply(lambda x: np.max(x)/np.min(x), axis=1) 最后打印 max_of_min 示例让我们检查以下… 阅读更多
963 次浏览
假设您有一个数据框,并且每一列的第二小值的结果如下所示:Id 2 Salary 30000 Age 23 为了解决这个问题,我们将遵循以下步骤 -解决方案 定义一个数据框 设置 df.apply() 函数,在其中创建 lambda 函数并设置变量 x 来访问所有列,并检查表达式 x.sort_values().unique()[1],轴为 0,以返回第二小值,如下所示: result = df.apply(lambda x: x.sort_values().unique()[1], axis=0) 示例让我们检查以下代码以更好地理解 -import pandas as pd df = pd.DataFrame({'Id':[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], 'Salary':[20000, 30000, 50000, ... 阅读更多
345 次浏览
假设您有一个数据框,缺失值最少的列如下所示:数据框: Id Salary Age 0 1.0 20000.0 22.0 1 2.0 NaN 23.0 2 3.0 50000.0 NaN 3 NaN 40000.0 25.0 4 5.0 80000.0 NaN 5 6.0 NaN 25.0 6 7.0 350000.0 26.0 7 8.0 55000.0 27.0 8 9.0 60000.0 NaN 9 10.0 70000.0 24.0 缺失值最少的列是:Id 为了解决这个问题,我们将遵循以下步骤… 阅读更多
379 次浏览
假设您有一个日期范围,总工作日数的结果如下所示:日期:DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03', '2020-01-06', '2020-01-07', '2020-01-08', '2020-01-09', '2020-01-10', '2020-01-13', '2020-01-14', '2020-01-15', '2020-01-16', '2020-01-17', '2020-01-20', '2020-01-21', '2020-01-22', '2020-01-23', '2020-01-24', '2020-01-27', '2020-01-28', '2020-01-29', '2020-01-30', '2020-01-31'], dtype='datetime64[ns]', freq='B') 总天数:23 解决方案 1 定义一个函数 business_days() 设置 pd.bdate_range() 函数的起始… 阅读更多
124 次浏览
假设您有一个数据框,并且使用 C 顺序和 F 顺序展平记录的结果如下所示:flat c_order: [10 12 25 13 3 12 11 14 24 15 6 14] flat F_order: [10 25 3 11 24 6 12 13 12 14 15 14] 解决方案 为了解决这个问题,我们将遵循以下步骤 -定义一个数据框 应用 df.values.ravel() 函数,在其中设置参数 order='C' 并将其保存为 C_order,C_order = df.values.ravel(order='C') 应用 df.values.ravel() 函数,在其中设置参数 order='F' 并将其保存为 F_order,F_order = df.values.ravel(order='F') 示例让我们检查以下代码以更好地理解… 阅读更多
79 次浏览
假设您有一个数据框,并且包含元组列表的 orderDict 的结果如下所示:OrderedDict([('Index', 0), ('Name', 'Raj'), ('Age', 13), ('City', 'Chennai'), ('Mark', 80)]) OrderedDict([('Index', 1), ('Name', 'Ravi'), ('Age', 12), ('City', 'Delhi'), ('Mark', 90)]) OrderedDict([('Index', 2), ('Name', 'Ram'), ('Age', 13), ('City', 'Chennai'), ('Mark', 95)]) 解决方案 为了解决这个问题,我们将遵循以下步骤 -定义一个数据框 设置 for 循环,使用 df.itertuples() 函数访问所有行,在其中设置 name='stud' for row in df.itertuples(name='stud') 使用 rows._asdict() 函数将所有行转换为包含元组列表的 orderDict,并将其保存为 dict_row。最后打印值,dict_row = row._asdict() print(dict_row) 示例让我们检查… 阅读更多
143 次浏览
假设您有一个数据框,并且调整后和未调整后的 EWM 的结果如下所示:adjusted ewm: Id Age 0 1.000000 12.000000 1 1.750000 12.750000 2 2.615385 12.230769 3 2.615385 13.425000 4 4.670213 14.479339 non adjusted ewm: Id Age 0 1.000000 12.000000 1 1.666667 12.666667 2 2.555556 12.222222 3 2.555556 13.407407 4 4.650794 14.469136 解决方案 为了解决这个问题,我们将遵循以下步骤 -定义一个数据框 使用 df.ewm(com=0.5).mean() 计算延迟为 0.5 的调整后 EWM。df.ewm(com=0.5).mean() 使用 df.ewm(com=0.5).mean() 计算延迟为 0.5 的未调整后 EWM。df.ewm(com=0.5, adjust=False).mean() 示例 import numpy as np import pandas as pd df ... 阅读更多
227 次浏览
解决方案 为了解决这个问题,我们将遵循以下步骤 -定义一个数据框 应用 df.interpolate 函数,在其中 method='linear',limit_direction='forward',并填充 NaN limit = 2 df.interpolate(method ='linear', limit_direction ='forward', limit = 2) 示例 import pandas as pd df = pd.DataFrame({"Id":[1, 2, 3, None, 5], "Age":[12, 12, 14, 13, None], "Mark":[80, 90, None, 95, 85], }) print("数据框是:",df) print("插值缺失值:") print(df.interpolate(method ='linear', limit_direction ='forward', limit = 2)) 输出 数据框是: Id Age Mark 0 1.0 12.0 80.0 1 2.0 12.0 90.0 2 3.0 14.0 NaN 3 NaN 13.0 95.0 4 5.0 NaN 85.0 插值缺失值: Id Age Mark 0 1.0 12.0 80.0 1 2.0 12.0 90.0 2 3.0 14.0 92.5 3 4.0 13.0 95.0 4 5.0 13.0 85.0
216 次浏览
假设你有一个数据框,重命名轴的结果是:重命名索引:索引 Id 年龄 分数 0 1.0 12.0 80.0 1 2.0 12.0 90.0 2 3.0 14.0 NaN 3 NaN 13.0 95.0 4 5.0 NaN 85.0解决方案为了解决这个问题,我们将遵循以下步骤:定义一个数据框在轴名称中应用df.rename_axis()函数为“index”,并将axis设置为1df.rename_axis('index',axis=1)示例import pandas as pd df = pd.DataFrame({"Id":[1, 2, 3, None, 5], "Age":[12, 12, 14, 13, None], "Mark":[80, 90, None, 95, 85], }) print("数据框为:",df) print("重命名索引:") df = df.rename_axis('index',axis=1) print(df)输出数据框为: Id 年龄 分数 0 1.0 12.0 80.0 1 2.0 12.0 90.0 2 3.0 14.0 NaN 3 NaN 13.0 95.0 4 5.0 NaN 85.0 重命名索引: index Id 年龄 分数 0 1.0 12.0 80.0 1 2.0 12.0 90.0 2 3.0 14.0 NaN 3 NaN 13.0 95.0 4 5.0 NaN 85.0