找到 507 篇文章 关于 Pandas
144 次浏览
假设您有一个数据框,将索引正向和反向移动两个周期的意思是,正向移动三个周期 Id Age 2020-01-01 00:00:00 NaN NaN 2020-01-01 12:00:00 NaN NaN 2020-01-02 00:00:00 1.0 10.0 2020-01-02 12:00:00 2.0 12.0 2020-01-03 00:00:00 3.0 14.0 反向移动三个周期 Id Age 2020-01-01 00:00:00 3.0 14.0 2020-01-01 12:00:00 4.0 11.0 2020-01-02 00:00:00 5.0 13.0 2020-01-02 12:00:00 NaN NaN 2020-01-03 00:00:00 NaN NaNSolutionTo ... 阅读更多
252 次浏览
假设您有一个数据框,删除第一行重复行的结果如下: Id Age 0 1 12 3 4 13 4 5 14 5 6 12 6 2 13 7 7 16 8 3 14 9 9 15 10 10 14Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框在 Id 和 Age 列中应用 drop_duplicates 函数,然后将 keep 初始值设置为 'last'。df.drop_duplicates(subset=['Id', 'Age'], keep='last')将结果存储在相同的数据框中并打印它示例让我们看看下面的实现以更好地理解 -import pandas ... 阅读更多
295 次浏览
假设您有一个数据框,从分组数据计算协方差及其对应列的结果如下:分组数据的协方差为: mark1 mark2 subjects maths mark1 25.0 12.500000 mark2 12.5 108.333333 science mark1 28.0 50.000000 mark2 50.0 233.333333 两列之间的分组数据的协方差:subjects maths 12.5 science 50.0 dtype: float64Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框在数据框科目中应用 groupby 函数 ... 阅读更多
392 次浏览
我们可以使用 melt()、stack()、unstack() 和 pivot() 函数重塑数据框。解决方案 1定义一个数据框。应用 melt() 函数将宽数据框列转换为行。它定义如下,df.melt()示例让我们看看下面的代码以更好地理解 -import pandas as pd df = pd.DataFrame({'Id':[1, 2, 3], 'Age':[13, 14, 13], 'Mark':[80, 90, 85]}) print("数据框为:", df) print(df.melt())输出Dataframe is: Id Age Mark 0 1 13 80 1 2 14 90 2 3 13 85 variable value 0 Id 1 1 Id 2 2 Id 3 3 Age 13 4 ... 阅读更多
254 次浏览
假设您有一个包含时间序列数据的数据框,截断后的数据结果如下:截断前: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 截断后: Id time_series 1 2 2020-01-12Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框。在 start='01/01/2020'、periods = 10 中创建 date_range 函数并分配 freq = 'W'。它将从给定的开始日期生成十个日期到下一个每周开始日期,并将其存储为 df['time_series']。df['time_series'] ... 阅读更多
231 次浏览
假设您有序列,并且滞后 2 的自相关结果如下:序列为:0 2.0 1 10.0 2 3.0 3 4.0 4 9.0 5 10.0 6 2.0 7 NaN 8 3.0 dtype: float64 序列相关性: -0.4711538461538461 带滞后的序列相关性: -0.2933396642805515Solution为了解决这个问题,我们将遵循以下步骤 -定义一个序列使用以下方法查找序列自相关,series.autocorr()计算滞后=2 的自相关如下,series.autocorr(lag=2)示例让我们看看下面的代码以更好地理解,import pandas as pd import numpy as np series = ... 阅读更多
156 次浏览
假设您有一个数据框,将数据框导出到 pickle 文件并从文件中读取内容的结果如下:导出到 pickle 文件:从 pickle 文件读取内容: Fruits City 0 Apple Shimla 1 Orange Sydney 2 Mango Lucknow 3 Kiwi WellingtonSolution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框。将数据框导出为 pickle 格式,并将其命名为“pandas.pickle”,df.to_pickle('pandas.pickle')从“pandas.pickle”文件中读取内容并将其存储为结果,result = pd.read_pickle('pandas.pickle')示例让我们看看下面的实现以更好地理解,import pandas as pd df = pd.DataFrame({'Fruits': ... 阅读更多
980 次浏览
假设您在文件中存储了以下 JSON 样本数据,如 pandas_sample.json{ "employee": { "name": "emp1", "salary": 50000, "age": 31 } }转换为 csv 后的结果如下:, employee age, 31 name, emp1 salary, 50000Solution为了解决这个问题,我们将遵循以下步骤 -创建 pandas_sample.json 文件并存储 JSON 数据。从文件中读取 json 数据并将其存储为数据。data = pd.read_json('pandas_sample.json')将数据转换为数据框df = pd.DataFrame(data)Apple df.to_csv 函数将数据转换为 csv 文件格式,df.to_csv('pandas_json.csv')示例让我们看看下面的实现 ... 阅读更多
140 次浏览
假设您有时间序列,并且最大的月末频率的结果如下:DataFrame 为: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 最大的月末频率: Id time_series time_series 2020-01-31 4 2020-01-26 2020-02-29 8 2020-02-23 2020-03-31 10 2020-03-08Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框,其中有一列,d = {'Id': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]} ... 阅读更多
1K+ 次浏览
假设我们已经保存了 pandas.csv 文件,并将其导出为 Html 格式解决方案为了解决这个问题,我们将按照以下步骤操作 -使用 read_csv 方法读取 csv 文件,如下所示 -df = pd.read_csv('pandas.csv')使用文件对象以写入模式创建新的文件 pandas.html,f = open('pandas.html', 'w')声明结果变量以将数据框转换为 html 文件格式,result = df.to_html()使用文件对象写入结果中的所有数据。最后关闭文件对象,f.write(result) f.close()示例让我们看看下面的实现来更好地理解 -import pandas as pd df = pd.read_csv('pandas.csv') print(df) f = open('pandas.html', 'w') result ... 阅读更多