找到 507 篇文章 关于 Pandas

编写一个 Python 程序,将数据框索引正向和反向移动两个周期

Vani Nalliappan
更新于 2021-02-25 05:29:56

144 次浏览

假设您有一个数据框,将索引正向和反向移动两个周期的意思是,正向移动三个周期                     Id Age 2020-01-01 00:00:00 NaN NaN 2020-01-01 12:00:00 NaN NaN 2020-01-02 00:00:00 1.0 10.0 2020-01-02 12:00:00 2.0 12.0 2020-01-03 00:00:00 3.0 14.0 反向移动三个周期                     Id Age 2020-01-01 00:00:00 3.0 14.0 2020-01-01 12:00:00 4.0 11.0 2020-01-02 00:00:00 5.0 13.0 2020-01-02 12:00:00 NaN NaN 2020-01-03 00:00:00 NaN NaNSolutionTo ... 阅读更多

编写一个 Python 程序,删除给定数据框中的第一行重复行

Vani Nalliappan
更新于 2021-02-25 05:28:07

252 次浏览

假设您有一个数据框,删除第一行重复行的结果如下:    Id Age 0    1 12 3    4 13 4    5 14 5    6 12 6    2 13 7    7 16 8    3 14 9    9 15 10  10 14Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框在 Id 和 Age 列中应用 drop_duplicates 函数,然后将 keep 初始值设置为 'last'。df.drop_duplicates(subset=['Id', 'Age'], keep='last')将结果存储在相同的数据框中并打印它示例让我们看看下面的实现以更好地理解 -import pandas ... 阅读更多

编写一个 Python 程序来计算分组数据的协方差,并在给定数据框中计算两列之间的分组数据的协方差

Vani Nalliappan
更新于 2021-02-25 05:26:51

295 次浏览

假设您有一个数据框,从分组数据计算协方差及其对应列的结果如下:分组数据的协方差为:                  mark1       mark2 subjects maths    mark1    25.0    12.500000          mark2    12.5    108.333333 science  mark1    28.0    50.000000          mark2    50.0    233.333333 两列之间的分组数据的协方差:subjects maths    12.5 science  50.0 dtype: float64Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框在数据框科目中应用 groupby 函数 ... 阅读更多

编写一个 Python 程序以不同的方式重塑给定的数据框

Vani Nalliappan
更新于 2021-02-25 05:24:37

392 次浏览

我们可以使用 melt()、stack()、unstack() 和 pivot() 函数重塑数据框。解决方案 1定义一个数据框。应用 melt() 函数将宽数据框列转换为行。它定义如下,df.melt()示例让我们看看下面的代码以更好地理解 -import pandas as pd df = pd.DataFrame({'Id':[1, 2, 3], 'Age':[13, 14, 13], 'Mark':[80, 90, 85]}) print("数据框为:", df) print(df.melt())输出Dataframe is:  Id Age Mark 0 1 13   80 1 2 14   90 2 3 13   85 variable value 0    Id    1 1    Id    2 2    Id    3 3   Age    13 4   ... 阅读更多

编写一个程序,根据索引值截断数据框时间序列数据

Vani Nalliappan
更新于 2021-02-24 10:35:10

254 次浏览

假设您有一个包含时间序列数据的数据框,截断后的数据结果如下:截断前: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 截断后: Id time_series 1 2 2020-01-12Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框。在 start='01/01/2020'、periods = 10 中创建 date_range 函数并分配 freq = 'W'。它将从给定的开始日期生成十个日期到下一个每周开始日期,并将其存储为 df['time_series']。df['time_series'] ... 阅读更多

编写一个 Python 程序来计算序列和滞后次数之间的自相关

Vani Nalliappan
更新于 2021-02-24 10:33:27

231 次浏览

假设您有序列,并且滞后 2 的自相关结果如下:序列为:0    2.0 1    10.0 2    3.0 3    4.0 4    9.0 5    10.0 6    2.0 7    NaN 8    3.0 dtype: float64 序列相关性:   -0.4711538461538461 带滞后的序列相关性:   -0.2933396642805515Solution为了解决这个问题,我们将遵循以下步骤 -定义一个序列使用以下方法查找序列自相关,series.autocorr()计算滞后=2 的自相关如下,series.autocorr(lag=2)示例让我们看看下面的代码以更好地理解,import pandas as pd import numpy as np series = ... 阅读更多

编写一个 Python 程序,将给定的数据框导出为 Pickle 文件格式,并从 Pickle 文件中读取内容

Vani Nalliappan
更新于 2021-02-24 10:31:34

156 次浏览

假设您有一个数据框,将数据框导出到 pickle 文件并从文件中读取内容的结果如下:导出到 pickle 文件:从 pickle 文件读取内容:  Fruits    City 0 Apple    Shimla 1 Orange   Sydney 2 Mango    Lucknow 3 Kiwi    WellingtonSolution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框。将数据框导出为 pickle 格式,并将其命名为“pandas.pickle”,df.to_pickle('pandas.pickle')从“pandas.pickle”文件中读取内容并将其存储为结果,result = pd.read_pickle('pandas.pickle')示例让我们看看下面的实现以更好地理解,import pandas as pd df = pd.DataFrame({'Fruits': ... 阅读更多

编写 Python 代码从文件读取 JSON 数据并将其转换为数据框、CSV 文件

Vani Nalliappan
更新于 2021-02-24 10:28:26

980 次浏览

假设您在文件中存储了以下 JSON 样本数据,如 pandas_sample.json{    "employee": {       "name": "emp1",       "salary": 50000,       "age": 31    } }转换为 csv 后的结果如下:, employee age, 31 name, emp1 salary, 50000Solution为了解决这个问题,我们将遵循以下步骤 -创建 pandas_sample.json 文件并存储 JSON 数据。从文件中读取 json 数据并将其存储为数据。data = pd.read_json('pandas_sample.json')将数据转换为数据框df = pd.DataFrame(data)Apple df.to_csv 函数将数据转换为 csv 文件格式,df.to_csv('pandas_json.csv')示例让我们看看下面的实现 ... 阅读更多

编写一个 Python 程序来重新采样给定的时间序列数据并找到最大的月末频率

Vani Nalliappan
更新于 2021-02-24 10:27:30

140 次浏览

假设您有时间序列,并且最大的月末频率的结果如下:DataFrame 为: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 最大的月末频率:              Id time_series time_series 2020-01-31    4 2020-01-26 2020-02-29    8 2020-02-23 2020-03-31    10 2020-03-08Solution为了解决这个问题,我们将遵循以下步骤 -定义一个数据框,其中有一列,d = {'Id': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]} ... 阅读更多

编写一个 Python 程序将数据框导出到 html 文件

Vani Nalliappan
更新于 2021-02-24 10:20:19

1K+ 次浏览

假设我们已经保存了 pandas.csv 文件,并将其导出为 Html 格式解决方案为了解决这个问题,我们将按照以下步骤操作 -使用 read_csv 方法读取 csv 文件,如下所示 -df = pd.read_csv('pandas.csv')使用文件对象以写入模式创建新的文件 pandas.html,f = open('pandas.html', 'w')声明结果变量以将数据框转换为 html 文件格式,result = df.to_html()使用文件对象写入结果中的所有数据。最后关闭文件对象,f.write(result) f.close()示例让我们看看下面的实现来更好地理解 -import pandas as pd df = pd.read_csv('pandas.csv') print(df) f = open('pandas.html', 'w') result ... 阅读更多

广告