找到 10786 篇文章 关于 Python

编写一个 Python 程序,将数据框索引正向和反向移动两个周期

Vani Nalliappan
更新于 2021-02-25 05:29:56

144 次浏览

假设您有一个数据框,并且将索引正向和反向移动两个周期的结果如下:正向移动三个周期                      Id Age 2020-01-01 00:00:00 NaN NaN 2020-01-01 12:00:00 NaN NaN 2020-01-02 00:00:00 1.0 10.0 2020-01-02 12:00:00 2.0 12.0 2020-01-03 00:00:00 3.0 14.0 反向移动三个周期                      Id Age 2020-01-01 00:00:00 3.0 14.0 2020-01-01 12:00:00 4.0 11.0 2020-01-02 00:00:00 5.0 13.0 2020-01-02 12:00:00 NaN NaN 2020-01-03 00:00:00 NaN NaN解决方案... 阅读更多

编写一个 Python 程序,删除给定数据框中的第一行重复行

Vani Nalliappan
更新于 2021-02-25 05:28:07

252 次浏览

假设您有一个数据框,删除第一行重复行的结果如下:     Id Age 0    1 12 3    4 13 4    5 14 5    6 12 6    2 13 7    7 16 8    3 14 9    9 15 10  10 14解决方案为了解决这个问题,我们将遵循以下步骤:定义一个数据框在 Id 和 Age 列中应用 drop_duplicates 函数,然后将 keep 的初始值设置为 'last'。df.drop_duplicates(subset=['Id', 'Age'], keep='last')将结果存储在同一个数据框中并打印它示例让我们看看下面的实现来更好地理解:import pandas ... 阅读更多

编写一个 Python 程序,计算分组数据的协方差,并计算给定数据框中两列之间的分组数据的协方差

Vani Nalliappan
更新于 2021-02-25 05:26:51

295 次浏览

假设您有一个数据框,并且从分组数据计算协方差以及对应列的结果如下:分组数据的协方差为:                   mark1       mark2 科目 数学    mark1    25.0    12.500000          mark2    12.5    108.333333 科学  mark1    28.0    50.000000          mark2    50.0    233.333333 两列之间的分组数据的协方差:科目 数学    12.5 科学  50.0 dtype: float64解决方案为了解决这个问题,我们将遵循以下步骤:定义一个数据框在数据框科目中应用 groupby 函数 ... 阅读更多

编写一个 Python 程序,以不同的方式重塑给定的数据框

Vani Nalliappan
更新于 2021-02-25 05:24:37

392 次浏览

我们可以使用 melt()、stack()、unstack() 和 pivot() 函数重塑数据框。解决方案 1定义一个数据框。应用 melt() 函数将宽数据框列转换为行。它定义如下,df.melt()示例让我们看看下面的代码来更好地理解:import pandas as pd df = pd.DataFrame({'Id':[1, 2, 3], 'Age':[13, 14, 13], 'Mark':[80, 90, 85]}) print("数据框为:", df) print(df.melt())输出数据框为:  Id Age Mark 0 1 13   80 1 2 14   90 2 3 13   85 variable value 0    Id    1 1    Id    2 2    Id    3 3   Age    13 4   ... 阅读更多

编写一个程序,根据索引值截断数据框时间序列数据

Vani Nalliappan
更新于 2021-02-24 10:35:10

254 次浏览

假设您有一个包含时间序列数据的数据框,并且截断后的数据结果如下:截断前:  Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 截断后:  Id time_series 1 2 2020-01-12解决方案为了解决这个问题,我们将遵循以下步骤:定义一个数据框。在 start='01/01/2020'、periods = 10 中创建 date_range 函数,并将 freq 设置为 'W'。它将从给定的开始日期生成十个日期到下一个每周开始日期,并将其存储为 df['time_series']。df['time_series'] ... 阅读更多

编写一个 Python 程序,计算序列和滞后次数之间的自相关

Vani Nalliappan
更新于 2021-02-24 10:33:27

231 次浏览

假设您有一个序列,并且滞后 2 的自相关结果如下:序列为: 0    2.0 1    10.0 2    3.0 3    4.0 4    9.0 5    10.0 6    2.0 7    NaN 8    3.0 dtype: float64 序列相关性:    -0.4711538461538461 序列滞后相关性:    -0.2933396642805515解决方案为了解决这个问题,我们将遵循以下步骤:定义一个序列使用以下方法查找序列自相关,series.autocorr()计算滞后=2 的自相关,如下所示,series.autocorr(lag=2)示例让我们看看下面的代码来更好地理解,import pandas as pd import numpy as np series = ... 阅读更多

编写一个 Python 程序,将给定的数据框导出为 Pickle 文件格式,并从 Pickle 文件中读取内容

Vani Nalliappan
更新于 2021-02-24 10:31:34

156 次浏览

假设您有一个数据框,并且导出到 pickle 文件并从文件中读取内容的结果如下:导出到 pickle 文件:从 pickle 文件读取内容:   Fruits    City 0 Apple    Shimla 1 Orange   Sydney 2 Mango    Lucknow 3 Kiwi    Wellington解决方案为了解决这个问题,我们将遵循以下步骤:定义一个数据框。将数据框导出为 pickle 格式,并将其命名为 'pandas.pickle',df.to_pickle('pandas.pickle')从 'pandas.pickle' 文件中读取内容并将其存储为结果,result = pd.read_pickle('pandas.pickle')示例让我们看看下面的实现来更好地理解,import pandas as pd df = pd.DataFrame({'Fruits': ... 阅读更多

编写 Python 代码,从文件中读取 JSON 数据并将其转换为数据框、CSV 文件

Vani Nalliappan
更新于 2021-02-24 10:28:26

980 次浏览

假设您有以下存储在文件 pandas_sample.json 中的示例 json 数据{    "employee": {       "name": "emp1",       "salary": 50000,       "age": 31    } }转换为 csv 后的结果为:, employee age, 31 name, emp1 salary, 50000解决方案为了解决这个问题,我们将遵循以下步骤:创建 pandas_sample.json 文件并存储 JSON 数据。从文件中读取 json 数据并将其存储为 data。data = pd.read_json('pandas_sample.json')将数据转换为数据框df = pd.DataFrame(data)应用 df.to_csv 函数将数据转换为 csv 文件格式,df.to_csv('pandas_json.csv')示例让我们看看下面的实现 ... 阅读更多

编写一个 Python 程序,重新采样给定的时间序列数据并找到最大月底频率

Vani Nalliappan
更新于 2021-02-24 10:27:30

140 次浏览

假设您有一个时间序列,并且最大月底频率的结果,DataFrame 为: Id time_series 0 1 2020-01-05 1 2 2020-01-12 2 3 2020-01-19 3 4 2020-01-26 4 5 2020-02-02 5 6 2020-02-09 6 7 2020-02-16 7 8 2020-02-23 8 9 2020-03-01 9 10 2020-03-08 最大月底频率:              Id time_series time_series 2020-01-31    4 2020-01-26 2020-02-29    8 2020-02-23 2020-03-31    10 2020-03-08解决方案为了解决这个问题,我们将按照以下步骤操作 -定义一个只有一个列的 DataFrame,d = {'Id': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]} ... 阅读更多

编写一个 Python 程序将 DataFrame 导出到 HTML 文件

Vani Nalliappan
更新于 2021年2月24日 10:20:19

1K+ 次浏览

假设我们已经保存了 pandas.csv 文件,并将文件导出为 Html 格式解决方案为了解决这个问题,我们将按照以下步骤操作 -使用 read_csv 方法读取 csv 文件,如下所示 -df = pd.read_csv('pandas.csv')使用文件对象以写入模式创建新的文件 pandas.html,f = open('pandas.html', 'w')声明 result 变量以将 DataFrame 转换为 html 文件格式,result = df.to_html()使用文件对象写入 result 中的所有数据。最后关闭文件对象,f.write(result) f.close()示例让我们看看下面的实现以更好地理解 -import pandas as pd df = pd.read_csv('pandas.csv') print(df) f = open('pandas.html', 'w') result ... 阅读更多

广告

© . All rights reserved.