找到 34423 篇文章 关于编程

Python - 计算 Pandas DataFrame 中分组值的最后一个值

AmitDiwan
更新于 2021年9月16日 06:48:58

浏览量 133 次

要计算分组值的最后一个值,请使用 groupby.last() 方法。首先,使用别名导入所需的库 −import pandas as pd; 创建一个包含 3 列的 DataFrame −dataFrame = pd.DataFrame(    {       "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'], "Place": ['Delhi', 'Bangalore', 'Pune', 'Punjab', 'Chandigarh', 'Mumbai'], "Units": [100, 150, 50, 80, 110, 90]    } ) 现在,按列对 DataFrame 进行分组 −groupDF = dataFrame.groupby("Car") 计算分组值的最后一个值并重置索引 −res = groupDF.last() res = res.reset_index() 示例 以下是完整的代码。显示重复值的最后一次出现,即分组值的最后一个值…… 阅读更多

Python Pandas - 基于总和过滤 DataFrame 中的列

AmitDiwan
更新于 2021年9月16日 06:40:49

浏览量 701 次

要基于列的总和进行过滤,我们使用 loc() 方法。在这里,在我们的示例中,我们对每个学生的成绩求和,以获得成绩高于 400(即 80%)的学生列。首先,创建一个包含学生记录的 DataFrame。我们有 3 个学生(即 3 列)的成绩记录 −dataFrame = pd.DataFrame({ 'Jacob_Marks': [95, 90, 75, 85, 88], 'Ted_Marks': [60, 50, 65, 85, 70], 'Jamie_Marks': [77, 76, 65, 45, 50]}) 基于列进行过滤。获取总成绩高于 400 的学生 −dataFrame = dataFrame.loc[:, dataFrame.sum(axis=0) > 400] 示例 以下是完整的…… 阅读更多

Python Pandas - 基于日期偏移选择时间序列数据的第一个周期

AmitDiwan
更新于 2021年9月16日 06:34:11

浏览量 162 次

要基于日期偏移选择时间序列的第一个周期,请使用 first() 方法。首先,使用 periods 和 freq 参数设置日期索引。Freq 用于频率 −i = pd.date_range('2021-07-15', periods=5, freq='3D') 现在,使用上述索引创建一个 DataFrame −dataFrame = pd.DataFrame({'k': [1, 2, 3, 4, 5]}, index=i) 从前 4 天(即 4D)获取行 −dataFrame.first('4D') 示例 以下是完整的代码 − import pandas as pd # 使用 5 个周期和 3 天的频率设置日期索引 i = pd.date_range('2021-07-15', periods=5, freq='3D') # 使用上述索引创建 DataFrame dataFrame = pd.DataFrame({'k': [1, 2, 3, ... 阅读更多

Python Pandas - 使用指示器值合并 DataFrame

AmitDiwan
更新于 2021年9月15日 13:40:28

浏览量 5K+

要合并 Pandas DataFrame,请使用 merge() 函数。您可以将参数 indicator 设置为 True 或 False。如果您想检查哪个 DataFrame 具有特定记录,则使用 −indicator= True 如上所示,将上述参数设置为 True 会向输出 DataFrame 添加一个名为“_merge”的列。首先,让我们使用别名导入 pandas 库 −import pandas as pd 让我们创建 DataFrame1 −dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'], "Units": [100, 150, 110, 80, ... 阅读更多

Python - 计算 Pandas DataFrame 中一列的标准差

AmitDiwan
更新于 2021年9月15日 13:33:16

浏览量 675 次

要计算标准差,请使用 Pandas 的 std() 方法。首先,导入所需的 Pandas 库 −import pandas as pd 现在,创建一个包含两列的 DataFrame −dataFrame1 = pd.DataFrame(    {       "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'],       "Units": [100, 150, 110, 80, 110, 90] } ) 使用 std() 查找“Units”列值的标准差 −print"DataFrame1 中 Units 列的标准差 = ", dataFrame1['Units'].std() 同样,我们已经从第二个 DataFrame 计算了标准差。示例 以下是完整的代码 −# # Python - 计算…… 阅读更多

Python Pandas - 基于日期偏移选择时间序列数据的最后几个周期

AmitDiwan
更新于 2021年9月15日 13:17:10

浏览量 165 次

要基于日期偏移选择时间序列的最后几个周期,请使用 last() 方法。首先,使用 periods 和 freq 设置日期索引。Freq 用于频率 −i = pd.date_range('2021-07-15', periods=5, freq='3D') 现在,使用上述索引创建一个 DataFrame −dataFrame = pd.DataFrame({'k': [1, 2, 3, 4, 5]}, index=i) 从最后 4 天(即 4D)获取行 −dataFrame.last('4D') 示例 以下是完整的代码 −import pandas as pd # 使用 5 个周期和 3 天的频率设置日期索引 i = pd.date_range('2021-07-15', periods=5, freq='3D') # 使用上述索引创建 DataFrame dataFrame = pd.DataFrame({'k': [1, 2, 3, 4, 5]}, ... 阅读更多

Python Pandas – 从多列中删除前导和尾随空格

AmitDiwan
更新于 2021年9月15日 13:07:01

浏览量 1K+

要删除前导或尾随空格,请使用 strip() 方法。首先,创建一个包含 3 列“产品类别”、“产品名称”和“数量”的 DataFrame −dataFrame = pd.DataFrame({ 'Product Category': [' Computer', ' Mobile Phone', 'Electronics ', 'Appliances', ' Furniture', 'Stationery'], 'Product Name': ['Keyboard', 'Charger', ' SmartTV', 'Refrigerators', ' Chairs', 'Diaries'], 'Quantity': [10, 50, 10, 20, 25, 50]}) 从多列中删除空格 −dataFrame['Product Category'].str.strip() dataFrame['Product Name'].str.strip() 示例 以下是完整的代码 −import pandas as pd # 创建一个包含 3 列的 DataFrame dataFrame = pd.DataFrame({    'Product Category': [' Computer', ' Mobile Phone', 'Electronics ', 'Appliances', ... 阅读更多

Python - 将矩阵转换为字符串

AmitDiwan
更新于 2021年9月15日 12:37:31

浏览量 822 次

当需要将矩阵转换为字符串时,可以使用简单的列表推导式以及 ‘join’ 方法。示例 以下是相同的演示my_list = [[1, 22, "python"], [22, "is", 1], ["great", 1, 91]] print("列表是:") print(my_list) my_list_1, my_list_2 = ", ", " " my_result = my_list_2.join([my_list_1.join([str(elem) for elem in sub]) for sub in my_list]) print("结果是:") print(my_result) 输出 列表是: [[1, 22, 'python'], [22, 'is', 1], ['great', 1, 91]] 结果是: 1, 22, python 22, is, 1 great, 1, 91 解释 定义了一个列表的列表…… 阅读更多

比较 Pandas DataFrame 的特定时间戳 – Python

AmitDiwan
更新于 2021年9月15日 12:36:21

浏览量 532 次

要比较特定时间戳,请使用方括号中的索引号。首先,导入所需的库 −import pandas as pd 创建一个包含 3 列的 DataFrame。我们有两个带有时间戳的日期列 −dataFrame = pd.DataFrame(    {       "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW"],       "Date_of_Purchase": [          pd.Timestamp("2021-06-10"),          pd.Timestamp("2021-07-11"),          pd.Timestamp("2021-06-25"),          pd.Timestamp("2021-06-29"),          pd.Timestamp("2021-03-20"),       ],       "Date_of_Service": [           pd.Timestamp("2021-11-05"),           pd.Timestamp("2021-12-03"), ... 阅读更多

Python 程序:使用给定数字替换列表中一定范围内的元素

AmitDiwan
更新于 2021年9月15日 12:35:37

浏览量 640 次

当需要使用给定数字替换列表中一定范围内的元素时,可以使用列表切片。示例 以下是相同的演示my_list = [42, 42, 18, 73, 11, 28, 29, 0, 10, 16, 22, 53, 41] print("列表是:") print(my_list) i, j = 4, 8 my_key = 9 my_list[i:j] = [my_key] * (j - i) print("结果是:") print(my_list) 输出 列表是: [42, 42, 18, 73, 11, 28, 29, 0, 10, 16, 22, 53, 41] 结果是: [42, 42, 18, 73, 9, 9, 9, 9, 10, 16, 22, 53, 41] 解释 一个…… 阅读更多

广告
© . All rights reserved.