找到 34423 篇文章 关于编程
216 次浏览
要将数据框的索引显示为多级索引,请使用 dataframe.index()。首先,让我们创建一个列表字典:# 列表字典 d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'], 'Date_of_purchase': ['2020-10-10', '2020-10-12', '2020-10-17', '2020-10-16', '2020-10-19', '2020-10-22'] } 从上面的列表字典创建一个数据框:dataFrame = pd.DataFrame(d) 现在,设置索引列“Car”并显示索引:dataFrame.set_index(["Car"], inplace=True, append=True, drop=False) print"多级索引...", dataFrame.index 例子 以下是代码:import pandas as pd # 列表字典 d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'], 'Date_of_purchase': ['2020-10-10', ... 阅读更多
3K+ 次浏览
要使用另一个数据框的值替换数据框的值,请在 Pandas 中使用 replace() 方法。首先,让我们创建一个数据框:dataFrame1 = pd.DataFrame({"Car": ["Audi", "Lamborghini"], "Place": ["US", "UK"], "Units": [200, 500]}) 让我们创建另一个数据框:dataFrame2 = pd.DataFrame({"Car": ["BMW", "Lexus"], "Place": ["India", "Australia"], "Units": [800, 1000]}) 接下来,从 dataFrame2 获取值并用 dataFrame1 的值替换:# 从第二个数据框获取值 i = dataFrame2['Car'][1] # 用第一个数据框的值替换 j = dataFrame1['Car'][0] 最后,使用 replace() 方法将一个数据框的值替换为另一个数据框的值 ... 阅读更多
758 次浏览
要从多级索引数据框中删除特定行,请使用 drop() 方法。首先,让我们创建一个多级索引数组:arr = [np.array(['car', 'car', 'car', 'bike', 'bike', 'bike', 'truck', 'truck', 'truck']), np.array(['valueA', 'valueB', 'valueC', 'valueA', 'valueB', 'valueC', 'valueA', 'valueB', 'valueC'])] 接下来,创建多级索引数据框并设置索引:dataFrame = pd.DataFrame( np.random.randn(9, 3), index=arr, columns=['Col 1', 'Col 2', 'Col 3']) dataFrame.index.names = ['level 0', 'level 1'] 现在,删除特定行:dataFrame.drop(('car', 'valueA'), axis=0, inplace=True) 例子 以下是代码:import numpy as np import pandas as pd # 多级索引数组 arr = [np.array(['car', 'car', 'car', 'bike', 'bike', 'bike', 'truck', 'truck', 'truck']), ... 阅读更多
1K+ 次浏览
让我们看看如何查找负值和正值的总和。首先,创建一个包含正值和负值的数据框:dataFrame = pd.DataFrame({'Place': ['Chicago', 'Denver', 'Atlanta', 'Chicago', 'Dallas', 'Denver', 'Dallas', 'Atlanta'], 'Temperature': [-2, 30, -5, 10, 30, -5, 20, -10]}) 接下来,使用 groupby 根据 Place 列进行分组:groupRes = dataFrame.groupby(dataFrame['Place']) 使用 lambda 函数返回正值和负值。我们还分别添加了正值和负值:# lambda 函数 def plus(val): return val[val > 0].sum() def minus(val): return val[val < 0].sum() 例子 以下是完整代码 ... 阅读更多
2K+ 次浏览
我们将使用 groupby 对 Pandas 数据框进行分组。使用 grouper 函数选择要使用的列。我们将按月分组并计算每月注册价格的总和,以下面的汽车销售记录为例。首先,假设我们的 Pandas 数据框如下所示,包含三列:dataFrame = pd.DataFrame( { "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"], "Date_of_Purchase": [ pd.Timestamp("2021-06-10"), pd.Timestamp("2021-07-11"), pd.Timestamp("2021-06-25"), ... 阅读更多
1K+ 次浏览
要检查缺失的日期,首先,让我们设置一个包含日期记录的列表字典,即我们示例中的购买日期:# 列表字典 d = {'Car': ['BMW', 'Lexus', 'Audi', 'Mercedes', 'Jaguar', 'Bentley'], 'Date_of_purchase': ['2020-10-10', '2020-10-12', '2020-10-17', '2020-10-16', '2020-10-19', '2020-10-22']} 现在,从上面的列表字典创建一个数据框:dataFrame = pd.DataFrame(d) 接下来,将其设置为索引:dataFrame = dataFrame.set_index('Date_of_purchase') 使用 to_datetime() 将字符串转换为 DateTime 对象:dataFrame.index = pd.to_datetime(dataFrame.index) 显示范围内剩余的日期:k = pd.date_range( start="2020-10-10", end="2020-10-22").difference(dataFrame.index); 例子 以下是代码:import pandas as pd # 列表字典 d = {'Car': ['BMW', ... 阅读更多
11K+ 次浏览
要合并文件夹中的所有 Excel 文件,请使用 Glob 模块和 append() 方法。假设桌面上有以下 Excel 文件:Sales1.xlsxSales2.xlsx 注意 - 您可能需要安装 openpyxl 和 xlrd 包。首先,设置所有要合并的 Excel 文件所在的路径。使用 glob 获取 Excel 文件并读取它们:path = "C:\Users\amit_\Desktop\" filenames = glob.glob(path + "\*.xlsx") print('文件名:', filenames) 接下来,为合并的输出 Excel 文件创建一个空数据框,该文件将获取来自上述两个 Excel 文件的数据:outputxlsx = pd.DataFrame() 现在,实际过程 ... 阅读更多
273 次浏览
使用 Series.value_counts() 方法计算项目集的频率。首先,让我们创建一个数据框:# 创建数据框 dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'Audi', 'Mercedes', 'Porsche', 'Lamborghini', 'BMW'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Bangalore', 'Hyderabad', 'Mumbai', 'Mumbai', 'Pune'], 'UnitsSold': [95, 80, 80, 75, 92, 90, 95, 50 ]}) 使用 value_counts() 方法计算列 car 的频率:# 计算列 Car 的频率 count1 = dataFrame['Car'].value_counts() print("列 Car 中的计数") print(count1) 同样,计算其他列的频率。以下是计算 Pandas 数据框中项目集频率的完整代码 ... 阅读更多
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP