找到 10786 篇文章 关于 Python
290 次浏览
Seaborn 中的小提琴图用于绘制箱线图和核密度估计的组合。seaborn.violinplot() 用于此目的。使用 violinplot() 的 order 参数设置显式顺序。假设以下数据是 CSV 文件中的数据集 - Cricketers.csv 首先,导入所需的库 - import seaborn as sb import pandas as pd import matplotlib.pyplot as plt 从 CSV 文件加载数据到 Pandas DataFrame - dataFrame = pd.read_csv("C:\Users\amit_\Desktop\Cricketers.csv") 绘制带有角色和年龄的小提琴图。通过传递显式顺序(即基于“角色”的排序)来控制顺序。sb.violinplot(x = 'Role', y ... 阅读更多
11K+ 次浏览
要读取目录中的所有 Excel 文件,请使用 Glob 模块和 read_excel() 方法。假设以下文件是目录中的 Excel 文件 - Sales1.xlsx Sales2.xlsx 首先,设置所有 Excel 文件所在的路径。获取 Excel 文件并使用 glob 读取它们 - path = "C:\Users\amit_\Desktop\" filenames = glob.glob(path + "\*.xlsx") print('File names:', filenames) 接下来,使用 for 循环迭代并读取特定目录中的所有 Excel 文件。我们还使用 read_excel() - for file in filenames: print("Reading file = ", file) print(pd.read_excel(file)) 示例 完整的代码如下 ... 阅读更多
2K+ 次浏览
要将多个 CSV 文件合并到单个 Pandas DataFrame 中,请使用 read_csv。首先,导入所需的 Pandas 库。这里,我们将 pd 作为别名 - import pandas as pd 现在,假设以下文件是我们的 CSV 文件 - Sales1.csv Sales2.csv 我们已将路径设置为字符串。这两个文件都在桌面上 - file1 = "C:\Users\amit_\Desktop\sales1.csv" file2 = "C:\Users\amit_\Desktop\sales2.csv" 接下来,合并以上两个 CSV 文件。pd.concat() 将 CSV 文件合并在一起 - dataFrame = pd.concat( map(pd.read_csv, [file1, file2]), ignore_index=True) 示例 以下代码 - import pandas as pd file1 = "C:\Users\amit_\Desktop\sales1.csv" file2 = "C:\Users\amit_\Desktop\sales2.csv" print("合并 ... 阅读更多
1K+ 次浏览
要连接两个以上的 Pandas DataFrame,请使用 concat() 方法。首先,导入所需的库 - import pandas as pd 让我们创建第一个 DataFrame - dataFrame1 = pd.DataFrame( { "Col1": [10, 20, 30], "Col2": [40, 50, 60], "Col3": [70, 80, 90], }, index=[0, 1, 2], ) 让我们创建第二个 DataFrame - dataFrame2 = pd.DataFrame( { "Col1": [100, 110, 120], "Col2": [130, 140, 150], "Col3": [160, 170, 180], }, index=[3, 4, 5], ) 让我们创建 ... 阅读更多
2K+ 次浏览
要堆叠多层列,请使用 stack() 方法。首先,导入所需的库 - import pandas as pd 创建一个多层列 - items = pd.MultiIndex.from_tuples([('Maths', 'Mental Maths'), ('Maths', 'Discrete Mathematics'), ('Maths', 'Applied Mathematics')]) 现在,创建一个 DataFrame 并设置我们上面设置的多层列 - dataFrame = pd.DataFrame([[67, 86, 78], [56, 92, 97], [92, 95, 91]], index=['John', 'Tom', 'Henry'], columns=items) 堆叠多层列 - dataframe.stack() 示例 完整的代码如下 - import pandas as pd # 多层列 items = pd.MultiIndex.from_tuples([('Maths', 'Mental Maths'), ('Maths', 'Discrete Mathematics'), ('Maths', 'Applied Mathematics')]) # 创建一个 DataFrame dataFrame = pd.DataFrame([[67, 86, 78], [56, 92, 97], ... 阅读更多
990 次浏览
要创建子集并仅显示重复值的最后一条条目,请在 drop_duplicates() 方法中使用“keep”参数和“last”值。drop_duplicates() 方法删除重复项。让我们首先创建一个包含 3 列的 DataFrame - dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'], 'UnitsSold': [85, 70, 80, 95, 55, 90]}) 删除重复项并显示最后一条条目。使用 keep 参数,我们设置了“last”。除了最后一条条目之外,重复的行将被删除。我们使用“subset”参数考虑了一个子集 - dataFrame2 = dataFrame.drop_duplicates(subset = ['Car', 'Place'], keep ='last').reset_index(drop = True) 示例 以下 ... 阅读更多
209 次浏览
要获取两个 DataFrame 共享的列,请使用 intersect1d() 方法。此方法由 numpy 提供,因此您还需要使用 Pandas 导入 Numpy。让我们首先导入所需的库 - import pandas as pd import numpy as np 创建两个 DataFrame - # 创建 dataframe1 dataFrame1 = pd.DataFrame({"Car": ['Bentley', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'], "Cubic_Capacity": [2000, 1800, 1500, 2500, 2200, 3000], "Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000], "Units_Sold": [ 100, 110, 150, 80, 200, 90] }) # 创建 dataframe2 dataFrame2 = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'], "Units_Sold": [ 100, 110, 150, 80, 200, 90] ... 阅读更多
11K+ 次浏览
要使用公共列合并两个 Pandas DataFrame,请使用 merge() 函数并将 ON 参数设置为列名。首先,让我们使用别名导入 pandas 库 - import pandas as pd 让我们创建第一个 DataFrame - dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'], "Units": [100, 150, 110, 80, 110, 90] } ) 接下来,创建第二个 DataFrame - dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Mercedes', 'Jaguar'], "Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000] } ) 现在,合并 ... 阅读更多
705 次浏览
要合并两个 Pandas DataFrame,请使用 merge() 函数。只需将两个 DataFrame 作为 merge() 函数的参数即可。首先,让我们使用别名“pd”导入所需的库 - import pandas as pd 创建第一个 DataFrame - # 创建 DataFrame1 dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'], "Units": [100, 150, 110, 80, 110, 90] } ) 接下来,创建第二个 DataFrame - # 创建 DataFrame2 dataFrame2 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Mercedes', 'Jaguar'], "Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000] } ... 阅读更多
1K+ 次浏览
iloc 方法是基于整数位置的索引,用于按位置进行选择。我们使用 iloc 将列表添加到 DataFrame。让我们首先创建一个 DataFrame。对于我们的示例,数据采用球队排名的列表形式 - # 以球队排名列表形式的数据 Team = [['India', 1, 100], ['Australia', 2, 85], ['England', 3, 75], ['New Zealand', 4 , 65], ['South Africa', 5, 50], ['Bangladesh', 6, 40]] # 创建一个 DataFrame 并添加列 dataFrame = pd.DataFrame(Team, columns=['Country', 'Rank', 'Points']) 以下是待添加的行 - myList = ["Sri Lanka", 7, ... 阅读更多
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP