找到关于 Python 的10786 篇文章
658 次浏览
要从 Pandas DataFrame 中删除重复值,请使用 drop_duplicates() 方法。首先,创建一个包含 3 列的 DataFrame −dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'], 'UnitsSold': [95, 70, 80, 95, 70, 90]})删除重复值 −dataFrame = dataFrame.drop_duplicates() 示例以下是完整的代码 −import pandas as pd # 创建 DataFrame dataFrame = pd.DataFrame({'Car': ['BMW', 'Mercedes', 'Lamborghini', 'BMW', 'Mercedes', 'Porsche'], 'Place': ['Delhi', 'Hyderabad', 'Chandigarh', 'Delhi', 'Hyderabad', 'Mumbai'], 'UnitsSold': [95, 70, 80, 95, 70, 90]}) print"Dataframe...", dataFrame # 统计 Car 列的频率 count = dataFrame['Car'].value_counts() print"Count in column ... 阅读更多
1K+ 次浏览
我们将考虑一个汽车销售记录的例子,并按月分组计算汽车每月注册价格的总和。为了求和,我们使用 sum() 方法。首先,假设我们的 Pandas DataFrame 包含三列 −dataFrame = pd.DataFrame( { "Car": ["Audi", "Lexus", "Tesla", "Mercedes", "BMW", "Toyota", "Nissan", "Bentley", "Mustang"], "Date_of_Purchase": [ pd.Timestamp("2021-06-10"), pd.Timestamp("2021-07-11"), pd.Timestamp("2021-06-25"), ... 阅读更多
6K+ 次浏览
在 OSI(开放系统互连)模型中,传输层是七层中的其中一层,它负责通过互联网在发送方和接收方之间进行端到端通信。它提供发送方和接收方之间的逻辑通信,并确保数据包的端到端交付。传输层的主要协议如下 −TCP(传输控制协议)UDP(用户数据报协议)SCTP(流控制传输协议)RDP(可靠数据协议)RUDP(可靠用户数据报协议)传输层的职责传输层的职责如下 −它提供进程到进程的交付或端到端... 阅读更多
694 次浏览
要生成日期范围,请使用 date_range() 方法。首先,导入所需的 pandas 库并使用别名 −import pandas as pd现在,假设您需要生成日期范围,为此,请指定要开始的日期。在这里,我们指定了 2021 年 6 月 1 日和 60 天的期限 −dates = pd.date_range('6/1/2021', periods=60) 示例以下是完整的代码 − import pandas as pd # 生成日期范围 # 期限为 60,即从 2021 年 6 月 1 日起的 60 天 dates = pd.date_range('6/1/2021', periods=60) print"Displaying dates in a range...", ... 阅读更多
317 次浏览
要将字符串数据转换为实际日期(即 datetime 类型),请使用 to_datetime() 方法。首先,让我们创建一个包含 3 个类别(其中一个是日期字符串)的 DataFrame −dataFrame = pd.DataFrame({ 'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Stationery'], 'Product Name': ['Keyboard', 'Charger', 'SmartTV', 'Chairs'], 'Date_of_Purchase': ['10/07/2021', '20/04/2021', '25/06/2021', '15/02/2021'], }) 使用 to_datetime() 将日期字符串转换为实际日期 −dataFrame['Date_of_Purchase'] = pd.to_datetime(dataFrame['Date_of_Purchase'])示例以下是完整的代码 −import pandas as pd # 创建一个数据框 dataFrame = pd.DataFrame({ 'Product Category': ['Computer', 'Mobile Phone', 'Electronics', 'Stationery'], 'Product Name': ['Keyboard', 'Charger', 'SmartTV', ... 阅读更多
133 次浏览
要计算分组值的最后一个值,请使用 groupby.last() 方法。首先,导入所需的库并使用别名 −import pandas as pd;创建一个包含 3 列的 DataFrame −dataFrame = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'BMW', 'Tesla', 'Lexus', 'Tesla'], "Place": ['Delhi', 'Bangalore', 'Pune', 'Punjab', 'Chandigarh', 'Mumbai'], "Units": [100, 150, 50, 80, 110, 90] } ) 现在,按列对 DataFrame 进行分组 −groupDF = dataFrame.groupby("Car")计算分组值的最后一个值并重置索引 −res = groupDF.last() res = res.reset_index()示例以下是完整的代码。将显示重复值的最后一次出现,即分组值的最后一个值... 阅读更多
701 次浏览
要基于列的总和进行过滤,我们使用 loc() 方法。在这里,在我们的示例中,我们对每个学生的成绩进行求和,以获取成绩高于 400(即 80%)的学生列。首先,创建一个包含学生记录的 DataFrame。我们有 3 个学生(即 3 列)的成绩记录 −dataFrame = pd.DataFrame({ 'Jacob_Marks': [95, 90, 75, 85, 88], 'Ted_Marks': [60, 50, 65, 85, 70], 'Jamie_Marks': [77, 76, 65, 45, 50]}) 基于列进行过滤。获取总分超过 400 的学生 −dataFrame = dataFrame.loc[:, dataFrame.sum(axis=0) > 400]示例以下是完整的... 阅读更多
162 次浏览
要选择基于日期偏移量的时间序列的前几期,请使用 first() 方法。首先,使用 periods 和 freq 参数设置日期索引。Freq 用于频率 −i = pd.date_range('2021-07-15', periods=5, freq='3D')现在,使用上述索引创建一个 DataFrame −dataFrame = pd.DataFrame({'k': [1, 2, 3, 4, 5]}, index=i) 获取前 4 天(即 4D)的行 −dataFrame.first('4D')示例以下是完整的代码 − import pandas as pd # 使用 5 个周期和 3 天的频率设置日期索引 i = pd.date_range('2021-07-15', periods=5, freq='3D') # 使用上述索引创建 DataFrame dataFrame = pd.DataFrame({'k': [1, 2, 3, ... 阅读更多
5K+ 次浏览
要合并 Pandas DataFrame,请使用 merge() 函数。您可以将 indicator 参数设置为 True 或 False。如果要检查哪个数据框具有特定记录,则使用 −indicator= True如上所示,将上述参数设置为 True 会向输出 DataFrame 添加一个名为“_merge”的列。首先,让我们导入 pandas 库并使用别名 −import pandas as pd 让我们创建 DataFrame1 −dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'], "Units": [100, 150, 110, 80, ... 阅读更多
675 次浏览
要计算标准差,请使用 Pandas 的 std() 方法。首先,导入所需的 Pandas 库 −import pandas as pd现在,创建一个包含两列的 DataFrame −dataFrame1 = pd.DataFrame( { "Car": ['BMW', 'Lexus', 'Audi', 'Tesla', 'Bentley', 'Jaguar'], "Units": [100, 150, 110, 80, 110, 90] } ) 使用 std() 查找“Units”列值的标准差 −print"Standard Deviation of Units column from DataFrame1 = ", dataFrame1['Units'].std()同样,我们从第二个 DataFrame 计算了标准差。示例以下是完整的代码 −# # Python - 计算... 阅读更多
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C 编程
C++
C#
MongoDB
MySQL
Javascript
PHP