使用 Python 中的 matplotlib 进行活跃产品销售分析
Python 中的 Matplotlib 具有各种函数,如 read_csv、sort_values、group_by 等,用于执行销售数据分析。任何从事任何类型产品销售的在线业务都使用产品销售数据分析来增加销售额并更好地了解客户。任何从事任何类型的电子商务业务的公司都使用其销售和客户数据来识别趋势、模式和见解,这些见解可用于改进销售和收入。销售数据可用于确定哪种产品吸引力最高,哪个节日季需求量最大,以及许多其他有助于增加销售额的趋势。
Python 是一种流行的数据分析和可视化编程语言。Python 提供了许多可用于有效进行产品销售分析的库和工具。在本文中,我们将使用 Matplotlib(Python 中流行的数据可视化库)进行活跃产品销售分析。
我们将使用示例销售数据,使用 numpy、pandas 和 matplotlib 进行活跃产品销售分析。示例销售数据可在此处找到。
分步销售数据分析
数据读取和处理
本例中用于分析的示例销售数据包含以下列:
订单编号 |
产品类型 |
数量 |
单价 |
订单日期 |
地址 |
订单编号 - 每个已下订单的唯一编号。
产品类型 - 产品类别
数量 - 订购产品的数量
单价 - 每单位价格
订单日期 - 下订单的日期和时间
地址 - 产品交付的地址。
我们将需要导入 pandas 和 numpy,它们可用于读取和处理示例销售数据。以下是读取数据的代码:
示例销售数据可在 Kaggle 平台上找到 此处。
示例
import pandas as pd import numpy as np import io from google.colab import files uploaded = files.upload() # read csv data Sales_data = pd.read_csv(io.BytesIO(uploaded['sample_sales_data.csv']), encoding='cp1252') Sales_data.sort_values(by=['ORDER_NUMBER'])
输出
读取数据后,我们需要处理数据。“订单日期”列需要转换为 DateTime 对象,我们可以从订单日期中提取月份和年份,并为月份、年份和总销售额添加新列。数据清理和处理的代码如下所示:
示例
Sales_data['ORDER_DATE'] = pd.to_datetime(Sales_data['ORDER_DATE']) Sales_data['MONTH'] = Sales_data['ORDER_DATE'].dt.month Sales_data['YEAR'] = Sales_data['ORDER_DATE'].dt.year Sales_data['TOTAL_SALES'] = Sales_data['QUANTITY'] * Sales_data['PRICE_EACH'] Sales_data.sort_values(by=['ORDER_NUMBER'])
输出
新的月份、年份和总销售额列将帮助我们分析随时间推移的销售趋势。现在,我们可以使用这些列使用 matplotlib 库绘制不同的图表,以从 sample_sales_data 中获得一些见解。
数据可视化
到目前为止,我们已经读取并处理了我们的数据,以便使用 Python 中的 matplotlib 库绘制不同的图表。Matplotlib 提供线状图、条形图和散点图来可视化数据。
随时间推移的总销售额可视化
为了可视化随时间推移的总销售额,我们可以使用 matplotlib 绘制线形图。为此,我们需要:
按年份和月份分组数据
使用 matplotlib 创建折线图
设置标题和轴标签
显示图表
示例
import matplotlib.pyplot as plt # Group the data by year and month sales_by_month = Sales_data.groupby(['YEAR', 'MONTH']).sum()['TOTAL_SALES'].reset_index() # Create a line chart plt.plot(sales_by_month.index, sales_by_month.values) # Set the title and axis labels plt.title('Total Sales by Month') plt.xlabel('Month') plt.ylabel('Sales ($)') # Display the chart plt.show()
输出
随时间推移的年度收入可视化
我们可以可视化每年的年度收入,并查看哪一年收入最高,哪一年收入最低。为此,我们需要:
按年份分组销售数据
使用 Seaborn(底层使用 matplotlib)创建条形图
设置标题和轴标签
显示图表
示例
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # Annual Revenue plt.figure(figsize=(10,6)) yearly_revenue = Sales_data.groupby(['YEAR'])['TOTAL_SALES'].sum().reset_index() sns.barplot(x="YEAR", y="TOTAL_SALES", data=yearly_revenue) plt.title('Annual Revenue', fontsize = 20) plt.xlabel('Year', fontsize = 16) plt.ylabel('Revenue', fontsize = 16) plt.show()
输出
结论
我们可以使用 Python 中的 matplotlib 分析和可视化任何类型的产品销售数据,并获得公司可用于增加销售额的标准数据见解。我们在上文中使用 Python 中的 matplotlib、pandas 和 numpy 分析了随时间推移的总销售额和按年度计算的收入。