使用 Pandas 查找给定 Excel 表格中的损益
Pandas 是 Python 中一个流行的数据操作和分析库,被数据科学家和分析师广泛使用。它提供了许多用于处理 Excel 表格中数据的函数。在分析财务数据中最常见的任务之一是在给定的 Excel 表格中查找损益。
设置
要使用 Python 处理 Excel 文件,您需要安装 **openpyxl** 依赖项。为此,请打开您的终端并输入以下命令:
pip install openpyxl
安装成功后,您可以开始尝试使用 Excel 文件和电子表格。
要下载以下练习中使用的 Excel 电子表格,请查看 此链接
算法
要将 Excel 文件中的数据读取到 Pandas DataFrame 中,请使用内置于 Pandas 中的 **read_excel()** 方法。为了计算损益,我们必须从总收入中扣除总成本。可以使用以下步骤总结使用 Pandas 计算损益的算法:
使用 **read_excel()** 方法将 Excel 表格读取到 Pandas DataFrame 中。
DataFrame 应该更新一个用于损益的新列。
从总收入中减去总成本以确定每一行的损益。
将 DataFrame 中的损益列加总以确定总的损益。
示例 1
以下代码读取名为 **'sales.xlsx'** 的 Excel 表格并创建一个 DataFrame。然后,它为损益添加一个新列并计算每一行的损益。
import pandas as pd # read excel sheet into pandas dataframe df = pd.read_excel('sales.xlsx') # calculate total cost df['Total Cost'] = df['Units Purchased'] * df['Unit Cost'] # calculate total revenue df['Total Revenue'] = df['Units Sold'] * df['Unit Price'] # calculate profit/loss df['Profit/Loss'] = df['Total Revenue'] - df['Total Cost'] # print the resulting dataframe print(df) # save the resulting dataframe to a new excel sheet df.to_excel('sales_results.xlsx', index=False)
输出
Units Purchased Unit Cost Units Sold Unit Price Item Name Total Cost Total Revenue Profit/Loss 50 5.00 40 9.00 Apples 250.00 360.0 110.00 100 3.50 80 7.00 Oranges 350.00 560.0 210.00 25 12.00 20 15.00 Pineapples 300.00 300.0 0.00 75 1.75 60 3.50 Bananas 131.25 210.0 78.75 200 0.50 180 1.25 Carrots 100.00 225.0 125.00 450 2.00 120 4.50 Potatoes 900.00 540.0 -360.00 40 8.00 30 12.00 Avocados 320.00 360.0 40.00 80 1.50 70 3.00 Tomatoes 120.00 210.0 90.00 300 20.00 25 25.00 Mangoes 6000.00 625.0 -5375.00 60 4.00 45 8.00 Grapes 240.00 360.0 120.00
在此示例中,我们首先导入 Pandas 库,然后使用 **read_excel**() 函数读取 Excel 表格。然后,我们在数据框中创建新列以计算每个产品的总成本、总收入和损益。最后,我们打印包含新列和计算值的结果数据框,并将其保存到新的 Excel 表格中以供进一步处理。
示例 2:使用过滤器计算损益
import pandas as pd # read excel sheet into pandas dataframe df = pd.read_excel('sales_results.xlsx') # filter the dataframe to include only the products with profit df_profit = df[df['Total Revenue'] > df['Total Cost']] # calculate the total profit total_profit = df_profit['Total Revenue'].sum() - df_profit['Total Cost'].sum() # filter the dataframe to include only the products with loss df_loss = df[df['Total Revenue'] < df['Total Cost']] # calculate the total loss total_loss = df_loss['Total Cost'].sum() - df_loss['Total Revenue'].sum() # print the total profit and loss print(f"Total Profit: {total_profit}") print(f"Total Loss: {total_loss}")
输出
Total Profit: 773.75 Total Loss: 5735.0
首先导入 **Pandas** 库,然后使用 read_excel() 函数读取先前示例中保存的结果 Excel 表格。然后,我们**过滤**数据框以仅包含有盈利的商品并计算总利润。类似地,我们过滤数据框以仅包含亏损的商品并计算总亏损。最后,我们使用 print() 函数打印总利润和亏损。
使用 Pandas 计算损益的应用
**财务数据分析** - 企业可以使用 Pandas 分析其财务信息并确定各种商品和服务的损益。
**投资分析** - 投资者可以使用 Pandas 分析公司的财务信息以确定它是否盈利。
**业务预测** - 企业可以通过分析历史数据使用 Pandas 预测未来的收入和损失。
结论
对于分析和计算 Excel 表格中的损益,Pandas 是一个可以使用的强大的 Python 库。由于其简单的界面和强大的功能,Pandas 对于任何数据分析师或财务专家来说都是一个必不可少的工具。开发人员可以通过遵循本文中提供的示例,使用 Pandas 分析其财务数据并深入了解其业务的成功情况。