使用Python程序进行数据分析和可视化
在本教程中,我们将学习如何使用诸如**pandas**和**matplotlib**之类的模块在Python中进行数据分析和可视化。Python非常适合数据分析。使用以下命令安装**pandas**和**matplotlib**模块。
pip install pandas
pip install matplotlib
安装过程完成后,您将收到成功消息。我们将首先学习**pandas**,然后学习**matplotlib**。
pandas
Pandas是一个开源的Python库,它提供数据分析工具。我们将学习一些来自**pandas**的有用数据分析方法。
创建DataFrame
我们需要多行才能创建一个**DataFrame**。让我们看看如何操作。
示例
# importing the pands package import pandas as pd # creating rows hafeez = ['Hafeez', 19] aslan = ['Aslan', 21] kareem = ['Kareem', 18] # pass those Series to the DataFrame # passing columns as well data_frame = pd.DataFrame([hafeez, aslan, kareem], columns = ['Name', 'Age']) # displaying the DataFrame print(data_frame)
输出
如果您运行上述程序,您将获得以下结果。
Name Age 0 Hafeez 19 1 Aslan 21 2 Kareem 18
使用pandas导入数据
访问链接并下载**CSV**文件。**CSV**中的数据将以逗号(,)分隔的行形式呈现。让我们看看如何使用**pandas**导入和使用数据。
示例
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # displaying the first 5 rows using data.head() method print(data.head())
输出
如果您运行上述程序,您将获得以下结果。
让我们使用shape变量看看有多少行和列。
示例
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.shape)
输出
如果您运行上述程序,您将获得以下结果。
(29, 16)
我们有一个名为**describe()**的方法,它可以计算各种统计数据,但不包括**NaN**。让我们来看一下。
示例
# importing pandas package import pandas as pd # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # no. of rows and columns print(data.describe())
输出
如果您运行上述程序,您将获得以下结果。
数据绘图
我们有**matplotlib**包可以使用数据创建图表。让我们看看如何使用**matplotlib**创建各种类型的图表。
示例
# importing the pyplot module to create graphs import matplotlib.pyplot as plot # importing the data using pd.read_csv() method data = pd.read_csv('CountryData.IND.csv') # creating a histogram of Time period data['Time period'].hist(bins = 10)
输出
如果您运行上述程序,您将获得以下结果。
<matplotlib.axes._subplots.AxesSubplot at 0x25e363ea8d0>
我们可以使用**matplotlib**包创建不同类型的图表。
结论
如果您对本教程有任何疑问,请在评论区提出。
广告