在 Python 中导入数据


在运行 Python 程序时,我们需要使用数据集进行数据分析。Python 有各种模块可以帮助我们将各种文件格式的外部数据导入到 Python 程序中。在本例中,我们将了解如何将各种格式的数据导入到 Python 程序中。

导入 csv 文件

csv 模块使我们能够使用逗号作为分隔符来读取文件中的每一行。我们首先以只读模式打开文件,然后分配分隔符。最后,使用 for 循环从 csv 文件中读取每一行。

示例

import csv

with open("E:\customers.csv",'r') as custfile:
rows=csv.reader(custfile,delimiter=',')
for r in rows:
print(r)

输出

运行以上代码将得到以下结果:

['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn']
['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No']
['5575-GNVDE', 'Male', 'One year', 'No', 'No']
['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes']
['7795-CFOCW', 'Male', 'One year', 'No', 'No']
……
…….

使用 pandas

pandas 库实际上可以处理大多数文件类型,包括 csv 文件。在本程序中,让我们看看 pandas 库如何使用 read_excel 模块处理 excel 文件。在下面的示例中,我们读取上述文件的 excel 版本,并在读取文件时获得相同的结果。

示例

import pandas as pd

df = pd.ExcelFile("E:\customers.xlsx")
data=df.parse("customers")
print(data.head(10))

输出

运行以上代码将得到以下结果:

  customerID   gender Contract            PaperlessBilling Churn
0 7590-VHVEG Female   Month-to-month         Yes            No
1 5575-GNVDE   Male   One year                No            No
2 3668-QPYBK   Male   Month-to-month         Yes           Yes
3 7795-CFOCW   Male   One year                No            No
4 9237-HQITU Female   Month-to-month        Yes            Yes
5 9305-CDSKC Female   Month-to-month        Yes            Yes
6 1452-KIOVK   Male   Month-to-month        Yes             No
7 6713-OKOMC Female   Month-to-month         No             No
8 7892-POOKP Female   Month-to-month        Yes            Yes
9 6388-TABGU   Male   One year               No             No

使用 pyodbc

我们还可以使用名为 pyodbc 的模块连接到数据库服务器。这将帮助我们使用 sql 查询从关系源导入数据。当然,我们还必须在传递查询之前定义到数据库的连接详细信息。

示例

import pyodbc
sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;")
data_sql = pd.read_sql_query(SQL QUERY’, sql_conn)
data_sql.head()

输出

根据 SQL 查询,结果将显示。

更新于:2020-07-10

16K+ 次查看

开启你的 职业生涯

通过完成课程获得认证

开始学习
广告