在 Python 中导入数据
在运行 Python 程序时,我们需要使用数据集进行数据分析。Python 有各种模块可以帮助我们将各种文件格式的外部数据导入到 Python 程序中。在本例中,我们将了解如何将各种格式的数据导入到 Python 程序中。
导入 csv 文件
csv 模块使我们能够使用逗号作为分隔符来读取文件中的每一行。我们首先以只读模式打开文件,然后分配分隔符。最后,使用 for 循环从 csv 文件中读取每一行。
示例
import csv with open("E:\customers.csv",'r') as custfile: rows=csv.reader(custfile,delimiter=',') for r in rows: print(r)
输出
运行以上代码将得到以下结果:
['customerID', 'gender', 'Contract', 'PaperlessBilling', 'Churn'] ['7590-VHVEG', 'Female', 'Month-to-month', 'Yes', 'No'] ['5575-GNVDE', 'Male', 'One year', 'No', 'No'] ['3668-QPYBK', 'Male', 'Month-to-month', 'Yes', 'Yes'] ['7795-CFOCW', 'Male', 'One year', 'No', 'No'] …… …….
使用 pandas
pandas 库实际上可以处理大多数文件类型,包括 csv 文件。在本程序中,让我们看看 pandas 库如何使用 read_excel 模块处理 excel 文件。在下面的示例中,我们读取上述文件的 excel 版本,并在读取文件时获得相同的结果。
示例
import pandas as pd df = pd.ExcelFile("E:\customers.xlsx") data=df.parse("customers") print(data.head(10))
输出
运行以上代码将得到以下结果:
customerID gender Contract PaperlessBilling Churn 0 7590-VHVEG Female Month-to-month Yes No 1 5575-GNVDE Male One year No No 2 3668-QPYBK Male Month-to-month Yes Yes 3 7795-CFOCW Male One year No No 4 9237-HQITU Female Month-to-month Yes Yes 5 9305-CDSKC Female Month-to-month Yes Yes 6 1452-KIOVK Male Month-to-month Yes No 7 6713-OKOMC Female Month-to-month No No 8 7892-POOKP Female Month-to-month Yes Yes 9 6388-TABGU Male One year No No
使用 pyodbc
我们还可以使用名为 pyodbc 的模块连接到数据库服务器。这将帮助我们使用 sql 查询从关系源导入数据。当然,我们还必须在传递查询之前定义到数据库的连接详细信息。
示例
import pyodbc sql_conn = pyodbc.connect("Driver={SQL Server};Server=serverName;UID=UserName;PWD=Password;Database=sqldb;") data_sql = pd.read_sql_query(SQL QUERY’, sql_conn) data_sql.head()
输出
根据 SQL 查询,结果将显示。
广告