
- 敏捷数据科学教程
- 敏捷数据科学——主页
- 敏捷数据科学——简介
- 方法论概念
- 敏捷数据科学——流程
- 敏捷工具及安装
- 敏捷中的数据处理
- SQL 与 NoSQL
- NoSQL 和数据流编程
- 收集及展示记录
- 数据可视化
- 数据丰富
- 操作报告
- 预测的作用
- 使用 PySpark 提取特征
- 建立回归模型
- 部署预测系统
- 敏捷数据科学——SparkML
- 解决预测问题
- 提升预测性能
- 敏捷及数据科学创造更好的场景
- 敏捷的实现
- 敏捷数据科学有用资源
- 敏捷数据科学——快速指南
- 敏捷数据科学——资源
- 敏捷数据科学——讨论
部署预测系统
在本示例中,我们将学习如何创建和部署预测模型,该模型用于预测房价,方法是使用 python 脚本。用于部署预测系统的重要框架包括 Anaconda 和“Jupyter Notebook”。
请按照以下步骤部署预测系统 -
步骤 1 - 实施以下代码,将 csv 文件中的值转换为关联的值。
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import mpl_toolkits %matplotlib inline data = pd.read_csv("kc_house_data.csv") data.head()
上述代码生成以下输出 -

步骤 2 - 执行 describe 函数以获取 csv 文件属性中包含的数据类型。
data.describe()

步骤 3 - 我们可以根据我们创建的预测模型的部署来放弃关联的值。
train1 = data.drop(['id', 'price'],axis=1) train1.head()

步骤 4 - 您可以逐记录可视化数据。这些数据可用于数据科学分析和白皮书的输出。
data.floors.value_counts().plot(kind='bar')

广告