Python 中的逻辑回归 - 案例研究



考虑一家银行联系你开发一个机器学习应用程序,该应用程序将帮助他们识别可能开定期存款(一些银行也称之为固定存款)的潜在客户。银行定期通过电话呼叫或网络表单进行调查,以收集有关潜在客户的信息。该调查的性质是通用的,并且在非常广泛的受众中进行,其中许多受众可能没有兴趣与这家银行本身打交道。而剩下的其他人中,可能只有少数人会对开设定期存款感兴趣。其他人可能对银行提供的其他设施感兴趣。因此,该调查不一定是为了识别开设定期存款的客户。你的任务是从银行将与你分享的大量调查数据中识别出所有开立定期存款概率较高的客户。

幸运的是,此类数据是公开的,对于那些想开发机器学习模型的人来说。此数据由加州大学欧文分校的一些学生在外部资金的支持下准备。该数据库是UCI 机器学习存储库的一部分,全球很多学生、教育工作者和研究人员都在广泛使用。可以从此处下载数据。

在接下来的章节中,让我们使用相同的数据来执行应用程序开发。

广告