适合初学者的十大机器学习项目
介绍
机器学习的本质思想是,不同的技术工具,例如计算机和平板电脑,可以根据编码和其他数据来理解任何事物。虽然这看起来像是来自未来的事物,但大多数人每天都在互联网上使用这种级别的技术。语音识别就是一个很好的例子。虚拟个人助理(如Siri和Alexa)使用这项技术来朗读提醒、回答问题和执行任务。
随着该行业的增长,越来越多的专家正在考虑从事机器学习专家的职业。从头到尾完成一个项目是入门最好的方法之一,并且网上有很多免费工具。
让我们探讨机器学习项目背后的想法:
适合初学者的十大机器学习项目
使用Movielens数据集进行电影推荐。
使用智能手机进行人体活动识别。
TensorFlow。
沃尔玛销售预测。
对Twitter上的特定推文进行分类
股票价格预测。
葡萄酒质量预测。
鸢尾花分类。
乳腺癌预测。
创建手写文档的数字化版本。
1) 使用Movielens数据集进行电影推荐
如今,几乎每个人都使用技术来流式播放电影和电视节目。但是,选择接下来观看什么可能会很困难,然而,建议通常是根据观众过去的观看习惯和个人喜好给出的。机器学习被用来实现这一点,这使得它成为初学者的一个简单而引人入胜的项目。使用Movielens数据集和Python或R编程语言,初级程序员可以磨练他们的技能。目前,超过9000人已经为6800部电影贡献了超过200万个电影评分。
2) 使用智能手机进行人体活动识别
许多现代移动设备都设计成可以自动检测我们何时正在进行特定的活动,例如骑自行车或慢跑。在这里,机器学习发挥了作用。对于此类项目,初级机器学习工程师使用包含来自少量人员(越多越好)的健身活动记录的数据集,这些数据是使用配备惯性传感器的移动设备获得的。这也可以帮助他们更好地理解多分类问题。
3) TensorFlow
TensorFlow是一个开源数值计算软件,它使用数据流图。谷歌大脑团队在Apache 2.0免费软件许可证的条款下创建了它。TensorFlow提供了一系列工具,用于神经网络、自然语言处理、机器学习、强化学习以及机器学习的其他领域的应用。TensorFlow用于各种应用,包括时间序列分析、基于文本的程序、图像和语音识别。它还用于构建用于机器学习和深度学习的大规模分布式网络。
4) 沃尔玛销售预测
虽然可能无法完美预测未来的销售额,但企业可以通过机器学习来接近完美。开发人员可以使用98种产品的销售价格数据,这些数据涵盖了45家沃尔玛商店,并按地点和部门细分。这个大型项目旨在改进数据驱动的库存规划和渠道优化决策。
5) 对Twitter上的特定推文进行分类
能够快速过滤包含特定单词和内容的推文将非常棒。好消息是,程序员可以使用经过自然语言处理的抓取推文创建一个算法,并根据初级机器学习软件确定哪些推文更可能符合主题、讨论特定人物等等。
6) 股票价格预测
用于销售预测的相同数据集、波动性指数和基本指标也用于预测股票价格。有了这样的工具,初学者可以从小规模开始,使用股票价格统计数据预测未来几个月的情况。要开始,请从Quantopian或Quandl获取股票市场数据集。
7) 葡萄酒质量预测
在购买葡萄酒时,找到我们喜欢的葡萄酒可能具有挑战性。如果我们不是专家,无法考虑包括年份和价格在内的各种因素,就无法确定葡萄酒的质量。通过这个项目,ML新手可以体验数据探索、数据可视化、回归建模和R编程。
8) 鸢尾花分类
鸢尾花数据集是初学者最著名、最古老、最简单的机器学习项目之一。作为这个项目的一部分,学生必须能够在基础层面处理数值数据和数量。数据包括萼片和花瓣的长度和宽度。在一个成功的项目中,鸢尾花成功地被分成三个物种中的每一个。
9) 乳腺癌预测
这个计算机视觉实验中使用的数据集可以预测乳腺肿瘤更有可能是良性还是恶性。对于初级机器学习专家来说,R编程培训是一个很好的起点。乳腺癌预测是根据多种因素(包括家族病史、生活方式、环境暴露和其他危险因素)预测个人患乳腺癌可能性的过程。预测模型使用统计算法和机器学习来评估患乳腺癌的风险。
10) 创建手写文档的数字化版本
对于这类项目的练习,深度学习和神经网络(图像识别必不可少的机器学习组件)是合适的。初学者还可以学习如何应用逻辑回归、MNIST数据集以及如何将像素数据转换为图像。创建手写文档的数字化版本
可以通过扫描文档并使用光学字符识别 (OCR) 软件将扫描图像转换为可编辑的数字文本文件来创建手写文档的数字版本。OCR 软件可以识别各种字体和笔迹样式的文本,并可以准确地将文本转换为数字文件。转换文件后,可以使用各种文本编辑器或文字处理程序对其进行编辑和处理。
结论
在本文中,我们讨论了机器学习的重要性以及它如何在日常生活中使用。该公司已经启动了一些项目,在预测方面取得了显著进展,并且已经能够以最高的准确度做出高质量的决策。
机器学习使这一切成为可能。机器学习的真正潜力将在未来展现出来,帮助普通人和组织蓬勃发展。
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP