400 次浏览
回归分析定义了一种监督式机器学习方法的类型,可用于预测任何连续值的属性。回归分析帮助企业探索目标变量和预测变量之间的关联。它是探索数据的重要工具,可用于货币预测和时间序列建模。通过将数据拟合到函数(例如回归分析)可以平滑数据。线性回归包括找到拟合两个属性(或变量)的“最佳”直线,以便可以使用一个属性来预测另一个属性。多元线性回归是线性回归的改进,其中……阅读更多
1K+ 次浏览
Orange是一个C++核心对象和例程库,包含大量标准和非标准机器学习和数据挖掘算法。它是一个开源的数据可视化、数据挖掘和机器学习工具。在Orange中,它是一个可编写脚本的环境,用于快速原型设计现有算法和测试设计。它是一组基于python的模块,位于中心库中。它执行一些对性能时间不重要的功能,这些功能在Python中完成。它包括多个任务,包括决策树的漂亮打印、bagging和boosting、属性子集等。Orange是一个……阅读更多
180 次浏览
比特币钱包是一种数字钱包,可以发送和接收比特币。这类似于实体钱包。但是,它不是保存实体货币,而是保存可以访问比特币地址和发送交易的加密数据。各种比特币钱包也可以用于多种加密货币。比特币钱包的类型如下:桌面钱包 - 桌面钱包安装在台式机或笔记本电脑上,允许用户完全控制钱包。一些桌面钱包还包含更多功能,包括节点软件或交易所……阅读更多
395 次浏览
比特币挖掘定义了将交易数据验证并添加到公共分类账的过程。公共分类账称为区块链,因为它包含一组区块。比特币是一种虚拟货币,具有某种价值,其价值并非一成不变,而是随时间变化。没有管理比特币交易的比特币监管机构。比特币是由化名(假名)中本聪创建的,他宣布了创建,并且它作为一个开源程序执行。只有端到端版本的计算机货币才能允许在线费用直接从一个人发送到另一个人,而无需……阅读更多
401 次浏览
跨行业标准数据挖掘流程 (CRISP-DM) 被认为是一种进一步标准化 M&V 方法并允许更有效地估计节能量的方法。CRISP-DM 有几种应用,如下所示:业务理解 - 选择一家生物医学制造工厂作为案例研究,以创建将 DM 应用于辅助 M&V 的可行性。对所分析业务的质量理解对于在过程的建模和评估阶段执行结果至关重要。这是通过进行流程演练、学习流程流程图和……阅读更多
2K+ 次浏览
统计方法是基于模型的方法,例如为数据创建模型,并根据对象与模型的拟合程度计算对象。大多数用于异常值检测的统计方法都依赖于开发概率分布模型并考虑对象在该模型下的可能性。异常值是指根据数据的概率分布模型具有低概率的对象。概率分布模型是通过计算用户定义分布的参数从数据中生成的。如果数据被认为具有高斯分布,那么基本……阅读更多
541 次浏览
异常检测存在各种问题,如下所示:用于定义异常的属性数量 - 对象是否异常的问题取决于单个属性,以及该属性的对象值是否异常的问题。因为对象可以具有多个属性,所以它可以针对多个属性具有异常值,但针对多个属性具有普通值。此外,即使对象的任何属性值本身都不是异常值,该对象也可能是异常值。例如,通常情况下会有身高两英尺(儿童)或体重 300 磅的人……阅读更多
806 次浏览
在异常检测中,目标是发现与多个对象不同的对象。异常对象通常被称为异常值,因为在数据的散点图上,它们远离多个数据点。异常检测被称为偏差检测,因为异常对象具有与预期或一般属性值基本偏离的属性值,或者被称为异常挖掘,因为异常在某种意义上是异常的。在全球、人类社会或数据组领域中,大多数事件和对象都是具有代表性的、公共区域或规律的。但它可能有一个敏锐的……阅读更多
在异常检测中,目标是发现与多个对象不同的对象。异常对象通常被称为异常值,因为在数据的散点图上,它们远离多个数据点。异常检测被称为偏差检测,因为异常对象具有与预期或一般属性值基本偏离的属性值,或者被称为异常挖掘,因为异常在某种意义上是异常的。异常检测有各种应用,如下所示:欺诈检测 - 持有信用卡的人的购买行为与……阅读更多
CURE (使用代表点聚类) 是一种聚类算法,它结合多种技术,能够处理大型数据集、异常值以及具有非球形结构和非均匀大小的簇。CURE 通过使用簇中的几个代表点来定义簇。这些点将体现簇的几何形状和结构。第一个代表点选择为距离簇中心最远的点,而其余点则选择为距离所有先前选择的点最远的点。这种方法使得代表点在簇中分布得比较均匀……阅读更多