400 次浏览
回归分析定义了一种监督式机器学习方法,可用于预测任何连续值属性。回归分析帮助企业探索目标变量和预测变量之间的关联。它是探索数据的重要工具,可用于货币预测和时间序列建模。通过将数据拟合到函数(例如回归分析)可以平滑数据。线性回归包括找到拟合两个属性(或变量)的“最佳”直线,以便可以使用一个属性来预测另一个属性。多元线性回归是线性回归的扩展,其中…… 阅读更多
1000+ 次浏览
Orange是一个基于C++的核心对象和例程库,包含大量标准和非标准机器学习和数据挖掘算法。它是一个开源的数据可视化、数据挖掘和机器学习工具。在Orange中,它是一个可脚本化的环境,用于快速原型设计现有算法和测试设计。它是一组基于python的模块,位于中心库中。它执行一些性能时间不重要的功能,这些功能在Python中完成。它包括多个任务,包括决策树的漂亮打印、装袋和提升、属性子集等。Orange是一个…… 阅读更多
180 次浏览
比特币钱包是一种数字钱包,可以发送和接收比特币。这类似于实体钱包。但是,它不是保存实体货币,而是保存可以访问比特币地址和发送交易的加密数据。各种比特币钱包也可以用于多种加密货币。以下是一些比特币钱包类型:桌面钱包 - 桌面钱包安装在台式机或笔记本电脑上,使用户可以完全控制钱包。一些桌面钱包还包含更多功能,包括节点软件或交易所…… 阅读更多
395 次浏览
比特币挖矿定义了将交易数据验证并添加到公共分类账的过程。公共分类账称为区块链,因为它包含一组区块。比特币是一种虚拟货币,具有一定的价值,其价值并非一成不变,会随着时间而变化。没有管理比特币交易的比特币监管机构。比特币是由化名(假名)中本聪创建的,他宣布了它的创建,并将其作为开源程序进行开发。只有端到端版本的电脑货币才能允许在线支付直接从一个人发送到另一个人,而无需…… 阅读更多
401 次浏览
跨行业标准数据挖掘过程 (CRISP-DM) 被认为是一种进一步标准化 M&V 方法论的方法,并允许更有效地估计节能量。CRISP-DM 有多种应用,如下所示:业务理解 - 选择一家生物医学制造工厂作为案例研究,以创建将 DM 应用于辅助 M&V 的可行性。对所分析业务的质量理解对于在过程的建模和评估阶段执行结果至关重要。这是通过进行过程贯穿、学习过程流程图和…… 阅读更多
2000+ 次浏览
统计方法是基于模型的方法,例如为数据创建模型,并计算对象与模型拟合程度。大多数用于异常值检测的统计方法都依赖于开发概率分布模型并考虑对象在该模型下的可能性。异常值是一个关于数据的概率分布模型的概率低的物体。概率分布模型是通过计算用户定义分布的参数从数据中生成的。如果数据被认为具有高斯分布,则基本…… 阅读更多
541 次浏览
异常检测的各种问题如下:用于定义异常的属性数量 - 对象是否异常的问题取决于单个属性,这是一个问题,即对象对该属性的值是否异常。因为一个对象可以有多个属性,所以它可以对多个属性具有异常值,但对多个属性具有普通值。此外,即使对象的任何属性值都不是独立异常的,它也可能是异常的。例如,通常有人身高两英尺(儿童)或体重300磅…… 阅读更多
806 次浏览
在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为异常值,因为在数据的散点图上,它们远离多个数据点。异常检测被称为偏差检测,因为异常对象的属性值与预期或一般的属性值存在很大偏差,或者被称为异常挖掘,因为异常在某种意义上是例外的。在全球、人类社会或数据组的领域中,大多数事件和对象都是通过表示、公共区域或常规来定义的。但它可以有一个敏锐的…… 阅读更多
在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为异常值,因为在数据的散点图上,它们远离多个数据点。异常检测被称为偏差检测,因为异常对象的属性值与预期或一般的属性值存在很大偏差,或者被称为异常挖掘,因为异常在某种意义上是例外的。异常检测的各种应用如下:欺诈检测 - 持有信用卡的人的购买行为与…… 阅读更多
CURE代表使用代表的聚类。它是一种聚类算法,它使用多种技术来实现一种可以管理高数据量、异常值以及具有非球形结构和非均匀大小的聚类的方法。CURE通过使用聚类中的多个代表点来定义聚类。这些点将捕捉聚类的几何形状和结构。第一个代表点被选择为距聚类中心最远的点,而其余点被选择为它们距所有先前选择的点最远。在这种方法中,代表点是关联地良好分布的…… 阅读更多