1K+ 阅读量
Orange 是一个 C++ 核心对象和例程库,其中包含大量标准和非标准机器学习和数据挖掘算法。它是一个开源的数据可视化、数据挖掘和机器学习工具。在 Orange 中,它是一个可脚本化的设置,用于快速原型设计当前算法和测试设计。它是一组基于 Python 的模块,位于中心库中。它执行一些性能时间不重要的功能,并在 Python 中完成。它包括多个任务,包括决策树的漂亮打印、装袋和提升、属性子集等。Orange 是一个组... 阅读更多
180 阅读量
比特币钱包是一种可以发送和接收比特币的数字钱包。这类似于实体钱包。但是,它不是保存实体货币,而是保存可以访问比特币地址并发送交易的加密数据。有各种比特币钱包也可以用于多种加密货币。比特币钱包的类型如下:桌面钱包 - 桌面钱包设置在台式机或笔记本电脑上,并为用户提供对钱包的完全控制。一些桌面钱包还包含更多功能,包括节点软件或交易所... 阅读更多
395 阅读量
比特币挖矿定义了对交易数据进行认证并将其插入公共分类账的过程。公共分类账称为区块链,因为它包含一组区块。比特币是虚拟货币,具有一定的价值,其价值并非一成不变,会随着时间推移而变化。没有管理比特币交易的比特币监管机构。比特币是由化名(假名)中本聪创建的,他宣布了创建,并且它是作为开源程序执行的。只有端到端版本的电脑货币才能允许在线费用直接从一个人发送到另一个人,而无需... 阅读更多
401 阅读量
数据挖掘跨行业标准流程 (CRISP-DM) 被认为是一种进一步标准化 M&V 方法的方法,并允许更有效地估算节能效果。CRISP-DM 有几个应用,如下所示:业务理解 - 选择了一个生物医学制造设施作为案例研究,以创建将 DM 应用于帮助 M&V 的可行性。对所分析业务的质量理解对于在流程的建模和评估阶段执行结果至关重要。这是通过执行流程贯穿、学习流程流程图和... 阅读更多
2K+ 阅读量
统计方法是基于模型的方法,例如为数据生成模型,并根据对象与模型的拟合程度计算对象。大多数用于异常值检测的统计方法都依赖于开发概率分布模型并考虑对象在该模型下的可能性。异常值是一个对象,相对于数据的概率分布模型,它具有低概率。概率分布模型是从数据中生成的,方法是计算用户定义分布的参数。如果数据被认为具有高斯分布,则基本... 阅读更多
541 阅读量
异常检测有各种问题,如下所示:用于定义异常的属性数量 - 对象是否异常的问题取决于单个属性,这是对象该属性的值是否异常的问题。因为一个对象可以有多个属性,所以它可以对多个属性有异常值,但对多个属性有普通值。此外,即使对象没有任何属性值独立异常,它也可能是异常的。例如,通常有人身高两英尺(儿童)或体重 300 磅... 阅读更多
806 阅读量
在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为离群值,因为在数据的散点图上,它们远离多个数据点。异常检测称为偏差检测,因为异常对象具有与预期或一般属性值基本不同的属性值,或者称为异常挖掘,因为异常在某种意义上是异常的。在全球、人类社会或数据组的领域中,大多数事件和对象在表示上是普通区域或常规的。但它可能有一个敏锐的... 阅读更多
在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为离群值,因为在数据的散点图上,它们远离多个数据点。异常检测称为偏差检测,因为异常对象具有与预期或一般属性值基本不同的属性值,或者称为异常挖掘,因为异常在某种意义上是异常的。异常检测的应用如下:欺诈检测 - 持有信用卡的人的购买行为与... 阅读更多
CURE 代表使用代表的聚类。它是一种聚类算法,它使用多种技术来实现一种可以管理高数据集、离群值以及具有非球形架构和非均匀大小的聚类的方法。CURE 通过使用聚类中的多个代表点来定义聚类。这些点将采用聚类的几何形状和架构。第一个代表点被选择为距离聚类中心最远的点,而其余点被选择为它们距离所有先前选择的点最远。在这种方法中,代表点是关联地均匀分布的。... 阅读更多
482 阅读量
m 个数据点的 m×m 邻近矩阵可以定义为一个密集图,其中每个节点都与其他一些节点连接,并且一些节点组之间边的权重遵循它们的成对邻近性。尽管每个对象都具有一些与其他每个对象相似的程度,但对于大多数数据集,对象与少量对象非常相似,而与大多数其他对象则弱相似。此功能可用于稀疏化邻近图(矩阵),方法是在开始实际聚类过程之前将一些低相似度(高差异度)值设置为 0。稀疏化... 阅读更多