找到 1861 篇文章 关于数据结构

什么是 Orange 数据挖掘?

Ginni
更新于 2022年2月14日 13:21:46

1K+ 浏览量

Orange 是一个 C++ 核心对象和例程库,包含大量标准和非标准机器学习和数据挖掘算法。它是一个开源的数据可视化、数据挖掘和机器学习工具。在 Orange 中,它是一个可脚本化的设置,用于快速原型化当前算法和测试设计。它是一组基于 Python 的模块,位于中心库中。它执行一些性能时间不重要的功能,并且在 Python 中完成。它包括多个任务,包括决策树的漂亮打印、装袋和提升、属性子集等。Orange 是一组 ... 阅读更多

比特币钱包的类型有哪些?

Ginni
更新于 2022年2月14日 13:18:39

180 浏览量

比特币钱包是一种可以发送和接收比特币的数字钱包。这类似于实体钱包。但是,钱包不是保存实体货币,而是保存可以访问比特币地址和发送交易的加密数据。有各种各样的比特币钱包也可以用于多种加密货币。比特币钱包的类型如下:桌面钱包 - 桌面钱包设置在台式机或笔记本电脑上,并为用户提供对钱包的完全控制。一些桌面钱包还包含更多功能,包括节点软件或交易所 ... 阅读更多

什么是比特币数据挖掘?

Ginni
更新于 2022年2月14日 13:13:31

395 浏览量

比特币挖矿定义了对交易数据进行认证并将其插入公共分类账的过程。公共分类账称为区块链,因为它包含一组区块。比特币是一种虚拟货币,具有一定的价值,并且其价值不是静态的,会随着时间而变化。没有管理比特币交易的比特币监管机构。比特币是由化名(假名)中本聪创建的,他宣布了创建,并且它是作为开源程序执行的。只有端到端的计算机货币版本才能允许在线费用直接从一个人发送到另一个人,而无需 ... 阅读更多

CRISP-DM 的应用有哪些?

Ginni
更新于 2022年2月14日 13:11:03

401 浏览量

数据挖掘跨行业标准流程 (CRISP-DM) 被认为是一种进一步标准化 M&V 方法的方法,并允许更有效地估算节能效果。CRISP-DM 有几个应用,如下所示:业务理解 - 选择了一个生物医学制造设施作为案例研究,以创建 DM 应用的可行性,以帮助 M&V。对正在分析的业务有良好的理解对于在流程的建模和评估阶段执行结果非常重要。这是通过执行流程贯穿、学习流程流程图和 ... 阅读更多

什么是统计方法?

Ginni
更新于 2022年2月14日 13:09:15

2K+ 浏览量

统计方法是基于模型的方法,例如为数据创建模型,并且计算对象与它们适合模型的程度。大多数用于异常值检测的统计方法取决于开发概率分布模型以及考虑对象在该模型下出现的可能性。异常值是一个对象,它在数据的概率分布模型下具有低概率。概率分布模型是通过计算用户定义分布的参数从数据中生成的。如果数据被认为具有高斯分布,则基本 ... 的均值和标准差 ... 阅读更多

异常检测的问题有哪些?

Ginni
更新于 2022年2月14日 13:07:37

541 浏览量

异常检测存在各种问题,如下所示:用于定义异常的属性数量 - 对象是否异常的问题取决于单个属性,这是一个问题,即对象对该属性的值是否异常。因为一个对象可以有多个属性,所以它可以对多个属性具有异常值,但对多个属性具有普通值。此外,即使对象的任何属性值都不独立异常,它也可能是异常的。例如,通常有身高两英尺(儿童)或体重 300 磅的人 ... 阅读更多

异常的原因有哪些?

Ginni
更新于 2022年2月14日 13:06:18

806 浏览量

在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为离群值,因为在数据的散点图上,它们远离多个数据点。异常检测称为偏差检测,因为异常对象的属性值基本上偏离预期或一般的属性值,或者作为异常挖掘,因为异常在某种意义上是异常的。在全球、人类社会或数据组域中,大多数事件和对象在表示上是常见区域或规则的。但它可能有一个敏锐的 ... 阅读更多

异常检测的应用有哪些?

Ginni
更新于 2022年2月14日 13:04:27

1K+ 浏览量

在异常检测中,目标是发现与多个对象不同的对象。通常,异常对象被称为离群值,因为在数据的散点图上,它们远离多个数据点。异常检测称为偏差检测,因为异常对象的属性值基本上偏离预期或一般的属性值,或者作为异常挖掘,因为异常在某种意义上是异常的。异常检测有各种应用,如下所示:欺诈检测 - 持有信用卡的人的购买行为不同于 ... 阅读更多

什么是 CURE?

Ginni
更新于 2022年2月14日 13:02:59

2K+ 浏览量

CURE 代表使用代表的聚类。它是一种聚类算法,它使用多种技术来创建一种可以管理高数据集、异常值以及具有非球形架构和非均匀大小的聚类的方法。CURE 通过使用聚类中的多个代表点来定义聚类。这些点将获取聚类的几何形状和架构。第一个代表点被选择为距聚类中心最远的点,而其余点被选择,以便它们距所有先前选择的点最远。在这种方法中,代表点关联地分布良好。 ... 阅读更多

什么是稀疏化?

Ginni
更新于 2022年2月14日 13:01:09

482 浏览量

m 个数据点的 m×m 邻近矩阵可以定义为一个密集图,其中每个节点都与其他一些节点连接,并且一些节点组之间边的权重遵循它们的成对邻近性。尽管每个对象都有一些与其他每个对象相似的方法,但对于大多数数据集,对象与少量对象非常相似,而与大多数其他对象相似性较弱。此功能可用于稀疏化邻近图(矩阵),方法是在开始实际聚类过程之前将一些低相似性(高差异性)值设置为 0。稀疏化 ... 阅读更多

广告