找到关于数据库的6705 篇文章

什么是时间序列数据库?

Ginni
更新于 2021年11月25日 08:00:25

996 次浏览

时间序列数据库包含通过重复评估时间访问的值或事件序列。这些值通常以相等的时间间隔计算(例如,每小时、每天、每周)。时间序列数据库在许多应用程序中很流行,例如股票市场分析、经济和销售预测、预算分析、效用研究、库存研究、产量预测、工作量预测、过程和质量控制、自然现象观测(包括大气、温度、风和地震)、数值和工程实验以及医疗治疗。时间序列数据库也是一种序列数据库。序列数据库是任何包含有序事件序列的数据库,无论是否有具体的……阅读更多

什么是CluStream?

Ginni
更新于 2021年11月25日 07:58:04

780 次浏览

CluStream 是一种基于用户指定的在线聚类查询对不断演变的数据流进行聚类的算法。它将聚类过程划分为在线和离线组件。在线组件使用微型聚类计算和存储有关数据流的汇总统计信息,并执行微型聚类的增量在线计算和维护。离线组件执行宏聚类,并使用存储的汇总统计信息(基于倾斜时间框架模型)回答各种用户问题。基于历史和当前流数据信息对聚类演变数据流,采用倾斜时间框架模型(例如渐进对数模型),……阅读更多

什么是Hoeffding树算法?

Ginni
更新于 2021年11月25日 07:54:06

4K+ 次浏览

Hoeffding 树算法是一种用于流数据分类的决策树学习方法。它最初用于跟踪 Web 点击流并构建模型以预测用户可能访问哪些 Web 主机和网站。它通常以次线性时间运行,并生成与传统批量学习者几乎相同的决策树。它使用 Hoeffding 树,利用这样一个想法:一个小样本通常足以选择最佳分割属性。这个想法在数学上得到了 Hoeffding 界限(或加性 Chernoff 界限)的支持。假设我们对随机……阅读更多

什么是BIRCH?

Ginni
更新于 2021年11月25日 07:47:53

1K+ 次浏览

BIRCH 代表使用层次结构的平衡迭代归约和聚类。它旨在通过集成层次聚类和其他聚类方法(包括迭代划分)来聚类大量数值记录。BIRCH 提供了两个概念,即聚类特征和聚类特征树 (CF 树),用于总结聚类描述。这些结构使聚类方法能够在大型数据库中实现最佳速度和可扩展性,并使其能够有效地对传入对象的增量和动态聚类。给定一个聚类中的 n 个 d 维数据对象或点,它可以表示质心 x0、半径 R 和直径 D……阅读更多

什么是基于距离的异常值?

Ginni
更新于 2021年11月25日 07:46:20

2K+ 次浏览

如果数据集 S 中的最小分数 p 的对象与 o 的距离高于 d,则数据集中 S 中的一个对象 o 是具有参数 p 和 d 的基于距离的 (DB) 异常值,即 DB (p, d)。换句话说,它可以认为基于距离的异常值是那些没有足够邻居的对象,而不是依赖于统计检验。邻居是基于与给定对象的距离来表示的。与基于统计的方法相比,基于距离的异常值检测概括或合并了标准分布的差异性检验背后的思想。因此,基于距离的异常值也是……阅读更多

什么是半监督聚类分析?

Ginni
更新于 2021年11月24日 10:55:56

6K+ 次浏览

半监督聚类是一种通过利用领域知识来划分未标记数据的方法。它通常表示为实例之间的成对约束,或者只是作为一组附加的标记实例。使用一些弱监督结构(例如,成对约束的形式(即标记为属于相似或不同聚类的对象的对))可以实质上提高无监督聚类的质量。这种依赖于用户反馈或指导约束的聚类过程称为半监督聚类。有几种半监督聚类方法,可以分为两类,它们是……阅读更多

基于约束的聚类分析有哪些类型?

Ginni
更新于 2021年11月24日 10:53:53

3K+ 次浏览

基于约束的聚类查找满足用户声明的首选项或约束的聚类。它基于约束的性质,基于约束的聚类可以采用不同的方法。有几类约束如下:对单个对象的约束 - 它可以定义对要聚类的对象的约束。例如,在一个房地产应用程序中,人们可能希望仅对价值超过一百万美元的豪华别墅进行空间聚类。此约束将要聚类的对象集合限制在范围内。它可以通过预处理(例如,使用 SQL 查询实现选择)来简单地管理,之后……阅读更多

什么是概念聚类?

Ginni
更新于 2021年11月24日 11:19:48

2K+ 次浏览

概念聚类是一种机器学习中的聚类形式,它在给定一组未标记对象的情况下,对这些对象进行分类设计。与通常识别相似对象组的传统聚类不同,概念聚类更进一步,还发现了每个组的特征定义,其中每个组定义一个概念或类别。因此,概念聚类是一个两步过程 - 首先执行聚类,然后进行表征。因此,聚类质量不仅仅是单个对象的效用。大多数概念聚类技术采用一种统计方法,该方法使用概率度量来决定概念或聚类。概率……阅读更多

什么是期望最大化?

Ginni
更新于 2021年11月24日 10:11:39

598 次浏览

EM(期望最大化)算法是一种著名的迭代细化算法,可用于发现参数估计。它可以被认为是 k 均值范式的扩展,它根据聚类均值将对象创建到与其最相似的聚类中。EM 根据定义成员概率的权重将每个对象创建到聚类中。换句话说,聚类之间没有严格的界限。因此,新的均值是根据加权度量来评估的。EM 从组合模型参数的原始估计或“猜测”(统称为参数……阅读更多

为什么小波变换对聚类有用?

Ginni
更新于 2021年11月24日 07:10:54

1K+ 次浏览

WaveCluster 是一种多分辨率聚类算法,它首先通过将多维网格结构强加到数据空间上来总结记录。它可以使用小波变换来改变原始特征空间,在变换空间中找到密集的域。在这种方法中,每个网格单元总结映射到该单元的一组点的数。此汇总数据通常适合主内存,供多分辨率小波变换和随后的聚类分析使用。小波变换是一种信号处理方法,它将信号分解成多个频率子带。小波模型可用于……阅读更多

广告