3K+ 次查看
本文分解了 K 均值的概念,这是一种流行的划分方法,从其算法框架到其优缺点,帮助您更好地理解此复杂工具。让我们深入了解 K 均值聚类的迷人世界!K 均值算法 K 均值算法是一种基于质心的技术,通常用于数据挖掘和聚类分析。K 均值的工作原理?K 均值算法是数据挖掘划分方法中的主要参与者,它通过一系列清晰的步骤进行操作,这些步骤从基本的数据分组到详细的聚类分析。初始化 - 指定要创建的聚类数“K”。这... 阅读更多
778 次查看
介绍 数据挖掘是一种从海量数据集中提取重要结论和知识的方法,它严重依赖于数据清洗。在发挥数据挖掘算法的潜力之前,确保输入数据准确、一致和完整非常重要。由于人为错误或系统故障(例如缺失值或格式错误),原始收集的数据通常包含错误。数据挖掘是指从大量原始或非结构化数据中发现模式、关系和有价值见解的过程。数据挖掘 – 数据清洗 数据清洗是任何成功数据挖掘练习中不可或缺的一部分,因为... 阅读更多
217 次查看
介绍 过滤器组的概念,也称为分组卷积,最早由 AlexNet 在 2012 年提出。这种创造性的解决方案源于需要使用两块 Nvidia GTX 580 GPU(每块 GPU 内存为 1.5GB)来训练网络。挑战:GPU 内存有限 在测试期间,AlexNet 的创建者发现它需要略低于 3GB 的 GPU RAM 才能进行训练。不幸的是,由于内存限制,他们无法有效地使用两块 GPU 来训练模型。过滤器组背后的动机 为了解决 GPU 内存问题,作者提出了过滤器组。通过优化模型的并行化... 阅读更多
84 次查看
介绍 LSTM 代表长短期记忆,是一种先进的循环神经网络 (RNN),专门设计用于分析文本、语音和时间序列等顺序数据。与传统的 RNN 难以捕获数据中的长期依赖关系不同,LSTM 擅长理解和预测序列中的模式。传统的 RNN 在处理序列时随着时间的推移保留关键信息方面面临重大挑战。此限制阻碍了它们根据长期记忆进行准确预测的能力。LSTM 的开发是为了克服这一障碍,使网络能够在较长时间内存储和维护信息。一个... 阅读更多
92 次查看
介绍 近年来,深度神经网络 (DNN) 在强化学习算法方面取得了重大进展。然而,为了获得理想的结果,这些算法在样本效率方面存在不足。解决这一挑战的一种很有前途的方法是基于情景记忆的强化学习,它使智能体能够快速掌握最佳动作。使用情景记忆来增强智能体训练,情景记忆深度 Q 网络 (EMDQN) 是一种受生物启发的 RL 算法。研究表明,EMDQN 显着提高了样本效率,从而提高了发现有效策略的机会。它通过在 Atari 上取得最先进的性能,超越了常规 DQN 和其他基于情景记忆的 RL 算法... 阅读更多
205 次查看
密度估计是机器学习和统计学的重要组成部分。这意味着获取一组数据的概率密度函数 (PDF)。它对于许多事情都是必要的,例如查找异常值、将事物分组、创建模型以及查找问题。基于深度学习,本研究考察了测量旧密度和新密度的所有方法。传统密度估计方法 直方图 无论您是否需要快速了解您的数据收集是否完整,直方图都是最佳选择。它们获取数据范围并将其分成称为“箱”的类别以确定... 阅读更多
259 次查看
Transformer 模型在自然语言处理 (NLP) 领域取得了长足的进步,在许多任务中取得了最先进的结果。但是,Transformer 的计算复杂度和内存需求随着输入序列长度的增加而增加四倍。这使得快速处理长序列变得困难。研究人员开发了稀疏 Transformer,这是 Transformer 设计的扩展,它添加了稀疏注意力机制,以解决这些问题。本文探讨了稀疏 Transformer 的概念,重点关注步幅和固定因式分解注意力,这两种方法有助于使这些模型更有效率和有效。Transformer 回顾 在深入了解... 阅读更多
67 次查看
介绍 大脑是最复杂的器官,被用于各种科学研究。人类大脑被研究,其原型被用于人工智能 (AI) 和机器学习 (ML)。海马体是大脑的重要组成部分。它帮助我们学习、记忆和四处走动。研究人员试图创建一种人工海马算法 (AHA),它可以复制 ML 系统中海马体的功能和技能。本文讨论了 AHA,其机制、范围和局限性。人工海马算法的动机 创建 AHA 的目标是提高... 阅读更多
417 次查看
稳态遗传算法 (SSGA) 通常用于机器学习和优化任务。它是一种基于种群的迭代搜索方法,基于自然进化和遗传学背后的思想。SSGA 使用一组可能的解决方案,表示为个体或染色体。以下是 SSGA 遗传算法的工作原理 初始化 - 算法首先创建一个称为初始种群的组。每个人都是解决手头问题的可能方法。大多数情况下,种群是根据我们对问题领域的了解随机创建或启动的。评估 - 每个人... 阅读更多
226 次查看
简单遗传算法 (SGA) 是机器学习和人工智能中一种流行的优化方法。SGA 以自然选择为模型,使用交叉和变异等遗传算子来创建候选解决方案池。它们具有全局搜索能力,并且擅长解决复杂的优化问题。SGA 有助于解决组合问题,并且可以处理不可微的景观。由于其灵活且可靠的结构(通过更改参数进行调整),因此可以使用 SGA 找到最优或接近最优的解决方案。本文深入探讨了 SGA 的基础知识、其优点和缺点、它们擅长的领域以及... 阅读更多