DC.js - Crossfilter 简介



Crossfilter 是一个多维数据集。它支持与包含百万条甚至更多记录的数据集进行极快的交互。

基本概念

Crossfilter 在 crossfilter 命名空间下定义。它使用语义版本控制。考虑一下下面定义的,加载了水果集合的 crossfilter 对象:

var fruits = crossfilter ([
   { name: “Apple”, type: “fruit”, count: 20 },
   { name: “Orange”, type: "fruit”, count: 10 },
   { name: “Grapes”, type: “fruit”, count: 50 },
   { name: “Mango”,  type: “fruit”, count: 40 }
]);

如果我们需要计算组中的总记录数,可以使用以下函数:

var count = fruits.groupAll().reduceCount().value();

如果我们想按特定类型过滤:

var filtering = fruits.dimension(function(d) { return d.type; });
filtering.filter(“Grapes”)

类似地,我们可以使用 Crossfilter 进行分组。为此,可以使用以下函数:

var grouping = filtering.group().reduceCount();
var first = grouping.top(2);

因此,Crossfilter 的构建速度非常快。如果要在应用过滤器时重新计算组,它会增量计算。Crossfilter 维度非常昂贵。

Crossfilter API

让我们详细了解一下值得注意的 Crossfilter API。

  • crossfilter([records]) - 用于构造新的 crossfilter。如果指定了记录,则会同时添加指定的记录。记录可以是任何 JavaScript 对象或原语的数组。

  • crossfilter.add(records) - 将指定的记录添加到 crossfilter。

  • crossfilter.remove() - 从 crossfilter 中删除与当前过滤器匹配的所有记录。

  • crossfilter.size() - 返回 crossfilter 中的记录数。

  • crossfilter.groupAll() - 用于对所有记录进行分组并简化为单个值的函数。

  • crossfilter.dimension(value) - 用于使用指定的 value 访问器函数构造新的维度。

  • dimension.filter(value) - 用于过滤维度匹配值的记录,并返回维度。

  • dimension.filterRange(range) - 过滤维度值为大于等于 range[0] 且小于 range[1] 的记录。

  • dimension.filterAll() - 清除此维度上的任何过滤器。

  • dimension.top(k) - 用于返回一个新数组,其中包含根据此维度的自然顺序排列的前 k 条记录。

  • dimension.bottom(k) - 用于返回一个新数组,其中包含根据此维度的自然顺序排列的最后 k 条记录。

  • dimension.dispose() - 用于从 crossfilter 中删除维度。

在下一章中,我们将简要了解 D3.js。

广告