KDB+ 快速指南



KDB+ - 概述

这是一份关于kdb+(来自 kx 系统)的完整指南,主要面向独立学习的人员。kdb+ 于 2003 年推出,是 kdb 数据库的新一代产品,旨在捕获、分析、比较和存储数据。

一个 kdb+ 系统包含以下两个组件:

  • KDB+ - 数据库(k 数据库加)

  • Q - 用于操作 kdb+ 的编程语言

kdb+q 都是用k 编程语言编写的(与q相同,但可读性较差)。

背景

Kdb+/q 最初起源于一个鲜为人知的学术语言,但多年来,它逐渐提高了用户友好性。

  • APL (1964, A Programming Language)

  • A+ (1988, Arthur Whitney 修改的 APL)

  • K (1993, A+ 的简洁版本,由 A. Whitney 开发)

  • Kdb (1998, 内存列式数据库)

  • Kdb+/q (2003, q 语言 – k 的更易读版本)

为什么要使用 KDB+ 以及在哪里使用

为什么?- 如果你需要一个用于实时数据分析的单一解决方案,那么你应该考虑 kdb+。Kdb+ 将数据库存储为普通的本地文件,因此它对硬件和存储架构没有特殊需求。值得指出的是,数据库只是一组文件,因此你的管理工作不会很困难。

在哪里使用 KDB+?- 很容易统计哪些投资银行没有使用 kdb+,因为大多数银行目前正在使用或计划从传统的数据库切换到 kdb+。随着数据量的逐日增加,我们需要一个能够处理海量数据的系统。KDB+ 满足了这一需求。KDB+ 不仅存储大量数据,而且还可以实时分析数据。

入门

有了这些背景知识,让我们开始学习如何为 KDB+ 设置环境。我们将从如何下载和安装 KDB+ 开始。

下载 & 安装 KDB+

您可以从http://kx.com/software-download.php获取 KDB+ 的免费 32 位版本,它具有 64 位版本的所有功能。

同意许可协议,选择操作系统(适用于所有主要操作系统)。对于 Windows 操作系统,最新版本为 3.2。下载最新版本。解压缩后,您将获得名为“windows”的文件夹,在 windows 文件夹内,您将获得另一个名为“q”的文件夹。将整个q文件夹复制到您的 c:/ 驱动器上。

打开“运行”终端,键入存储q文件夹的位置;它将类似于“c:/q/w32/q.exe”。按下 Enter 键后,您将获得一个新的控制台,如下所示:

KDB+ Console

在第一行,您可以看到版本号为 3.2,发布日期为 2015.03.05。

目录布局

试用/免费版本通常安装在以下目录中:

对于 Linux/Mac -

~/q       / main q directory (under the user’s home)
~/q/l32   / location of linux 32-bit executable
~/q/m32   / Location of mac 32-bit executable

对于 Windows -

c:/q          / Main q directory
c:/q/w32/     / Location of windows 32-bit executable

示例文件 -

下载 kdb+ 后,Windows 平台上的目录结构将如下所示:

KDB+ Example Files

在上面的目录结构中,trade.qsp.q 是我们可以用作参考点的示例文件。

KDB+ - 架构

Kdb+ 是一个高性能、高容量的数据库,从一开始就设计用于处理海量数据。它是完全 64 位的,并内置了多核处理和多线程功能。相同的架构用于实时和历史数据。数据库包含其自身强大的查询语言q,因此可以直接在数据上运行分析。

kdb+tick 是一种架构,允许捕获、处理和查询实时和历史数据。

Kdb+/ tick 架构

下图提供了典型 Kdb+/tick 架构的概括性概述,随后是对各个组件和数据贯穿流程的简要说明。

KDB+ Architecture
  • 数据馈送是指通常由数据馈送提供商(如路透社、彭博社或直接来自交易所)提供的时间序列数据。

  • 为了获取相关数据,来自数据馈送的数据将由馈送处理器进行解析。

  • 馈送处理器解析数据后,数据将发送到行情数据处理程序

  • 为了从任何故障中恢复数据,行情数据处理程序首先将新数据更新/存储到日志文件中,然后更新其自身表格。

  • 更新内部表格和日志文件后,实时循环数据将持续发送/发布到实时数据库以及所有请求数据的链接订阅者。

  • 在某个营业日结束时,日志文件将被删除,创建一个新的日志文件,并将实时数据库保存到历史数据库中。所有数据保存到历史数据库后,实时数据库将清除其表格。

Kdb+ Tick 架构的组件

数据馈送

数据馈送可以是任何市场或其他时间序列数据。将数据馈送视为馈送处理器的原始输入。馈送可以来自交易所(实时数据流)、来自新闻/数据提供商(如汤森路透、彭博社)或任何其他外部机构。

馈送处理器

馈送处理器将数据流转换为适合写入 kdb+ 的格式。它连接到数据馈送,并从特定于馈送的格式中检索和转换数据,转换为 Kdb+ 消息,并将其发布到行情数据处理程序进程。通常,馈送处理器用于执行以下操作:

  • 根据一组规则捕获数据。
  • 将数据从一种格式转换为另一种格式(/丰富)。
  • 捕获最新的值。

行情数据处理程序

行情数据处理程序是 KDB+ 架构中最重要的组件。它是行情数据处理程序,实时数据库或直接订阅者(客户端)连接到它以访问财务数据。它以发布和订阅机制运行。一旦你获得订阅(许可证),就会定义来自发布者(行情数据处理程序)的滴答(例行)发布。它执行以下操作:

  • 接收来自馈送处理器的的数据。

  • 行情数据处理程序收到数据后,会立即将其副本存储为日志文件,并在行情数据处理程序获取任何更新时更新它,以便在发生任何故障时,我们不会丢失任何数据。

  • 客户端(实时订阅者)可以直接订阅行情数据处理程序。

  • 在每个营业日结束时,即实时数据库收到最后一条消息后,它会将今天的所有数据存储到历史数据库中,并将其推送到所有订阅了今天数据的订阅者。然后它重置所有表格。一旦数据存储在历史数据库或其他直接链接到实时数据库 (rtdb) 的订阅者中,日志文件也会被删除。

  • 因此,行情数据处理程序、实时数据库和历史数据库全天候运行。

由于行情数据处理程序是 Kdb+ 应用程序,因此可以使用q像任何其他 Kdb+ 数据库一样查询其表格。所有行情数据处理程序客户端都应该只能作为订阅者访问数据库。

实时数据库

实时数据库 (rdb) 存储今天的数据。它直接连接到行情数据处理程序。通常,它会在市场交易时间(一天)存储在内存中,并在一天结束时写入历史数据库 (hdb)。由于数据 (rdb 数据) 存储在内存中,因此处理速度非常快。

由于 kdb+ 建议 RAM 大小为每天预期数据大小的四倍或更多,因此在 rdb 上运行的查询非常快,并提供卓越的性能。由于实时数据库仅包含今天的数据,因此不需要日期列(参数)。

例如,我们可以执行以下 rdb 查询:

select from trade where sym = `ibm

OR

select from trade where sym = `ibm, price > 100

历史数据库

如果我们需要计算公司的估值,我们需要其历史数据可用。历史数据库 (hdb) 保存过去交易的数据。每天的新记录都会在一天结束时添加到 hdb 中。hdb 中的大型表格要么被展开存储(每列存储在其自己的文件中),要么按时间数据进行分区存储。此外,一些非常大的数据库可以使用par.txt (文件)进一步分区。

这些存储策略(展开、分区等)在搜索或访问大型表格中的数据时非常有效。

历史数据库还可以用于内部和外部报告目的,即用于分析。例如,假设我们想从 trade(或任何)表格名称中获取 IBM 在特定日期的公司交易,我们需要编写如下查询:

thisday: 2014.10.12

select from trade where date = thisday, sym =`ibm

注意 - 一旦我们对q语言有所了解,我们将编写所有此类查询。

Q 编程语言

Kdb+ 带有其内置的编程语言,称为q。它包含标准 SQL 的超集,该超集扩展用于时间序列分析,并且相对于标准版本提供了许多优势。任何熟悉 SQL 的人都可以在几天内学习q,并能够快速编写自己的临时查询。

启动“q”环境

要开始使用 kdb+,您需要启动q会话。有三种方法可以启动q会话:

  • 在您的运行终端上简单地键入“c:/q/w32/q.exe”。

  • 启动 MS-DOS 命令终端并键入q

  • q.exe文件复制到“C:\Windows\System32”,并在运行终端上,只需键入“q”。

这里我们假设您正在 Windows 平台上工作。

数据类型

下表提供了支持的数据类型的列表:

名称 示例 字符 类型 大小
布尔值 1b b 1 1
字节 0xff x 4 1
短整型 23h h 5 2
整型 23i i 6 4
长整型 23j j 7 8
实数 2.3e e 8 4
浮点数 2.3f f 9 8
字符 “a” c 10 1
可变字符 `ab s 11 *
月份 2003.03m m 13 4
日期 2015.03.17T18:01:40.134 z 15 8
分钟 08:31 u 17 4
08:31:53 v 18 4
时间 18:03:18.521 t 19 4
枚举 `u$`b, where u:`a`b * 20 4

原子和列表形成

原子是单个实体,例如,单个数字、字符或符号。在上表(不同数据类型)中,所有支持的数据类型都是原子。列表是原子或其他类型的序列,包括列表。

将任何类型的原子传递给一元(即单参数函数)类型函数将返回一个负值,即–n,而将这些原子的简单列表传递给类型函数将返回一个正值n

示例 1 – 原子和列表的形成

/ Note that the comments begin with a slash “ / ” and cause the parser
/ to ignore everything up to the end of the line.

x: `mohan              / `mohan is a symbol, assigned to a variable x
type x                 / let’s check the type of x
-11h                   / -ve sign, because it’s single element.

y: (`abc;`bca;`cab)    / list of three symbols, y is the variable name.

type y
11h                    / +ve sign, as it contain list of atoms (symbol).

y1: (`abc`bca`cab)     / another way of writing y, please note NO semicolon

y2: (`$”symbols may have interior blanks”)   / string to symbol conversion
y[0]                   / return `abc
y 0                    / same as y[0], also returns `abc
y 0 2                  / returns `abc`cab, same as does y[0 2]

z: (`abc; 10 20 30; (`a`b); 9.9 8.8 7.7)      / List of different types,
z 2 0                  / returns (`a`b; `abc),
z[2;0]                 / return `a. first element of z[2]

x: “Hello World!”      / list of character, a string
x 4 0                  / returns “oH” i.e. 4th and 0th(first)
element

Q 语言 - 类型转换

通常需要将某些数据的数据类型从一种类型更改为另一种类型。标准的转换函数是“$”二元运算符

有三种方法用于从一种类型转换为另一种类型(字符串除外)−

  • 通过其符号名称指定所需的数据类型
  • 通过其字符指定所需的数据类型
  • 通过其短值指定所需的数据类型。

将整数转换为浮点数

在以下将整数转换为浮点数的示例中,所有三种不同的转换方式都是等效的−

q)a:9 18 27

q)$[`float;a]     / Specify desired data type by its symbol name, 1st way
9 18 27f

q)$["f";a]        / Specify desired data type by its character, 2nd way
9 18 27f

q)$[9h;a]         / Specify desired data type by its short value, 3rd way
9 18 27f

检查所有三个操作是否等效,

q)($[`float;a]~$["f";a]) and ($[`float;a] ~ $[9h;a])
1b

将字符串转换为符号

将字符串转换为符号反之亦然的工作方式略有不同。让我们用一个例子来检查一下−

q)b: ("Hello";"World";"HelloWorld")    / define a list of strings

q)b
"Hello"
"World"
"HelloWorld"

q)c: `$b                               / this is how to cast strings to symbols

q)c                                    / Now c is a list of symbols
`Hello`World`HelloWorld

尝试使用关键字`symbol 或 11h 将字符串转换为符号将导致类型错误−

q)b
"Hello"
"World"
"HelloWorld"

q)`symbol$b
'type

q)11h$b
'type

将字符串转换为非符号

将字符串转换为除符号以外的数据类型,方法如下−

q)b:900               / b contain single atomic integer

q)c:string b          / convert this integer atom to string “900”

q)c
"900"

q)`int $ c            / converting string to integer will return the
                      / ASCII equivalent of the character “9”, “0” and
                      / “0” to produce the list of integer 57, 48 and
                      / 48.
57 48 48i

q)6h $ c              / Same as above
57 48 48i

q)"i" $ c             / Same a above
57 48 48i

q)"I" $ c
900i

因此,要将整个字符串(字符列表)转换为数据类型为x的单个原子,我们需要将表示数据类型x的大写字母指定为$运算符的第一个参数。如果以任何其他方式指定数据类型x,则会导致转换应用于字符串的每个字符。

Q 语言 - 时间数据

q语言有许多不同的方法来表示和操作时间数据,例如时间和日期。

日期

kdb+中的日期在内部存储为自我们的参考日期2000年1月1日以来的天数整数。此日期之后的日期在内部存储为正数,在此日期之前的日期则引用为负数。

默认情况下,日期以“YYYY.MM.DD”格式写入

q)x:2015.01.22      / This is how we write 22nd Jan 2015

q)`int$x            / Number of days since 2000.01.01
5500i

q)`year$x           / Extracting year from the date
2015i

q)x.year            / Another way of extracting year
2015i

q)`mm$x             / Extracting month from the date
1i

q)x.mm              / Another way of extracting month
1i

q)`dd$x             / Extracting day from the date
22i

q)x.dd              / Another way of extracting day
22i

可以直接对日期执行算术和逻辑运算

q)x+1        / Add one day
2015.01.23

q)x-7        / Subtract 7 days
2015.01.15

2000年1月1日是星期六。因此,历史上或未来任何一个星期六除以7,余数都为0,星期日为1,星期一为2。

             Day               mod 7
           Saturday              0
           Sunday                1
           Monday                2
           Tuesday               3
           Wednesday             4
           Thursday              5
           Friday                6

时间

时间在内部存储为自午夜开始的毫秒数整数。时间以HH:MM:SS.MSS格式写入

q)tt1: 03:30:00.000     / tt1 store the time 03:30 AM

q)tt1
03:30:00.000

q)`int$tt1              / Number of milliseconds in 3.5 hours
12600000i

q)`hh$tt1               / Extract the hour component from time
3i

q)tt1.hh
3i

q)`mm$tt1               / Extract the minute component from time
30i

q)tt1.mm
30i

q)`ss$tt1               / Extract the second component from time
0i

q)tt1.ss
0i

与日期一样,可以直接对时间执行算术运算。

日期时间

日期时间是日期和时间的组合,以ISO标准格式中的“T”分隔。日期时间值存储自2000年1月1日午夜以来的小数天数。

q)dt:2012.12.20T04:54:59:000      / 04:54.59 AM on 20thDec2012

q)type dt
-15h

q)dt
2012.12.20T04:54:59.000
9
q)`float$dt
4737.205

可以通过转换为浮点数来获取底层的小数天数。

Q 语言 - 列表

列表是q语言的基本构建块,因此彻底了解列表非常重要。列表只是原子(原子元素)和其他列表(一个或多个原子的组)的有序集合。

列表类型

通用列表将其项目括在匹配的括号内,并用分号分隔。例如−

(9;8;7)   or   ("a"; "b"; "c")   or   (-10.0; 3.1415e; `abcd; "r")

如果列表包含相同类型的原子,则称为统一列表。否则,称为通用列表(混合类型)。

计数

我们可以通过列表的计数获取列表中的项目数。

q)l1:(-10.0;3.1415e;`abcd;"r")    / Assigning variable name to general list

q)count l1                        / Calculating number of items in the list l1
4

简单列表的示例

q)h:(1h;2h;255h)                    / Simple Integer List

q)h
1 2 255h

q)f:(123.4567;9876.543;98.7)        / Simple Floating Point List

q)f
123.4567 9876.543 98.7

q)b:(0b;1b;0b;1b;1b)                / Simple Binary Lists

q)b
01011b

q)symbols:(`Life;`Is;`Beautiful)    / Simple Symbols List

q)symbols
`Life`Is`Beautiful

q)chars:("h";"e";"l";"l";"o";" ";"w";"o";"r";"l";"d") 
                                    / Simple char lists and Strings.
q)chars
"hello world"

**注意 - 字符的简单列表称为字符串。**

列表包含原子或列表。要创建单项列表,我们使用−

q)singleton:enlist 42

q)singleton
,42

要区分原子和等效的单例,检查其类型的符号。

q)signum type 42
-1i

q)signum type enlist 42
1i

Q 语言 - 索引

列表按其项目的顺序从左到右排序。项目从列表开头到其位置的偏移量称为其索引。因此,第一个项目的索引为0,第二个项目(如果有)的索引为1,依此类推。计数为n的列表的索引域为0n–1

索引表示法

给定一个列表L,索引为i的项目通过L[i]访问。通过其索引检索项目称为项目索引。例如,

q)L:(99;98.7e;`b;`abc;"z")

q)L[0]
99

q)L[1]
98.7e

q)L[4]
"z

索引赋值

列表中的项目也可以通过项目索引进行赋值。因此,

q)L1:9 8 7

q)L1[2]:66      / Indexed assignment into a simple list
                / enforces strict type matching.
                
q)L1
9 8 66

来自变量的列表

q)l1:(9;8;40;200)

q)l2:(1 4 3; `abc`xyz)

q)l:(l1;l2)               / combining the two list l1 and l2

q)l
9 8 40 200
(1 4 3;`abc`xyz)

连接列表

两个列表上最常见的操作是将它们连接在一起以形成一个更大的列表。更准确地说,连接运算符 (,) 将其右操作数追加到左操作数的末尾并返回结果。它接受任一参数中的原子。

q)1,2 3 4
1 2 3 4

q)1 2 3, 4.4 5.6     / If the arguments are not of uniform type,
                     / the result is a general list.
1
2
3
4.4
5.6

嵌套

数据复杂性是通过使用列表作为列表的项目来构建的。

深度

列表的嵌套级别数称为其深度。原子的深度为0,简单列表的深度为1。

q)l1:(9;8;(99;88))

q)count l1
3

这是一个深度为3且有两个项目的列表−

q)l5
9
(90;180;900 1800 2700 3600)

q)count l5
2

q)count l5[1]
3

深度索引

可以直接索引到嵌套列表的项目中。

重复项目索引

通过单个索引检索项目始终从嵌套列表中检索最上面的项目。

q)L:(1;(100;200;(300;400;500;600)))

q)L[0]
1

q)L[1]
100
200
300 400 500 600

由于结果L[1]本身是一个列表,因此我们可以使用单个索引检索其元素。

q)L[1][2]
300 400 500 600

我们可以再次重复单个索引以从最内部的嵌套列表中检索项目。

q)L[1][2][0]
300

您可以这样理解,

从 L 中获取索引为 1 的项目,并从中检索索引为 2 的项目,并从中检索索引为 0 的项目。

深度索引表示法

对于重复索引到嵌套列表的组成部分,有一种替代表示法。最后一次检索也可以写成,

q)L[1;2;0]
300

通过索引的赋值也适用于深度。

q)L[1;2;1]:900

q)L
1
(100;200;300 900 500 600)

省略索引

省略通用列表的索引

q)L:((1 2 3; 4 5 6 7); (`a`b`c;`d`e`f`g;`0`1`2);("good";"morning"))

q)L
(1 2 3;4 5 6 7)
(`a`b`c;`d`e`f`g;`0`1`2)
("good";"morning")

q)L[;1;]
4 5 6 7
`d`e`f`g
"morning"

q)L[;;2]
3 6
`c`f`2
"or"

将 L[;1;] 解释为,

检索顶层每个列表中第二个位置的所有项目。

将 L[;;2] 解释为,

检索第二级每个列表中第三个位置的项目。

Q 语言 - 字典

字典是列表的扩展,为创建表提供了基础。在数学术语中,字典创建了

“域 → 范围”

或者一般(简短)创建

“键 → 值”

元素之间的关系。

字典是有序的键值对集合,大致相当于哈希表。字典是通过位置对应关系由域列表和范围列表之间的显式 I/O 关联定义的映射。字典的创建使用“xkey”原语(!)

                  ListOfDomain ! ListOfRange

最基本的字典将简单列表映射到简单列表。

输入 (I) 输出 (O)
`姓名 `约翰
`年龄 36
`性别 “M”
体重 60.3
q)d:`Name`Age`Sex`Weight!(`John;36;"M";60.3)   / Create a dictionary d

q)d

Name   | `John
Age    | 36
Sex    | "M"
Weight | 60.3

q)count d             / To get the number of rows in a dictionary.
4

q)key d               / The function key returns the domain
`Name`Age`Sex`Weight

q)value d             / The function value returns the range.

`John
36

"M"
60.3

q)cols d             / The function cols also returns the domain.
`Name`Age`Sex`Weight

查找

查找与输入值对应的字典输出值称为查找输入。

q)d[`Name]       / Accessing the value of domain `Name
`John

q)d[`Name`Sex]   / extended item-wise to a simple list of keys
`John
"M"

使用动词 @ 进行查找

q)d1:`one`two`three!9 18 27

q)d1[`two]
18

q)d1@`two
18

字典操作

修改和更新

与列表一样,可以通过索引赋值修改字典的项目。

d:`Name`Age`Sex`Weight! (`John;36;"M";60.3)
                                  / A dictionary d
                                  
q)d[`Age]:35                      / Assigning new value to key Age

q)d 
                              / New value assigned to key Age in d
Name   | `John
Age    | 35
Sex    | "M"
Weight | 60.3

可以通过索引赋值扩展字典。

q)d[`Height]:"182 Ft"

q)d

Name   | `John
Age    | 35
Sex    | "M"
Weight | 60.3
Height | "182 Ft"

使用查找 (?) 进行反向查找

查找 (?) 运算符用于通过将一系列元素映射到其域元素来执行反向查找。

q)d2:`x`y`z!99 88 77

q)d2?77
`z

如果列表的元素不唯一,则查找返回从域列表中映射到它的第一个项目。

删除条目

要从字典中删除条目,可以使用删除 ( _ ) 函数。(_) 的左操作数是字典,右操作数是键值。

q)d2:`x`y`z!99 88 77

q)d2 _`z

x| 99
y| 88

如果第一个操作数是变量,则需要在 _ 的左侧添加空格。

q)`x`y _ d2           / Deleting multiple entries

z| 77

列字典

列字典是创建表的基石。请考虑以下示例−

q)scores: `name`id!(`John`Jenny`Jonathan;9 18 27)
                              / Dictionary scores
                              
q)scores[`name]               / The values for the name column are
`John`Jenny`Jonathan

q)scores.name                 / Retrieving the values for a column in a
                              / column dictionary using dot notation.
`John`Jenny`Jonathan

q)scores[`name][1]            / Values in row 1 of the name column
`Jenny

q)scores[`id][2]              / Values in row 2 of the id column is
27

翻转字典

翻转列字典的最终效果只是反转索引的顺序。这在逻辑上等同于转置行和列。

在列字典上翻转

字典的转置是通过应用一元翻转运算符获得的。看看下面的例子−

q)scores

name  | John Jenny Jonathan
id    | 9   18   27

q)flip scores

  name     id
---------------
  John     9
  Jenny    18
 Jonathan  27

翻转列字典的翻转

如果转置字典两次,则会获得原始字典,

q)scores ~ flip flip scores
1b

Q 语言 - 表格

表是kdb+的核心。表是作为字典实现的命名列的集合。q表是面向列的。

创建表

使用以下语法创建表−

q)trade:([]time:();sym:();price:();size:())

q)trade
time sym price size
-------------------

在上面的例子中,我们没有指定每一列的类型。这将由第一次插入表中设置。

另一种方法,我们可以在初始化时指定列类型−

q)trade:([]time:`time$();sym:`$();price:`float$();size:`int$())

或者我们也可以定义非空表−

q)trade:([]sym:(`a`b);price:(1 2))

q)trade

 sym   price
-------------
  a      1
  b      2

如果方括号内没有列,如上例所示,则表为无键

要创建键表,我们将键的列插入方括号中。

q)trade:([sym:`$()]time:`time$();price:`float$();size:`int$())

q)trade

 sym   | time price size
-----  | ---------------

也可以通过将值设置为各种类型的空列表来定义列类型−

q)trade:([]time:0#0Nt;sym:0#`;price:0#0n;size:0#0N)

获取表信息

让我们创建一个交易表−

trade: ([]sym:`ibm`msft`apple`samsung;mcap:2000 4000 9000 6000;ex:`nasdaq`nasdaq`DAX`Dow)

q)cols trade                         / column names of a table
`sym`mcap`ex

q)trade.sym                          / Retrieves the value of column sym
`ibm`msft`apple`samsung

q)show meta trade                    / Get the meta data of a table trade.

  c   | t f a
----- | -----
 Sym  | s
 Mcap | j
 ex   | s

主键和键表

键表

键表是一个字典,它将唯一键表中的每一行映射到值表中的对应行。让我们举个例子−

val:flip `name`id!(`John`Jenny`Jonathan;9 18 27)
                          / a flip dictionary create table val
id:flip (enlist `eid)!enlist 99 198 297
                          / flip dictionary, having single column eid

现在创建一个包含 eid 作为键的简单键表,

q)valid: id ! val

q)valid                 / table name valid, having key as eid

  eid |  name      id
---   | ---------------
  99  |  John      9
  198 |  Jenny     18
  297 |  Jonathan  27

外键

外键定义了从定义它的表的行到具有相应主键的表的行的映射。

外键提供引用完整性。换句话说,尝试插入主键中不存在的外键值将失败。

请考虑以下示例。在第一个示例中,我们将在外键初始化时显式定义外键。在第二个示例中,我们将使用外键追溯,它不假设两个表之间存在任何先前的关系。

示例 1 - 在初始化时定义外键

q)sector:([sym:`SAMSUNG`HSBC`JPMC`APPLE]ex:`N`CME`DAQ`N;MC:1000 2000 3000 4000)

q)tab:([]sym:`sector$`HSBC`APPLE`APPLE`APPLE`HSBC`JPMC;price:6?9f)

q)show meta tab

  c    | t f a
------ | ----------
 sym   | s sector
 price | f

q)show select from tab where sym.ex=`N

  sym     price
----------------
 APPLE   4.65382
 APPLE   4.643817
 APPLE   3.659978

示例 2 - 表之间没有预定义的关系

sector: ([symb:`IBM`MSFT`HSBC]ex:`N`CME`N;MC:1000 2000 3000)
tab:([]sym:`IBM`MSFT`MSFT`HSBC`HSBC;price:5?9f)

要使用外键追溯,我们必须创建一个表来作为扇区的键。

q)show update mc:(sector([]symb:sym))[`MC] from tab

  sym     price      mc
--------------------------
  IBM   7.065297    1000
  MSFT  4.812387    2000
  MSFT  6.400545    2000
  HSBC  3.704373    3000
  HSBC  4.438651    3000

预定义外键的一般表示法 -

从 c 中选择 a.b 其中 a 是外键 (sym),b 是

主键表中的字段 (ind),c 是

外键表 (trade)

操作表

让我们创建一个交易表并检查不同表表达式的结果 -

q)trade:([]sym:5?`ibm`msft`hsbc`samsung;price:5?(303.00*3+1);size:5?(900*5);time:5?(.z.T-365))

q)trade

  sym        price   size   time
-----------------------------------------
 msft      743.8592  3162  02:32:17.036
 msft      641.7307  2917  01:44:56.936
 hsbc      838.2311  1492  00:25:23.210
 samsung   278.3498  1983  00:29:38.945
 ibm       838.6471  4006  07:24:26.842

现在让我们看一下用于使用q语言操作表的语句。

选择

使用Select语句的语法如下 -

select [columns] [by columns] from table [where clause]

现在让我们举一个例子来演示如何使用Select语句 -

q)/ select expression example

q)select sym,price,size by time from trade where size > 2000

    time      |  sym    price     size
------------- | -----------------------
 01:44:56.936 |  msft   641.7307  2917
 02:32:17.036 |  msft   743.8592  3162
 07:24:26.842 |  ibm    838.6471  4006

插入

使用Insert语句的语法如下 -

`tablename insert (values)
Insert[`tablename; values]

现在让我们举一个例子来演示如何使用Insert语句 -

q)/ Insert expression example

q)`trade insert (`hsbc`apple;302.0 730.40;3020 3012;09:30:17.00409:15:00.000)
5 6

q)trade

   sym    price     size    time
------------------------------------------
  msft    743.8592  3162   02:32:17.036
  msft    641.7307  2917   01:44:56.936
  hsbc    838.2311  1492   00:25:23.210
 samsung  278.3498  1983   00:29:38.945
  ibm     838.6471  4006   07:24:26.842
  hsbc    302       3020   09:30:17.004
  apple   730.4     3012   09:15:00.000

q)/Insert another value

q)insert[`trade;(`samsung;302.0; 3333;10:30:00.000]
']

q)insert[`trade;(`samsung;302.0; 3333;10:30:00.000)]
,7

q)trade

   sym     price   size     time
----------------------------------------
  msft   743.8592  3162  02:32:17.036
  msft   641.7307  2917  01:44:56.936
  hsbc   838.2311  1492  00:25:23.210
 samsung 278.3498  1983  00:29:38.945
  ibm    838.6471  4006  07:24:26.842
  hsbc   302       3020  09:30:17.004
  apple  730.4     3012  09:15:00.000
 samsung 302       3333  10:30:00.000

删除

使用Delete语句的语法如下 -

delete columns from table
delete from table where clause

现在让我们举一个例子来演示如何使用Delete语句 -

q)/Delete expression example

q)delete price from trade

   sym   size       time
-------------------------------
  msft   3162   02:32:17.036
  msft   2917   01:44:56.936
  hsbc   1492   00:25:23.210
 samsung 1983   00:29:38.945
  ibm    4006   07:24:26.842
  hsbc   3020   09:30:17.004
  apple  3012   09:15:00.000
 samsung 3333   10:30:00.000

q)delete from trade where price > 3000

   sym     price     size       time
-------------------------------------------
  msft    743.8592   3162    02:32:17.036
  msft    641.7307   2917    01:44:56.936
  hsbc    838.2311   1492    00:25:23.210
 samsung  278.3498   1983    00:29:38.945
  ibm     838.6471   4006    07:24:26.842
  hsbc    302        3020    09:30:17.004
  apple   730.4      3012    09:15:00.000
 samsung  302        3333    10:30:00.000

q)delete from trade where price > 500

  sym     price     size     time
-----------------------------------------
 samsung  278.3498  1983  00:29:38.945
  hsbc    302       3020  09:30:17.004
 samsung  302       3333  10:30:00.000

更新

使用Update语句的语法如下 -

update column: newValue from table where ….

使用以下语法使用cast函数更新列的格式/数据类型 -

update column:newValue from `table where …

现在让我们举一个例子来演示如何使用Update语句 -

q)/Update expression example

q)update size:9000 from trade where price > 600

  sym     price      size     time
------------------------------------------
  msft    743.8592   9000   02:32:17.036
  msft    641.7307   9000   01:44:56.936
  hsbc    838.2311   9000   00:25:23.210
 samsung  278.3498   1983   00:29:38.945
  ibm     838.6471   9000   07:24:26.842
  hsbc    302        3020   09:30:17.004
  apple   730.4      9000   09:15:00.000
 samsung  302        3333   10:30:00.000

q)/Update the datatype of a column using the cast function

q)meta trade

   c  |  t f a
----- | --------
  sym |  s
 price|  f
 size |  j
 time |  t

q)update size:`float$size from trade

  sym     price     size      time
------------------------------------------
  msft    743.8592  3162    02:32:17.036
  msft    641.7307  2917    01:44:56.936 
  hsbc    838.2311  1492    00:25:23.210
 samsung  278.3498  1983    00:29:38.945
  ibm     838.6471  4006    07:24:26.842
  hsbc    302       3020    09:30:17.004
  apple   730.4     3012    09:15:00.000
 samsung  302       3333    10:30:00.000

q)/ Above statement will not update the size column datatype permanently

q)meta trade

   c   |  t f a
------ | --------
  sym  |   s
 price |   f
 size  |   j
 time  |   t
 
q)/to make changes in the trade table permanently, we have do

q)update size:`float$size from `trade
`trade

q)meta trade

   c   |  t f a
------ | --------
  sym  |   s
 price |   f
 size  |   f
 time  |   t

Q 语言 - 动词 & 副词

Kdb+ 具有名词、动词和副词。所有数据对象和函数都是名词动词通过减少表达式中方括号和圆括号的数量来增强可读性。副词修改二元(2 个参数)函数和动词以生成新的相关动词。由副词生成的函数称为派生函数派生动词

每个

副词each,用 ( ` ) 表示,修改二元函数和动词以应用于列表的项目而不是列表本身。请查看以下示例 -

q)1, (2 3 5)       / Join
1 2 3 5

q)1, '( 2 3 4)     / Join each
1 2
1 3
1 4

对于一元函数,有一种Each形式使用关键字“each”。例如,

q)reverse ( 1 2 3; "abc")           /Reverse
a b c
1 2 3

q)each [reverse] (1 2 3; "abc")     /Reverse-Each
3 2 1
c b a

q)'[reverse] ( 1 2 3; "abc")
3 2 1
c b a

Each-Left 和 Each-Right

对于二元函数,Each 有两个变体,称为Each-Left(\:)和Each-Right(/:)。以下示例说明了如何使用它们。

q)x: 9 18 27 36

q)y:10 20 30 40

q)x,y            / join
9 18 27 36 10 20 30 40

q)x,'y           / each

9   10
18  20
27  30
36  40

q)x: 9 18 27 36

q)y:10 20 30 40

q)x,y            / join
9 18 27 36 10 20 30 40

q)x,'y           / each, will return a list of pairs

9   10
18  20
27  30
36  40

q)x, \:y         / each left, returns a list of each element
                 / from x with all of y
					  
9   10  20  30  40
18  10  20  30  40
27  10  20  30  40
36  10  20  30  40

q)x,/:y          / each right, returns a list of all the x with
                 / each element of y
					  
9  18  27  36  10
9  18  27  36  20
9  18  27  36  30
9  18  27  36  40

q)1 _x           / drop the first element
18 27 36

q)-2_y           / drop the last two element
10 20

q)               / Combine each left and each right to be a
                 / cross-product (cartesian product)
                 
q)x,/:\:y

9   10  9   20  9   30  9   40
18  10  18  20  18  30  18  40
27  10  27  20  27  30  27  40
36  10  36  20  36  30  36  40

Q 语言 - 连接

q语言中,我们根据提供的输入表和我们所需的连接表类型,有不同类型的连接。连接组合来自两个表的数据。除了外键追溯之外,还有四种连接表的方法 -

  • 简单连接
  • Asof 连接
  • 左连接
  • 联合连接

在本节中,我们将详细讨论这些连接中的每一个。

简单连接

简单连接是最基本的连接类型,用逗号“,”执行。在这种情况下,两个表必须类型一致,即两个表具有相同数量的列,顺序相同,并且键相同。

table1,:table2 / table1 is assigned the value of table2

我们可以对长度相同的表使用逗号连接来进行横向连接。其中一个表可以在这里加键,

Table1, `Table2

Asof 连接 (aj)

它是功能最强大的连接,用于获取一个表中字段的值,作为另一个表中时间点的值。通常用于获取每次交易时的现行买价和卖价。

通用格式

aj[joinColumns;tbl1;tbl2]

例如,

aj[`sym`time;trade;quote]

示例

q)tab1:([]a:(1 2 3 4);b:(2 3 4 5);d:(6 7 8 9))

q)tab2:([]a:(2 3 4);b:(3 4 5); c:( 4 5 6))

q)show aj[`a`b;tab1;tab2]

 a  b  d  c
-------------
 1  2  6
 2  3  7  4
 3  4  8  5
 4  5  9  6

左连接(lj)

它是 aj 的一个特例,其中第二个参数是键控表,第一个参数包含右参数键的列。

通用格式

table1 lj Keyed-table

示例

q)/Left join- syntax table1 lj table2 or lj[table1;table2]

q)tab1:([]a:(1 2 3 4);b:(2 3 4 5);d:(6 7 8 9))

q)tab2:([a:(2 3 4);b:(3 4 5)]; c:( 4 5 6))

q)show lj[tab1;tab2]

 a  b  d  c
-------------
 1  2  6
 2  3  7  4
 3  4  8  5
 4  5  9  6

联合连接 (uj)

它允许创建具有不同模式的两个表的联合。它基本上是对简单连接 ( , ) 的扩展。

q)tab1:([]a:(1 2 3 4);b:(2 3 4 5);d:(6 7 8 9))

q)tab2:([]a:(2 3 4);b:(3 4 5); c:( 4 5 6))

q)show uj[tab1;tab2]

 a  b  d  c
------------
 1  2  6
 2  3  7
 3  4  8
 4  5  9
 2  3     4
 3  4     5
 4  5     6

如果您在键控表上使用 uj,则主键必须匹配。

Q 语言 - 函数

函数类型

函数可以以多种方式分类。在这里,我们根据它们接受的参数数量和类型以及结果类型对它们进行了分类。函数可以是,

  • 原子 - 参数为原子并产生原子结果

  • 聚合 - 列表中的原子

  • 统一(列表来自列表) - 扩展了原子的概念,因为它们适用于列表。参数列表的计数等于结果列表的计数。

  • 其他 - 如果函数不属于上述类别。

数学中的二元运算在 q 中称为二元函数;例如,“+”。类似地,一元运算称为一元函数;例如,“abs”或“floor”。

常用函数

q编程中,有很多函数经常使用。在本节中,我们将了解一些常用函数的使用 -

abs

q) abs -9.9 / Absolute value, Negates -ve number & leaves non -ve number
9.9

all

q) all 4 5 0 -4 / Logical AND (numeric min), returns the minimum value
0b

Max (&), Min (|), and Not (!)

q) /And, Or, and Logical Negation

q) 1b & 1b        / And (Max)
1b

q) 1b|0b              / Or (Min)
1b

q) not 1b             /Logical Negate (Not)
0b 

asc

q)asc 1 3 5 7 -2 0 4    / Order list ascending, sorted list
                        / in ascending order i
s returned
`s#-2 0 1 3 4 5 7

q)/attr - gives the attributes of data, which describe how it's sorted.
`s denotes fully sorted, `u denotes unique and `p and `g are used to 
refer to lists with repetition, with `p standing for parted and `g for grouped

avg

q)avg 3 4 5 6 7           / Return average of a list of numeric values
5f

q)/Create on trade table

q)trade:([]time:3?(.z.Z-200);sym:3?(`ibm`msft`apple);price:3?99.0;size:3?100)

by

q)/ by - Groups rows in a table at given sym

q)select sum price by sym from trade    / find total price for each sym

  sym  |   price
------ | --------
 apple | 140.2165
  ibm  | 16.11385

cols

q)cols trade / Lists columns of a table
`time`sym`price`size

count

q)count (til 9) / Count list, count the elements in a list and
                / return a single int value 9

port

q)\p 9999 / assign port number

q)/csv - This command allows queries in a browser to be exported to
   excel by prefixing the query, such as https://127.0.0.1:9999/.csv?select from trade where sym =`ibm

cut

q)/ cut - Allows a table or list to be cut at a certain point

q)(1 3 5) cut "abcdefghijkl"
                            / the argument is split at 1st, 3rd and 5th letter.
"bc"
"de"
"fghijkl"

q)5 cut "abcdefghijkl"      / cut the right arg. Into 5 letters part
                            / until its end.
"abcde"
"fghij"
"kl"

删除

q)/delete - Delete rows/columns from a table

q)delete price from trade

          time              sym   size
---------------------------------------
  2009.06.18T06:04:42.919  apple   36
  2009.11.14T12:42:34.653   ibm    12
  2009.12.27T17:02:11.518  apple   97

Distinct

q)/distinct - Returns the distinct element of a list

q)distinct 1 2 3 2 3 4 5 2 1 3            / generate unique set of number
1 2 3 4 5

enlist

q)/enlist - Creates one-item list.

q)enlist 37
,37

q)type 37           / -ve type value
-7h

q)type enlist 37    / +ve type value
7h 

Fill (^)

q)/fill - used with nulls. There are three functions for processing null values.

The dyadic function named fill replaces null values in the right argument with the atomic left argument.

q)100 ^ 3 4 0N 0N -5
3 4 100 100 -5

q)`Hello^`jack`herry``john`
`jack`herry`Hello`john`Hello

Fills

q)/fills - fills in nulls with the previous not null value.

q)fills 1 0N 2 0N 0N 2 3 0N -5 0N
1 1 2 2 2 2 3 3 -5 -5

First

q)/first - returns the first atom of a list

q)first 1 3 34 5 3
1

Flip

q)/flip - Monadic primitive that applies to lists and associations. It interchange the top two levels of its argument.

q)trade

       time                   sym      price   size
------------------------------------------------------
  2009.06.18T06:04:42.919    apple   72.05742   36
  2009.11.14T12:42:34.653    ibm     16.11385   12
  2009.12.27T17:02:11.518    apple   68.15909   97

q)flip trade

time | 2009.06.18T06:04:42.919 2009.11.14T12:42:34.653
2009.12.27T17:02:11.518

sym   |  apple         ibm         apple
price | 72.05742     16.11385    68.15909
size  | 36 12 97

iasc

q)/iasc - Index ascending, return the indices of the ascended sorted list relative to the input list.

q)iasc 5 4 0 3 4 9

2 3 1 4 0 5

Idesc

q)/idesc - Index desceding, return the descended sorted list relative to the input list

q)idesc 0 1 3 4

3 2 1 0

in

q)/in - In a list, dyadic function used to query list (on the right-handside) about their contents.

q)(2 4) in 1 2 3

10b

insert

q)/insert - Insert statement, upload new data into a table.

q)insert[`trade;((.z.Z);`samsung;48.35;99)],3

q)trade

      time                  sym       price     size
------------------------------------------------------
 2009.06.18T06:04:42.919   apple    72.05742     36
 2009.11.14T12:42:34.653    ibm     16.11385     12
 2009.12.27T17:02:11.518   apple    68.15909     97
 2015.04.06T10:03:36.738   samsung  48.35        99

key

q)/key - three different functions i.e. generate +ve integer number, gives content of a directory or key of a table/dictionary.

q)key 9

0 1 2 3 4 5 6 7 8

q)key `:c:
`$RECYCLE.BIN`Config.Msi`Documents and Settings`Drivers`Geojit`hiberfil.sys`I..

lower

q)/lower - Convert to lower case and floor

q)lower ("JoHn";`HERRY`SYM)
"john"
`herry`sym

Max and Min (i.e. | and &)

q)/Max and Min / a|b and a&b

q)9|7
9

q)9&5
5

null

q)/null - return 1b if the atom is a null else 0b from the argument list

q)null 1 3 3 0N
0001b

Peach

q)/peach - Parallel each, allows process across slaves

q)foo peach list1       / function foo applied across the slaves named in list1

'list1

q)foo:{x+27}

q)list1:(0 1 2 3 4)

q)foo peach list1       / function foo applied across the slaves named in list1
27 28 29 30 31

Prev

q)/prev - returns the previous element i.e. pushes list forwards

q)prev 0 1 3 4 5 7

0N 0 1 3 4 5

Random( ?)

q)/random - syntax - n?list, gives random sequences of ints and floats

q)9?5
0 0 4 0 3 2 2 0 1

q)3?9.9
0.2426823 1.674133 3.901671

Raze

q)/raze - Flattn a list of lists, removes a layer of indexing from a list of lists. for instance:

q)raze (( 12 3 4; 30 0);("hello";7 8); 1 3 4)

12 3 4
30 0
"hello"
7 8
1
3
4

read0

q)/read0 - Read in a text file

q)read0 `:c:/q/README.txt    / gives the contents of *.txt file

read1

q)/read1 - Read in a q data file

q)read1 `:c:/q/t1

0xff016200630b000500000073796d0074696d6500707269636…

reverse

q)/reverse - Reverse a list

q)reverse 2 30 29 1 3 4

4 3 1 29 30 2

q)reverse "HelloWorld"

"dlroWolleH"

set

q)/set - set value of a variable

q)`x set 9
`x

q)x
9

q)`:c:/q/test12 set trade

`:c:/q/test12

q)get `:c:/q/test12

       time                   sym      price     size
---------------------------------------------------------
  2009.06.18T06:04:42.919    apple    72.05742    36
  2009.11.14T12:42:34.653     ibm     16.11385    12
  2009.12.27T17:02:11.518    apple    68.15909    97
  2015.04.06T10:03:36.738    samsung  48.35       99
  2015.04.06T10:03:47.540    samsung  48.35       99
  2015.04.06T10:04:44.844    samsung  48.35       99

ssr

q)/ssr - String search and replace, syntax - ssr["string";searchstring;replaced-with]

q)ssr["HelloWorld";"o";"O"]

"HellOWOrld"

string

q)/string - converts to string, converts all types to a string format.

q)string (1 2 3; `abc;"XYZ";0b)

(,"1";,"2";,"3")
"abc"

(,"X";,"Y";,"Z")
,"0"

SV

q)/sv - Scalar from vector, performs different tasks dependent on its arguments.

It evaluates the base representation of numbers, which allows us to calculate the number of seconds in a month or convert a length from feet and inches to centimeters.

q)24 60 60 sv 11 30 49

41449   / number of seconds elapsed in a day at 11:30:49

system

q)/system - allows a system command to be sent,

q)system "dir *.py"

" Volume in drive C is New Volume"
" Volume Serial Number is 8CD2-05B2"
""

" Directory of C:\\Users\\myaccount-raj"
""

"09/14/2014    06:32 PM     22 hello1.py"
"                1 File(s)    22 bytes"

tables

q)/tables - list all tables

q)tables `

`s#`tab1`tab2`trade

Til

q)/til - Enumerate

q)til 5

0 1 2 3 4

trim

q)/trim - Eliminate string spaces

q)trim " John "

"John"

vs

q)/vs - Vector from scaler , produces a vector quantity from a scaler quantity

q)"|" vs "20150204|msft|20.45"

"20150204"
"msft"
"20.45"

xasc

q)/xasc - Order table ascending, allows a table (right-hand argument) to be sorted such that (left-hand argument) is in ascending order

q)`price xasc trade

          time                 sym      price      size
----------------------------------------------------------
   2009.11.14T12:42:34.653     ibm     16.11385     12
   2015.04.06T10:03:36.738   samsung   48.35        99
   2015.04.06T10:03:47.540   samsung   48.35        99
   2015.04.06T10:04:44.844   samsung   48.35        99
   2009.12.27T17:02:11.518    apple    68.15909     97
   2009.06.18T06:04:42.919    apple    72.05742     36

xcol

q)/xcol - Renames columns of a table

q)`timeNew`symNew xcol trade

        timeNew                 symNew    price      size
-------------------------------------------------------------
   2009.06.18T06:04:42.919      apple    72.05742     36
   2009.11.14T12:42:34.653       ibm     16.11385     12
   2009.12.27T17:02:11.518      apple    68.15909     97
   2015.04.06T10:03:36.738     samsung   48.35        99
   2015.04.06T10:03:47.540     samsung   48.35        99
   2015.04.06T10:04:44.844     samsung   48.35        99

xcols

q)/xcols - Reorders the columns of a table,

q)`size`price xcols trade

  size    price           time                   sym
-----------------------------------------------------------
   36   72.05742   2009.06.18T06:04:42.919      apple 
   12   16.11385   2009.11.14T12:42:34.653       ibm
   97   68.15909   2009.12.27T17:02:11.518      apple
   99   48.35      2015.04.06T10:03:36.738     samsung 
   99   48.35      2015.04.06T10:03:47.540     samsung
   99   48.35      2015.04.06T10:04:44.844     samsung

xdesc

q)/xdesc - Order table descending, allows tables to be sorted such that the left-hand argument is in descending order.

q)`price xdesc trade

        time                   sym       price      size
-----------------------------------------------------------
   2009.06.18T06:04:42.919    apple    72.05742      36
   2009.12.27T17:02:11.518    apple    68.15909      97
   2015.04.06T10:03:36.738   samsung   48.35         99
   2015.04.06T10:03:47.540   samsung   48.35         99
   2015.04.06T10:04:44.844   samsung   48.35         99
   2009.11.14T12:42:34.653     ibm     16.11385      12

xgroup

q)/xgroup - Creates nested table

q)`x xgroup ([]x:9 18 9 18 27 9 9;y:10 20 10 20 30 40)
'length

q)`x xgroup ([]x:9 18 9 18 27 9 9;y:10 20 10 20 30 40 10)

  x  |    y
---- | -----------
  9  | 10 10 40 10
  18 | 20 20
  27 | ,30

xkey

q)/xkey - Set key on table

q)`sym xkey trade

    sym   |      time                    price     size
--------- | -----------------------------------------------
   apple  | 2009.06.18T06:04:42.919    72.05742     36
    ibm   | 2009.11.14T12:42:34.653    16.11385     12
   apple  | 2009.12.27T17:02:11.518    68.15909     97
  samsung | 2015.04.06T10:03:36.738    48.35        99
  samsung | 2015.04.06T10:03:47.540    48.35        99
  samsung | 2015.04.06T10:04:44.844    48.35        99

系统命令

系统命令控制q环境。它们具有以下形式 -

\cmd [p]       where p may be optional

下面讨论了一些常用的系统命令 -

\a [命名空间] – 列出给定命名空间中的表

q)/Tables in default namespace

q)\a
,`trade

q)\a .o         / table in .o namespace.
,`TI

\b – 查看依赖项

q)/ views/dependencies

q)a:: x+y      / global assingment

q)b:: x+1

q)\b
`s#`a`b

\B – 等待的视图/依赖项

q)/ Pending views/dependencies

q)a::x+1     / a depends on x

q)\B         / the dependency is pending
' / the dependency is pending

q)\B
`s#`a`b

q)\b
`s#`a`b

q)b
29

q)a
29

q)\B
`symbol$()

\cd – 更改目录

q)/change directory, \cd [name]

q)\cd
"C:\\Users\\myaccount-raj"

q)\cd ../new-account

q)\cd
"C:\\Users\\new-account"

\d – 设置当前命名空间

q)/ sets current namespace \d [namespace]

q)\d             /default namespace
'

q)\d .o          /change to .o

q.o)\d
`.o

q.o)\d .         / return to default

q)key `          /lists namespaces other than .z
`q`Q`h`j`o

q)\d .john       /change to non-existent namespace

q.john)\d
`.john

q.john)\d .

q)\d
`.

\l – 从 db 加载文件或目录

q)/ Load file or directory, \l

q)\l test2.q / loading test2.q which is stored in current path.

   ric      |     date      ex      openP    closeP    MCap
----------- | -------------------------------------------------
 JPMORGAN   | 2008.05.23  SENSEX  18.30185  17.16319  17876
   HSBC     | 2002.05.21  NIFTY   2.696749  16.58846  26559
 JPMORGAN   | 2006.09.07  NIFTY   14.15219  20.05624  14557
   HSBC     | 2010.10.11  SENSEX  7.394497  25.45859  29366
 JPMORGAN   | 2007.10.02  SENSEX  1.558085  25.61478  20390
 
   ric     |    date       ex      openP     closeP    MCap
---------- | ------------------------------------------------
  INFOSYS  | 2003.10.30    DOW    21.2342   7.565652   2375
 RELIANCE  | 2004.08.12    DOW    12.34132  17.68381   4201
   SBIN    | 2008.02.14    DOW    1.830857  9.006485   15465
  INFOSYS  | 2009.06.11  HENSENG  19.47664  12.05208   11143
   SBIN    | 2010.07.05    DOW    18.55637  10.54082   15873

\p – 端口号

q)/ assign port number, \p

q)\p
5001i

q)\p 8888

q)\p
8888i

\\ - 从 q 控制台退出

\\ - exit
Exit form q.

Q 语言 - 内置函数

q编程语言有一组丰富且强大的内置函数。内置函数可以是以下类型 -

  • 字符串函数 - 以字符串作为输入并返回字符串。

  • 聚合函数 - 以列表作为输入并返回原子。

  • 统一函数 - 获取列表并返回相同计数的列表。

  • 数学函数 - 获取数字参数并返回数字参数。

  • 杂项函数 - 除上述提到的所有其他函数。

字符串函数

Like - 模式匹配

q)/like is a dyadic, performs pattern matching, return 1b on success else 0b

q)"John" like "J??n"
1b

q)"John My Name" like "J*"
1b

ltrim - 删除前导空格

q)/ ltrim - monadic ltrim takes string argument, removes leading blanks

q)ltrim " Rick "
"Rick "

rtrim - 删除尾随空格

q)/rtrim - takes string argument, returns the result of removing trailing blanks

q)rtrim " Rick "
" Rick"

ss - 字符串搜索

q)/ss - string search, perform pattern matching, same as "like" but return the indices of the matches of the pattern in source.

q)"Life is beautiful" ss "i"
1 5 13

trim - 删除前导和尾随空格

q)/trim - takes string argument, returns the result of removing leading & trailing blanks

q)trim " John "
"John"

数学函数

acos - cos 的反函数

q)/acos - inverse of cos, for input between -1 and 1, return float between 0 and pi

q)acos 1
0f

q)acos -1
3.141593

q)acos 0
1.570796

cor - 给出相关性

q)/cor - the dyadic takes two numeric lists of same count, returns a correlation between the items of the two arguments

q)27 18 18 9 0 cor 27 36 45 54 63
-0.9707253

cross - 笛卡尔积

q)/cross - takes atoms or lists as arguments and returns their Cartesian product

q)9 18 cross `x`y`z

9 `x
9 `y
9 `z

18 `x
18 `y
18 `z

var - 方差

q)/var - monadic, takes a scaler or numeric list and returns a float equal to the mathematical variance of the items

q)var 45
0f

q)var 9 18 27 36
101.25

wavg

q)/wavg - dyadic, takes two numeric lists of the same count and returns the average of the second argument weighted by the first argument.

q)1 2 3 4 wavg 200 300 400 500
400f

聚合函数

all - & 运算

q)/all - monadic, takes a scaler or list of numeric type and returns the result of & applied across the items.

q)all 0b
0b

q)all 9 18 27 36
1b

q)all 10 20 30
1b

Any - | 运算

q)/any - monadic, takes scaler or list of numeric type and the return the result of | applied across the items

q)any 20 30 40 50
1b

q)any 20012.02.12 2013.03.11
'20012.02.12

prd - 算术乘积

q)/prd - monadic, takes scaler, list, dictionary or table of numeric type and returns the arithmetic product.

q)prd `x`y`z! 10 20 30
6000

q)prd ((1 2; 3 4);(10 20; 30 40))

10 40
90 160

Sum - 算术和

q)/sum - monadic, takes a scaler, list,dictionary or table of numeric type and returns the arithmetic sum.

q)sum 2 3 4 5 6
20

q)sum (1 2; 4 5)
5 7

统一函数

Deltas - 与其前一项的差值。

q)/deltas -takes a scalar, list, dictionary or table and returns the difference of each item from its predecessor.

q)deltas 2 3 5 7 9
2 1 2 2 2

q)deltas `x`y`z!9 18 27

x | 9
y | 9
z | 9

fills - 填充空值

q)/fills - takes scalar, list, dictionary or table of numeric type and returns a c copy of the source in which non-null items are propagated forward to fill nulls

q)fills 1 0N 2 0N 4
1 1 2 2 4

q)fills `a`b`c`d! 10 0N 30 0N

a | 10
b | 10
c | 30
d | 30

maxs - 累积最大值

q)/maxs - takes scalar, list, dictionary or table and returns the cumulative maximum of the source items.

q)maxs 1 2 4 3 9 13 2
1 2 4 4 9 13 13

q)maxs `a`b`c`d!9 18 0 36

a | 9
b | 18
c | 18
d | 36

杂项函数

Count - 返回元素的数量

q)/count - returns the number of entities in its argument.

q)count 10 30 30
3

q)count (til 9)
9

q)count ([]a:9 18 27;b:1.1 2.2 3.3)
3

Distinct - 返回不同的实体

q)/distinct - monadic, returns the distinct entities in its argument

q)distinct 1 2 3 4 2 3 4 5 6 9
1 2 3 4 5 6 9

Except - 第二个参数中不存在的元素。

q)/except - takes a simple list (target) as its first argument and returns a list containing the items of target that are not in its second argument

q)1 2 3 4 3 1 except 1
2 3 4 3

fill - 用第一个参数填充空值

q)/fill (^) - takes an atom as its first argument and a list(target) as its second argument and return a list obtained by substituting the first argument for every occurrence of null in target

q)42^ 9 18 0N 27 0N 36
9 18 42 27 42 36

q)";"^"Life is Beautiful"
"Life;is;Beautiful"

Q 语言 - 查询

q中的查询更短、更简单,并扩展了sql的功能。主要的查询表达式是“select表达式”,它最简单的形式是提取子表,但它也可以创建新列。

Select 表达式的一般形式如下 -

Select columns by columns from table where conditions

**注意 - by & where短语是可选的,只有“from表达式”是必须的。

通常,语法将是 -

select [a] [by b] from t [where c]
update [a] [by b] from t [where c]

q表达式的语法看起来与SQL非常相似,但q表达式简单而强大。上面q表达式的等效sql表达式如下 -

select [b] [a] from t [where c] [group by b order by b]
update t set [a] [where c]

所有子句都在列上执行,因此q可以利用顺序。由于Sql查询不是基于顺序的,因此它们无法利用该优势。

与相应的sql相比,q关系查询的大小通常要小得多。有序和函数式查询可以完成sql中难以完成的事情。

在历史数据库中,where子句的顺序非常重要,因为它会影响查询的性能。partition变量(日期/月/日)始终放在第一位,然后是排序和索引的列(通常是sym列)。

例如,

select from table where date in d, sym in s

select from table where sym in s, date in d

基本查询

让我们在记事本中编写一个查询脚本(如下所示),保存(为*.q),然后加载它。

sym:asc`AIG`CITI`CSCO`IBM`MSFT;
ex:"NASDAQ"
dst:`$":c:/q/test/data/";           /database destination

@[dst;`sym;:;sym];
n:1000000;

trade:([]sym:n?`sym;time:10:30:00.0+til
n;price:n?3.3e;size:n?9;ex:n?ex);

quote:([]sym:n?`sym;time:10:30:00.0+til
n;bid:n?3.3e;ask:n?3.3e;bsize:n?9;asize:n?9;ex:n?ex);

{@[;`sym;`p#]`sym xasc x}each`trade`quote;
d:2014.08.07 2014.08.08 2014.08.09 2014.08.10 2014.08.11; /Date vector can also be changed by the user

dt:{[d;t].[dst;(`$string d;t;`);:;value t]};
d dt/:\:`trade`quote;

Note: Once you run this query, two folders .i.e. "test" and "data" will be created under "c:/q/", and date partition data can be seen inside data folder.

带约束条件的查询

* 表示 HDB 查询

选择所有 IBM 交易

select from trade where sym in `IBM

*选择某一天的所有 IBM 交易

thisday: 2014.08.11
select from trade where date=thisday,sym=`IBM

选择价格 > 100 的所有 IBM 交易

select from trade where sym=`IBM, price > 100.0

选择价格小于或等于 100 的所有 IBM 交易

select from trade where sym=`IBM,not price > 100.0

*选择某一天上午 10.30 到 10.40 之间的所有 IBM 交易

thisday: 2014.08.11
select from trade where
date = thisday, sym = `IBM, time > 10:30:00.000,time < 10:40:00.000

按价格升序选择所有 IBM 交易

`price xasc select from trade where sym =`IBM

*在特定时间范围内按价格降序选择所有 IBM 交易

`price xdesc select from trade where date within 2014.08.07 2014.08.11, sym =`IBM

复合排序 - 按 sym 升序排序,然后按价格降序排序结果

`sym xasc `price xdesc select from trade where date = 2014.08.07,size = 5

选择所有 IBM 或 MSFT 交易

select from trade where sym in `IBM`MSFT

*计算特定时间范围内所有符号的计数(升序)

`numsym xasc select numsym: count i by sym from trade where date within 2014.08.07 2014.08.11

*计算特定时间范围内所有符号的计数(降序)

`numsym xdesc select numsym: count i by sym from trade where date within 2014.08.07 2014.08.11

* IBM 股票在特定时间范围内的最高价格是多少,以及何时首次出现?

select time,ask from quote where date within 2014.08.07 2014.08.11,
sym =`IBM, ask = exec first ask from select max ask from quote where
sym =`IBM

选择每个 sym 在每小时区间内的最后价格

select last price by hour:time.hh, sym from trade

带聚合的查询

* 计算所有符号的 vwap(成交量加权平均价格)

select vwap:size wavg price by sym from trade

* 统计某个月的记录数(以百万计)

(select trade:1e-6*count i by date.dd from trade where date.month=2014.08m) + select quote:1e-6*count i by date.dd from quote where date.month=2014.08m

* HLOC - 某个月 CSCO 的每日最高价、最低价、开盘价和收盘价

select high:max price,low:min price,open:first price,close:last price by date.dd from trade where date.month=2014.08m,sym =`CSCO

* 某个月 CSCO 的每日 Vwap

select vwap:size wavg price by date.dd from trade where date.month = 2014.08m ,sym = `CSCO

* 计算 AIG 价格的每小时均值、方差和标准差

select mean:avg price, variance:var price, stdDev:dev price by date, hour:time.hh from trade where sym = `AIG

选择每小时区间内的价格范围

select range:max[price] – min price by date,sym,hour:time.hh from trade

* 某个月 CSCO 的每日价差(平均买价-卖价)

select spread:avg bid-ask by date.dd from quote where date.month = 2014.08m, sym = `CSCO

* 某个月所有符号的每日交易价值

select dtv:sum size by date,sym from trade where date.month = 2014.08m

提取 CSCO 的 5 分钟 vwap

select size wavg price by 5 xbar time.minute from trade where sym = `CSCO

* 提取 CSCO 的 10 分钟 K 线

select high:max price,low:min price,close:last price by date, 10 xbar time.minute from trade where sym = `CSCO

* 查找 CSCO 价格在某一天超过上次价格 100 个基点 (100e-4) 的时间

select time from trade where date = 2014.08.11,sym = `CSCO,price > 1.01*last price

* 数据库中最后一天 MSFT 的 1 分钟间隔的全天价格和成交量

select last price,last size by time.minute from trade where date = last date, sym = `MSFT

Q 语言 - 进程间通信

KDB+ 允许一个进程通过进程间通信与另一个进程通信。Kdb+ 进程可以连接到同一台计算机、同一网络甚至远程的任何其他 kdb+。我们只需要指定端口,然后客户端就可以与该端口通信。任何q进程都可以与任何其他q进程通信,只要它在网络上可访问并且正在侦听连接。

  • 服务器进程侦听连接并处理任何请求

  • 客户端进程启动连接并将要执行的命令发送到服务器

客户端和服务器可以在同一台机器上或不同的机器上。一个进程可以同时是客户端和服务器。

通信可以是,

  • 同步(等待返回结果)

  • 异步(无需等待且不返回结果)

初始化服务器

通过指定要侦听的端口来初始化q服务器,

q –p 5001 / command line
\p 5001   / session command

通信句柄

通信句柄是一个以“:”开头的符号,其形式为 -

`:[server]:port-number

示例

`::5001              / server and client on same machine
`:jack:5001          / server on machine jack
`:192.168.0.156      / server on specific IP address
`:www.myfx.com:5001  / server at www.myfx.com

要开始连接,我们使用函数“hopen”,它返回一个整数连接句柄。此句柄用于所有后续的客户端请求。例如 -

q)h:hopen `::5001

q)h"til 5"
0 1 2 3 4

q)hclose h

同步和异步消息

一旦我们有了句柄,我们就可以同步或异步地发送消息。

同步消息 - 发送消息后,它会等待并返回结果。其格式如下 -

handle “message”

异步消息 - 发送消息后,立即开始处理下一条语句,无需等待并返回结果。其格式如下 -

neg[handle] “message”

需要响应的消息,例如函数调用或 select 语句,通常使用同步形式;而不需要返回输出的消息,例如将更新插入表中,将是异步的。

Q 语言 - 消息处理器

当一个q进程通过进程间通信连接到另一个q进程时,它由消息处理器处理。这些消息处理器具有默认行为。例如,在同步消息处理的情况下,处理器返回查询的值。在这种情况下,同步处理器是.z.pg,我们可以根据需要覆盖它。

Kdb+ 进程有几个预定义的消息处理器。消息处理器对于配置数据库非常重要。一些用法包括 -

  • 日志记录 - 记录传入的消息(在发生任何致命错误时很有用),

  • 安全性 - 根据用户名/IP 地址允许/拒绝访问数据库、某些函数调用等。它有助于仅向授权的订阅者提供访问权限。

  • 处理来自其他进程的连接/断开连接

预定义的消息处理器

下面讨论一些预定义的消息处理器。

.z.pg

它是一个同步消息处理器(进程获取)。每当在 kdb+ 实例上接收到同步消息时,此函数都会自动调用。

参数是要执行的字符串/函数调用,即传递的消息。默认情况下,其定义如下 -

.z.pg: {value x}                / simply execute the message 
                                received but we can overwrite it to
give any customized result.
.z.pg : {handle::.z.w;value x}  / this will store the remote handle
.z.pg : {show .z.w;value x}     / this will show the remote handle

.z.ps

它是一个异步消息处理器(进程设置)。它是异步消息的等效处理器。参数是要执行的字符串/函数调用。默认情况下,其定义为,

.z.pg : {value x}        / Can be overriden for a customized action.

以下是异步消息的自定义消息处理器,其中我们使用了受保护的执行,

.z.pg: {@[value; x; errhandler x]}

这里errhandler是发生任何意外错误时使用的函数。

.z.po[]

它是一个连接打开处理器(进程打开)。当远程进程打开连接时执行。要查看连接到进程时打开的句柄,我们可以将 .z.po 定义为,

.z.po : {Show “Connection opened by” , string h: .z.h}

.z.pc[]

它是一个关闭连接处理器(进程关闭)。当连接关闭时调用。我们可以创建自己的关闭处理器,它可以将全局连接句柄重置为 0,并发出命令设置计时器每 3 秒(3000 毫秒)触发(执行)。

.z.pc : { h::0; value “\\t 3000”} 

计时器处理器 (.z.ts) 尝试重新打开连接。成功后,它会关闭计时器。

.z.ts : { h:: hopen `::5001; if [h>0; value “\\t 0”] }

.z.pi[]

PI 代表进程输入。它用于任何类型的输入。它可以用于处理控制台输入或远程客户端输入。使用 .z.pi[],可以验证控制台输入或替换默认显示。此外,它可以用于任何类型的日志记录操作。

q).z.pi
'.z.pi

q).z.pi:{">", .Q.s value x}

q)5+4
>9

q)30+42
>72

q)30*2
>60

q)\x .z.pi
>q)

q)5+4
9

.z.pw

它是一个验证连接处理器(用户身份验证)。当连接到 kdb+ 会话时,它会添加一个额外的回调。它在 –u/-U 检查之后和 .z.po(端口打开)之前调用。

.z.pw : {[user_id;passwd] 1b}

输入是userid(符号)和password(文本)。

Q 语言 - 属性

列表、字典或表的列可以应用属性。属性对列表施加某些属性。某些属性在修改时可能会消失。

属性类型

排序(`s#)

`s# 表示列表按升序排序。如果列表由 asc(或 xasc)显式排序,则列表将自动设置排序属性。

q)L1: asc 40 30 20 50 9 4

q)L1
`s#4 9 20 30 40 50

已知排序的列表也可以显式设置属性。Q 将检查列表是否已排序,如果不是,则会抛出s-fail错误。

q)L2:30 40 24 30 2

q)`s#L2
's-fail

在未排序的追加操作后,排序属性将丢失。

分区(`p#)

`p# 表示列表已分区,并且相同的项连续存储。

范围是int时间类型,具有底层 int 值,例如年、月、日等。您还可以对提供的符号进行分区,前提是它已枚举。

应用分区属性会创建一个索引字典,该字典将每个唯一的输出值映射到其第一次出现的的位置。当列表被分区时,查找速度快得多,因为线性搜索被哈希表查找取代。

q)L:`p# 99 88 77 1 2 3

q)L
`p#99 88 77 1 2 3

q)L,:3

q)L
99 88 77 1 2 3 3

注意 -

  • 分区属性不会在列表上的操作下保留,即使操作保留了分区。

  • 当实体数量达到十亿并且大部分分区都很大时,即存在大量重复时,应考虑分区属性。

分组(`g#)

`g# 表示列表已分组。构建并维护一个内部字典,该字典将每个唯一项映射到其每个索引,需要大量的存储空间。对于长度为L、包含u个唯一项(大小为s)的列表,这将为(L × 4) + (u × s)字节。

当无法对列表的结构做出其他假设时,可以将分组应用于列表。

该属性可以应用于任何类型的列表。它在追加时维护,但在删除时丢失。

q)L: `g# 1 2 3 4 5 4 2 3 1 4 5 6

q)L
`g#1 2 3 4 5 4 2 3 1 4 5 6

q)L,:9

q)L
`g#1 2 3 4 5 4 2 3 1 4 5 6 9

q)L _:2

q)L
1 2 4 5 4 2 3 1 4 5 6 9

唯一(`#u)

将唯一属性(`u#)应用于列表表示列表的项是不同的。知道列表的元素是唯一的,可以大大加快distinct的速度,并允许q尽早执行一些比较。

当列表被标记为唯一时,会为列表中的每个项创建一个内部哈希映射。列表上的操作必须保持唯一性,否则属性将丢失。

q)LU:`u#`MSFT`SAMSUNG`APPLE

q)LU
`u#`MSFT`SAMSUNG`APPLE

q)LU,:`IBM                        /Uniqueness preserved

q)LU
`u#`MSFT`SAMSUNG`APPLE`IBM

q)LU,:`SAMSUNG                    / Attribute lost

q)LU
`MSFT`SAMSUNG`APPLE`IBM`SAMSUNG

注意 -

  • `u# 在保留唯一性的连接上保留。在删除和非唯一连接上丢失。

  • 对`u#列表的搜索通过哈希函数完成。

删除属性

可以通过应用`#删除属性。

应用属性

应用属性的三种格式为 -

  • L: `s# 14 2 3 3 9/ 在列表创建期间指定

  • @[ `.; `L ; `s#]/ 函数应用,即应用于变量列表 L

    / 在默认命名空间(即`。)中应用

    / 排序`s#属性

  • 更新`s#time 来自`tab

    / 更新表(tab)以应用

    / 属性。

让我们用示例应用以上三种不同的格式。

q)/ set the attribute during creation

q)L:`s# 3 4 9 10 23 84 90

q)/apply the attribute to existing list data

q)L1: 9 18 27 36 42 54

q)@[`.;`L1;`s#]
`.

q)L1                 / check
`s#9 18 27 36 42 54

q)@[`.;`L1;`#]       / clear attribute
`.

q)L1
9 18 27 36 42 54

q)/update a table to apply the attribute

q)t: ([] sym:`ibm`msft`samsung; mcap:9000 18000 27000)

q)t:([]time:09:00 09:30 10:00t;sym:`ibm`msft`samsung; mcap:9000 18000 27000)

q)t

    time         sym    mcap
---------------------------------
  09:00:00.000   ibm    9000
  09:30:00.000   msft   18000
  10:00:00.000  samsung 27000

q)update `s#time from `t
`t

q)meta t               / check it was applied

    c  | t f a
------ | -----
  time | t s
  sym  | s
  mcap | j
  
Above we can see that the attribute column in meta table results shows the time column is sorted (`s#).

Q 语言 - 函数式查询

函数式(动态)查询允许将列名指定为符号,用于典型的 q-sql select/exec/delete 列。当我们想要动态指定列名时,它非常方便。

函数式形式为 -

?[t;c;b;a]    / for select
![t;c;b;a]    / for update

其中

  • t是表;

  • a是聚合的字典;

  • b是by短语;以及

  • c是约束列表。

注意 -

  • abc中的所有q实体都必须按名称引用,即包含实体名称的符号。

  • select 和 update 的语法形式由q解释器解析成其等效的函数式形式,因此两种形式之间没有性能差异。

函数式 select

以下代码块显示了如何使用函数式 select -

q)t:([]n:`ibm`msft`samsung`apple;p:40 38 45 54)

q)t

    n       p
-------------------
   ibm     40
   msft    38
 samsung   45
  apple    54

q)select m:max p,s:sum p by name:n from t where p>36, n in `ibm`msft`apple

  name |   m   s
------ | ---------
 apple |  54  54
 ibm   |  40  40
 msft  |  38  38

示例 1

让我们从最简单的案例开始,“select from t”的函数式版本将如下所示 -

q)?[t;();0b;()]     / select from t

    n      p
-----------------
   ibm    40
   msft   38
 samsung  45
  apple   54

示例 2

在以下示例中,我们使用 enlist 函数创建单例以确保适当的实体是列表。

q)wherecon: enlist (>;`p;40)

q)?[`t;wherecon;0b;()] / select from t where p > 40

    n      p
----------------
 samsung  45
  apple   54

示例 3

q)groupby: enlist[`p] ! enlist `p

q)selcols: enlist [`n]!enlist `n

q)?[ `t;(); groupby;selcols]        / select n by p from t

   p  |    n
----- | -------
  38  |  msft
  40  |  ibm
  45  | samsung
  54  | apple

函数式 Exec

exec 的函数式形式是select的简化形式。

q)?[t;();();`n]                / exec n from t (functional form of exec)
`ibm`msft`samsung`apple

q)?[t;();`n;`p]                / exec p by n from t (functional exec)

apple   | 54
ibm     | 40
msft    | 38
samsung | 45

函数式 Update

update 的函数式形式与select完全类似。在以下示例中,使用 enlist 是为了创建单例,以确保输入实体是列表。

q)c:enlist (>;`p;0)

q)b: (enlist `n)!enlist `n

q)a: (enlist `p) ! enlist (max;`p)

q)![t;c;b;a]

   n      p
-------------
  ibm    40
  msft   38
 samsung 45
 apple   54

函数式 delete

函数式 delete 是函数式 update 的简化形式。其语法如下 -

![t;c;0b;a]        / t is a table, c is a list of where constraints, a is a
                   / list of column names

现在让我们举一个例子来展示函数式 delete 如何工作 -

q)![t; enlist (=;`p; 40); 0b;`symbol$()]
                                          / delete from t where p = 40
   n       p
---------------
  msft    38
 samsung  45
  apple   54

Q 语言 - 表格运算

在本章中,我们将学习如何操作字典,然后操作表。让我们从字典开始 -

q)d:`u`v`x`y`z! 9 18 27 36 45                  / Creating a dictionary d

q)/ key of this dictionary (d) is given by

q)key d
`u`v`x`y`z

q)/and the value by

q)value d
9 18 27 36 45

q)/a specific value

q)d`x
27

q)d[`x]
27

q)/values can be manipulated by using the arithmetic operator +-*% as,

q)45 + d[`x`y]
72 81

如果需要修改字典值,则修改公式可以为 -

q)@[`d;`z;*;9]
`d

q)d

u | 9
v | 18
x | 27
y | 36

q)/Example, table tab

q)tab:([]sym:`;time:0#0nt;price:0n;size:0N)

q)n:10;sym:`IBM`SAMSUNG`APPLE`MSFT

q)insert[`tab;(n?sym;("t"$.z.Z);n?100.0;n?100)]
0 1 2 3 4 5 6 7 8 9

q)`time xasc `tab
`tab

q)/ to get particular column from table tab

q)tab[`size]
12 10 1 90 73 90 43 90 84 63

q)tab[`size]+9
21 19 10 99 82 99 52 99 93 72

z | 405

q)/Example table tab

q)tab:([]sym:`;time:0#0nt;price:0n;size:0N)

q)n:10;sym:`IBM`SAMSUNG`APPLE`MSFT

q)insert[`tab;(n?sym;("t"$.z.Z);n?100.0;n?100)]
0 1 2 3 4 5 6 7 8 9

q)`time xasc `tab
`tab

q)/ to get particular column from table tab

q)tab[`size]
12 10 1 90 73 90 43 90 84 63

q)tab[`size]+9
21 19 10 99 82 99 52 99 93 72

q)/Example table tab

q)tab:([]sym:`;time:0#0nt;price:0n;size:0N)

q)n:10;sym:`IBM`SAMSUNG`APPLE`MSFT

q)insert[`tab;(n?sym;("t"$.z.Z);n?100.0;n?100)]
0 1 2 3 4 5 6 7 8 9

q)`time xasc `tab
`tab

q)/ to get particular column from table tab

q)tab[`size]
12 10 1 90 73 90 43 90 84 63

q)tab[`size]+9
21 19 10 99 82 99 52 99 93 72

q)/We can also use the @ amend too

q)@[tab;`price;-;2]

   sym      time           price     size
--------------------------------------------
  APPLE   11:16:39.779   6.388858     12
  MSFT    11:16:39.779   17.59907     10
  IBM     11:16:39.779   35.5638      1
 SAMSUNG  11:16:39.779   59.37452     90
  APPLE   11:16:39.779   50.94808     73
 SAMSUNG  11:16:39.779   67.16099     90
  APPLE   11:16:39.779   20.96615     43
 SAMSUNG  11:16:39.779   67.19531     90
  IBM     11:16:39.779   45.07883     84
  IBM     11:16:39.779   61.46716     63

q)/if the table is keyed

q)tab1:`sym xkey tab[0 1 2 3 4]

q)tab1

   sym    |   time          price     size
--------- | ----------------------------------
  APPLE   | 11:16:39.779   8.388858    12
  MSFT    | 11:16:39.779   19.59907    10
  IBM     | 11:16:39.779   37.5638     1
 SAMSUNG  | 11:16:39.779   61.37452    90
  APPLE   | 11:16:39.779   52.94808    73

q)/To work on specific column, try this

q){tab1[x]`size} each sym
1 90 12 10

q)(0!tab1)`size
12 10 1 90 73

q)/once we got unkeyed table, manipulation is easy

q)2+ (0!tab1)`size
14 12 3 92 75

Q 语言 - 磁盘上的表格

硬盘上的数据(也称为历史数据库)可以保存为三种不同的格式 - 平文件、扩展表和分区表。在这里,我们将学习如何使用这三种格式保存数据。

平文件

平文件完全加载到内存中,因此其大小(内存占用)应该很小。表完全保存在磁盘上的一个文件中(因此大小很重要)。

用于操作这些表的函数是set/get -

`:path_to_file/filename set tablename

让我们举一个例子来演示它是如何工作的 -

q)tables `.
`s#`t`tab`tab1 

q)`:c:/q/w32/tab1_test set tab1
`:c:/q/w32/tab1_test

在 Windows 环境中,平文件保存在以下位置 - C:\q\w32

Windows Environment

从磁盘(历史数据库)获取平文件,并使用get命令,如下所示 -

q)tab2: get `:c:/q/w32/tab1_test

q)tab2

   sym    |   time           price   size
--------- | -------------------------------
  APPLE   | 11:16:39.779   8.388858   12
  MSFT    | 11:16:39.779   19.59907   10
  IBM     | 11:16:39.779   37.5638    1
 SAMSUNG  | 11:16:39.779   61.37452   90
  APPLE   | 11:16:39.779   52.94808   73

创建了一个新表tab2,其内容存储在tab1_test文件中。

扩展表

如果表中包含太多列,则我们将此类表存储为扩展格式,即我们将它们保存在磁盘上的目录中。在目录内部,每列都保存在与列名相同的名称下的单独文件中。每列都作为对应类型的列表保存在 kdb+ 二进制文件中。

当我们必须经常访问其许多列中的一些列时,将表保存为扩展格式非常有用。扩展表目录包含.d二进制文件,其中包含列的顺序。

与平文件非常类似,可以使用set命令将表保存为扩展格式。要将表保存为扩展格式,文件路径应以反斜杠结尾 -

`:path_to_filename/filename/ set tablename

要读取扩展表,我们可以使用get函数 -

tablename: get `:path_to_file/filename

注意 - 要将表保存为扩展格式,它应该是不带键且已枚举的。

在 Windows 环境中,您的文件结构将如下所示 -

File Structure

分区表

分区表提供了一种有效的方法来管理包含大量数据的庞大表。分区表是分布在更多分区(目录)中的扩展表。

在每个分区内部,表将有自己的目录,其结构为扩展表。可以按天/月/年划分表,以便优化对其内容的访问。

要获取分区表的内容,请使用以下代码块 -

q)get `:c:/q/data/2000.01.13              // “get” command used, sample folder

quote| +`sym`time`bid`ask`bsize`asize`ex!(`p#`sym!0 0 0 0 0 0 0 0 0 0 0
0 0 0….

trade| +`sym`time`price`size`ex!(`p#`sym!0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 ….

让我们尝试获取交易表的内容 -

q)get `:c:/q/data/2000.01.13/trade

   sym    time            price     size    ex
--------------------------------------------------
    0   09:30:00.496    0.4092016    7      T
    0   09:30:00.501    1.428629     4      N
    0   09:30:00.707    0.5647834    6      T
    0   09:30:00.781    1.590509     5      T
    0   09:30:00.848    2.242627     3      A
    0   09:30:00.860    2.277041     8      T
    0   09:30:00.931    0.8044885    8      A
    0   09:30:01.197    1.344031     2      A
    0   09:30:01.337    1.875        3      A
    0   09:30:01.399    2.187723     7      A

注意 - 分区模式适用于每天有数百万条记录的表(即时间序列数据)

Sym 文件

sym 文件是一个 kdb+ 二进制文件,包含来自所有扩展表和分区表的所有符号的列表。可以使用以下命令读取,

get `:sym

par.txt 文件(可选)

这是一个配置文件,用于分区分布在多个目录/磁盘驱动器上的情况,并包含磁盘分区的路径。

Q 语言 - 维护函数

.Q.en

.Q.en是一个二元函数,它通过枚举符号列来帮助扩展表。当我们处理历史数据库(扩展表、分区表等)时,它特别有用。 -

.Q.en[`:directory;table]

其中directory是历史数据库的主目录,其中sym 文件位于其中,table是要枚举的表。

不需要手动枚举表以将其保存为扩展表,因为这将由 -

.Q.en[`:directory_where_symbol_file_stored]table_name

.Q.dpft

.Q.dpft函数有助于创建分区和分段表。它是.Q.en的高级形式,因为它不仅扩展了表,还创建了一个分区表。

.Q.dpft 函数使用了四个参数 -

  • 我们要创建分区的数据库的符号文件句柄,

  • 我们将要对表进行分区的q数据值,

  • 将应用`p#`属性的字段名称(通常为`sym`),以及

  • 表名。

让我们看一个例子来了解它是如何工作的 -

q)tab:([]sym:5?`msft`hsbc`samsung`ibm;time:5?(09:30:30);price:5?30.25)

q).Q.dpft[`:c:/q/;2014.08.24;`sym;`tab]
`tab

q)delete tab from `
'type

q)delete tab from `/
'type

q)delete tab from .
'type

q)delete tab from `.
`.

q)tab
'tab

我们已从内存中删除了表tab。现在让我们从数据库中加载它

q)\l c:/q/2014.08.24/

q)\a
,`tab

q)tab

   sym      time      price
-------------------------------
  hsbc    07:38:13   15.64201
  hsbc    07:21:05   5.387037
  msft    06:16:58   11.88076
  msft    08:09:26   12.30159
 samsung  04:57:56   15.60838

.Q.chk

.Q.chk是一个一元函数,其单个参数是根目录的符号文件句柄。它通过检查根目录中的每个分区子目录,在必要时创建分区中的空表。

.Q.chk `:directory

其中directory是历史数据库的主目录。

广告