- KDB+ 教程
- KDB+ - 首页
- Q 编程语言
- Q 编程语言
- Q 语言 - 类型转换
- Q 语言 - 时间数据
- Q 语言 - 列表
- Q 语言 - 索引
- Q 语言 - 字典
- Q 语言 - 表格
- Q 语言 - 动词 & 副词
- Q 语言 - 连接
- Q 语言 - 函数
- Q 语言 - 内置函数
- Q 语言 - 查询
- Q - 进程间通信
- Q - 消息处理程序(.Z 库)
- KDB+ 有用资源
- KDB+ - 快速指南
- KDB+ - 有用资源
- KDB+ - 讨论
Q 语言 - 查询
在q 中的查询更短、更简单,并且扩展了 SQL 的功能。主要的查询表达式是“选择表达式”,它在最简单的形式下提取子表,但它也可以创建新的列。
选择表达式的一般形式如下:
Select columns by columns from table where conditions
**注意 - by & where 短语是可选的,只有“from 表达式”是必须的。
一般来说,语法将是:
select [a] [by b] from t [where c] update [a] [by b] from t [where c]
q 表达式的语法看起来与 SQL 非常相似,但q 表达式简单而强大。上面q 表达式的等效 SQL 表达式如下:
select [b] [a] from t [where c] [group by b order by b] update t set [a] [where c]
所有子句都在列上执行,因此q 可以利用顺序。由于 Sql 查询不基于顺序,因此它们无法利用该优势。
与相应的 SQL 相比,q 关系查询的大小通常要小得多。有序和函数式查询可以完成 SQL 中难以完成的事情。
在历史数据库中,where 子句的排序非常重要,因为它会影响查询的性能。partition 变量(日期/月份/日期)始终放在首位,然后是排序和索引的列(通常是 sym 列)。
例如,
select from table where date in d, sym in s
比以下速度快得多:
select from table where sym in s, date in d
基本查询
让我们在记事本中编写一个查询脚本(如下所示),保存(为 *.q),然后加载它。
sym:asc`AIG`CITI`CSCO`IBM`MSFT; ex:"NASDAQ" dst:`$":c:/q/test/data/"; /database destination @[dst;`sym;:;sym]; n:1000000; trade:([]sym:n?`sym;time:10:30:00.0+til n;price:n?3.3e;size:n?9;ex:n?ex); quote:([]sym:n?`sym;time:10:30:00.0+til n;bid:n?3.3e;ask:n?3.3e;bsize:n?9;asize:n?9;ex:n?ex); {@[;`sym;`p#]`sym xasc x}each`trade`quote; d:2014.08.07 2014.08.08 2014.08.09 2014.08.10 2014.08.11; /Date vector can also be changed by the user dt:{[d;t].[dst;(`$string d;t;`);:;value t]}; d dt/:\:`trade`quote; Note: Once you run this query, two folders .i.e. "test" and "data" will be created under "c:/q/", and date partition data can be seen inside data folder.
带有约束条件的查询
* 表示 HDB 查询
选择所有 IBM 交易
select from trade where sym in `IBM
*选择特定日期的所有 IBM 交易
thisday: 2014.08.11 select from trade where date=thisday,sym=`IBM
选择所有价格 > 100 的 IBM 交易
select from trade where sym=`IBM, price > 100.0
选择所有价格小于或等于 100 的 IBM 交易
select from trade where sym=`IBM,not price > 100.0
*选择特定日期上午 10.30 到 10.40 之间的所有 IBM 交易
thisday: 2014.08.11 select from trade where date = thisday, sym = `IBM, time > 10:30:00.000,time < 10:40:00.000
按价格升序选择所有 IBM 交易
`price xasc select from trade where sym =`IBM
*在特定时间范围内按价格降序选择所有 IBM 交易
`price xdesc select from trade where date within 2014.08.07 2014.08.11, sym =`IBM
复合排序 - 按 sym 升序排序,然后按价格降序排序结果
`sym xasc `price xdesc select from trade where date = 2014.08.07,size = 5
选择所有 IBM 或 MSFT 交易
select from trade where sym in `IBM`MSFT
*在特定时间范围内计算所有符号的计数(升序)
`numsym xasc select numsym: count i by sym from trade where date within 2014.08.07 2014.08.11
*在特定时间范围内计算所有符号的计数(降序)
`numsym xdesc select numsym: count i by sym from trade where date within 2014.08.07 2014.08.11
* 在特定时间范围内,IBM 股票的最大价格是多少,以及何时首次出现?
select time,ask from quote where date within 2014.08.07 2014.08.11, sym =`IBM, ask = exec first ask from select max ask from quote where sym =`IBM
选择每个 sym 在每小时时段内的最后价格
select last price by hour:time.hh, sym from trade
带有聚合的查询
* 计算所有符号的 vwap(成交量加权平均价格)
select vwap:size wavg price by sym from trade
* 统计特定月份的记录数(以百万计)
(select trade:1e-6*count i by date.dd from trade where date.month=2014.08m) + select quote:1e-6*count i by date.dd from quote where date.month=2014.08m
* HLOC – 特定月份 CSCO 的每日最高价、最低价、开盘价和收盘价
select high:max price,low:min price,open:first price,close:last price by date.dd from trade where date.month=2014.08m,sym =`CSCO
* 特定月份 CSCO 的每日 Vwap
select vwap:size wavg price by date.dd from trade where date.month = 2014.08m ,sym = `CSCO
* 计算 AIG 价格的每小时平均值、方差和标准差
select mean:avg price, variance:var price, stdDev:dev price by date, hour:time.hh from trade where sym = `AIG
选择每小时时段内的价格范围
select range:max[price] – min price by date,sym,hour:time.hh from trade
* 特定月份 CSCO 的每日价差(平均买价-卖价)
select spread:avg bid-ask by date.dd from quote where date.month = 2014.08m, sym = `CSCO
* 特定月份所有 sym 的每日交易价值
select dtv:sum size by date,sym from trade where date.month = 2014.08m
提取 CSCO 的 5 分钟 vwap
select size wavg price by 5 xbar time.minute from trade where sym = `CSCO
* 提取 CSCO 的 10 分钟 K 线图
select high:max price,low:min price,close:last price by date, 10 xbar time.minute from trade where sym = `CSCO
* 查找 CSCO 在特定日期内价格超过最后价格 100 个基点(100e-4)的时间
select time from trade where date = 2014.08.11,sym = `CSCO,price > 1.01*last price
* 数据库中最后一天 MSFT 的全天价格和成交量,以 1 分钟为间隔
select last price,last size by time.minute from trade where date = last date, sym = `MSFT