influxdb 基础(七)
influx -import -path=NOAA_data.txt -precision=s -database=NOAA_water_database
[](()三、SELECT 基本语法
===============================================================================
SELECT field keys [time | tag kyes | * ] FROM measurements WHERE conditions GROUP BY [tag keys | time] ORDER BY time [asc | desc] LIMIT number [OFFSET number]
SELECT
后面查询显示字段必须至少有一个field key
,否则会抛异常ERR: at least 1 non-time field must be queried
。还可显示tag keys
、time
,或者*
显示所有字段。FROM
查询数据来源一个或者多个measurement
。WHERE
查询条件可为tag keys
和time
,field keys
也可作为查询条件但是不常用,因为不是索引,查询效率比较低。tag keys
条件操作符支持=、!=、<>、正则
,field keys
支持=、!=、<>、>、>=、<、<=、正则
。GROUP BY
只能对tag keys
和time
进行合分组,可以多字段排序,如group by tag1,tag2,time
,也可一个*
对所有的tag
进行分组聚合(不包括time
)。ORDER BY
只能对time
进行排序,asc
升序,desc
降序。LIMIT
分页,LIMIT
后面的数字是查询显示多少条,OFFSET
后面数字代表偏移量(从 0 开始代表第一条),如limit 10 offset 10
意思为从第 11 条开始往后 10 条。
[](()1、简单查询示例数据
--- 《一线大厂 Java 面试题解析+后端开发学习笔记+最新架构讲解视频+实战项目源码讲义》无偿开源 威信搜索公众号【编程进阶路】 --------------------------------------------------------------------------
现在开始简单查询之前导入的示例数据:
(1)查询 average_temperature 的数据。
因为数据量比较大,配合 limit 防止返回大量数据。
select * from average_temperature limit 2
(2)查询average_temperature
,location
为coyote_creek
的数据,字段只显示time
和degrees
。
select time, degrees from average_temperature where location='coyote_creek' limit 2
上面的数据显示格式是 column,且时间是时间戳,前面的文章也介绍过,可执行如下指令进行设置:
输入 json 格式
format json
让 json 格式输出更好看
pretty
格式化时间显示
precision rfc3339
[](()2、没有 in 还有 or
where
后面没有in
来范围查询,但是有or
也可以做到异曲同工之妙。
select * from h2o_pH where location='coyote_creek' or location='santa_monica' limit 4
[](()3、模糊查询
tag keys
和field keys
都支持正则,可通过如下正则达到模糊查询的效果。
location 名称中包含 coyote 的数据
select * from h2o_quality where location=~/.coyote./ limit 10
[](()4、group by
[](()(1)group by tag
对location
分组查询,返回结果是一个大results
对象结果集内包含两个series
,第一个series
是location
为coyote_creek
的聚合结果集,第二个series
是location
为santa_monica
的聚合结果集。
select * from h2o_pH group by location limit 2
查询结果显示
{
"results": [
{
"series": [
{
"name": "h2o_pH",
"tags": {
"location": "coyote_creek"
},
"columns": [
"time",
"pH"
],
"values": [
[
"2019-08-17T00:00:00Z",
7
],
[
"2019-08-17T00:06:00Z",
8
]
]
}
]
},
{
"series": [
{
"name": "h2o_pH",
"tags": {
"location": "santa_monica"
},
"columns": [
"time",
"pH"
],
"values": [
[
"2019-08-17T00:00:00Z",
6
],
[
"2019-08-17T00:06:00Z",
6
]
]
}
]
}
]
}
[](()(2)group by time(1m)
对time
分组时并不是简单的group by time
,time
后面还需要加一个分组聚合的持续时间,如group by time(1m)
。支持的持续时间单位有:
| 单位 | 备注 |
| --- | --- |
| u or μ | microseconds (1 millionth of a second) |
| ms | milliseconds (1 thousandth of a second) |
| s | second |
| m | minute |
| h | hour |
| d | day |
| w | week |
对time
进行分组,查询结果必须对field
使用聚合函数,如count()
、sum()
、max()
、min()
等。
select sum(pH) from h2o_pH group by time(1m) limit 4
查询结果显示
{
"results": [
{
"series": [
{
"name": "h2o_pH",
"columns": [
"time",
"sum"
],
"values": [
[
"2019-08-17T08:00:00+08:00",
13
],
[
"2019-08-17T08:01:00+08:00",
null
]
]
}
]
}
]
}
由于Influxdb
时区默认是UTC
,若以一天进行数据聚合,需要加上便宜量 -8h 进行聚合:
select sum(pH) from h2o_pH group by time(1d,-8h) fill(0) limit 4
[](()(3)fill(0)填充 null
可以看到values
结果集中有null
的情况,可在查询语句中加fill(0)
,遇到null
用0
来填充。fill()
中只能填数字。
[](()5、order by
order by
只能对time
进行排序,asc
升序,desc
降序。
select sum(pH) from h2o_pH group by time(1m) fill(0) order by time asc limit 2
[](()6、limit 和 slimit
limit
可单独使用,也可配合offset
使用,offset
偏移量的意思。
select sum(pH) from h2o_pH group by time(1h) fill(0) order by time asc limit 2 offset 10
select
进行多个tag
分组后,会返回多个series
,可使用slmit
限制series
返回的个数。slimit
不像limit
有偏移量offset
,但是可以配合limit
一起使用:
查询显示 前两个 series,且每个 series 里显示 2 条数据,偏移量 10
select * from h2o_quality group by * limit 2 offset 10 slimit 2
评论