HTTP API
当前稳定的 HTTP API 可在 Prometheus 服务器的 /api/v1 路径下访问。任何非破坏性的新增功能都将添加到该端点下。
格式概述
API 响应格式为 JSON。每个成功的 API 请求都会返回一个 2xx 状态码。
到达 API 处理程序的无效请求将返回一个 JSON 错误对象和以下 HTTP 响应码之一:
- 当参数缺失或不正确时,返回
400 Bad Request。 - 当表达式无法执行时,返回
422 Unprocessable Entity(RFC4918 )。 - 当查询超时或中止时,返回
503 Service Unavailable。
对于在到达 API 端点之前发生的错误,可能会返回其他非 2xx 状态码。
如果存在不影响请求执行的错误,可能会返回一个警告数组。如果存在潜在的查询问题(可能是也可能不是误报),可能会返回一个信息级别的注释数组。所有成功收集的数据都将在数据字段中返回。
JSON 响应封装格式如下:
{
"status": "success" | "error",
"data": <data>,
// Only set if status is "error". The data field may still hold
// additional data.
"errorType": "<string>",
"error": "<string>",
// Only set if there were warnings while executing the request.
// There will still be data in the data field.
"warnings": ["<string>"],
// Only set if there were info-level annotations while executing the request.
"infos": ["<string>"]
}
通用占位符定义如下
<rfc3339 | unix_timestamp>:输入的时间戳可以采用 RFC3339 格式或以秒为单位的 Unix 时间戳提供,可选的小数位表示亚秒级精度。输出的时间戳始终表示为以秒为单位的 Unix 时间戳。<series_selector>:Prometheus 时间序列选择器,如http_requests_total或http_requests_total{method=~"(GET|POST)"},需要进行 URL 编码。<duration>:使用时间单位的 Prometheus 浮点数字面量的子集。例如,5m表示 5 分钟的持续时间。<bool>:布尔值(字符串true和false)。
注意:可能重复的查询参数名称以 [] 结尾。
表达式查询
查询语言表达式可以在单个瞬间或一个时间范围内进行评估。以下各节描述了每种表达式查询类型的 API 端点。
瞬时查询
以下端点在单个时间点评估瞬时查询:
GET /api/v1/query
POST /api/v1/query
URL 查询参数:
query=<string>:Prometheus 表达式查询字符串。time=<rfc3339 | unix_timestamp>:评估时间戳。可选。timeout=<duration>:评估超时。可选。默认为-query.timeout标志的值,并受其限制。limit=<number>:返回的最大序列数。不影响标量或字符串,但会截断矩阵和向量的序列数。可选。0 表示禁用。lookback_delta=<number>:仅针对此查询覆盖回顾期。可选。
如果省略 time 参数,则使用当前服务器时间。
您可以使用 POST 方法和 Content-Type: application/x-www-form-urlencoded 标头,将这些参数直接在请求正文中进行 URL 编码。当指定一个可能超出服务器端 URL 字符限制的大型查询时,这非常有用。
查询结果的 data 部分具有以下格式:
{
"resultType": "matrix" | "vector" | "scalar" | "string",
"result": <value>
}
<value> 指的是查询结果数据,其格式根据 resultType 而有所不同。请参阅表达式查询结果格式。
以下示例在 2015-07-01T20:10:51.781Z 时刻评估表达式 up:
curl 'https://:9090/api/v1/query?query=up&time=2015-07-01T20:10:51.781Z'
{
"status" : "success",
"data" : {
"resultType" : "vector",
"result" : [
{
"metric" : {
"__name__" : "up",
"job" : "prometheus",
"instance" : "localhost:9090"
},
"value": [ 1435781451.781, "1" ]
},
{
"metric" : {
"__name__" : "up",
"job" : "node",
"instance" : "localhost:9100"
},
"value" : [ 1435781451.781, "0" ]
}
]
}
}
范围查询
以下端点在一个时间范围内评估表达式查询:
GET /api/v1/query_range
POST /api/v1/query_range
URL 查询参数:
query=<string>:Prometheus 表达式查询字符串。start=<rfc3339 | unix_timestamp>:开始时间戳,包含在内。end=<rfc3339 | unix_timestamp>:结束时间戳,包含在内。step=<duration | float>:查询分辨率步长,格式为duration或浮点数秒。timeout=<duration>:评估超时。可选。默认为-query.timeout标志的值,并受其限制。limit=<number>:返回的最大序列数。可选。0 表示禁用。lookback_delta=<number>:仅针对此查询覆盖回顾期。可选。
您可以使用 POST 方法和 Content-Type: application/x-www-form-urlencoded 标头,将这些参数直接在请求正文中进行 URL 编码。当指定一个可能超出服务器端 URL 字符限制的大型查询时,这非常有用。
查询结果的 data 部分具有以下格式:
{
"resultType": "matrix",
"result": <value>
}
关于 <value> 占位符的格式,请参阅范围向量结果格式。
以下示例在一个 30 秒的范围内以 15 秒的查询分辨率评估表达式 up。
curl 'https://:9090/api/v1/query_range?query=up&start=2015-07-01T20:10:30.781Z&end=2015-07-01T20:11:00.781Z&step=15s'
{
"status" : "success",
"data" : {
"resultType" : "matrix",
"result" : [
{
"metric" : {
"__name__" : "up",
"job" : "prometheus",
"instance" : "localhost:9090"
},
"values" : [
[ 1435781430.781, "1" ],
[ 1435781445.781, "1" ],
[ 1435781460.781, "1" ]
]
},
{
"metric" : {
"__name__" : "up",
"job" : "node",
"instance" : "localhost:9091"
},
"values" : [
[ 1435781430.781, "0" ],
[ 1435781445.781, "0" ],
[ 1435781460.781, "1" ]
]
}
]
}
}
格式化查询表达式
以下端点以美化方式格式化 PromQL 表达式:
GET /api/v1/format_query
POST /api/v1/format_query
URL 查询参数:
query=<string>:Prometheus 表达式查询字符串。
您可以使用 POST 方法和 Content-Type: application/x-www-form-urlencoded 标头,将这些参数直接在请求正文中进行 URL 编码。当指定一个可能超出服务器端 URL 字符限制的大型查询时,这非常有用。
查询结果的 data 部分是一个包含格式化查询表达式的字符串。请注意,格式化后的字符串中会删除所有注释。
以下示例格式化表达式 foo/bar:
curl 'https://:9090/api/v1/format_query?query=foo/bar'
{
"status" : "success",
"data" : "foo / bar"
}
将 PromQL 表达式解析为抽象语法树 (AST)
此端点是实验性的,将来可能会更改。目前仅供 Prometheus 自己的 Web UI 使用,端点名称和返回的确切格式可能会在不同 Prometheus 版本之间发生变化。如果 UI 不再需要它,也可能会再次被删除。
以下端点解析 PromQL 表达式并将其作为 JSON 格式的 AST(抽象语法树)表示返回:
GET /api/v1/parse_query
POST /api/v1/parse_query
URL 查询参数:
query=<string>:Prometheus 表达式查询字符串。
您可以使用 POST 方法和 Content-Type: application/x-www-form-urlencoded 标头,将这些参数直接在请求正文中进行 URL 编码。当指定一个可能超出服务器端 URL 字符限制的大型查询时,这非常有用。
查询结果的 data 部分是一个包含已解析查询表达式的 AST 的字符串。
以下示例解析表达式 foo/bar:
curl 'https://:9090/api/v1/parse_query?query=foo/bar'
{
"data" : {
"bool" : false,
"lhs" : {
"matchers" : [
{
"name" : "__name__",
"type" : "=",
"value" : "foo"
}
],
"name" : "foo",
"offset" : 0,
"startOrEnd" : null,
"timestamp" : null,
"type" : "vectorSelector"
},
"matching" : {
"card" : "one-to-one",
"include" : [],
"labels" : [],
"on" : false
},
"op" : "/",
"rhs" : {
"matchers" : [
{
"name" : "__name__",
"type" : "=",
"value" : "bar"
}
],
"name" : "bar",
"offset" : 0,
"startOrEnd" : null,
"timestamp" : null,
"type" : "vectorSelector"
},
"type" : "binaryExpr"
},
"status" : "success"
}
查询元数据
Prometheus 提供了一组 API 端点,用于查询有关序列及其标签的元数据。
注意这些 API 端点可能会返回在所选时间范围内没有样本的序列的元数据,和/或其样本已通过删除 API 端点标记为已删除的序列的元数据。额外返回的序列元数据的确切范围是一个实现细节,将来可能会更改。
通过标签匹配器查找序列
以下端点返回与某个标签集匹配的时间序列列表。
GET /api/v1/series
POST /api/v1/series
URL 查询参数:
match[]=<series_selector>:重复的序列选择器参数,用于选择要返回的序列。必须至少提供一个match[]参数。start=<rfc3339 | unix_timestamp>:开始时间戳。end=<rfc3339 | unix_timestamp>:结束时间戳。limit=<number>:返回的最大序列数。可选。0 表示禁用。
您可以使用 POST 方法和 Content-Type: application/x-www-form-urlencoded 标头,将这些参数直接在请求正文中进行 URL 编码。当指定大量或动态数量的序列选择器,可能超出服务器端 URL 字符限制时,这非常有用。
查询结果的 data 部分包含一个对象列表,这些对象包含标识每个序列的标签名称/值对。请注意,start 和 end 时间是近似值,结果可能包含在给定时间间隔内没有样本的序列的标签值。
以下示例返回与选择器 up 或 process_start_time_seconds{job="prometheus"} 匹配的所有序列:
curl -g 'https://:9090/api/v1/series?' --data-urlencode 'match[]=up' --data-urlencode 'match[]=process_start_time_seconds{job="prometheus"}'
{
"status" : "success",
"data" : [
{
"__name__" : "up",
"job" : "prometheus",
"instance" : "localhost:9090"
},
{
"__name__" : "up",
"job" : "node",
"instance" : "localhost:9091"
},
{
"__name__" : "process_start_time_seconds",
"job" : "prometheus",
"instance" : "localhost:9090"
}
]
}
获取标签名称
以下端点返回标签名称列表:
GET /api/v1/labels
POST /api/v1/labels
URL 查询参数:
start=<rfc3339 | unix_timestamp>:开始时间戳。可选。end=<rfc3339 | unix_timestamp>:结束时间戳。可选。match[]=<series_selector>:重复的序列选择器参数,用于选择要从中读取标签名称的序列。可选。limit=<number>:返回的最大序列数。可选。0 表示禁用。
JSON 响应的 data 部分是字符串标签名称的列表。请注意,start 和 end 时间是近似值,结果可能包含在给定时间间隔内没有样本的序列的标签名称。
这是一个示例。
curl 'localhost:9090/api/v1/labels'
{
"status": "success",
"data": [
"__name__",
"call",
"code",
"config",
"dialer_name",
"endpoint",
"event",
"goversion",
"handler",
"instance",
"interval",
"job",
"le",
"listener_name",
"name",
"quantile",
"reason",
"role",
"scrape_job",
"slice",
"version"
]
}
查询标签值
以下端点返回所提供标签名称的标签值列表:
GET /api/v1/label/<label_name>/values
URL 查询参数:
start=<rfc3339 | unix_timestamp>:开始时间戳。可选。end=<rfc3339 | unix_timestamp>:结束时间戳。可选。match[]=<series_selector>:重复的序列选择器参数,用于选择要从中读取标签值的序列。可选。limit=<number>:返回的最大序列数。可选。0 表示禁用。
JSON 响应的 data 部分是字符串标签值的列表。请注意,start 和 end 时间是近似值,结果可能包含在给定时间间隔内没有样本的序列的标签值。
此示例查询 http_status_code 标签的所有标签值:
curl https://:9090/api/v1/label/http_status_code/values
{
"status" : "success",
"data" : [
"200",
"504"
]
}
标签名称可以选择使用“值转义”方法进行编码,如果名称包含 / 字符,则必须这样做。要以这种方式对名称进行编码:
- 在标签前加上
U__。 - 字母、数字和冒号保持原样。
- 将单个下划线转换为双下划线。
- 对于所有其他字符,使用其 UTF-8 码点的十六进制整数,并用下划线包围。所以
变成_20_,.变成_2e_。
有关文本转义的更多信息,请参阅原始 UTF-8 提案文档 。
此示例查询 http.status_code 标签的所有标签值:
curl https://:9090/api/v1/label/U__http_2e_status_code/values
{
"status" : "success",
"data" : [
"200",
"404"
]
}
查询样本数据
这是实验性的,将来可能会更改。以下端点返回特定时间范围内有效 PromQL 查询的样本数据列表:
GET /api/v1/query_exemplars
POST /api/v1/query_exemplars
URL 查询参数:
query=<string>:Prometheus 表达式查询字符串。start=<rfc3339 | unix_timestamp>:开始时间戳。end=<rfc3339 | unix_timestamp>:结束时间戳。
curl -g 'https://:9090/api/v1/query_exemplars?query=test_exemplar_metric_total&start=2020-09-14T15:22:25.479Z&end=2020-09-14T15:23:25.479Z'
{
"status": "success",
"data": [
{
"seriesLabels": {
"__name__": "test_exemplar_metric_total",
"instance": "localhost:8090",
"job": "prometheus",
"service": "bar"
},
"exemplars": [
{
"labels": {
"trace_id": "EpTxMJ40fUus7aGY"
},
"value": "6",
"timestamp": 1600096945.479
}
]
},
{
"seriesLabels": {
"__name__": "test_exemplar_metric_total",
"instance": "localhost:8090",
"job": "prometheus",
"service": "foo"
},
"exemplars": [
{
"labels": {
"trace_id": "Olp9XHlq763ccsfa"
},
"value": "19",
"timestamp": 1600096955.479
},
{
"labels": {
"trace_id": "hCtjygkIHwAN9vs4"
},
"value": "20",
"timestamp": 1600096965.489
}
]
}
]
}
表达式查询结果格式
表达式查询可能会在 data 部分的 result 属性中返回以下响应值。<sample_value> 占位符是数字样本值。JSON 不支持特殊的浮点值,如 NaN、Inf 和 -Inf,因此样本值以带引号的 JSON 字符串形式传输,而不是原始数字。
只有当响应中存在原生直方图时,才会显示键 "histogram" 和 "histograms"。它们的占位符 <histogram> 在下面的单独部分中有详细解释。
范围向量
范围向量作为结果类型 matrix 返回。相应的 result 属性具有以下格式:
[
{
"metric": { "<label_name>": "<label_value>", ... },
"values": [ [ <unix_time>, "<sample_value>" ], ... ],
"histograms": [ [ <unix_time>, <histogram> ], ... ]
},
...
]
每个序列可以有 "values" 键,或 "histograms" 键,或两者兼有。对于给定的时间戳,只会有浮点型或直方图类型的样本之一。
序列按 metric 排序返回。像 sort 和 sort_by_label 这样的函数对范围向量没有影响。
瞬时向量
瞬时向量作为结果类型 vector 返回。相应的 result 属性具有以下格式:
[
{
"metric": { "<label_name>": "<label_value>", ... },
"value": [ <unix_time>, "<sample_value>" ],
"histogram": [ <unix_time>, <histogram> ]
},
...
]
每个序列可以有 "value" 键,或 "histogram" 键,但不能两者都有。
除非使用像 sort 或 sort_by_label 这样的函数,否则不保证序列以任何特定顺序返回。
标量
标量结果作为结果类型 scalar 返回。相应的 result 属性具有以下格式:
[ <unix_time>, "<scalar_value>" ]
字符串
字符串结果作为结果类型 string 返回。相应的 result 属性具有以下格式:
[ <unix_time>, "<string_value>" ]
原生直方图
上面使用的 <histogram> 占位符格式如下。
{
"count": "<count_of_observations>",
"sum": "<sum_of_observations>",
"buckets": [ [ <boundary_rule>, "<left_boundary>", "<right_boundary>", "<count_in_bucket>" ], ... ]
}
<boundary_rule> 占位符是一个 0 到 3 之间的整数,含义如下:
- 0:“左开”(左边界不包含,右边界包含)
- 1:“右开”(左边界包含,右边界不包含)
- 2:“双开”(两个边界都不包含)
- 3:“双闭”(两个边界都包含)
请注意,对于当前实现的桶模式,正值桶是“左开”,负值桶是“右开”,而零值桶(具有负左边界和正右边界)是“双闭”。
目标
以下端点返回 Prometheus 目标发现当前状态的概览:
GET /api/v1/targets
默认情况下,活动目标和已丢弃目标都是响应的一部分。已丢弃目标受 keep_dropped_targets 限制(如果已设置)。labels 表示重新标记后发生的标签集。discoveredLabels 表示在重新标记发生之前,在服务发现期间检索到的未修改标签。
curl https://:9090/api/v1/targets
{
"status": "success",
"data": {
"activeTargets": [
{
"discoveredLabels": {
"__address__": "127.0.0.1:9090",
"__metrics_path__": "/metrics",
"__scheme__": "http",
"job": "prometheus"
},
"labels": {
"instance": "127.0.0.1:9090",
"job": "prometheus"
},
"scrapePool": "prometheus",
"scrapeUrl": "http://127.0.0.1:9090/metrics",
"globalUrl": "http://example-prometheus:9090/metrics",
"lastError": "",
"lastScrape": "2017-01-17T15:07:44.723715405+01:00",
"lastScrapeDuration": 0.050688943,
"health": "up",
"scrapeInterval": "1m",
"scrapeTimeout": "10s"
}
],
"droppedTargets": [
{
"discoveredLabels": {
"__address__": "127.0.0.1:9100",
"__metrics_path__": "/metrics",
"__scheme__": "http",
"__scrape_interval__": "1m",
"__scrape_timeout__": "10s",
"job": "node"
},
"scrapePool": "node"
}
]
}
}
state 查询参数允许调用者按活动或已丢弃的目标进行筛选(例如,state=active、state=dropped、state=any)。请注意,对于被筛选掉的目标,仍会返回一个空数组。其他值将被忽略。
curl 'https://:9090/api/v1/targets?state=active'
{
"status": "success",
"data": {
"activeTargets": [
{
"discoveredLabels": {
"__address__": "127.0.0.1:9090",
"__metrics_path__": "/metrics",
"__scheme__": "http",
"job": "prometheus"
},
"labels": {
"instance": "127.0.0.1:9090",
"job": "prometheus"
},
"scrapePool": "prometheus",
"scrapeUrl": "http://127.0.0.1:9090/metrics",
"globalUrl": "http://example-prometheus:9090/metrics",
"lastError": "",
"lastScrape": "2017-01-17T15:07:44.723715405+01:00",
"lastScrapeDuration": 50688943,
"health": "up"
}
],
"droppedTargets": []
}
}
scrapePool 查询参数允许调用者按抓取池名称进行筛选。
curl 'https://:9090/api/v1/targets?scrapePool=node_exporter'
{
"status": "success",
"data": {
"activeTargets": [
{
"discoveredLabels": {
"__address__": "127.0.0.1:9091",
"__metrics_path__": "/metrics",
"__scheme__": "http",
"job": "node_exporter"
},
"labels": {
"instance": "127.0.0.1:9091",
"job": "node_exporter"
},
"scrapePool": "node_exporter",
"scrapeUrl": "http://127.0.0.1:9091/metrics",
"globalUrl": "http://example-prometheus:9091/metrics",
"lastError": "",
"lastScrape": "2017-01-17T15:07:44.723715405+01:00",
"lastScrapeDuration": 50688943,
"health": "up"
}
],
"droppedTargets": []
}
}
重新标记步骤
此端点是实验性的,将来可能会更改。目前仅供 Prometheus 自己的 Web UI 使用,端点名称和返回的确切格式可能会在不同 Prometheus 版本之间发生变化。如果 UI 不再需要它,也可能会再次被删除。
以下端点返回重新标记规则及其对给定目标标签集影响的逐步列表。
GET /api/v1/targets/relabel_steps
URL 查询参数:
scrapePool=<string>:目标的抓取池名称,用于确定要应用的重新标记规则。必需。labels=<string>:一个 JSON 对象,包含在应用任何重新标记之前目标的标签集。必需。
以下示例返回在 prometheus 抓取池中发现的目标的重新标记步骤,其标签集为 {"__address__": "localhost:9090", "job": "prometheus"}:
curl -g 'https://:9090/api/v1/targets/relabel_steps?scrapePool=prometheus&labels={"__address__":"localhost:9090","job":"prometheus"}'
{
"data" : {
"steps" : [
{
"keep" : true,
"output" : {
"__address__" : "localhost:9090",
"env" : "development",
"job" : "prometheus"
},
"rule" : {
"action" : "replace",
"regex" : "(.*)",
"replacement" : "development",
"separator" : ";",
"target_label" : "env"
}
},
{
"keep" : false,
"output" : {},
"rule" : {
"action" : "drop",
"regex" : "localhost:.*",
"replacement" : "$1",
"separator" : ";",
"source_labels" : [
"__address__"
]
}
}
]
},
"status" : "success"
}
规则
/rules API 端点返回当前加载的告警和记录规则列表。此外,它还返回由 Prometheus 实例为每个告警规则触发的当前活动告警。
由于 /rules 端点相对较新,它没有与整个 API v1 相同的稳定性保证。
GET /api/v1/rules
URL 查询参数:
type=alert|record:仅返回告警规则(例如type=alert)或记录规则(例如type=record)。当参数不存在或为空时,不进行筛选。rule_name[]=<string>:仅返回具有给定规则名称的规则。如果参数重复,则返回具有任何提供名称的规则。如果我们筛选掉了某个组的所有规则,则不返回该组。当参数不存在或为空时,不进行筛选。rule_group[]=<string>:仅返回具有给定规则组名称的规则。如果参数重复,则返回具有任何提供规则组名称的规则。当参数不存在或为空时,不进行筛选。file[]=<string>: 仅返回具有给定文件路径的规则。如果重复该参数,则返回具有任何所提供文件路径的规则。当该参数不存在或为空时,不进行筛选。exclude_alerts=<bool>: 仅返回规则,不返回活动的警报。match[]=<label_selector>: 仅返回配置的标签满足标签选择器的规则。如果重复该参数,则返回匹配任何标签选择器集的规则。请注意,匹配是基于每条规则定义中的标签,而不是模板扩展后的值(对于警报规则)。可选。group_limit=<number>:group_limit参数允许您指定单个响应中返回的规则组数量的限制。如果规则组总数超过指定的group_limit值,响应将包含一个groupNextToken属性。您可以在后续请求的group_next_token参数中使用此groupNextToken属性的值,以对剩余的规则组进行分页。最终的响应中将不包含groupNextToken属性,表示您已检索所有可用的规则组。请注意,如果在分页过程中修改规则组,则无法保证响应的一致性。group_next_token: 当设置了group_limit属性时,上一个请求中返回的分页令牌。该分页令牌用于迭代地对大量的规则组进行分页。要使用group_next_token参数,group_limit参数也需要存在。如果在对规则组进行分页时,与下一个令牌相符的规则组被删除,将返回状态码为 400 的响应。
curl https://:9090/api/v1/rules
{
"data": {
"groups": [
{
"rules": [
{
"alerts": [
{
"activeAt": "2018-07-04T20:27:12.60602144+02:00",
"annotations": {
"summary": "High request latency"
},
"labels": {
"alertname": "HighRequestLatency",
"severity": "page"
},
"state": "firing",
"value": "1e+00"
}
],
"annotations": {
"summary": "High request latency"
},
"duration": 600,
"health": "ok",
"labels": {
"severity": "page"
},
"name": "HighRequestLatency",
"query": "job:request_latency_seconds:mean5m{job=\"myjob\"} > 0.5",
"type": "alerting"
},
{
"health": "ok",
"name": "job:http_inprogress_requests:sum",
"query": "sum by (job) (http_inprogress_requests)",
"type": "recording"
}
],
"file": "/rules.yaml",
"interval": 60,
"limit": 0,
"name": "example"
}
]
},
"status": "success"
}
警报
/alerts 端点返回所有活动警报的列表。
由于 /alerts 端点相对较新,它不具备与整个 API v1 相同的稳定性保证。
GET /api/v1/alerts
curl https://:9090/api/v1/alerts
{
"data": {
"alerts": [
{
"activeAt": "2018-07-04T20:27:12.60602144+02:00",
"annotations": {},
"labels": {
"alertname": "my-alert"
},
"state": "firing",
"value": "1e+00"
}
]
},
"status": "success"
}
查询目标元数据
以下端点返回有关当前从目标抓取的指标的元数据。这是实验性功能,将来可能会更改。
GET /api/v1/targets/metadata
URL 查询参数:
match_target=<label_selectors>: 按标签集匹配目标的标签选择器。如果留空,则选择所有目标。metric=<string>: 要检索元数据的指标名称。如果留空,则检索所有指标元数据。limit=<number>: 匹配的最大目标数。
查询结果的 data 部分包含一个对象列表,每个对象包含指标元数据和目标标签集。
以下示例返回标签为 job="prometheus" 的前两个目标的 go_goroutines 指标的所有元数据条目。
curl -G https://:9091/api/v1/targets/metadata \
--data-urlencode 'metric=go_goroutines' \
--data-urlencode 'match_target={job="prometheus"}' \
--data-urlencode 'limit=2'
{
"status": "success",
"data": [
{
"target": {
"instance": "127.0.0.1:9090",
"job": "prometheus"
},
"type": "gauge",
"help": "Number of goroutines that currently exist.",
"unit": ""
},
{
"target": {
"instance": "127.0.0.1:9091",
"job": "prometheus"
},
"type": "gauge",
"help": "Number of goroutines that currently exist.",
"unit": ""
}
]
}
以下示例返回标签为 instance="127.0.0.1:9090" 的所有目标的所有指标的元数据。
curl -G https://:9091/api/v1/targets/metadata \
--data-urlencode 'match_target={instance="127.0.0.1:9090"}'
{
"status": "success",
"data": [
// ...
{
"target": {
"instance": "127.0.0.1:9090",
"job": "prometheus"
},
"metric": "prometheus_treecache_zookeeper_failures_total",
"type": "counter",
"help": "The total number of ZooKeeper failures.",
"unit": ""
},
{
"target": {
"instance": "127.0.0.1:9090",
"job": "prometheus"
},
"metric": "prometheus_tsdb_reloads_total",
"type": "counter",
"help": "Number of times the database reloaded block data from disk.",
"unit": ""
},
// ...
]
}
查询指标元数据
它返回当前从目标抓取的指标的元数据。但是,它不提供任何目标信息。这被认为是实验性功能,将来可能会更改。
GET /api/v1/metadata
URL 查询参数:
limit=<number>: 返回的最大指标数。limit_per_metric=<number>: 每个指标返回的最大元数据数。metric=<string>: 用于筛选元数据的指标名称。如果留空,则检索所有指标元数据。
查询结果的 data 部分由一个对象组成,其中每个键是一个指标名称,每个值是一个唯一的元数据对象列表,这些元数据是在所有目标上为该指标名称暴露的。
以下示例返回两个指标。请注意,指标 http_requests_total 在列表中有多个对象。这表示至少有一个目标的 HELP 值与其他目标不匹配。
curl -G https://:9090/api/v1/metadata?limit=2
{
"status": "success",
"data": {
"cortex_ring_tokens": [
{
"type": "gauge",
"help": "Number of tokens in the ring",
"unit": ""
}
],
"http_requests_total": [
{
"type": "counter",
"help": "Number of HTTP requests",
"unit": ""
},
{
"type": "counter",
"help": "Amount of HTTP requests",
"unit": ""
}
]
}
}
以下示例为每个指标仅返回一个元数据条目。
curl -G https://:9090/api/v1/metadata?limit_per_metric=1
{
"status": "success",
"data": {
"cortex_ring_tokens": [
{
"type": "gauge",
"help": "Number of tokens in the ring",
"unit": ""
}
],
"http_requests_total": [
{
"type": "counter",
"help": "Number of HTTP requests",
"unit": ""
}
]
}
}
以下示例仅返回指标 http_requests_total 的元数据。
curl -G https://:9090/api/v1/metadata?metric=http_requests_total
{
"status": "success",
"data": {
"http_requests_total": [
{
"type": "counter",
"help": "Number of HTTP requests",
"unit": ""
},
{
"type": "counter",
"help": "Amount of HTTP requests",
"unit": ""
}
]
}
}
Alertmanagers
以下端点返回 Prometheus alertmanager 服务发现当前状态的概览。
GET /api/v1/alertmanagers
响应中包含活动和已丢弃的 Alertmanager。
curl https://:9090/api/v1/alertmanagers
{
"status": "success",
"data": {
"activeAlertmanagers": [
{
"url": "http://127.0.0.1:9090/api/v1/alerts"
}
],
"droppedAlertmanagers": [
{
"url": "http://127.0.0.1:9093/api/v1/alerts"
}
]
}
}
状态
以下状态端点公开当前的 Prometheus 配置。
配置
以下端点返回当前加载的配置文件。
GET /api/v1/status/config
配置以转储的 YAML 文件形式返回。由于 YAML 库的限制,不包括 YAML 注释。
curl https://:9090/api/v1/status/config
{
"status": "success",
"data": {
"yaml": "<content of the loaded config file in YAML>",
}
}
标志
以下端点返回 Prometheus 配置的标志值。
GET /api/v1/status/flags
所有值的结果类型均为 string。
curl https://:9090/api/v1/status/flags
{
"status": "success",
"data": {
"alertmanager.notification-queue-capacity": "10000",
"alertmanager.timeout": "10s",
"log.level": "info",
"query.lookback-delta": "5m",
"query.max-concurrency": "20",
...
}
}
v2.2 版本新增。
运行时信息
以下端点返回有关 Prometheus 服务器的各种运行时信息属性。
GET /api/v1/status/runtimeinfo
返回值的类型各不相同,取决于运行时属性的性质。
curl https://:9090/api/v1/status/runtimeinfo
{
"status": "success",
"data": {
"startTime": "2019-11-02T17:23:59.301361365+01:00",
"CWD": "/",
"hostname" : "DESKTOP-717H17Q",
"serverTime": "2025-01-05T18:27:33Z",
"reloadConfigSuccess": true,
"lastConfigTime": "2019-11-02T17:23:59+01:00",
"timeSeriesCount": 873,
"corruptionCount": 0,
"goroutineCount": 48,
"GOMAXPROCS": 4,
"GOGC": "",
"GODEBUG": "",
"storageRetention": "15d"
}
}
注意在 Prometheus 版本之间,确切返回的运行时属性可能会更改,恕不另行通知。
v2.14 版本新增。
构建信息
以下端点返回有关 Prometheus 服务器的各种构建信息属性。
GET /api/v1/status/buildinfo
所有值的结果类型均为 string。
curl https://:9090/api/v1/status/buildinfo
{
"status": "success",
"data": {
"version": "2.13.1",
"revision": "cb7cbad5f9a2823a622aaa668833ca04f50a0ea7",
"branch": "master",
"buildUser": "julius@desktop",
"buildDate": "20191102-16:19:59",
"goVersion": "go1.13.1"
}
}
注意在 Prometheus 版本之间,确切返回的构建属性可能会更改,恕不另行通知。
v2.14 版本新增。
TSDB 统计信息
以下端点返回有关 Prometheus TSDB 的各种基数统计信息。
GET /api/v1/status/tsdb
URL 查询参数:
limit=<number>: 将每组统计信息返回的项数限制为给定数量。默认情况下,返回 10 项。
查询结果的 data 部分包含:
- headStats: 提供有关 TSDB 头块的以下数据:
- numSeries: 序列数。
- chunkCount: 块数。
- minTime: 当前最小时间戳(毫秒)。
- maxTime: 当前最大时间戳(毫秒)。
- seriesCountByMetricName: 提供指标名称及其序列计数的列表。
- labelValueCountByLabelName: 提供标签名称及其值计数的列表。
- memoryInBytesByLabelName 提供标签名称及其使用的内存(字节)的列表。内存使用量是通过将给定标签名称的所有值的长度相加计算得出的。
- seriesCountByLabelPair 提供标签值对及其序列计数的列表。
curl https://:9090/api/v1/status/tsdb
{
"status": "success",
"data": {
"headStats": {
"numSeries": 508,
"chunkCount": 937,
"minTime": 1591516800000,
"maxTime": 1598896800143,
},
"seriesCountByMetricName": [
{
"name": "net_conntrack_dialer_conn_failed_total",
"value": 20
},
{
"name": "prometheus_http_request_duration_seconds_bucket",
"value": 20
}
],
"labelValueCountByLabelName": [
{
"name": "__name__",
"value": 211
},
{
"name": "event",
"value": 3
}
],
"memoryInBytesByLabelName": [
{
"name": "__name__",
"value": 8266
},
{
"name": "instance",
"value": 28
}
],
"seriesCountByLabelValuePair": [
{
"name": "job=prometheus",
"value": 425
},
{
"name": "instance=localhost:9090",
"value": 425
}
]
}
}
v3.6.0 版本新增。
TSDB 块
注意:此端点是实验性的,将来可能会更改。端点名称和返回数据的确切格式可能会在 Prometheus 版本之间更改。此端点返回的确切元数据是实现细节,可能会在将来的 Prometheus 版本中更改。
以下端点返回当前加载的 TSDB 块及其元数据的列表。
GET /api/v1/status/tsdb/blocks
此端点为每个块返回以下信息:
ulid: 块的唯一 ID。minTime: 块的最小时间戳(毫秒)。maxTime: 块的最大时间戳(毫秒)。stats:numSeries: 块中的序列数。numSamples: 块中的样本数。numChunks: 块中的块数。
compaction:level: 块的压缩级别。sources: 用于压缩此块的源块的 ULID 列表。
version: 块版本。
curl https://:9090/api/v1/status/tsdb/blocks
{
"status": "success",
"data": {
"blocks": [
{
"ulid": "01JZ8JKZY6XSK3PTDP9ZKRWT60",
"minTime": 1750860620060,
"maxTime": 1750867200000,
"stats": {
"numSamples": 13701,
"numSeries": 716,
"numChunks": 716
},
"compaction": {
"level": 1,
"sources": [
"01JZ8JKZY6XSK3PTDP9ZKRWT60"
]
},
"version": 1
}
]
}
}
v2.15 版本新增。
WAL 重放统计信息
以下端点返回有关 WAL 重放的信息:
GET /api/v1/status/walreplay
- read: 到目前为止已重放的段数。
- total: 需要重放的总段数。
- progress: 重放进度 (0 - 100%)。
- state: 重放的状态。可能的状态:
- waiting: 等待重放开始。
- in progress: 重放正在进行中。
- done: 重放已完成。
curl https://:9090/api/v1/status/walreplay
{
"status": "success",
"data": {
"min": 2,
"max": 5,
"current": 40,
"state": "in progress"
}
}
注意此端点在服务器标记为就绪之前可用,并实时更新,以方便监控 WAL 重放的进度。
v2.28 版本新增。
TSDB 管理 API
这些 API 为高级用户公开数据库功能。除非设置了 --web.enable-admin-api,否则这些 API 不会启用。
快照
快照将所有当前数据创建快照到 TSDB 数据目录下的 snapshots/<datetime>-<rand> 中,并以目录作为响应返回。它可以选择性地跳过对仅存在于头块中且尚未压缩到磁盘的数据进行快照。
POST /api/v1/admin/tsdb/snapshot
PUT /api/v1/admin/tsdb/snapshot
URL 查询参数:
skip_head=<bool>: 跳过头块中存在的数据。可选。
curl -XPOST https://:9090/api/v1/admin/tsdb/snapshot
{
"status": "success",
"data": {
"name": "20171210T211224Z-2be650b6d019eb54"
}
}
现在,快照存在于 <data-dir>/snapshots/20171210T211224Z-2be650b6d019eb54
v2.1 版本新增,并从 v2.9 开始支持 PUT。
删除序列
DeleteSeries 删除时间范围内选定序列的数据。实际数据仍然存在于磁盘上,并在将来的压缩中进行清理,或者可以通过访问 清理墓碑 端点来明确清理。
如果成功,将返回 204。
POST /api/v1/admin/tsdb/delete_series
PUT /api/v1/admin/tsdb/delete_series
URL 查询参数:
match[]=<series_selector>: 重复的标签匹配器参数,用于选择要删除的序列。必须至少提供一个match[]参数。start=<rfc3339 | unix_timestamp>: 开始时间戳。可选,默认为可能的最小时间。end=<rfc3339 | unix_timestamp>: 结束时间戳。可选,默认为可能的最大时间。
如果不指定开始和结束时间,将清除数据库中匹配序列的所有数据。
示例
curl -X POST \
-g 'https://:9090/api/v1/admin/tsdb/delete_series?match[]=up&match[]=process_start_time_seconds{job="prometheus"}'
注意此端点将序列中的样本标记为已删除,但不一定会阻止相关的序列元数据仍在受影响时间范围的元数据查询中返回(即使在清理墓碑之后)。元数据删除的确切范围是一个实现细节,将来可能会更改。
v2.1 版本新增,并从 v2.9 开始支持 PUT。
清理墓碑
CleanTombstones 从磁盘中删除已删除的数据并清理现有的墓碑。这可以在删除序列后用于释放空间。
如果成功,将返回 204。
POST /api/v1/admin/tsdb/clean_tombstones
PUT /api/v1/admin/tsdb/clean_tombstones
这不需要任何参数或正文。
curl -XPOST https://:9090/api/v1/admin/tsdb/clean_tombstones
v2.1 版本新增,并从 v2.9 开始支持 PUT。
远程写入接收器
Prometheus 可以配置为 Prometheus 远程写入协议的接收器。这不被认为是摄取样本的有效方式。请谨慎用于特定的低容量用例。它不适合替代通过抓取进行摄取,也不适合将 Prometheus 转变为基于推送的指标收集系统。
通过设置 --web.enable-remote-write-receiver 启用远程写入接收器。启用后,远程写入接收器端点为 /api/v1/write。在此处查找更多详细信息:这里。
v2.33 版本新增。
OTLP 接收器
Prometheus 可以配置为 OTLP 指标协议的接收器。这不被认为是摄取样本的有效方式。请谨慎用于特定的低容量用例。它不适合替代通过抓取进行摄取。
通过设置 --web.enable-otlp-receiver 启用 OTLP 接收器。启用后,OTLP 接收器端点为 /api/v1/otlp/v1/metrics。
v2.47 版本新增。
OTLP 增量
Prometheus 可以将传入的增量时序性指标转换为其累积等效项。这是通过使用 OpenTelemetry Collector 的 deltatocumulative 来完成的。
要启用,请传递 --enable-feature=otlp-deltatocumulative。
v3.2 版本新增。
通知
以下端点提供有关 Prometheus 服务器本身的活动状态通知的信息。通知用于 Web UI。
这些端点是实验性的。它们将来可能会更改。
活动通知
/api/v1/notifications 端点返回所有当前活动通知的列表。
GET /api/v1/notifications
示例
curl https://:9090/api/v1/notifications
{
"status": "success",
"data": [
{
"text": "Prometheus is shutting down and gracefully stopping all operations.",
"date": "2024-10-07T12:33:08.551376578+02:00",
"active": true
}
]
}
v3.0 版本新增。
实时通知
/api/v1/notifications/live 端点使用 服务器发送事件 实时流式传输通知。已删除的通知以 active: false 发送。连接到端点时将发送活动通知。
GET /api/v1/notifications/live
示例
curl https://:9090/api/v1/notifications/live
data: {
"status": "success",
"data": [
{
"text": "Prometheus is shutting down and gracefully stopping all operations.",
"date": "2024-10-07T12:33:08.551376578+02:00",
"active": true
}
]
}
注意:如果达到最大订阅者数,/notifications/live 端点将返回 204 No Content 响应。您可以使用 --web.max-notifications-subscribers 标志设置最大侦听器数,默认为 16。
GET /api/v1/notifications/live
204 No Content
v3.0 版本新增。