Skip to content

Глоссарий

Специфичные для проекта термины, используемые в документации и исходном коде. Если у термина есть более длинное рассмотрение, выделенная страница приложена ссылкой.

A

Agent

В Ongrid agent — это сконфигурированный LLM-воркер с конкретной задачей (coordinator, incident investigator, network specialist и т. д.). Каждый agent имеет persona, описывающую, какую модель он запускает, какие tools может вызывать и сколько ReAct-итераций ему выдано. Отличается от "edge agent" — см. Edge.

Agent kernel

Рантайм, который двигает ReAct-петлю агента: сборка prompt'а, разрешение реестра tools, вызов модели, исполнение tool, парсинг ответа. Существует два ядра: graph (по умолчанию; построен на eino) и legacy (for-loop). Переключается через ONGRID_AGENT_KERNEL.

Air-gapped

Деплой без интернет-egress. Ongrid работает полностью оффлайн при наличии локального LLM-relay (например, vLLM, Ollama) и локальной embedding-модели, поставляемой в release-tarball. См. Air-gapped / on-prem.

B

Blast radius

Набор сервисов или хостов, затронутых изменением или инцидентом. Агент вычисляет это, обходя граф топологии (downstream-узлы), перед тем как рекомендовать любое деструктивное действие.

Bounded context (BC)

Поддомен manager'а с собственными пакетами model, biz, data и server. Примеры: iam, edge, device, alert, aiops. Импорты между BC ограничены интерфейс-портами; go-arch-lint enforce'ит границу.

Built-in vault

Дефолтное содержимое базы знаний, упакованное в github.com/ongridio/vault. Manager синхронизирует это при первом boot и re-sync'ает по требованию. Публичный репозиторий; около 96 markdown-playbook'ов.

C

Channel

Цель доставки уведомлений. Типы: webhook, slack, feishu, dingtalk, wecom, telegram. Каждый канал может быть отфильтрован по severity и scope. См. Channels.

Class (tool class)

Классификация tool'а по blast radius: safe (read-only), mutating (обратимая запись), dangerous (необратимая). Поле permission_mode у persona гейтит, какие классы вызываемы. См. Skill manifest.

Cmdpolicy

Edge-side песочница, которая гейтит вызовы скилла bash. Определяет binary-whitelist, argument-matcher'ы, path-allowlist и network-allowlist. Расположена под internal/edgeagent/cmdpolicy. Read-only по умолчанию — переключение на mutating требует явных правок политики.

Control plane

Geminio-туннель. Несёт жизненный цикл edge, RPC, heartbeat'ы, события алертов и (сегодня) push метрик. См. Data plane.

Coordinator

Top-level агент, который декомпозирует пользовательские вопросы, диспатчит specialist sub-агенты и собирает финальный ответ. Имя persona: coordinator. См. Coordinator.

D

Data plane

Независимый исходящий HTTPS-путь, который edges используют для прямой отправки логов и трейсов на публичные ingest-эндпоинты manager'а — отличается от туннеля (control plane). См. Плоскость данных телеметрии.

Dedupe key

Per-rule, per-scope ключ, который evaluator алертов использует для схлопывания повторных срабатываний в один открытый инцидент. Строится из rule_key + scope_type + scope identifier + (опциональные rule-specific измерения). Уникальный индекс на alert_incidents.dedupe_key.

Device

Логический хост. Отличается от edge, который является tunnel-connected agent-процессом. Одно устройство может иметь ноль или много edges (если переустанавливалось). device_id — канонический join-ключ в PromQL-метках и узлах топологии.

E

Edge

Tunnel-connected agent-процесс — ongrid-edge. Идентифицируется edge_id. Один edge на запущенный agent-процесс; одно устройство может host'ить несколько edges за свою жизнь (после переустановок). Правило отображения: страница Edges перечисляет агентов; страница Devices перечисляет хосты.

Edge bundle

Tarball, который manager шлёт на edge для whole-bundle апгрейда (ADR-024). Содержит agent-бинарь плюс каждый плагин-бинарь, всё для целевой архитектуры. Stage'ится в /var/lib/ongrid-edge/.upgrade/ и свопается при следующем boot.

eino

Библиотека graph-ядра, которую Ongrid использует для ReAct-петли агента (ONGRID_AGENT_KERNEL=graph). Предоставляет примитивы prompt-assembly, tool-call и graph-execution.

F

Frontier

Upstream geminio-брокер (github.com/singchia/frontier, ADR-007). Edge дозванивается на порт 40012; manager дозванивается на порт 40011 через docker-сеть. Поставляется как docker-image, упакованный в release-tarball.

G

geminio

TLS-based multi-stream туннельный протокол (github.com/singchia/geminio), который реализует frontier-брокер Ongrid. Поддерживает request/response RPC + raw-потоки поверх одного persistent TLS-соединения.

Grafana embed

Страница Monitor рендерит Grafana-панели через iframe (solo-mode URLs) под /grafana/.... nginx фронтит и manager API, и Grafana embed на одном origin; iframe разрешён через GF_SECURITY_ALLOW_EMBEDDING=true.

H

Health (plugin)

Сообщаемое supervisor'ом runtime-состояние плагина edge: running, crashed, starting, stopping. Surface'ится через GET /v1/edges/{id}/plugins и на странице Edges рядом с каждым plugin-toggle.

I

IM bridge

Bounded context, который соединяет чат Ongrid с внешними IM-платформами (Slack, Telegram, Lark, DingTalk, WeCom). Одна строка в im_apps на зарегистрированное приложение. Входящие события на /v1/im/<provider>/events конвертируются в chat-сессии.

Incident

Сработавший алерт. Один инцидент на (rule, scope) tuple, дедуплицируется через dedupe key. Имеет жизненный цикл (open → acknowledged → resolved), таймлайн событий и опционально AI-сгенерированный investigation-отчёт.

J

join_mode

Поле правила: all или any. Определяет, должна ли каждая запись в conditions[] совпасть, чтобы правило сработало (по умолчанию all), или любая одна (any).

K

Kind (rule kind)

Дискриминатор, который определяет, какой sub-evaluator работает над conditions правила. Phase-A: metric_raw, metric_anomaly, metric_forecast, metric_burn_rate. Phase-B: log_match, log_volume, trace_latency, trace_error_rate. Плюс UI-only input kind metric_threshold. См. схему правила алерта.

L

Loki

Лог-хранилище Grafana (ADR-012). Упаковано в compose-стек как loki:3.4.0. Edges push'ат через data plane; manager запрашивает через /v1/logs/query_range.

M

Marketplace

Система дистрибуции skill-паков (ADR-017). Пак — это директория скиллов + агентов + манифест. Установка через POST /v1/marketplace/install. Registry указывают на HTTPS-hosted индексы.

Mention

Синтаксис автодополнения @edge, @device, @dashboard, @incident в chat-box. Manager резолвит их в структурированный контекст перед отправкой сообщения LLM.

N

NotifyWindowSeconds / NotifyMinFires

Per-rule пара damping'а уведомлений. Правило, срабатывающее меньше чем NotifyMinFires раз внутри trailing NotifyWindowSeconds, пишет событие repeat_suppressed, но не отправляет уведомление. См. схему правила алерта.

O

OTLP

OpenTelemetry Protocol — wire-формат, который edges используют для отправки трейсов (через otelcol-contrib) к эндпоинту manager'а /v1/traces.

otelcol-contrib

Дистрибутив OpenTelemetry Collector contrib. Упакован в release-tarball как trace-плагин. Subprocess, управляемый supervisor'ом плагинов агента.

P

Persona

Определение поведения агента — markdown-файл с YAML frontmatter (name, description, when_to_use, tools, model, permission_mode, system prompt). См. формат persona агента.

Pluggable embedding

RAG-pipeline поддерживает три embedding-провайдера: zhipu (по умолчанию, GLM embedding API), openai и local (on-disk bge-модель). Переключение через ONGRID_EMBEDDING_PROVIDER.

Plugin (edge plugin)

Subprocess, управляемый supervisor'ом edge-агента: promtail (логи), node_exporter (host-метрики), process_exporter (proc-метрики), otelcol-contrib (трейсы). Конфигурируется через PUT /v1/edges/{id}/plugins/{name}.

promtail

Log-shipper Grafana. Упакован в release-tarball как log-плагин. Subprocess edge-агента.

push_prom_samples

Tunnel-side RPC push'а метрик. Несёт сэмплы метрик edge к cloud Prom manager'а. Сегодня на control plane; потенциально переезжает в data plane — см. триггеры миграции в Плоскость данных телеметрии.

Q

query_promql / query_traceql / search_logs

Три из core observability-tools, которые агент может вызывать. Они проксируются через manager к Prom / Tempo / Loki соответственно, возвращая структурированные результаты, над которыми LLM может рассуждать.

R

RAG

Retrieval-Augmented Generation. База знаний Ongrid (vault + repos + загруженные доки) индексируется в Qdrant; запросы к агенту автоматически извлекают top-k чанки. См. Возможности → База знаний.

RCA

Root Cause Analysis (анализ корневой причины). Investigation-pipeline агента, который идёт от симптома алерта через топологию + метрики + логи + трейсы + исходный код к верифицируемому утверждению о причине.

ReAct

Петля "Reason + Act": агент думает (собирает tool-план), действует (вызывает tool), наблюдает (читает результат), затем зацикливается. Ограничено max_turns на persona.

Rule key

Стабильный lower_snake идентификатор для правила алерта. Используется в dedupe-ключах и incident.rule. Уникален среди non-soft-deleted строк.

S

Scope type

Поле правила: host, global или monitoring_pipeline. Определяет измерение группировки evaluator'а. host производит один инцидент на device_id; global производит один инцидент system-wide; monitoring_pipeline — для внутренних правил здоровья pipeline.

Severity

Alert / channel severity floor: info, warning, critical. match_severity_min=warning канала принимает warning + critical; critical принимает только critical.

Skill

Tool, который агент может вызвать. Либо встроенный (вкомпилирован в бинарь), либо внешний (subprocess с манифестом skill.json). Оба живут в одном реестре; LLM не различает. См. Skill manifest.

SOP (dual-sign)

Двухшаговый flow подтверждения для dangerous tool-вызовов. Persona должна иметь permission_mode: dual-sign-required; рантайм представляет планируемый вызов на review, затем исполняет только после явного подтверждения.

Specialist

Не-coordinator persona агента — incident investigator, network, compute, disk, SRE. Coordinator выбирает одного, сопоставляя запрос пользователя с полем when_to_use каждой persona. См. Specialists.

T

Tempo

Trace-хранилище Grafana (ADR-013). Упаковано как tempo:2.5.0. Edges push'ат через OTLP; manager запрашивает через TraceQL.

Tenant

Логическая граница изоляции (org + участники). Single-tenant в open-source MVP — tenant-логика существует в схеме, но эвалится в "все в одном tenant", пока не поставлены multi-tenant фичи.

Tool

LLM-facing handle к скиллу. Скилл может объявить несколько tools (через список SKILL.md tools:). На рантайме каждый tool имеет имя, описание, JSON Schema, class и when_to_use-подсказку.

ToolBag deferral

Оптимизация для больших реестров скиллов. Когда количество tools превышает ONGRID_TOOLBAG_DEFERRAL_THRESHOLD (по умолчанию 30), специальные tools получают отредактированные схемы в prompt'е. LLM должна вызвать ToolSearch, чтобы расширить отредактированный tool перед использованием. Экономит токены prompt'а.

Topology

Типизированный CMDB (узлы + связи) под internal/manager/server/topology. Узлы имеют type (service, host, database, queue, ...) со схемой; связи имеют type (depends_on, runs_on, served_by). Агент обходит топологию для вычисления blast radius.

Tunnel

Geminio TLS-соединение от edge до брокера (frontier). См. Control plane и geminio.

V

Vault

Встроенный репозиторий базы знаний (github.com/ongridio/vault). Синхронизируется в RAG-хранилище manager'а при первом boot. См. Built-in vault.

W

WebSSH

Browser-based shell поверх туннеля. Edge port-forward'ит байты к локальному sshd; SSH-клиент целиком живёт в manager'е. См. Возможности → WebShell.

when_to_use

Поле persona / skill / tool frontmatter, которое даёт coordinator'у (или LLM) однострочную "когда это должно быть выбрано" decision-подсказку. Отличается от description, который "что это".

Z

Zhipu / GLM

LLM-провайдер по умолчанию в деплоях с китайской сетью. Модели включают glm-4.7, glm-5, glm-5.1. Конфигурируется через env-переменные ONGRID_ZHIPU_*.