Глоссарий
Специфичные для проекта термины, используемые в документации и исходном коде. Если у термина есть более длинное рассмотрение, выделенная страница приложена ссылкой.
A
Agent
В Ongrid agent — это сконфигурированный LLM-воркер с конкретной задачей (coordinator, incident investigator, network specialist и т. д.). Каждый agent имеет persona, описывающую, какую модель он запускает, какие tools может вызывать и сколько ReAct-итераций ему выдано. Отличается от "edge agent" — см. Edge.
Agent kernel
Рантайм, который двигает ReAct-петлю агента: сборка prompt'а, разрешение реестра tools, вызов модели, исполнение tool, парсинг ответа. Существует два ядра: graph (по умолчанию; построен на eino) и legacy (for-loop). Переключается через ONGRID_AGENT_KERNEL.
Air-gapped
Деплой без интернет-egress. Ongrid работает полностью оффлайн при наличии локального LLM-relay (например, vLLM, Ollama) и локальной embedding-модели, поставляемой в release-tarball. См. Air-gapped / on-prem.
B
Blast radius
Набор сервисов или хостов, затронутых изменением или инцидентом. Агент вычисляет это, обходя граф топологии (downstream-узлы), перед тем как рекомендовать любое деструктивное действие.
Bounded context (BC)
Поддомен manager'а с собственными пакетами model, biz, data и server. Примеры: iam, edge, device, alert, aiops. Импорты между BC ограничены интерфейс-портами; go-arch-lint enforce'ит границу.
Built-in vault
Дефолтное содержимое базы знаний, упакованное в github.com/ongridio/vault. Manager синхронизирует это при первом boot и re-sync'ает по требованию. Публичный репозиторий; около 96 markdown-playbook'ов.
C
Channel
Цель доставки уведомлений. Типы: webhook, slack, feishu, dingtalk, wecom, telegram. Каждый канал может быть отфильтрован по severity и scope. См. Channels.
Class (tool class)
Классификация tool'а по blast radius: safe (read-only), mutating (обратимая запись), dangerous (необратимая). Поле permission_mode у persona гейтит, какие классы вызываемы. См. Skill manifest.
Cmdpolicy
Edge-side песочница, которая гейтит вызовы скилла bash. Определяет binary-whitelist, argument-matcher'ы, path-allowlist и network-allowlist. Расположена под internal/edgeagent/cmdpolicy. Read-only по умолчанию — переключение на mutating требует явных правок политики.
Control plane
Geminio-туннель. Несёт жизненный цикл edge, RPC, heartbeat'ы, события алертов и (сегодня) push метрик. См. Data plane.
Coordinator
Top-level агент, который декомпозирует пользовательские вопросы, диспатчит specialist sub-агенты и собирает финальный ответ. Имя persona: coordinator. См. Coordinator.
D
Data plane
Независимый исходящий HTTPS-путь, который edges используют для прямой отправки логов и трейсов на публичные ingest-эндпоинты manager'а — отличается от туннеля (control plane). См. Плоскость данных телеметрии.
Dedupe key
Per-rule, per-scope ключ, который evaluator алертов использует для схлопывания повторных срабатываний в один открытый инцидент. Строится из rule_key + scope_type + scope identifier + (опциональные rule-specific измерения). Уникальный индекс на alert_incidents.dedupe_key.
Device
Логический хост. Отличается от edge, который является tunnel-connected agent-процессом. Одно устройство может иметь ноль или много edges (если переустанавливалось). device_id — канонический join-ключ в PromQL-метках и узлах топологии.
E
Edge
Tunnel-connected agent-процесс — ongrid-edge. Идентифицируется edge_id. Один edge на запущенный agent-процесс; одно устройство может host'ить несколько edges за свою жизнь (после переустановок). Правило отображения: страница Edges перечисляет агентов; страница Devices перечисляет хосты.
Edge bundle
Tarball, который manager шлёт на edge для whole-bundle апгрейда (ADR-024). Содержит agent-бинарь плюс каждый плагин-бинарь, всё для целевой архитектуры. Stage'ится в /var/lib/ongrid-edge/.upgrade/ и свопается при следующем boot.
eino
Библиотека graph-ядра, которую Ongrid использует для ReAct-петли агента (ONGRID_AGENT_KERNEL=graph). Предоставляет примитивы prompt-assembly, tool-call и graph-execution.
F
Frontier
Upstream geminio-брокер (github.com/singchia/frontier, ADR-007). Edge дозванивается на порт 40012; manager дозванивается на порт 40011 через docker-сеть. Поставляется как docker-image, упакованный в release-tarball.
G
geminio
TLS-based multi-stream туннельный протокол (github.com/singchia/geminio), который реализует frontier-брокер Ongrid. Поддерживает request/response RPC + raw-потоки поверх одного persistent TLS-соединения.
Grafana embed
Страница Monitor рендерит Grafana-панели через iframe (solo-mode URLs) под /grafana/.... nginx фронтит и manager API, и Grafana embed на одном origin; iframe разрешён через GF_SECURITY_ALLOW_EMBEDDING=true.
H
Health (plugin)
Сообщаемое supervisor'ом runtime-состояние плагина edge: running, crashed, starting, stopping. Surface'ится через GET /v1/edges/{id}/plugins и на странице Edges рядом с каждым plugin-toggle.
I
IM bridge
Bounded context, который соединяет чат Ongrid с внешними IM-платформами (Slack, Telegram, Lark, DingTalk, WeCom). Одна строка в im_apps на зарегистрированное приложение. Входящие события на /v1/im/<provider>/events конвертируются в chat-сессии.
Incident
Сработавший алерт. Один инцидент на (rule, scope) tuple, дедуплицируется через dedupe key. Имеет жизненный цикл (open → acknowledged → resolved), таймлайн событий и опционально AI-сгенерированный investigation-отчёт.
J
join_mode
Поле правила: all или any. Определяет, должна ли каждая запись в conditions[] совпасть, чтобы правило сработало (по умолчанию all), или любая одна (any).
K
Kind (rule kind)
Дискриминатор, который определяет, какой sub-evaluator работает над conditions правила. Phase-A: metric_raw, metric_anomaly, metric_forecast, metric_burn_rate. Phase-B: log_match, log_volume, trace_latency, trace_error_rate. Плюс UI-only input kind metric_threshold. См. схему правила алерта.
L
Loki
Лог-хранилище Grafana (ADR-012). Упаковано в compose-стек как loki:3.4.0. Edges push'ат через data plane; manager запрашивает через /v1/logs/query_range.
M
Marketplace
Система дистрибуции skill-паков (ADR-017). Пак — это директория скиллов + агентов + манифест. Установка через POST /v1/marketplace/install. Registry указывают на HTTPS-hosted индексы.
Mention
Синтаксис автодополнения @edge, @device, @dashboard, @incident в chat-box. Manager резолвит их в структурированный контекст перед отправкой сообщения LLM.
N
NotifyWindowSeconds / NotifyMinFires
Per-rule пара damping'а уведомлений. Правило, срабатывающее меньше чем NotifyMinFires раз внутри trailing NotifyWindowSeconds, пишет событие repeat_suppressed, но не отправляет уведомление. См. схему правила алерта.
O
OTLP
OpenTelemetry Protocol — wire-формат, который edges используют для отправки трейсов (через otelcol-contrib) к эндпоинту manager'а /v1/traces.
otelcol-contrib
Дистрибутив OpenTelemetry Collector contrib. Упакован в release-tarball как trace-плагин. Subprocess, управляемый supervisor'ом плагинов агента.
P
Persona
Определение поведения агента — markdown-файл с YAML frontmatter (name, description, when_to_use, tools, model, permission_mode, system prompt). См. формат persona агента.
Pluggable embedding
RAG-pipeline поддерживает три embedding-провайдера: zhipu (по умолчанию, GLM embedding API), openai и local (on-disk bge-модель). Переключение через ONGRID_EMBEDDING_PROVIDER.
Plugin (edge plugin)
Subprocess, управляемый supervisor'ом edge-агента: promtail (логи), node_exporter (host-метрики), process_exporter (proc-метрики), otelcol-contrib (трейсы). Конфигурируется через PUT /v1/edges/{id}/plugins/{name}.
promtail
Log-shipper Grafana. Упакован в release-tarball как log-плагин. Subprocess edge-агента.
push_prom_samples
Tunnel-side RPC push'а метрик. Несёт сэмплы метрик edge к cloud Prom manager'а. Сегодня на control plane; потенциально переезжает в data plane — см. триггеры миграции в Плоскость данных телеметрии.
Q
query_promql / query_traceql / search_logs
Три из core observability-tools, которые агент может вызывать. Они проксируются через manager к Prom / Tempo / Loki соответственно, возвращая структурированные результаты, над которыми LLM может рассуждать.
R
RAG
Retrieval-Augmented Generation. База знаний Ongrid (vault + repos + загруженные доки) индексируется в Qdrant; запросы к агенту автоматически извлекают top-k чанки. См. Возможности → База знаний.
RCA
Root Cause Analysis (анализ корневой причины). Investigation-pipeline агента, который идёт от симптома алерта через топологию + метрики + логи + трейсы + исходный код к верифицируемому утверждению о причине.
ReAct
Петля "Reason + Act": агент думает (собирает tool-план), действует (вызывает tool), наблюдает (читает результат), затем зацикливается. Ограничено max_turns на persona.
Rule key
Стабильный lower_snake идентификатор для правила алерта. Используется в dedupe-ключах и incident.rule. Уникален среди non-soft-deleted строк.
S
Scope type
Поле правила: host, global или monitoring_pipeline. Определяет измерение группировки evaluator'а. host производит один инцидент на device_id; global производит один инцидент system-wide; monitoring_pipeline — для внутренних правил здоровья pipeline.
Severity
Alert / channel severity floor: info, warning, critical. match_severity_min=warning канала принимает warning + critical; critical принимает только critical.
Skill
Tool, который агент может вызвать. Либо встроенный (вкомпилирован в бинарь), либо внешний (subprocess с манифестом skill.json). Оба живут в одном реестре; LLM не различает. См. Skill manifest.
SOP (dual-sign)
Двухшаговый flow подтверждения для dangerous tool-вызовов. Persona должна иметь permission_mode: dual-sign-required; рантайм представляет планируемый вызов на review, затем исполняет только после явного подтверждения.
Specialist
Не-coordinator persona агента — incident investigator, network, compute, disk, SRE. Coordinator выбирает одного, сопоставляя запрос пользователя с полем when_to_use каждой persona. См. Specialists.
T
Tempo
Trace-хранилище Grafana (ADR-013). Упаковано как tempo:2.5.0. Edges push'ат через OTLP; manager запрашивает через TraceQL.
Tenant
Логическая граница изоляции (org + участники). Single-tenant в open-source MVP — tenant-логика существует в схеме, но эвалится в "все в одном tenant", пока не поставлены multi-tenant фичи.
Tool
LLM-facing handle к скиллу. Скилл может объявить несколько tools (через список SKILL.md tools:). На рантайме каждый tool имеет имя, описание, JSON Schema, class и when_to_use-подсказку.
ToolBag deferral
Оптимизация для больших реестров скиллов. Когда количество tools превышает ONGRID_TOOLBAG_DEFERRAL_THRESHOLD (по умолчанию 30), специальные tools получают отредактированные схемы в prompt'е. LLM должна вызвать ToolSearch, чтобы расширить отредактированный tool перед использованием. Экономит токены prompt'а.
Topology
Типизированный CMDB (узлы + связи) под internal/manager/server/topology. Узлы имеют type (service, host, database, queue, ...) со схемой; связи имеют type (depends_on, runs_on, served_by). Агент обходит топологию для вычисления blast radius.
Tunnel
Geminio TLS-соединение от edge до брокера (frontier). См. Control plane и geminio.
V
Vault
Встроенный репозиторий базы знаний (github.com/ongridio/vault). Синхронизируется в RAG-хранилище manager'а при первом boot. См. Built-in vault.
W
WebSSH
Browser-based shell поверх туннеля. Edge port-forward'ит байты к локальному sshd; SSH-клиент целиком живёт в manager'е. См. Возможности → WebShell.
when_to_use
Поле persona / skill / tool frontmatter, которое даёт coordinator'у (или LLM) однострочную "когда это должно быть выбрано" decision-подсказку. Отличается от description, который "что это".
Z
Zhipu / GLM
LLM-провайдер по умолчанию в деплоях с китайской сетью. Модели включают glm-4.7, glm-5, glm-5.1. Конфигурируется через env-переменные ONGRID_ZHIPU_*.