Skip to content

용어집

문서와 소스 전반에서 쓰이는 프로젝트 고유 용어들. 더 길게 다루는 항목이 있는 경우 전용 페이지를 링크합니다.

A

Agent

Ongrid 에서 agent 는 특정 작업 (coordinator, incident investigator, network specialist 등) 을 가진 구성된 LLM 워커입니다. 각 에이전트는 어떤 모델 위에서 도는지, 어떤 도구를 호출할 수 있는지, ReAct 턴이 몇 번 주어지는지를 기술하는 persona 를 가집니다. "edge agent" 와는 구분됩니다 — Edge 참고.

Agent kernel

에이전트의 ReAct 루프를 구동하는 런타임: 프롬프트 조립, 도구 레지스트리 해석, 모델 호출, 도구 실행, 응답 파싱. 두 가지 커널이 존재합니다: graph (기본; eino 위) 와 legacy (for-loop). ONGRID_AGENT_KERNEL 로 전환합니다.

Air-gapped

인터넷 egress 가 없는 배포. 로컬 LLM 릴레이 (예: vLLM, Ollama) 와 릴리스 tarball 에 번들된 로컬 임베딩 모델이 주어지면 Ongrid 는 완전 오프라인에서 동작합니다. 에어갭 / on-prem 참고.

B

Blast radius

변경이나 incident 의 영향을 받는 서비스 또는 호스트 집합. 에이전트는 어떤 파괴적 액션을 권고하기 전에 토폴로지 그래프 (하류 노드) 를 순회하여 이를 계산합니다.

Bounded context (BC)

매니저의 서브도메인 — 자체 model, biz, data, server 패키지를 가집니다. 예: iam, edge, device, alert, aiops. BC 간 import 는 인터페이스 포트에 한정되며, go-arch-lint 가 경계를 강제합니다.

Built-in vault

github.com/ongridio/vault 에 번들된 기본 지식 베이스 콘텐츠. 매니저는 첫 부팅에 동기화하고 필요 시 재동기화합니다. 공개 저장소이며 약 96 개의 markdown playbook 을 담습니다.

C

Channel

알림의 전달 대상. 타입: webhook, slack, feishu, dingtalk, wecom, telegram. 각 채널은 심각도와 scope 로 필터링 가능합니다. 채널 참고.

Class (tool class)

도구의 영향 범위 분류: safe (읽기 전용), mutating (가역 쓰기), dangerous (불가역). persona 의 permission_mode 필드가 호출 가능한 클래스를 게이팅합니다. Skill manifest 참고.

Cmdpolicy

bash skill 호출을 게이팅하는 edge 측 샌드박스. 바이너리 화이트리스트, 인수 매처, 경로 허용 목록, 네트워크 허용 목록을 정의합니다. internal/edgeagent/cmdpolicy 에 위치. 기본은 읽기 전용 — mutating 으로 전환하려면 명시적 정책 편집이 필요합니다.

Control plane

geminio 터널. edge 라이프사이클, RPC, 하트비트, 알림 이벤트, (오늘) 메트릭 push 를 운반합니다. Data plane 참고.

Coordinator

사용자 질문을 분해하고 specialist 서브에이전트를 디스패치하며 최종 답을 조립하는 최상위 에이전트. persona 이름: coordinator. Coordinator 참고.

D

Data plane

edge 가 로그와 트레이스를 매니저의 공개 ingest 엔드포인트로 직접 보내기 위해 사용하는 독립적인 아웃바운드 HTTPS 경로 — 터널 (컨트롤 플레인) 과는 다릅니다. 텔레메트리 데이터 플레인 참고.

Dedupe key

알림 evaluator 가 반복 발생을 하나의 열린 incident 로 모으는 데 쓰는 규칙별, scope 별 키. rule_key + scope_type + scope identifier + (선택적 규칙별 차원) 으로 구성됩니다. alert_incidents.dedupe_key 에 고유 인덱스.

Device

논리적 호스트. 터널 연결된 에이전트 프로세스인 edge 와 구분됩니다. 한 device 는 0 개 또는 많은 edge 를 가질 수 있습니다 (재설치 시). device_id 는 PromQL 라벨과 토폴로지 노드에서의 정규 join 키입니다.

E

Edge

터널 연결된 에이전트 프로세스 — ongrid-edge. edge_id 로 식별. 실행 중인 에이전트 프로세스당 하나의 edge; 한 device 는 라이프사이클 동안 (재설치 후) 여러 edge 를 호스팅할 수 있습니다. 표시 규칙: Edges 페이지는 에이전트를, Devices 페이지는 호스트를 나열.

Edge bundle

매니저가 whole-bundle 업그레이드 (ADR-024) 를 위해 edge 로 보내는 tarball. 대상 아키텍처용 에이전트 바이너리와 모든 플러그인 바이너리를 담습니다. /var/lib/ongrid-edge/.upgrade/ 에 스테이징되고 다음 부팅 시 교체됩니다.

eino

Ongrid 가 에이전트의 ReAct 루프 (ONGRID_AGENT_KERNEL=graph) 에 사용하는 그래프 커널 라이브러리. 프롬프트 조립, 도구 호출, 그래프 실행 프리미티브를 제공합니다.

F

Frontier

업스트림 geminio 브로커 (github.com/singchia/frontier, ADR-007). edge 는 40012 포트로 dial 하고, 매니저는 docker 네트워크로 40011 포트에 dial 합니다. 릴리스 tarball 에 docker 이미지로 번들됩니다.

G

geminio

Ongrid 의 frontier 브로커가 구현하는 TLS 기반 다중 스트림 터널 프로토콜 (github.com/singchia/geminio). 하나의 영속 TLS 연결 위에서 요청/응답 RPC + raw 스트림을 지원합니다.

Grafana embed

Monitor 페이지는 /grafana/... 아래에서 (solo-mode URL) iframe 으로 Grafana 패널을 렌더링합니다. nginx 가 매니저 API 와 Grafana 임베드를 같은 origin 에서 프록시하며, GF_SECURITY_ALLOW_EMBEDDING=true 로 iframe 이 허용됩니다.

H

Health (plugin)

edge 플러그인의 supervisor 보고 런타임 상태: running, crashed, starting, stopping. GET /v1/edges/{id}/plugins 와 Edges 페이지의 각 플러그인 토글 옆에 노출됩니다.

I

IM bridge

Ongrid chat 을 외부 IM 플랫폼 (Slack, Telegram, Lark, DingTalk, WeCom) 에 연결하는 bounded context. 등록된 앱당 im_apps 의 한 행. /v1/im/<provider>/events 의 인바운드 이벤트는 chat 세션으로 변환됩니다.

Incident

발생한 알림. (rule, scope) 튜플당 하나의 incident 가 dedupe key 로 중복 제거됩니다. 라이프사이클 (open → acknowledged → resolved), 이벤트 타임라인, 그리고 선택적으로 AI 생성 조사 보고서를 가집니다.

J

join_mode

규칙 필드: all 또는 any. 규칙이 발생하려면 conditions[] 의 모든 항목이 매치되어야 하는지 (기본 all) 또는 하나라도 매치되면 (any) 되는지를 결정합니다.

K

Kind (rule kind)

규칙의 conditions 위에 어떤 서브 evaluator 가 도는지를 구분하는 discriminator. Phase-A: metric_raw, metric_anomaly, metric_forecast, metric_burn_rate. Phase-B: log_match, log_volume, trace_latency, trace_error_rate. 그리고 UI 전용 입력 kind metric_threshold. 알림 규칙 스키마 참고.

L

Loki

Grafana 의 로그 저장소 (ADR-012). compose 스택에 loki:3.4.0 으로 번들됩니다. edge 는 데이터 플레인을 통해 push, 매니저는 /v1/logs/query_range 로 질의.

M

Marketplace

skill-pack 배포 시스템 (ADR-017). pack 은 skill + agent + manifest 의 디렉터리입니다. POST /v1/marketplace/install 로 설치. 레지스트리는 HTTPS 호스팅 인덱스를 가리킵니다.

Mention

chat 박스의 @edge, @device, @dashboard, @incident 자동완성 문법. 매니저는 메시지를 LLM 으로 보내기 전에 이들을 구조화된 컨텍스트로 해석합니다.

N

NotifyWindowSeconds / NotifyMinFires

규칙별 알림 dampening 쌍. 직전 NotifyWindowSeconds 안에서 NotifyMinFires 보다 적게 발생한 규칙은 repeat_suppressed 이벤트를 기록하지만 알림을 보내지 않습니다. 알림 규칙 스키마 참고.

O

OTLP

OpenTelemetry Protocol — edge 가 (via otelcol-contrib) 매니저의 /v1/traces 엔드포인트로 트레이스를 보낼 때 쓰는 와이어 포맷.

otelcol-contrib

OpenTelemetry Collector contrib 배포본. 릴리스 tarball 에 트레이스 플러그인으로 번들됩니다. 에이전트의 플러그인 supervisor 가 관리하는 subprocess.

P

Persona

에이전트의 행동 정의 — YAML frontmatter 가 있는 markdown 파일 (name, description, when_to_use, tools, model, permission_mode, system prompt). 에이전트 persona 포맷 참고.

Pluggable embedding

RAG 파이프라인은 세 가지 임베딩 제공자를 지원합니다: zhipu (기본, GLM 임베딩 API), openai, local (디스크의 bge 모델). ONGRID_EMBEDDING_PROVIDER 로 전환.

Plugin (edge plugin)

edge 에이전트의 supervisor 가 관리하는 subprocess: promtail (로그), node_exporter (호스트 메트릭), process_exporter (프로세스 메트릭), otelcol-contrib (트레이스). PUT /v1/edges/{id}/plugins/{name} 로 구성.

promtail

Grafana 의 로그 shipper. 릴리스 tarball 에 로그 플러그인으로 번들. edge 에이전트의 subprocess.

push_prom_samples

터널 측 메트릭 push RPC. edge 메트릭 샘플을 매니저의 cloud Prom 으로 운반합니다. 오늘은 컨트롤 플레인 위에 있고, 데이터 플레인으로 잠재적으로 이동 가능 — 텔레메트리 데이터 플레인 의 마이그레이션 트리거 참고.

Q

query_promql / query_traceql / search_logs

에이전트가 호출할 수 있는 핵심 가관측성 도구 셋. 각각 매니저를 통해 Prom / Tempo / Loki 로 프록시되며, LLM 이 추론할 수 있는 구조화 결과를 반환합니다.

R

RAG

Retrieval-Augmented Generation. Ongrid 의 지식 베이스 (vault + repo + 업로드 문서) 가 Qdrant 에 인덱싱되며, 에이전트로의 질의는 자동으로 top-k 청크를 검색합니다. Capabilities → 지식 베이스 참고.

RCA

Root Cause Analysis (근본 원인 분석). 알림 증상에서 출발해 토폴로지 + 메트릭 + 로그 + 트레이스 + 소스를 따라 검증 가능한 원인 진술까지 도달하는 에이전트의 조사 파이프라인.

ReAct

"Reason + Act" 루프: 에이전트가 생각하고 (도구 계획 조립), 행동하고 (도구 호출), 관찰한 뒤 (결과 읽기), 다시 반복합니다. persona 의 max_turns 로 제한됩니다.

Rule key

알림 규칙의 안정적 lower_snake 식별자. dedupe 키와 incident.rule 에 사용. soft delete 되지 않은 행들 사이에서 유일.

S

Scope type

규칙 필드: host, global, 또는 monitoring_pipeline. evaluator 의 그룹핑 차원을 결정합니다. hostdevice_id 당 하나의 incident, global 은 시스템 전체에 하나의 incident, monitoring_pipeline 은 내부 파이프라인 헬스 규칙용.

Severity

알림 / 채널 심각도 바닥값: info, warning, critical. 채널의 match_severity_min=warningwarning + critical 을 받고, criticalcritical 만 받습니다.

Skill

에이전트가 호출할 수 있는 도구. 빌트인 (바이너리에 컴파일됨) 이거나 외부 (skill.json 매니페스트가 있는 subprocess) 입니다. 둘 다 같은 레지스트리에 살며, LLM 은 둘을 구분하지 않습니다. Skill manifest 참고.

SOP (dual-sign)

dangerous 도구 호출을 위한 2단계 확인 흐름. persona 는 permission_mode: dual-sign-required 여야 하며, 런타임이 계획된 호출을 리뷰용으로 제시하고 명시적 확인이 있어야만 실행합니다.

Specialist

coordinator 가 아닌 에이전트 persona — incident investigator, network, compute, disk, SRE. coordinator 는 사용자 질의를 각 persona 의 when_to_use 와 매칭해 하나를 고릅니다. Specialists 참고.

T

Tempo

Grafana 의 트레이스 저장소 (ADR-013). tempo:2.5.0 으로 번들. edge 는 OTLP 로 push, 매니저는 TraceQL 로 질의.

Tenant

논리적 격리 경계 (org + 멤버). 오픈 소스 MVP 에서는 단일 테넌트입니다 — 스키마에는 tenant 로직이 존재하지만, multi-tenant 기능이 배포될 때까지 "같은 테넌트의 모든 사람" 으로 평가됩니다.

Tool

skill 에 대한 LLM 노출 핸들. 한 skill 은 (SKILL.md tools: 리스트로) 여러 도구를 선언할 수 있습니다. 런타임에서 각 도구는 이름, 설명, JSON Schema, class, when_to_use 힌트를 가집니다.

ToolBag deferral

큰 skill 레지스트리를 위한 최적화. 도구 수가 ONGRID_TOOLBAG_DEFERRAL_THRESHOLD (기본 30) 를 초과하면 specialty 등급 도구는 프롬프트에서 redacted 스키마 를 받습니다. LLM 은 redacted 도구를 쓰기 전에 ToolSearch 를 호출해 확장해야 합니다. 프롬프트 토큰을 절약합니다.

Topology

internal/manager/server/topology 아래의 타입드 CMDB (노드 + 관계). 노드는 스키마가 있는 type (service, host, database, queue, ...) 을 가지며, 관계는 type (depends_on, runs_on, served_by) 을 가집니다. 에이전트는 토폴로지를 순회해 blast radius 를 계산합니다.

Tunnel

edge 에서 브로커 (frontier) 로 가는 geminio TLS 연결. Control planegeminio 참고.

V

Vault

내장 지식 베이스 저장소 (github.com/ongridio/vault). 첫 부팅에 매니저의 RAG 저장소로 동기화됩니다. Built-in vault 참고.

W

WebSSH

터널 위의 브라우저 기반 shell. edge 가 로컬 sshd 로 바이트를 포워딩하며, SSH 클라이언트는 전적으로 매니저 안에 있습니다. Capabilities → WebShell 참고.

when_to_use

persona / skill / tool 의 frontmatter 필드 — coordinator (또는 LLM) 에게 "언제 이걸 골라야 하는가" 의 한 줄 결정 힌트를 줍니다. "무엇인가" 를 말하는 description 과 구분됩니다.

Z

Zhipu / GLM

중국 네트워크 배포에서의 기본 LLM 제공자. 모델은 glm-4.7, glm-5, glm-5.1 등을 포함합니다. ONGRID_ZHIPU_* env 변수로 구성.