Schnellstart

Ziel: in etwa 10 Minuten haben Sie…

Den vollständigen Ongrid-Stack auf einer einzelnen Linux-Maschine via docker compose laufen (Manager + Frontier-Broker + Prometheus + Loki + Tempo + Grafana + Qdrant + SearXNG).
Den Admin-Benutzer über HTTPS angemeldet.
Eine ongrid-edge gegen Ihren Manager registriert, die CPU-/Speicher-/Disk-Metriken liefert, die Sie auf der Monitor-Seite sehen können.

Wenn Sie eine tiefergehende Anleitung möchten, lesen Sie stattdessen Server-Installation und Edge-Installation.

0. Voraussetzungen

Eine Linux-Maschine (Ubuntu 22.04+, Debian 12+, RHEL/Rocky/Alma 9+ getestet).

Mindestens 4 GB RAM (8 GB empfohlen)
20 GB freier Speicherplatz unter /var/lib/ongrid (das Datenverzeichnis)
root oder sudo
docker ≥ 24 mit dem docker compose v2 Subcommand
openssl (wird zum Erstellen des selbstsignierten TLS-Zertifikats beim ersten Start verwendet)
TCP 443 und 40012 offen zu den Hosts, auf denen Ihre Edges laufen werden

Für lokales Testen

Sie können alles auf einem Laptop ausführen. Beachten Sie nur, dass ONGRID_PUBLIC_URL standardmäßig auf die LAN-IP des Laptops gesetzt wird, sodass jede Edge, die Sie auf einer anderen Maschine installieren, diese LAN-IP über TCP/443 erreichen können muss.

1. Den Server installieren

Der kanonische Installationspfad ist gh release download plus sudo ./install.sh. Das Tarball ist eigenständig — Docker-Images, Edge-Binaries, Konfigurationsdateien, alles gebündelt.

bash

# Pick the latest tag from https://github.com/ongridio/ongrid/releases
VER=v0.7.159

gh release download "$VER" \
    --repo ongridio/ongrid \
    -p 'ongrid-*-linux-amd64.tar.xz*'

tar xf "ongrid-${VER}-linux-amd64.tar.xz"
cd     "ongrid-${VER}-linux-amd64"

sudo ./install.sh

Was install.sh der Reihe nach tut:

Preflight. Prüft, ob docker + docker compose v2 vorhanden und der Daemon erreichbar ist.
Lagert Konfiguration unter /opt/ongrid/ (Compose-Datei, prometheus, loki, tempo, grafana, searxng, Edge-Artefakte).
Erstellt Datenverzeichnisse unter /var/lib/ongrid/ (mysql, prometheus, loki, tempo, qdrant, grafana, embeddings) und ändert deren Eigentümer auf die uid, die jedes Container-Image erwartet. Logs gehen nach /var/log/ongrid/.
Generiert ein selbstsigniertes TLS-Zertifikat in /opt/ongrid/certs/ — Browser warnen beim ersten Mal. Ersetzen Sie es später durch ein echtes Zertifikat; siehe Server-Installation.
Lädt Docker-Images (ongrid, ongrid-web, frontier) aus dem Tarball — kein Docker-Hub-Pull erforderlich.
Füllt .env mit starken zufälligen Passwörtern für MYSQL_*, ONGRID_JWT_SECRET, GRAFANA_ADMIN_PASSWORD und das Bootstrap-ONGRID_ADMIN_PASSWORD.
Fragt nach ONGRID_PUBLIC_URL mit einem 30-Sekunden-Countdown. Dies ist die URL, die Ihre Edges verwenden, um die Datenebene dieses Managers zu erreichen (Logs → Loki, Traces → OTLP-Push). Auf einem interaktiven Terminal ist ein falscher Wert hier die häufigste Ursache für „nur die Edge auf dem Manager-Host liefert Logs", also bestätigen Sie ihn. Siehe ONGRID_PUBLIC_URL.
Führt docker compose up -d aus und pollt bis zu 60 Sekunden lang https://localhost/healthz.
Druckt ein Banner mit der Web-URL, API-URL, dem Tunnel-Endpunkt und dem Bootstrap-Admin-Passwort — einmal aufgezeichnet.

Eine gesunde Installation endet so:

text

[INFO] ongrid is healthy (took ~14s)

===============================================================
  ongrid installation complete
===============================================================

Web UI:          https://203.0.113.10/
API URL:         https://203.0.113.10/api/v1
Tunnel endpoint: 203.0.113.10:40012   (for edges)

---------------- bootstrap admin ----------------
email:    admin@example.com
password: (generated — printed only here, once)
>> Record this password NOW. It will not be shown again.
-------------------------------------------------

Notieren Sie das Admin-Passwort

Das Bootstrap-Passwort wird einmal im Installations-Banner angezeigt und auch (chmod 600) in /opt/ongrid/.env als ONGRID_ADMIN_PASSWORD gespeichert. Wenn Sie beide verlieren, müssen Sie es aus der Datenbank zurücksetzen; siehe Erstinbetriebnahme-Checkliste.

2. Anmelden

Öffnen Sie https://<your-host>/ in einem Browser. Akzeptieren Sie die TLS-Warnung (oder installieren Sie zuerst ein echtes Zertifikat). Melden Sie sich an mit:

E-Mail — was auch immer Sie in .env als ONGRID_ADMIN_EMAIL eingetragen haben (standardmäßig admin@example.com)
Passwort — das aus dem Installations-Banner

Bei der ersten Anmeldung landen Sie auf der Chat-Startseite. Der Modell-Picker in der oberen Leiste zeigt „no provider configured" — beheben Sie das, bevor Sie fortfahren.

3. Ein Modell konfigurieren (1 Min)

Gehen Sie zu Settings → Models. Wählen Sie eines von:

OpenAI — fügen Sie sk-… ein, Standardmodell gpt-5.4.
Anthropic — fügen Sie sk-ant-… ein, Standard claude-opus-4-7.
Zhipu (GLM) — fügen Sie API-Schlüssel ein, Standard glm-4.7.
DeepSeek, Gemini, Kimi oder Custom (OpenAI-kompatibel) für alles andere (vLLM, Ollama, OpenRouter, ein Unternehmens-Relay…).

Klicken Sie Save. Das Formular registriert den Provider vor — kein Neustart erforderlich. Setzen Sie dann auf derselben Seite Default provider auf den, den Sie gerade konfiguriert haben.

Warum der Standard wichtig ist

Der Default Provider steuert jeden Backend-LLM-Aufruf (Alarm-Untersuchung, Übersetzen, Zusammenfassen). Der Modell-Picker auf der Chat-Seite überschreibt nur für den aktuellen Chat-Thread (siehe den Abschnitt Modelle in der Seitenleiste für Routing-Details).

Gehen Sie zurück zu Chat in der oberen Navigation und fragen Sie "hello". Wenn das Modell antwortet, sind Sie verdrahtet.

4. Ihre erste Edge registrieren

Klicken Sie Edges → New edge in der Seitennavigation. Füllen Sie aus:

Name — beliebig; z. B. prod-web-01.
Description — optional.

Klicken Sie Create. Die Detailseite zeigt zwei Dinge, die Sie benötigen:

Access key / secret key — serverseitig generiert; der Secret wird einmal angezeigt.
Install command — eine einzelne Zeile wie:

bash

curl -k -sSL https://203.0.113.10/install.sh | sudo bash -s -- \
    --access-key=AK_xxxxxxxxxxxxxxxx \
    --secret-key=SK_yyyyyyyyyyyyyyyy \
    --server-edge-addr=203.0.113.10:40012 \
    --server-http-addr=203.0.113.10:443

SSH-en Sie zu dem Host, den Sie überwachen möchten (es kann dieselbe Maschine sein, auf der Sie den Manager installiert haben — das ist eine gültige Demo) und führen Sie diesen Befehl als root aus.

Was der Reihe nach passiert:

Der Installer lädt das passende ongrid-edge-linux-amd64-Binary herunter, plus vier Plugin-Binaries (promtail, node_exporter, process_exporter, otelcol-contrib) und den apply-pending-upgrade.sh-Hook in /usr/local/lib/ongrid-edge/.
Erstellt den ongrid-edge-Systembenutzer, macht ihn zum Mitglied von adm und systemd-journal, damit das Logs-Plugin /var/log/* und das Journal lesen kann.
Legt eine systemd-Unit in /etc/systemd/system/ongrid-edge.service ab.
Schreibt /etc/ongrid-edge/ongrid-edge.env mit dem Access/Secret-Key (Mode 0640, Eigentümer root:ongrid-edge).
systemctl enable --now ongrid-edge. Pollt das Journal bis zu 20s lang nach der Zeile agent: registered with cloud.
Druckt eine Selbstprüfung (Plugin-Binaries vorhanden? journald lesbar? Datenebenen-Host erreichbar?).

Eine erfolgreiche Registrierung endet mit:

text

[OK]    plugin binary present: promtail
[OK]    plugin binary present: otelcol-contrib
[OK]    plugin binary present: node_exporter
[OK]    plugin binary present: process_exporter
[OK]    journald readable by ongrid-edge
[OK]    data-plane host 203.0.113.10:443 reachable (TCP)
[OK]    self-check passed

[OK]    installed:    ongrid-edge v0.7.159
[OK]    connected:    edge_id=42 via 203.0.113.10:40012
[OK]    tail logs:    journalctl -u ongrid-edge -f

5. In der UI sehen

Zurück im Browser:

Edges — Ihre Edge ist in der Liste mit einem grünen „online"-Punkt. Die Karte zeigt Hostnamen, Kernel-Version, gesamtes RAM, Disk, Distro.
Monitor — wählen Sie die Edge. Innerhalb von ~30 Sekunden sehen Sie CPU-, Speicher-, Disk-, Last-, Netzwerk-IO-Diagramme, die sich füllen. Es sind Grafana-Panels, die über den /grafana/-Subpfad in die Seite eingebettet sind.
Logs — wählen Sie die Edge. Tailen Sie /var/log/* und das systemd-Journal live; LogQL wird in der Suchleiste unterstützt.
Topology — die Edge erscheint als Host-Knoten. Wenn Sie weitere Edges hinzufügen (oder Dienste via expand_topology-Skill erkennen), füllt sich der Graph aus.

6. Den Agenten fragen

Gehen Sie zurück zu Chat. Versuchen Sie eines von:

"List my edges and show me which has the highest load."
"Tail /var/log/syslog on prod-web-01 for the last 5 minutes."
"Why did CPU spike on prod-web-01 around 10:42?"

Der Agent ruft echte Werkzeuge auf — list_edges, bash, query_promql, search_logs, find_topology_node, etc. Das Transkript zeigt jeden Aufruf als klappbaren Chip; klicken Sie einen an, um Argumente und Ausgabe zu sehen.

Was als Nächstes?

Einen Kanal konfigurieren, damit der Agent auf Slack / Telegram / Larksuite / DingTalk / WeCom antworten kann.
Eine Alarmregel verfassen — Ongrid bringt 6 eingebaute Host-Regeln und 14 Regel-Arten über PromQL / log_match / log_volume / trace_latency / trace_error_rate mit.
Eine Wissensbasis verbinden — der eingebaute Vault ist offline; fügen Sie eigene Org-Playbooks (Markdown, PDF, DOCX) hinzu oder synchronisieren Sie ein Git-Repo.
Produktionshärtung — ersetzen Sie das selbstsignierte TLS-Zertifikat, setzen Sie ONGRID_PUBLIC_URL auf eine echte Domain, sichern Sie /var/lib/ongrid, richten Sie einen echten default_provider mit Budget-Obergrenze ein.

Deinstallation

Auf dem Manager: cd ongrid-vX.Y.Z-linux-amd64 && sudo ./uninstall.sh. Auf einer Edge: curl -k -sSL https://<server>/install.sh | sudo bash -s -- --uninstall. Logs unter /var/log/ongrid-edge bleiben erhalten.

Schnellstart ​

0. Voraussetzungen ​

1. Den Server installieren ​

2. Anmelden ​

3. Ein Modell konfigurieren (1 Min) ​

4. Ihre erste Edge registrieren ​

5. In der UI sehen ​

6. Den Agenten fragen ​

Was als Nächstes? ​