Schnellstart
Ziel: in etwa 10 Minuten haben Sie…
- Den vollständigen Ongrid-Stack auf einer einzelnen Linux-Maschine via docker compose laufen (Manager + Frontier-Broker + Prometheus + Loki + Tempo + Grafana + Qdrant + SearXNG).
- Den Admin-Benutzer über HTTPS angemeldet.
- Eine
ongrid-edgegegen Ihren Manager registriert, die CPU-/Speicher-/Disk-Metriken liefert, die Sie auf der Monitor-Seite sehen können.
Wenn Sie eine tiefergehende Anleitung möchten, lesen Sie stattdessen Server-Installation und Edge-Installation.
0. Voraussetzungen
Eine Linux-Maschine (Ubuntu 22.04+, Debian 12+, RHEL/Rocky/Alma 9+ getestet).
- Mindestens 4 GB RAM (8 GB empfohlen)
- 20 GB freier Speicherplatz unter
/var/lib/ongrid(das Datenverzeichnis) - root oder sudo
docker≥ 24 mit demdocker composev2 Subcommandopenssl(wird zum Erstellen des selbstsignierten TLS-Zertifikats beim ersten Start verwendet)- TCP 443 und 40012 offen zu den Hosts, auf denen Ihre Edges laufen werden
Für lokales Testen
Sie können alles auf einem Laptop ausführen. Beachten Sie nur, dass ONGRID_PUBLIC_URL standardmäßig auf die LAN-IP des Laptops gesetzt wird, sodass jede Edge, die Sie auf einer anderen Maschine installieren, diese LAN-IP über TCP/443 erreichen können muss.
1. Den Server installieren
Der kanonische Installationspfad ist gh release download plus sudo ./install.sh. Das Tarball ist eigenständig — Docker-Images, Edge-Binaries, Konfigurationsdateien, alles gebündelt.
# Pick the latest tag from https://github.com/ongridio/ongrid/releases
VER=v0.7.159
gh release download "$VER" \
--repo ongridio/ongrid \
-p 'ongrid-*-linux-amd64.tar.xz*'
tar xf "ongrid-${VER}-linux-amd64.tar.xz"
cd "ongrid-${VER}-linux-amd64"
sudo ./install.shWas install.sh der Reihe nach tut:
- Preflight. Prüft, ob
docker+docker compose v2vorhanden und der Daemon erreichbar ist. - Lagert Konfiguration unter
/opt/ongrid/(Compose-Datei, prometheus, loki, tempo, grafana, searxng, Edge-Artefakte). - Erstellt Datenverzeichnisse unter
/var/lib/ongrid/(mysql, prometheus, loki, tempo, qdrant, grafana, embeddings) und ändert deren Eigentümer auf die uid, die jedes Container-Image erwartet. Logs gehen nach/var/log/ongrid/. - Generiert ein selbstsigniertes TLS-Zertifikat in
/opt/ongrid/certs/— Browser warnen beim ersten Mal. Ersetzen Sie es später durch ein echtes Zertifikat; siehe Server-Installation. - Lädt Docker-Images (
ongrid,ongrid-web,frontier) aus dem Tarball — kein Docker-Hub-Pull erforderlich. - Füllt
.envmit starken zufälligen Passwörtern fürMYSQL_*,ONGRID_JWT_SECRET,GRAFANA_ADMIN_PASSWORDund das Bootstrap-ONGRID_ADMIN_PASSWORD. - Fragt nach
ONGRID_PUBLIC_URLmit einem 30-Sekunden-Countdown. Dies ist die URL, die Ihre Edges verwenden, um die Datenebene dieses Managers zu erreichen (Logs → Loki, Traces → OTLP-Push). Auf einem interaktiven Terminal ist ein falscher Wert hier die häufigste Ursache für „nur die Edge auf dem Manager-Host liefert Logs", also bestätigen Sie ihn. Siehe ONGRID_PUBLIC_URL. - Führt
docker compose up -daus und pollt bis zu 60 Sekunden langhttps://localhost/healthz. - Druckt ein Banner mit der Web-URL, API-URL, dem Tunnel-Endpunkt und dem Bootstrap-Admin-Passwort — einmal aufgezeichnet.
Eine gesunde Installation endet so:
[INFO] ongrid is healthy (took ~14s)
===============================================================
ongrid installation complete
===============================================================
Web UI: https://203.0.113.10/
API URL: https://203.0.113.10/api/v1
Tunnel endpoint: 203.0.113.10:40012 (for edges)
---------------- bootstrap admin ----------------
email: admin@example.com
password: 9Xp4hKqf1bL2zRq3Wn7v
>> Record this password NOW. It will not be shown again.
-------------------------------------------------Notieren Sie das Admin-Passwort
Das Bootstrap-Passwort wird einmal im Installations-Banner angezeigt und auch (chmod 600) in /opt/ongrid/.env als ONGRID_ADMIN_PASSWORD gespeichert. Wenn Sie beide verlieren, müssen Sie es aus der Datenbank zurücksetzen; siehe Erstinbetriebnahme-Checkliste.
2. Anmelden
Öffnen Sie https://<your-host>/ in einem Browser. Akzeptieren Sie die TLS-Warnung (oder installieren Sie zuerst ein echtes Zertifikat). Melden Sie sich an mit:
- E-Mail — was auch immer Sie in
.envalsONGRID_ADMIN_EMAILeingetragen haben (standardmäßigadmin@example.com) - Passwort — das aus dem Installations-Banner
Bei der ersten Anmeldung landen Sie auf der Chat-Startseite. Der Modell-Picker in der oberen Leiste zeigt „no provider configured" — beheben Sie das, bevor Sie fortfahren.
3. Ein Modell konfigurieren (1 Min)
Gehen Sie zu Settings → Models. Wählen Sie eines von:
- OpenAI — fügen Sie
sk-…ein, Standardmodellgpt-5.4. - Anthropic — fügen Sie
sk-ant-…ein, Standardclaude-opus-4-7. - Zhipu (GLM) — fügen Sie API-Schlüssel ein, Standard
glm-4.7. - DeepSeek, Gemini, Kimi oder Custom (OpenAI-kompatibel) für alles andere (vLLM, Ollama, OpenRouter, ein Unternehmens-Relay…).
Klicken Sie Save. Das Formular registriert den Provider vor — kein Neustart erforderlich. Setzen Sie dann auf derselben Seite Default provider auf den, den Sie gerade konfiguriert haben.
Warum der Standard wichtig ist
Der Default Provider steuert jeden Backend-LLM-Aufruf (Alarm-Untersuchung, Übersetzen, Zusammenfassen). Der Modell-Picker auf der Chat-Seite überschreibt nur für den aktuellen Chat-Thread (siehe den Abschnitt Modelle in der Seitenleiste für Routing-Details).
Gehen Sie zurück zu Chat in der oberen Navigation und fragen Sie "hello". Wenn das Modell antwortet, sind Sie verdrahtet.
4. Ihre erste Edge registrieren
Klicken Sie Edges → New edge in der Seitennavigation. Füllen Sie aus:
- Name — beliebig; z. B.
prod-web-01. - Description — optional.
Klicken Sie Create. Die Detailseite zeigt zwei Dinge, die Sie benötigen:
- Access key / secret key — serverseitig generiert; der Secret wird einmal angezeigt.
- Install command — eine einzelne Zeile wie:
curl -k -sSL https://203.0.113.10/install.sh | sudo bash -s -- \
--access-key=AK_xxxxxxxxxxxxxxxx \
--secret-key=SK_yyyyyyyyyyyyyyyy \
--server-edge-addr=203.0.113.10:40012 \
--server-http-addr=203.0.113.10:443SSH-en Sie zu dem Host, den Sie überwachen möchten (es kann dieselbe Maschine sein, auf der Sie den Manager installiert haben — das ist eine gültige Demo) und führen Sie diesen Befehl als root aus.
Was der Reihe nach passiert:
- Der Installer lädt das passende
ongrid-edge-linux-amd64-Binary herunter, plus vier Plugin-Binaries (promtail,node_exporter,process_exporter,otelcol-contrib) und denapply-pending-upgrade.sh-Hook in/usr/local/lib/ongrid-edge/. - Erstellt den
ongrid-edge-Systembenutzer, macht ihn zum Mitglied vonadmundsystemd-journal, damit das Logs-Plugin/var/log/*und das Journal lesen kann. - Legt eine systemd-Unit in
/etc/systemd/system/ongrid-edge.serviceab. - Schreibt
/etc/ongrid-edge/ongrid-edge.envmit dem Access/Secret-Key (Mode 0640, Eigentümerroot:ongrid-edge). systemctl enable --now ongrid-edge. Pollt das Journal bis zu 20s lang nach der Zeileagent: registered with cloud.- Druckt eine Selbstprüfung (Plugin-Binaries vorhanden? journald lesbar? Datenebenen-Host erreichbar?).
Eine erfolgreiche Registrierung endet mit:
[OK] plugin binary present: promtail
[OK] plugin binary present: otelcol-contrib
[OK] plugin binary present: node_exporter
[OK] plugin binary present: process_exporter
[OK] journald readable by ongrid-edge
[OK] data-plane host 203.0.113.10:443 reachable (TCP)
[OK] self-check passed
[OK] installed: ongrid-edge v0.7.159
[OK] connected: edge_id=42 via 203.0.113.10:40012
[OK] tail logs: journalctl -u ongrid-edge -f5. In der UI sehen
Zurück im Browser:
- Edges — Ihre Edge ist in der Liste mit einem grünen „online"-Punkt. Die Karte zeigt Hostnamen, Kernel-Version, gesamtes RAM, Disk, Distro.
- Monitor — wählen Sie die Edge. Innerhalb von ~30 Sekunden sehen Sie CPU-, Speicher-, Disk-, Last-, Netzwerk-IO-Diagramme, die sich füllen. Es sind Grafana-Panels, die über den
/grafana/-Subpfad in die Seite eingebettet sind. - Logs — wählen Sie die Edge. Tailen Sie
/var/log/*und das systemd-Journal live; LogQL wird in der Suchleiste unterstützt. - Topology — die Edge erscheint als Host-Knoten. Wenn Sie weitere Edges hinzufügen (oder Dienste via
expand_topology-Skill erkennen), füllt sich der Graph aus.
6. Den Agenten fragen
Gehen Sie zurück zu Chat. Versuchen Sie eines von:
"List my edges and show me which has the highest load.""Tail /var/log/syslog on prod-web-01 for the last 5 minutes.""Why did CPU spike on prod-web-01 around 10:42?"
Der Agent ruft echte Werkzeuge auf — list_edges, bash, query_promql, search_logs, find_topology_node, etc. Das Transkript zeigt jeden Aufruf als klappbaren Chip; klicken Sie einen an, um Argumente und Ausgabe zu sehen.
Was als Nächstes?
- Einen Kanal konfigurieren, damit der Agent auf Slack / Telegram / Larksuite / DingTalk / WeCom antworten kann.
- Eine Alarmregel verfassen — Ongrid bringt 6 eingebaute Host-Regeln und 14 Regel-Arten über PromQL / log_match / log_volume / trace_latency / trace_error_rate mit.
- Eine Wissensbasis verbinden — der eingebaute Vault ist offline; fügen Sie eigene Org-Playbooks (Markdown, PDF, DOCX) hinzu oder synchronisieren Sie ein Git-Repo.
- Produktionshärtung — ersetzen Sie das selbstsignierte TLS-Zertifikat, setzen Sie
ONGRID_PUBLIC_URLauf eine echte Domain, sichern Sie/var/lib/ongrid, richten Sie einen echtendefault_providermit Budget-Obergrenze ein.
Deinstallation
Auf dem Manager: cd ongrid-vX.Y.Z-linux-amd64 && sudo ./uninstall.sh. Auf einer Edge: curl -k -sSL https://<server>/install.sh | sudo bash -s -- --uninstall. Logs unter /var/log/ongrid-edge bleiben erhalten.