Raspberry Pi rebootet ohne ersichtlichen Grund

  • Hallo alle zusammen,

    dies ist mein erster Post. Ich hoffe das ihr mich nicht direkt wegen meiner Unwissenheit in der Luft zerfleischt. ;)

    Ich habe leider dennoch ein anliegen zu meinem Pi. Und zwar habe ich das Problem das er ohne ersichtlichen Grund beim Filme schauen nach etwa 10 Minuten rebootet.

    Umgebung:

    • Raspberry Pi B+
    • 2000mA Netzteil [Anzeige]
    • Kühlkörper
    • 8GB microSD Karte (Class10)
    • Über die RaspBMC Settings übertaktet (Super)
    • Software/Dienste: nur SSH, RPi-Monitor, Hyperion (nicht konfiguriert), WiiMote über BT

    Nach den Reboots sehe ich im Syslog immer die Meldung "raspbmc watchdog[xxxx]: Last boot caused by watchdog." Wobei /var/log/watchdog leer bleibt.

    Die Temperatur beim Reboot liegt immer bei ~ 50°C - 55 °C. Die Load schwankt zwischen 0.8 und 1,2. Der Watchdog dürfte eigentlich nicht anspringen.

    Habt ihr noch eine Idee zur Fehlersuche?

    Ich danke euch bereits jetzt vielmals für die Unterstützung.

    Einmal editiert, zuletzt von gnilebein (8. Oktober 2014 um 10:28)

  • Die einfachste Lösung wäre wohl den watchdog mal zu deaktiveren indem du den entsprechenden Eintrag aus der /etc/modules entfernst.

    Wenn du ihn aus irgendeinem Grund brauchst, wäre die /etc/watchdog.config interessant.

    Ganz abgesehen davon erinnert das Verhalten ein bisschen an Stromversorgungsprobleme. Wenn du ein anderes NT zur Hand hast würde ich das einfach mal ausprobieren. Außerdem evtl. nicht benötigte Software mal runterschmeissen um die Auswahl einzuengen.

  • Hallo Gnilebein,

    die von Dir angebene Temperatur sowie die Angabe des Loads ist nichts, was den Raspberry in die Knie zwingen dürfte.

    Ich vermute, dass der Watchdaog auf irgendeine sinnlose Einstellung reagiert. Poste am Besten mal die Watchdog.config - vielleicht steht da etwas drin, was dort nicht hinein sollte.

    Kannst Du feststellen, ob das Teil sauber rebootet (wird ein reboot eingeleitet) - oder rebootet das Teil, weil der Reboot der letzte Rettungsversuch ist?

    Beste Grüsse

    Andreas

    Ich bin wirklich nicht darauf aus, Microsoft zu zerstören. Das wird nur ein völlig unbeabsichtigter Nebeneffekt sein.
    Linus Torvalds - "Vater" von Linux

    Linux is like a wigwam, no windows, no gates, but with an apache inside dancing samba, very hungry eating a yacc, a gnu and a bison.

  • Das mit dem Watchdog ist so ne Sache. Auch ohne installierten watchdog kam diese Meldng im syslog. Ich habe den watchdog dann mal nachinstalliert. Hier die dazugehörige config:

    http://pastebin.com/bw4NDu69

    Ich habe mal mein Syslog mit angehängt. Dort sind jedoch irgendwie Zeitsprünge drin. Ich vermute das die daher kommen, dass der Raspberry irgendwann im Boot Prozess sich die aktuelle Zeit via NTP holt.

    Gelegentlich bemängelt er, dass /dev/watchdog busy wäre. Ein 'lsof /dev/watchdog" sagt mir jedoch, dass es vom Watchdog in Benutzung ist.


  • ... ohne ersichtlichen Grund beim Filme schauen nach etwa 10 Minuten rebootet.

    Evtl. auch den Arbeitsspeicher-Verbrauch in diesem Zeitraum beachten.

    The most popular websites without IPv6 in Germany.  IPv6-Ausreden

    Meine PIs

    PI4B/8GB (border device) OpenBSD 7.4 (64bit): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server

    PI3B+ FreeBSD 14.0-R-p6 (arm64): SSH-Serv., WireGuard-Serv., ircd-hybrid-Serv., stunnel-Proxy, Mumble-Serv., ddclient

    PI4B/4GB Bullseye-lite (64bit; modifiziert): SSH-Server, WireGuard-Server, ircd-hybrid-Server, stunnel-Proxy, Mumble-Server, botamusique, ample

  • Der Watchdog im SoC prüft in regelmäßigen Abständen (default 60 Sekunden) die Datei /dev/watchdog bzw erwartet das in dem Intervall in diese Datei geschrieben wurde um zu wissen "die Software ist noch aktiv". Kommt es nun aber vor das nach 60 Sekunden nicht erneut in /dev/watchdog geschrieben wurde nimmt der SoC an das die Software sich aufgehängt hat und führt ein Reset durch. Anders ausgedrückt: Entsteht eine Pause von mehr als 60 Sekunden zwischen zwei Schreibvorgängen, führt der Watchdog einen Hardwarereset durch.

    Der SoC-Watchdog wird aktiviert indem nach dem Systemstart ein mal in die Datei geschrieben wurde, ab da erwartet er alle 60 Sekunden ein erneutes schreiben in die Datei.

    Ein Nachteil dieses Watchdogs ist allerdings das permanent ein sog. Daemon laufen muss, also ein Dienst welcher regelmäßig in /dev/watchdog schreibt.
    Dieser Dienst kann auch noch andere Aufgaben übernehmen wie zB das Überwachen der Systemlast, des freien Speichers, die Temperatur, die Erreichbarkeit des Netzwerks oder das beschreiben bestimmter Logfiles.
    Der Dienst beschreibt das Watchdog-Gerät (/dev/watchdog) regelmäßig, solange die vorgegebene Bedingung nicht zutrifft. Wird die Bedingung erreicht (etwa weil die Systemlast den festgelegten Wert auf Dauer überschreitet), unterbleibt der Schreibvorgang auf das Watchdog-Gerät. Ist dies länger als 60 Sekunden der Fall, erfolgt ein Reset.

    Diese zusätzliche Funktionalität ist aber eigentlich zu viel des guten und sollte man nicht über diesen SoC-Watchdog regeln: das der PI nicht so viel Leistung hat und es dadurch durchaus mal vor kommen kann das die Auslastung am Limit liegt, sollte kein Grund sein ihn zu resetten; die Temperatur kann problemlos auf 80°C ansteigen zumal der SoC bereits einen automatischen Schutz hat welcher ihn ab 85°C herunter taktet; der Kernel kümmert sich ums frei machen von Speicher falls dieser voll läuft (es werden dann halt Programme gekillt oder in den SWAP ausgelagert); fürs Netzwerk sollte man lieber Scripte nutzen die sich speziell um das Network-Device kümmern..usw

    Wenn jetzt die Belastung des PI's derart hoch ist dass die Software nicht rechtzeitig /dev/watchdog beschreibt, weil eben irgendwas läuft das 100% CPU Aufmerksamkeit verballert, kann das schon der Grund sein wieso der SoC ein Reset durchführt.


    Deine Einstellung max-load-1 bezieht sich auf den Load der letzen Minute. Ich würde dir empfehlen diese auszukommentieren und stattdessen max-load-5 zu verwenden, oder gar gänzlich auf diese " load " Sache zu verzichten da das eigentlich kein Grund sein sollte das System zu resetten nur weil er stark belastet ist...


    Hast du irgendeine Anleitung zur Einrichtung des Watchdogs befolgt?


    Wegen Ram:

    Normalerweise sollte das System mit SWAP versehen sein. Wenn nicht sollte das nachgeholt werden.

    SWAP zu haben ist fürs System wichtig, es nicht zu haben kann es ausbremsen und sogar die SD mehr belasten als wenn man SWAP hat. Denn SWAP hat 2 Existenzberechtigung:

    1. Libraries usw die längere Zeit nicht verwendet wurde, werden vom RAM in den SWAP ausgelagert, bleiben dadurch aber weiterhin für das System kurzfristig verfügbar. Gäbe es kein SWAP müssten diese also immer wieder ent- und wieder ge-laden werden.
    2. Ist nicht mehr genug RAM frei so kann das System auf den SWAP ausweichen und funktioniert weiter. Gibt es aber kein SWAP und der RAM läuft voll kommt es zu Programm-Abstürzen bis hin zum kompletten Crash des Systems.

    Um wegen des SWAP's die SD zu entlasten wäre es sinnvoll den SWAP auf einem externen Datenträger auszulagern - dieser sollte aber nicht allzu langsam sein (beim schreiben) um das System nicht unnötig auszubremsen... Wie das geht findet ihr in meinem Tutorial

    Selbst moderne Server mit >8GB Ram haben SWAP. Was nicht heißt das der SWAP verwendet wird aber gerade wenn ein System wie der PI nicht sooo viel RAM hat, kann es nicht schaden SWAP zu haben - insbesondere da es kurzfristig mal zu Engpässen kommen kann, die von dir aber nicht beobachtet werden könnten...

  • Letztendlich habe ich das auch gemacht. Seither ist es noch einmal passiert. Mittlerweile bin ich zudem eine Stufe bei der Übertaktung runter gegangen.

    Mich hätte dennoch interessiert warum das bei der alten Installation so regelmäßig passiert ist.

  • Mich hätte dennoch interessiert warum das bei der alten Installation so regelmäßig passiert ist.

    Das hab ich dir doch bereits erklärt: load

    Du hast den Watchdog so eingestellt das der PI resettet wird sobald er ausgelastet ist. Sowas ist aber eigentlich Quatsch

Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!