Hi,
bei einem ASUS-Notebook mit AMD Doppelkerner bekam ich schon bei einem Installationsversuch folgende Fehlermeldung:
Kernel panic - not syncing: Watchdog detected hard LOCKUP on cpu 0
Nach erfolgter Installation hängt der Rechner sich häufig mit der gleichen Fehlermeldung auf.
Googlen brachte zutage, dass bei früheren Kernelversionen möglicherweise ein bug vorlag.
Weiss irgend jemand, ob dies bei openSuSE mit Kernel 3.7.10-1.16 auch wieder der Fall ist - oder gibt es eine ander Lösung?
Gruss und Dank
Olaf
Linux 15.036 Themen, 107.107 Beiträge
Starte mal Knoppix oder installiere eine andere Distribution. Sollte der Fehler wieder auftreten, dann wird dein Notebook nicht unterstützt.
Hi
Bei welchem Kernel trat der Fehler auf?
Wenn Du als Bootoption nosmp oder maxcpus=0 angibst, ist die Fehlermeldung dann weg?
Sonst wäre ein BIOS-Update eine Option, falls das Problem von einem fehlerhaften ACPI des Books herrührt.
Klappt das nicht, dann gib doch bitte den das Book mit an, falls speziell dazu ein Problem bekannt sein sollte.
Hi KarstenW und fakiauso,
opensuse sollte es schon sein, da der compi für eine Bekannte ist, sie ist daran gewöhnt.
Der Fehler trat mit dem oben genannten Kernel auf - wie gesagt nicht immer.
Ein BIOS- bzw. UEFI-Update hab ich jetzt auch durchgeführt - keine Änderung.
Ich weiss noch nicht, wo ich die Bootoptionen bei der grub.cfg von grub2 einfügen sollte.
Mittlerweile hab ich das Gerät wieder abgegeben. Vielleicht kann ich noch etwas über Fernwartung regeln.
Gruss und D
aAnk
Olaf Runge
opensuse sollte es schon sein, da der compi für eine Bekannte ist, sie ist daran gewöhnt.
Hatte ich auch so aufgefasst;-)
Ich weiss noch nicht, wo ich die Bootoptionen bei der grub.cfg von grub2 einfügen sollte.
Als Test würde der Editormodus von grub(2) beim Rechnerstart erst einmal genügen, den Du unter grub2 durch Drücken "E" bekommst und dort die Option einfach einfügst.
Um die Option bei Erfolg dauerhaft einzubinden, gibst Du das in der /etc/default/grub im Kopf in die Zeile ein:
GRUB_CMDLINE_LINUX_DEFAULT="xxx"
Nach dem Ändern musst Du noch als root update-grub laufen lassen, damit die Konfiguration neu eingelesen wird.
Unter Opensuse müsste sich das aber auch für den jeweiligen Kerneleintrag über YaST-->
http://de.opensuse.org/YaST_Module_Bootloader
http://doc.opensuse.org/documentation/html/openSUSE/opensuse-reference/grub2.html
Mit Kernel meinte ich, ob z.B. bei Dir der Default- oder Desktopkernel installiert ist.
Hallo
ich hab ein paar Tage gebraucht um verschiedene Dinge zu probieren.
Das Gerät musste erst quer durch D zu mir zurück. U.a. hatte ich den Kernel von opensuse 13.1 aus dem factory-repo installiert - mit einem ähnlichen Ergebnis. Die obigen Vorschläge von fakiauso legen einen cpu-Kern lahm, wenn ich es richtig verstanden hab.
Jetzt hab ich hier: http://www.av8n.com/computer/htm/kernel-lockup.htm gelesen, dass man in der Kernelkonfiguration das Problem abstellen kann.
Ich hab vor ein paar Jahren häufiger Kernel selber gebacken - kenne die Routinen schon.
Jetzt taucht eine neues Problem auf: Wenn ich die bzimage nach /boot kopieren ändert sich plötzlich ohne Grund der Charakter dieser Datei - es ist plötzlich kein Kernelimage mehr, sondern nur eine einfache Konfigurationsdatei. Damit lässt sich natürlich nichts booten.
Gibt es seit grub2 da etwas neues zu beachten?
Das Problem nervt langsam.
Gruss und Dank
Olaf
Die obigen Vorschläge von fakiauso legen einen cpu-Kern lahm, wenn ich es richtig verstanden hab.
Ja, so ist es, Du müsstest eben dann die Anzahl der Kerne fix vorgeben, bei zwei Kernen eben maxcpu=2.
Hast Du bei dem Book bereits wegen eines BIOS-Updates geschaut, falls die APIC-Probleme daher rühren?
http://wiki.ubuntuusers.de/Multicore
Mit dem Rest muss ich selber erst schauen, aber nicht mehr heute;-)
Hallo Olaf Runge,
poste bitte folgende Konsolenausgabe:
rpm --query --all --queryformat '%{NAME}-%{VERSION}-%{RELEASE}-%{ARCH} -> %{VENDOR}\n' '*kernel*'
MfG.
violetta
Hi violetta, hi fakiauso,
die Ausgabe ist wie folgt:
kernel-desktop-3.7.10-1.1.1-x86_64 -> openSUSE
kernel-devel-3.7.10-1.16.1-noarch -> openSUSE
kernel-source-3.7.10-1.16.1-noarch -> openSUSE
kernel-desktop-devel-3.7.10-1.16.1-x86_64 -> openSUSE
kernel-firmware-20130114git-1.2.1-noarch -> openSUSE
BIOS bzw. UEFI-Update ist bereits gemacht, s. o.
Ich werd jetzt mal in /etc/default/grub folgendes eingeben:
GRUB_CMDLINE_LINUX_DEFAULT="maxcpu=2"
Gruss Olaf
Hallo
Jetzt habe ich mir Deinen Link in Ruhe zu Gemüte geführt. Dort wird aufgeführt, wie solche soft oder hard lockups debuggt werden können, indem die Fehlerausgabe aufgezeichnet wird.
Hier wird speziell noch eine Anleitung geliefert, um statt des möglicherweise fehlenden Kernel-Logs die Ausgabe über die serielle Schnittstelle an einen anderen PC zu schicken.
Ich gehe im Grunde immer noch davon aus, dass die Macke am Gerät liegt. Falls Du den PC im UEFI-Modus laufen hast, könntest Du das Teil als Versuch in den BIOS-kompatiblen Modus setzen. Der Nachteil ist dann, falls Du auch gleich noch in GPT installiert hast, mußt Du noch einmal neu aufsetzen.
Was den selbstkompilierten Kernel betrifft, bei einem Update würde Opensuse m.E. auf den aktuellsten linken und bei der automatischen Menüauswahl in grub hüpft dann sehr wahrscheinlich wieder dieser an die erste Stelle. Das Problem bestünde dann wieder, aber der vorhergehende Kernel ließe sich immerhin noch unter den zusätzlichen Bootoptionen starten.
Wenn ich die bzimage nach /boot kopiere
Sollte das nicht ein Image auf ***.gz sein?
Du kannst auch noch das genaue Gerät posten, damit sich die BIOS-Optionen mal durchforsten lassen und eventuell nachsehen lässt, ob andere Distris da auch so auffallen.
Hallo Olaf,
welche BS sind installiert und aktiv?
Poste bitte auch noch die Konsolenausgabe: uname -r
Danke sehr.
MfG.
violetta
Hi violetta und fakiauso,
ich hab nun das mit maxcpu=2 in die /etc/default/grub eingetragen. Seitdem ist der Rechner mehrmals problemlos gestartet. Ich hoffe, dass es das nun war. Falls es wieder Probleme geben sollte werde ich mich wieder melden.
Ich kann mir allerdings nicht erklären, warum das Problem aufgetaucht ist.
Gruss und Danke Olaf
Hi Olaf
Ich kann mir allerdings nicht erklären, warum das Problem aufgetaucht ist.
Siehe oben, da ist m.E. das BIOS buggy. Du kannst höchstens noch einen Fehlerbericht an Opensuse senden mit dem traceback an der Fehlermeldung im Log, vielleicht kommen die der Sache auf die Schliche.
Da aber das Problem mit mehreren Kernelversionen auftritt, sehe ich die Ursache in erster Linie beim Gerät, indem es die Zahl der CPU-Kerne nicht sauber weitergibt. Andere Lösungsansätze sind dann noch die Verendung einer anderen Distri wie Knoppix, Debian oder *buntu als Live-Version.
Steigt dort der Kernel auch aus, ist es definitiv nichts Suse-spezifisches.
Juxhalber kannst Du per cat /proc/cpuinfo oder in der Systemüberwachung noch schauen, ob die beiden Kerne angezeigt werden, aber das sollte schon so sein. Ein fixer Eintrag in grub ist allemal besser als ein permanent crashender Kernel;-)
Hi fakiauso,
heute Morgen ist dies Problem wieder aufgetaucht. In der Systeminfo sind beide Kerne angezeigt.
Ich werde jetzt mal andere live-versionen durchtesten
Gruss Olaf
Jetzt wird es langsam auch bei mir alle.
Du kannst eventuell noch per Yast statt des desktop-Kernel einmal den default-Kernel installieren und mit diesem versuchen, der ist u.a. nicht so sehr auf Bootzeiten optimiert, vielleicht geht es damit doch noch.
Entwarnung und Entschuldigung,
ich hatte gestern Abend noch mit dem Programm grub-customizer rumgespielt. Dabei ist der Eintrag wohl wieder futsch gegangen.
' hab ihn jetzt erneut eingegeben und dann den Befehl: grub2-mkconfig -o /boot/grub2/grub.cfg.
Scheint zu funktionieren.
Gruss und Dank Olaf
Scheint zu funktionieren.
Puuuh;-)
Hallo Olaf,
Du solltest Dich langsam vom devel-noarch-Kernel verabschieden. Wer mit diesem Kernel arbeitet, der bewegt sich auf der Entwicklerebene! Es ist eben kein stable-Kernel.
MfG.
violetta
Hi,
ich melde mich mal wieder. Ich will ja kein Spielverderber sein - aber die Fehlermeldung - wie ganz oben beschrieben kommt ab und zu trotzdem - trotz maxcpus=2.
Kernel-devel und -source hab ich deinstalliert. Die Fehlermeldung kam sowohl beim desktop als auch beim default-Kernel.
Kann es sein, dass die Fehlermeldung kommt weil das book ohne Akku betrieben wird?
Auf anderen Geräten Desktop-PC und Note- und Netbook läuft opensuse 12.3 sehr gut.
Gruss Olaf
Kann es sein, dass die Fehlermeldung kommt weil das book ohne Akku betrieben wird?
Auszuschliessen ist das nicht. Das geht wieder in die Richtung fehlerhaftes BIOS, denn irgendwoher muss die falsche Meldung über die CPU-Kerne ja kommen. Sonst kannst Du nur mit den APIC/ACPI-Einstellungen im BIOS fummeln, aber das hatte ich oben bereits geschrieben und da landest Du wahrscheinlich nur einen Zufallstreffer.
Hast Du es bereits mit Akku versucht?
Bei Lenovo ist es z.B. so, dass einige Modelle mit Intels Core-Prozessoren mit dem kleinen Netzteil und ohne Akku nicht hochtakten, sondern nur schaumgebremst laufen, weil da der Akku als Puffer dient.
Ist zwar etwas OT und hat mit Deiner Problematik nichts zu tun, aber so als Beispiel eben...
Hi,
also der Akku liegt ca. 300km von hier. Die Bekannte wollte das Gerät ohne Akku betreiben.
Hab ihr schon beigebracht, dass der Akku rein sollte.
Fedora 19 live ist mit der mehrmaligen Fehlermeldung 'soft Lockup on cpu 1'hochgefahren.
Gruss Olaf
Vielleicht liegt es dann am fehlenden Akku?
Das schließe ich für den Fall aus, sondern sehe da inzwischen wirklich das BIOS als Ursache, denn alle Kernel quer durch die Distris können ja nicht buggy sein.
Als allgemeine Abhilfe oder Ursachenforschung versuche das hier:
https://wiki.ubuntu.com/DebuggingACPI
Falls Du im BIOS/UEFI die Option "Plug´n´Play-OS installed" oder ähnlich hast, setze die einmal auf disabled, damit die IRQ-Konfiguration komplett vom BIOS vorgegeben wird.
Da das immer nur sporadisch auftritt, die CPU selber kann nicht einen Schuss weg haben?
Über dmidecode kannst Du die CPU und den Bootvorgang auch direkt abklopfen, ohne Option klappert das die ganze Kiste ab, für CPU und Bootvorgang nimmst Du das mit root-Rechten:
dmidecode -t 4
dmidecode -t 32
Ich hatte auch schon acpi=off eingestellt - keine Änderung.
Die Option "Plug'n'Play-OS gibt es nicht.
Die beiden Befehle dmidecode ergaben keine Auffälligkeiten.
Übrigens Windows (dual-boot) bootet immer anstandslos.
Ich denk, die Bekannte muss damit eine Zeitlang leben - vielleicht bis zum Versionsupgrade.
Gruss und Dank - Olaf
Oh je...
...Du bist der Mann für die harten Fälle;-)
Die Option "Plug'n'Play-OS gibt es nicht.
Naja, die muss nicht direkt so heißen, ist immer blöd, wenn man nicht selbst vor der Kiste hockt.
Das Windows sauber bootet, muss in dem Fall auch nichts bedeuten, weil das einfach anders arbeitet, nur wo anfangen zu suchen?
Ich meine letztendlich, das die Chose mit einem eventuellen BIOS-Update gelöst wird, wenn es denn mal eines gibt, weil es bei so vielen Distris nicht hinhaut.
Solltest Du noch auf den Dreh kommen, kannst Du Dich leise an diesen Thread erinnern, denn das interessiert mich schon, auch in Verbindung mit dem Book.
Gruss zurück
Thomas