Linux 15.036 Themen, 107.107 Beiträge

Kernel panic openSuSE 12.3

Olaf Runge / 23 Antworten / Baumansicht Nickles

Hi,
bei einem ASUS-Notebook mit AMD Doppelkerner bekam ich schon bei einem Installationsversuch folgende Fehlermeldung:
Kernel panic - not syncing: Watchdog detected hard LOCKUP on cpu 0

Nach erfolgter Installation hängt der Rechner sich häufig mit der gleichen Fehlermeldung auf.
Googlen brachte zutage, dass bei früheren Kernelversionen möglicherweise ein bug vorlag.
Weiss irgend jemand, ob dies bei openSuSE mit Kernel 3.7.10-1.16 auch wieder der Fall ist - oder gibt es eine ander Lösung?

Gruss und Dank
Olaf

bei Antwort benachrichtigen
KarstenW Olaf Runge „Kernel panic openSuSE 12.3“
Optionen

Starte mal Knoppix oder installiere eine andere Distribution. Sollte der Fehler wieder auftreten, dann wird dein Notebook nicht unterstützt.


Debian GNU/Linux https://www.debian.org/index.de.html
bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Kernel panic openSuSE 12.3“
Optionen

Hi

Bei welchem Kernel trat der Fehler auf?

Wenn Du als Bootoption nosmp oder maxcpus=0 angibst, ist die Fehlermeldung dann weg?

Sonst wäre ein BIOS-Update eine Option, falls das Problem von einem fehlerhaften ACPI des Books herrührt.
Klappt das nicht, dann gib doch bitte den das Book mit an, falls speziell dazu ein Problem bekannt sein sollte.

bei Antwort benachrichtigen
Olaf Runge gelöscht_189916 „Hi Bei welchem Kernel trat der Fehler auf Wenn Du als ...“
Optionen

Hi KarstenW und fakiauso,

opensuse sollte es schon sein, da der compi für eine Bekannte ist, sie ist daran gewöhnt.

Der Fehler trat mit dem oben genannten Kernel auf - wie gesagt nicht immer.
Ein BIOS- bzw. UEFI-Update hab ich jetzt auch durchgeführt - keine Änderung.
Ich weiss noch nicht, wo ich die Bootoptionen bei der grub.cfg von grub2 einfügen sollte.
Mittlerweile hab ich das Gerät wieder abgegeben. Vielleicht kann ich noch etwas über Fernwartung regeln.

Gruss und D
aAnk
Olaf Runge

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hi KarstenW und fakiauso, opensuse sollte es schon sein, da ...“
Optionen
opensuse sollte es schon sein, da der compi für eine Bekannte ist, sie ist daran gewöhnt.

Hatte ich auch so aufgefasst;-)

Ich weiss noch nicht, wo ich die Bootoptionen bei der grub.cfg von grub2 einfügen sollte.

Als Test würde der Editormodus von grub(2) beim Rechnerstart erst einmal genügen, den Du unter grub2 durch Drücken "E" bekommst und dort die Option einfach einfügst.

Um die Option bei Erfolg dauerhaft einzubinden, gibst Du das in der /etc/default/grub im Kopf in die Zeile ein:

GRUB_CMDLINE_LINUX_DEFAULT="xxx"

Nach dem Ändern musst Du noch als root update-grub laufen lassen, damit die Konfiguration neu eingelesen wird.
Unter Opensuse müsste sich das aber auch für den jeweiligen Kerneleintrag über YaST-->

http://de.opensuse.org/YaST_Module_Bootloader

http://doc.opensuse.org/documentation/html/openSUSE/opensuse-reference/grub2.html

Mit Kernel meinte ich, ob z.B. bei Dir der Default- oder Desktopkernel installiert ist.


bei Antwort benachrichtigen
Olaf Runge gelöscht_189916 „Hatte ich auch so aufgefasst - Als Test würde der ...“
Optionen

Hallo
ich hab ein paar Tage gebraucht um verschiedene Dinge zu probieren.
Das Gerät musste erst quer durch D zu mir zurück. U.a. hatte ich den Kernel von opensuse 13.1 aus dem factory-repo installiert - mit einem ähnlichen Ergebnis. Die obigen Vorschläge von fakiauso legen einen cpu-Kern lahm, wenn ich es richtig verstanden hab.
Jetzt hab ich hier:  http://www.av8n.com/computer/htm/kernel-lockup.htm gelesen, dass man in der Kernelkonfiguration das Problem abstellen kann.
Ich hab vor ein paar Jahren häufiger Kernel selber gebacken - kenne die Routinen schon.

Jetzt taucht eine neues Problem auf: Wenn ich die bzimage nach /boot kopieren ändert sich plötzlich ohne Grund der Charakter dieser Datei - es ist plötzlich kein Kernelimage mehr, sondern nur eine einfache Konfigurationsdatei. Damit lässt sich natürlich nichts booten.
Gibt es seit grub2 da etwas neues zu beachten?

Das Problem nervt langsam.

Gruss und Dank
Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hallo ich hab ein paar Tage gebraucht um verschiedene Dinge ...“
Optionen
Die obigen Vorschläge von fakiauso legen einen cpu-Kern lahm, wenn ich es richtig verstanden hab.

Ja, so ist es, Du müsstest eben dann die Anzahl der Kerne fix vorgeben, bei zwei Kernen eben maxcpu=2.

Hast Du bei dem Book bereits wegen eines BIOS-Updates geschaut, falls die APIC-Probleme daher rühren?

http://wiki.ubuntuusers.de/Multicore

Mit dem Rest muss ich selber erst schauen, aber nicht mehr heute;-)
bei Antwort benachrichtigen
violetta7388 Olaf Runge „Kernel panic openSuSE 12.3“
Optionen

Hallo Olaf Runge,

poste bitte folgende Konsolenausgabe: 


rpm --query --all --queryformat '%{NAME}-%{VERSION}-%{RELEASE}-%{ARCH} -> %{VENDOR}\n' '*kernel*'

MfG.
violetta

bei Antwort benachrichtigen
Olaf Runge violetta7388 „Hallo Olaf Runge,poste bitte folgende Konsolenausgabe: rpm ...“
Optionen

Hi violetta, hi fakiauso,

die Ausgabe ist wie folgt:

kernel-desktop-3.7.10-1.1.1-x86_64 -> openSUSE
kernel-devel-3.7.10-1.16.1-noarch -> openSUSE
kernel-source-3.7.10-1.16.1-noarch -> openSUSE
kernel-desktop-devel-3.7.10-1.16.1-x86_64 -> openSUSE
kernel-firmware-20130114git-1.2.1-noarch -> openSUSE

BIOS bzw. UEFI-Update ist bereits gemacht, s. o.
Ich werd jetzt mal in /etc/default/grub folgendes eingeben:

GRUB_CMDLINE_LINUX_DEFAULT="maxcpu=2"

Gruss Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hi violetta, hi fakiauso, die Ausgabe ist wie folgt: ...“
Optionen

Hallo

Jetzt habe ich mir Deinen Link in Ruhe zu Gemüte geführt. Dort wird aufgeführt, wie solche soft oder hard lockups debuggt werden können, indem die Fehlerausgabe aufgezeichnet wird.

Hier wird speziell noch eine Anleitung geliefert, um statt des möglicherweise fehlenden Kernel-Logs die Ausgabe über die serielle Schnittstelle an einen anderen PC zu schicken.

Ich gehe im Grunde immer noch davon aus, dass die Macke am Gerät liegt. Falls Du den PC im UEFI-Modus laufen hast, könntest Du das Teil als Versuch in den BIOS-kompatiblen Modus setzen. Der Nachteil ist dann, falls Du auch gleich noch in GPT installiert hast, mußt Du noch einmal neu aufsetzen.

Was den selbstkompilierten Kernel betrifft, bei einem Update würde Opensuse m.E. auf den aktuellsten linken und bei der automatischen Menüauswahl in grub hüpft dann sehr wahrscheinlich wieder dieser an die erste Stelle. Das Problem bestünde dann wieder, aber der vorhergehende Kernel ließe sich immerhin noch unter den zusätzlichen Bootoptionen starten.

Wenn ich die bzimage nach /boot kopiere

Sollte das nicht ein Image auf ***.gz sein?

Du kannst auch noch das genaue Gerät posten, damit sich die BIOS-Optionen mal durchforsten lassen und eventuell nachsehen lässt, ob andere Distris da auch so auffallen.
bei Antwort benachrichtigen
violetta7388 Olaf Runge „Hi violetta, hi fakiauso, die Ausgabe ist wie folgt: ...“
Optionen

Hallo Olaf,

welche BS sind installiert und aktiv? 
Poste bitte auch noch die Konsolenausgabe: uname -r

Danke sehr.

MfG.
violetta

bei Antwort benachrichtigen
Olaf Runge violetta7388 „Hallo Olaf,welche BS sind installiert und aktiv Poste bitte ...“
Optionen

Hi violetta und fakiauso,

ich hab nun das mit maxcpu=2 in die /etc/default/grub eingetragen. Seitdem ist der Rechner mehrmals problemlos gestartet. Ich hoffe, dass es das nun war. Falls es wieder Probleme geben sollte werde ich mich wieder melden.
Ich kann mir allerdings nicht erklären, warum das Problem aufgetaucht ist.

Gruss und Danke Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hi violetta und fakiauso, ich hab nun das mit maxcpu 2 in ...“
Optionen

Hi Olaf

Ich kann mir allerdings nicht erklären, warum das Problem aufgetaucht ist.

Siehe oben, da ist m.E. das BIOS buggy. Du kannst höchstens noch einen Fehlerbericht an Opensuse senden mit dem traceback an der Fehlermeldung im Log, vielleicht kommen die der Sache auf die Schliche.

Da aber das Problem mit mehreren Kernelversionen auftritt, sehe ich die Ursache in erster Linie beim Gerät, indem es die Zahl der CPU-Kerne nicht sauber weitergibt. Andere Lösungsansätze sind dann noch die Verendung einer anderen Distri wie Knoppix, Debian oder *buntu als Live-Version.
Steigt dort der Kernel auch aus, ist es definitiv nichts Suse-spezifisches.

Juxhalber kannst Du per cat /proc/cpuinfo oder in der Systemüberwachung noch schauen, ob die beiden Kerne angezeigt werden, aber das sollte schon so sein. Ein fixer Eintrag in grub ist allemal besser als ein permanent crashender Kernel;-)
bei Antwort benachrichtigen
Olaf Runge gelöscht_189916 „Hi Olaf Siehe oben, da ist m.E. das BIOS buggy. Du kannst ...“
Optionen

Hi fakiauso,

heute Morgen ist dies Problem wieder aufgetaucht. In der Systeminfo  sind beide Kerne angezeigt.
Ich werde jetzt mal andere live-versionen durchtesten

Gruss  Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hi fakiauso, heute Morgen ist dies Problem wieder ...“
Optionen

Jetzt wird es langsam auch bei mir alle.

Du kannst eventuell noch per Yast statt des desktop-Kernel einmal den default-Kernel installieren und mit diesem versuchen, der ist u.a. nicht so sehr auf Bootzeiten optimiert, vielleicht geht es damit doch noch.

bei Antwort benachrichtigen
Olaf Runge gelöscht_189916 „Jetzt wird es langsam auch bei mir alle. Du kannst eventuell ...“
Optionen

Entwarnung und Entschuldigung,

ich hatte gestern Abend noch mit dem Programm grub-customizer rumgespielt. Dabei ist der Eintrag wohl wieder futsch gegangen.
' hab ihn jetzt erneut eingegeben und dann den Befehl: grub2-mkconfig -o /boot/grub2/grub.cfg.

Scheint zu funktionieren.

Gruss und Dank Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Entwarnung und Entschuldigung, ich hatte gestern Abend noch ...“
Optionen
Scheint zu funktionieren.

Puuuh;-)
bei Antwort benachrichtigen
violetta7388 gelöscht_189916 „Puuuh -“
Optionen

Hallo Olaf,

Du solltest Dich langsam vom devel-noarch-Kernel verabschieden. Wer mit diesem Kernel arbeitet, der bewegt sich auf der Entwicklerebene! Es ist eben kein stable-Kernel.

MfG.
violetta

bei Antwort benachrichtigen
Olaf Runge violetta7388 „Hallo Olaf,Du solltest Dich langsam vom devel-noarch-Kernel ...“
Optionen

Hi,

ich melde mich mal wieder. Ich will ja kein Spielverderber sein - aber die Fehlermeldung - wie ganz oben beschrieben kommt ab und zu trotzdem - trotz maxcpus=2.
Kernel-devel und -source hab ich deinstalliert. Die Fehlermeldung kam sowohl beim desktop als auch beim default-Kernel.

Kann es sein, dass die Fehlermeldung kommt weil das book ohne Akku betrieben wird?
Auf anderen Geräten Desktop-PC und Note- und Netbook läuft opensuse 12.3 sehr gut.

Gruss Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hi, ich melde mich mal wieder. Ich will ja kein ...“
Optionen
Kann es sein, dass die Fehlermeldung kommt weil das book ohne Akku betrieben wird?

Auszuschliessen ist das nicht. Das geht wieder in die Richtung fehlerhaftes BIOS, denn irgendwoher muss die falsche Meldung über die CPU-Kerne ja kommen. Sonst kannst Du nur mit den APIC/ACPI-Einstellungen im BIOS fummeln, aber das hatte ich oben bereits geschrieben und da landest Du wahrscheinlich nur einen Zufallstreffer.

Hast Du es bereits mit Akku versucht?

Bei Lenovo ist es z.B. so, dass einige Modelle mit Intels Core-Prozessoren  mit dem kleinen Netzteil und ohne Akku nicht hochtakten, sondern nur schaumgebremst laufen, weil da der Akku als Puffer dient.
Ist zwar etwas OT und hat mit Deiner Problematik nichts zu tun, aber so als Beispiel eben...
bei Antwort benachrichtigen
Olaf Runge gelöscht_189916 „Auszuschliessen ist das nicht. Das geht wieder in die ...“
Optionen

Hi,

also der Akku liegt ca. 300km von hier. Die Bekannte wollte das Gerät ohne Akku betreiben.
Hab ihr schon beigebracht, dass der Akku rein sollte.
Fedora 19 live  ist mit der mehrmaligen Fehlermeldung 'soft Lockup on cpu 1'hochgefahren.

Bei openSuse kommt außerdem beim hoch- und runterfahren die Meldung: ACPI [Package] hast zero elements. Vielleicht liegt es dann am fehlenden Akku?

Gruss Olaf
bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Hi, also der Akku liegt ca. 300km von hier. Die Bekannte ...“
Optionen
Vielleicht liegt es dann am fehlenden Akku?

Das schließe ich für den Fall aus, sondern sehe da inzwischen wirklich das BIOS als Ursache, denn alle Kernel quer durch die Distris können ja nicht buggy sein.

Als allgemeine Abhilfe oder Ursachenforschung versuche das hier:

https://wiki.ubuntu.com/DebuggingACPI

Falls Du im BIOS/UEFI die Option "Plug´n´Play-OS installed" oder ähnlich hast, setze die einmal auf disabled, damit die IRQ-Konfiguration komplett vom BIOS vorgegeben wird.

Da das immer nur sporadisch auftritt, die CPU selber kann nicht einen Schuss weg haben?

Über dmidecode kannst Du die CPU und den Bootvorgang auch direkt abklopfen, ohne Option klappert das die ganze Kiste ab, für CPU und Bootvorgang nimmst Du das mit root-Rechten:

dmidecode -t 4
dmidecode -t 32
bei Antwort benachrichtigen
Olaf Runge gelöscht_189916 „Das schließe ich für den Fall aus, sondern sehe da ...“
Optionen

Ich hatte auch schon acpi=off eingestellt - keine Änderung.
Die Option "Plug'n'Play-OS gibt es nicht.
Die beiden Befehle dmidecode ergaben keine Auffälligkeiten.

Übrigens Windows (dual-boot) bootet immer anstandslos.

Ich denk, die Bekannte muss damit eine Zeitlang leben - vielleicht bis zum Versionsupgrade.

Gruss und Dank - Olaf

bei Antwort benachrichtigen
gelöscht_189916 Olaf Runge „Ich hatte auch schon acpi off eingestellt - keine Änderung. ...“
Optionen

Oh je...

...Du bist der Mann für die harten Fälle;-)

Die Option "Plug'n'Play-OS gibt es nicht.

Naja, die muss nicht direkt so heißen, ist immer blöd, wenn man nicht selbst vor der Kiste hockt.

Das Windows sauber bootet, muss in dem Fall auch nichts bedeuten, weil das einfach anders arbeitet, nur wo anfangen zu suchen?
Ich meine letztendlich, das die Chose mit einem eventuellen BIOS-Update gelöst wird, wenn es denn mal eines gibt, weil es bei so vielen Distris nicht hinhaut.

Solltest Du noch auf den Dreh kommen, kannst Du Dich leise an diesen Thread erinnern, denn das interessiert mich schon, auch in Verbindung mit dem Book.

Gruss zurück
Thomas
bei Antwort benachrichtigen