Czarny ekran przy starcie systemu - j

Wszystko związane z jądrem systemowym, sterownikami, sprzętem itp.
Dominik
Beginner
Posty: 209
Rejestracja: 22 lutego 2007, 21:29
Lokalizacja: katowice

Czarny ekran przy starcie systemu - jądro w wersji 3.2 Sid

Post autor: Dominik »

Mam problem po aktualizacji Debiana z wersji stabilnej do Sida.
Podczas rozruchu dostaje czarny ekran
  • W przypadku normalnego trybu pracy, jestem w stanie wymusić restart kombinacją klawiszy Alt+PrintScreen+O
  • W przypadku trybu awaryjnego konieczne jest odcięcie zasilania.
Problem występuje na systemie bez X-ów, po kilku sekundach i załadowaniu części modułów. Na oko nie jestem w stanie wychwycić kiedy. Dzieje się to już po przestawieniu czcionki, i włączeniu kolorowego terminala (więc chyba nie do końca jest to problem z kartą grafiki), przy zaczernieniu ekranu słychać tylko jakby cichy stuk na wyjściu audio.

Według polecenia:

Kod: Zaznacz cały

lspci
karta grafiki to:

Kod: Zaznacz cały

Display Controller: Intel Corporation Mobile 945GM/GMS/GME, 943/940GML Express Integrated Graphics Controller (rev 03)
Dźwięk:

Kod: Zaznacz cały

Audio device: Intel Corporation N10/ICH 7 Family High Definition Audio Controller (rev 02) 
Procesor: Intel Celeron M CPU 450 @ 2.00GHz

Problem nie występuje w Debian w wersji stabilnej (jądro2.6.32-5-686) ani przy wersji jądra 2.6.37 (Slackware).

Występuje z wersją jądra 3.2.13 (Slackware) oraz Debianowym linux-image-3.2.0-2-686-pae.

Po aktualizacji do Sida (czegokolwiek z jądrem w wersji 3.2) system bywa zdolny do jednego poprawnego restartu.
Przy Sidzie problem wystąpił zaraz po zainstalowaniu programu, który grzebał w initrd (zależny od pmount cryptsetup). Żadnych szyfrowanych partycji nie mam, partycja główna "/" to ext3, partycja ext4 z danymi nie jest automatycznie montowana.

Nie umiem czytać (ze zrozumieniem) /var/log/kern.log ale nie potrafię tam znaleźć żadnego wpisu:

Kod: Zaznacz cały

kernel panic

Znalazłem coś, jakby ślady mojego wojowania z czarnym ekranem i wpisuję to, co było kilka linii powyżej:

Kod: Zaznacz cały

May 24 00:43:37 debian kernel: [    1.623741]   sda1 sda2 < sda5 sda6 sda7 >
May 24 00:43:37 debian kernel: [    1.665577] sd 0:0:0:0: [sda] Attached SCSI disk
May 24 00:43:37 debian kernel: [    1.674126] sd 0:0:0:0: Attached scsi generic sg0 type 0
May 24 00:43:37 debian kernel: [    1.675181] sr 1:0:0:0: Attached scsi generic sg1 type 5
May 24 00:43:37 debian kernel: [    1.952103] firewire_core: created device fw0: GUID 00030d492000126a, S400
May 24 00:43:37 debian kernel: [    2.091597] PM: Starting manual resume from disk
May 24 00:43:37 debian kernel: [    2.091602] PM: Resume from partition 8:6
May 24 00:43:37 debian kernel: [    2.091603] PM: Checking hibernation image.
May 24 00:43:37 debian kernel: [    2.091878] PM: Error -22 checking image file
May 24 00:43:37 debian kernel: [    2.091880] PM: Resume from disk failed
May 24 00:43:37 debian kernel: [    2.140089] kjournald starting. Commit interval 5 seconds
May 24 00:43:37 debian kernel: [    2.140098] EXT3-fs: mounted filesystem with ordered data mode
May 24 00:43:37 debian kernel: [    3.455467] udev[341]: starting version 164
May 24 00:43:37 debian kernel: [    3.838910] intel_rng: FHW not detected
May 24 00:43:37 debian kernel: [    3.856051] input: Lid Switch as /devices/LNXSYSTM:00/LNXSYBUS:00/PNP0C0D:00/input/input1
May 24 00:43:37 debian kernel: [    3.856120] ACPI: Lid Switch [LID]
May 24 00:43:37 debian kernel: [    3.856480] input: Sleep Button as /devices/LNXSYSTM:00/LNXSYBUS:00/PNP0C0E:00/input/input2
May 24 00:43:37 debian kernel: [    3.856486] ACPI:  Sleep Button  [SLPB]
Nic z tego nie rozumiem - czyżby jakiś problem z dyskiem?
Swoją drogą przycisk wyłącznika interpretowany jako "sleep"?

Zupełnie się na tym nie znam a jakoś chciałbym to jądro (system, który go wymaga) zmusić do pracy.
Wszystkie wersje GNU/Linuksa ciągnące program, którego potrzebuję, mają to nieszczęsne jądro 3.2 i prosiłbym o pomoc.

Jestem w stanie tego Debiana Sida uruchomić na poprzedniej wersji jądra, więc jeśli potrzeba danych z jakiś logów/plików systemowych to proszę podać, których?

Edycja:
Sprawdziłem ten wpis z logu:

Kod: Zaznacz cały

intel_rng: FHW not detected
Wujek Google wkazuje na problemy z jakimś nieistniejącym od lat generatorem liczb losowych oraz kartą sieciową wifi - błędy jądra z 2008 roku. Dograłem sterownik do tej karty (firmware-iwlwifi) i system uruchomił się 1 raz z nową wersją jądra. Po poleceniu:

Kod: Zaznacz cały

reboot
problem powtarza się.

Zacznij wstawiać polecenia w znaczniki code (nie tylko ich wyniki). Używaj znaków przestankowych.
fnmirk
kordirko
Posty: 8
Rejestracja: 06 maja 2012, 09:45

Post autor: kordirko »

Przy bootowaniu w GRUB-ie naciśnij literkę E i zmień opcje kernela, będzie tam zapewne linijka podobna do tego:

Kod: Zaznacz cały

linux    /boot/vmlinuz-3.3.6 root=UUID=a9d332a0-e605-449a-9977-038723526a51 ro  quiet
skasuj opcję quiet i dodaj debug

Kod: Zaznacz cały

linux    /boot/vmlinuz-3.3.6irko2 root=UUID=a9d332a0-e605-449a-9977-038723526a51 ro  debug
zabootuj i zobacz komunikaty - powinno ich być więcej.

Można także spróbować dodać do kernela opcję boot_delay=1000, jak złapie tę opcję to będzie dawał pauzę 1 sek. po każdym komunikacie,
wtedy łatwiej jest wyłapać ostatni widoczny komunikat przed "zgaśnięciem" ekranu.

Rozumiem że za pierwszym razem bootuje się dobrze (zimny start), tylko potem przy restarcie się wiesza ?
To po pierwszym starcie zapisz komunikaty do pliku

Kod: Zaznacz cały

dmesg > plik
i potem spróbuj przy restarcie spróbuj zapamiętać ostatni widoczny komunikat, znajdź go potem w tym pliku i pokaż nam tutaj te ostatnie komunikaty które widać
do tego miejsca gdzie się wiesza i z tego pliku kilka linijek za tym miejscem - ponieważ być może wiesza się w tym miejscu, którego już nie widać ;)


Spróbuj także zabotować go wpisując w opcje kernela (w grubie) jedną z tych opcji:
noacpi
acpi=off
acpi=noirq
pci=noacpi

to wyłączy acpi i zapewne pomoże, jeśli nie masz laptopa to generalnie ACPI się mało przydaje.
Dominik
Beginner
Posty: 209
Rejestracja: 22 lutego 2007, 21:29
Lokalizacja: katowice

Post autor: Dominik »

@ fnmirk przepraszam, postaram się dostosować do zasad edycji.

1) Bootowanie

&quot pisze:Rozumiem że za pierwszym razem bootuje się dobrze (zimny start), tylko potem przy restarcie się wiesza ?


Nie. Po upgrade system zabootował tylko 1 raz.
Bootuje na stare jądro. Do udanego startu z jądrem 3.2 muszę dodać do GRUB

Kod: Zaznacz cały

acpi=off
Ta metoda uruchomienia wydaję się powtarzalna - próbowałem kilka razy pod rząd i zawsze wystartował.
Dziękuję :D

Bodaj raz zabootował z opcją

Kod: Zaznacz cały

pci=noacpi

ale nie udało się tego powtórzyć.
Pozostałe opcje nie przynoszą żadnych efektów.
W kilku dystrybucjach miałem już problemy z acpi. Niestety jest to laptop.

2) komunikaty tuż przed zaciemnieniem ekranu

Kod: Zaznacz cały

dmesg > plik 
Niestety nie potrafię dostarczyć takiego pliku dmesg z "ociemniałego startu".
Być może przyda się na coś zapis z tego polecenia, gdy uruchomiłem system bez ACPI?
Odszukałem analogiczne komunikaty w plikach z rozruchu "bez acpi" /var/log/dmesg oraz pliku /var/log/kern.log
Po datach modyfikacji (godzinie) wnioskuję, że nie jest to zapis z owych nieudanych prób uruchomienia.
Jednak "podejrzane" linijki powtarzają się w zapisach z powyższych plików i wyniku dmesg.

polecenie dmesg

Kod: Zaznacz cały

[   47.056155] ACPI: AC Adapter [AC0] (on-line)
[   47.552110] ACPI: Battery Slot [BAT0] (battery present)
[   47.588817] intel_rng: FWH not detected
[   47.695571] i801_smbus 0000:00:1f.3: PCI->APIC IRQ transform: INT B -> IRQ 19
[   47.717462] iTCO_vendor_support: vendor-support=0
[   47.822385] psmouse serio2: synaptics: Touchpad model: 1, fw: 6.2, id: 0x1a0b1, caps: 0xa04713/0x200000/0x0
[   47.863712] input: SynPS/2 Synaptics TouchPad as /devices/platform/i8042/serio2/input/input6
[   47.874467] [drm] Initialized drm 1.1.0 20060810
[   47.900416] iTCO_wdt: Intel TCO WatchDog Timer Driver v1.07
[   47.900587] iTCO_wdt: Found a ICH7-M or ICH7-U TCO device (Version=2, TCOBASE=0x0860)
[   47.901546] iTCO_wdt: initialized. heartbeat=30 sec (nowayout=0)
[   47.909862] Error: Driver 'pcspkr' is already registered, aborting...
[   48.172221] leds_ss4200: no LED devices found
[   48.173963] cfg80211: Calling CRDA to update world regulatory domain
[   48.186990] snd_hda_intel 0000:00:1b.0: PCI->APIC IRQ transform: INT A -> IRQ 16
[   48.187138] snd_hda_intel 0000:00:1b.0: irq 44 for MSI/MSI-X
[   48.187232] snd_hda_intel 0000:00:1b.0: setting latency timer to 64
[   48.313786] iwl3945: Intel(R) PRO/Wireless 3945ABG/BG Network Connection driver for Linux, in-tree:s
[   48.313885] iwl3945: Copyright(c) 2003-2011 Intel Corporation
[   48.314030] iwl3945 0000:03:00.0: PCI->APIC IRQ transform: INT A -> IRQ 18
[   48.314111] iwl3945 0000:03:00.0: setting latency timer to 64
[   48.366521] iwl3945 0000:03:00.0: Tunable channels: 13 802.11bg, 23 802.11a channels
[   48.366611] iwl3945 0000:03:00.0: Detected Intel Wireless WiFi Link 3945ABG
[   48.366836] iwl3945 0000:03:00.0: irq 45 for MSI/MSI-X
[   48.367116] Registered led device: phy0-led
[   48.422098] ieee80211 phy0: Selected rate control algorithm 'iwl-3945-rs'
[   48.462390] input: HDA Digital PCBeep as /devices/pci0000:00/0000:00:1b.0/input/input7
[   48.464191] i915 0000:00:02.0: PCI->APIC IRQ transform: INT A -> IRQ 16
[   48.464267] i915 0000:00:02.0: setting latency timer to 64
[   48.465541] [drm] Supports vblank timestamp caching Rev 1 (10.10.2010).
[   48.465617] [drm] Driver supports precise vblank timestamp query.
[   48.466202] vgaarb: device changed decodes: PCI:0000:00:02.0,olddecodes=io+mem,decodes=io+mem :o wns=io+mem
[   48.805215] [drm] initialized overlay support
[   48.970459] fbcon: inteldrmfb (fb0) is primary device
[   49.241804] Console: switching to colour frame buffer device 160x50
[   49.247050] fb0: inteldrmfb frame buffer device
[   49.247052] drm: registered panic notifier
[   49.247193] [drm] Initialized i915 1.6.0 20080730 for 0000:00:02.0 on minor 0
[   99.538985] EXT3-fs (sda5): using internal journal
[   99.627696] loop: module loaded
[  101.357351] sky2 0000:07:00.0: eth0: enabling interface
[  101.359663] ADDRCONF(NETDEV_UP): eth0: link is not ready
[  164.305918] input: ACPI Virtual Keyboard Device as /devices/virtual/input/input8

Ekran czernieje gdzieś po komunikacie

Kod: Zaznacz cały

ieee80211 phy0: Selected rate control algorithm 'iwl-3945-rs'
lub po jednym z tych dwu

Kod: Zaznacz cały

 
[   49.247193] [drm] Initialized i915 1.6.0 20080730 for 0000:00:02.0 on minor 0 

[   47.874467] [drm] Initialized drm 1.1.0 20060810
Pomimo opcji w grubie

Kod: Zaznacz cały

 ro debug boot_delay=1000 
komunikaty przelatują strasznie szybko.
Nie jestem w 100% pewny, który z tych 2 komunikatów jest ostatni.
Albo coś wolno dostrzegam komunikaty, albo ekran gaśnie raz przy jednym a raz przy drugim komunikacie:
czasem ostatni jest komunikat zaczynający się ieee... a czasem zaczynający się [drm] Initialized
ODPOWIEDZ