Du bist nicht angemeldet.

#1 03.09.2016 01:48:03

shibumi
Mitglied

Rauscht mir bald die SSD ab?

Moin,
Ich hatte mir dieses Jahr im April oder so einen neuen laptop mit samt SSD gekauft.
Heute ist es mir nun das zweite mal passiert, dass das system plötzlich mitten im Betrieb in den read-only mode gegangen ist.
Laut dmesg anscheinend wegen Kernel-Fehlern.
Ich habe danach 2x versucht zu rebooten.
Beide male hat mein BIOS gemeckert es wäre keine HDD verbaut.

Dann habe ich den laptop einmal aus der dockingstation genommen und wieder rein.
Danach lief alles wunderbar, ohne probleme.

Hier ein paar Screenshots von dem Fehler. Hab leider keinen textlog, weil das journalctl natürlich auch in ro-mode gegangen ist -.-

https://paste.archlinux.de/m-ee6hf/

Wo nach sieht das für euch aus? Muss ich mich darauf einstellen mir ne neue SSD zu kaufen?
Ich hab mal im Journal nachgeschaut und ich hab 2 services die schon echt irre viel noise erzeugen was geloggt wird. Schadet das der SSD?
Ich mein ne SSD kann ja nur eine bestimmte Größe an Read/Write Operationen und irgendwann ist halt schluss wegen Verschleiß..

Oder meint ihr das hängt mit der Dockingstation zusammen.

Hardware ist übrigens ein X220 mit Ultradock

Offline

#2 03.09.2016 06:22:12

niemand
Mitglied

Re: Rauscht mir bald die SSD ab?

Für mich sieht der Text auf den Bildern (an dieser Stelle würde ich gerne pastebinit erwähnen …) nach einem kaputten Kabel oder schlechtsitzenden Steckern aus. Was Verschleiß angeht, so loggen die meisten SSDs den Durchsatz und sonstige interessante Werte selbst, anzusehen zum Beispiel mit ›smartctl‹.

Offline

#3 03.09.2016 09:02:45

frostschutz
Mitglied

Re: Rauscht mir bald die SSD ab?

shibumi schrieb:

Ich hab mal im Journal nachgeschaut und ich hab 2 services die schon echt irre viel noise erzeugen was geloggt wird. Schadet das der SSD?
Ich mein ne SSD kann ja nur eine bestimmte Größe an Read/Write Operationen und irgendwann ist halt schluss wegen Verschleiß..

Google mal nach ssd write endurance test o.ä. also die stecken schon soviel weg daß man sich da weiters keine Sorgen machen muss.

Aber es gibt schon noch Gurken auf dem Markt [meistens dann auch die die kaum Performanz / IOPS schaffen] und natürlich kann man immer Pech haben daß eine SSD einfach so eingeht ohne daß man sagen kann worans lag.

Man sieht in deiner Ausgabe leider nicht (mehr) wie das alles angefangen hat. Vielleicht kannst du mal von einer Live CD aus die SSD einem Lesetest unterziehen, wenn das Root-Dateisystem nicht auf der SSD liegt dürfte das System auch nicht abschmieren wenn der SATA-Busreset kommt...

Wie von @niemand vorgeschlagen, ob alles richtig sitzt kannst du ja kontrollieren und smartctl -a mal posten.

Offline

#4 03.09.2016 09:38:03

k.osmo
Mitglied

Re: Rauscht mir bald die SSD ab?

Resolving NCQ errors

Some SSDs and SATA chipsets do not work properly with Linux Native Command Queueing (NCQ). The tell-tale dmesg errors look like this:

[ 9.115544] ata9: exception Emask 0x0 SAct 0xf SErr 0x0 action 0x10 frozen
[ 9.115550] ata9.00: failed command: READ FPDMA QUEUED
[ 9.115556] ata9.00: cmd 60/04:00:d4:82:85/00:00:1f:00:00/40 tag 0 ncq 2048 in
[ 9.115557] res 40/00:18:d3:82:85/00:00:1f:00:00/40 Emask 0x4 (timeout)

To disable NCQ on boot, add libata.force=noncq to the kernel command line in the bootloader configuration. To disable NCQ only for disk 0 on port 1 use: libata.force=1.00:noncq

Alternatively, you may disable NCQ for a specific drive without rebooting via sysfs:

# echo 1 > /sys/block/sdX/device/queue_depth

If this (and also updating the firmware) does not resolve the problem or cause other issues, then file a bug report.

wiki.archlinux.org/index.php/SSD#Troubleshooting

Möglicherweise versucht Du's erstmal damit? Interessant wäre generell auch noch, was in deiner fstab steht, und welchen Scheduler Du verwendest, siehe –> Improving_performance#Tuning_IO_schedulers

Offline

#5 03.09.2016 12:10:41

frostschutz
Mitglied

Re: Rauscht mir bald die SSD ab?

NCQ habe ich auch überall deaktiviert (libata.force=noncq). Zuviele Bugs in dem Gebiet und zuwenig (garkein) Performanzgewinn also weg damit.

Aber daß das dann auch im BIOS nicht mehr erkannt werden soll deswegen, das ist schon schräg.

Offline

#6 05.09.2016 19:26:47

k.osmo
Mitglied

Re: Rauscht mir bald die SSD ab?

OT: Bisschen schlechter Stil von mir, die Info so per Copy&Paste hier 'reinzuknallen. Ich denke mir, das könnte ich zukünftig auch anders machen, der besseren Forenverträglichkeit halber.

Zum Thema "Native Command Queuing": Ist eigentlich ziemlich gut nachvollziehbar, weshalb das bei SSD's wenig bzw. sogar keinen Sinn macht, wenn man sich mal den wikipedia-Artikel dazu ansieht: https://de.wikipedia.org/wiki/Native_Command_Queuing

Bei rotierenden Platten, die ausschließlich unverknüpfte Dateien (hmm… gibt's sowas je, wenn man in Ordnern speichert? roll…) enthalten, spielt NCQ – soweit ich es mir denke – eh' keine so große Rolle, weshalb man das Feature vermutlich auch in gemischten Umgebungen von HDD's und SSD's ohne großen Performanzverlust ausschalten kann, solange auf jeden Fall das System und die Programme von SSD gelesen werden.

Jedenfalls ist es im Fehlerfall wie oben beschrieben zunächst wohl weniger riskant, das Feature einfach abzuschalten (falls überhaupt effektiv), als gleich ein Firmware-Update zu implementieren (falls überhaupt verfügbar).

Offline

#7 06.09.2016 07:10:42

15arch
Gast

Re: Rauscht mir bald die SSD ab?

k.osmo schrieb:

Bei rotierenden Platten, die ausschließlich unverknüpfte Dateien (hmm… gibt's sowas je, wenn man in Ordnern speichert? roll…) enthalten, ...

Damit ist die Fragmentierung gemeint. wink

#8 06.09.2016 13:33:51

k.osmo
Mitglied

Re: Rauscht mir bald die SSD ab?

Hmm… logisch, eigentlich. smile

Offline

#9 30.09.2016 18:57:32

shibumi
Mitglied

Re: Rauscht mir bald die SSD ab?

Heute ist mir wieder ganze 2x die Platte abgerauscht. Ich konnte nicht mal mehr journalctl aufrufen um mal zu schauen woran es lag. Ich vermute aber mittlerweile, dass es wirklich an irgendeinem Treiber liegt. Laut smart ist die Platte ok:

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.7.5-1-ARCH] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     INTENSO
Serial Number:    E7CB075B1E0B00364019
Firmware Version: S9FM02.6
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 (minor revision not indicated)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Fri Sep 30 19:55:50 2016 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(   30) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (   2) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000a   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       1750
 12 Power_Cycle_Count       0x0012   100   100   000    Old_age   Always       -       312
168 Unknown_Attribute       0x0012   100   100   000    Old_age   Always       -       0
170 Unknown_Attribute       0x0013   100   100   010    Pre-fail  Always       -       19
173 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       29294613
192 Power-Off_Retract_Count 0x0012   100   100   000    Old_age   Always       -       7
194 Temperature_Celsius     0x0023   070   070   000    Pre-fail  Always       -       30
196 Reallocated_Event_Count 0x0000   100   100   000    Old_age   Offline      -       0
218 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       0
241 Total_LBAs_Written      0x0012   100   100   000    Old_age   Always       -       1161842

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1750         -

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Oder sieht hier jemand etwas auffälliges?

Offline

#10 01.10.2016 03:29:20

niemand
Mitglied

Re: Rauscht mir bald die SSD ab?

Ich würde schauen, ob es eine smartctl-Version gibt, in deren Datenbank das betreffende Laufwerk enthalten ist. Dort ist ein „Unknown_Attribute“ vom Typ „Pre-fail“ und einem RAW-Wert ≠0 – mich würde da brennend interessieren, worum es geht, wäre es mein SSD.

Was das Logging angeht: man kann journald auch irgendwie anweisen, das Journal auf einem anderen Datenträger zu schreiben. In die Richtung würde ich schauen, um an Daten zu kommen, die auf dem betreffenden Laufwerk nicht mehr geschrieben werden konnten.

Offline

#11 06.11.2016 23:31:47

shibumi
Mitglied

Re: Rauscht mir bald die SSD ab?

Danke niemand. Das ist eine Idee.
Ich habe auch noch ein Update. Kann jemand was hier mit anfangen? https://paste.archlinux.de/rZ4/

Offline

#12 07.11.2016 06:38:59

niemand
Mitglied

Re: Rauscht mir bald die SSD ab?

Args … hättest du es nicht etwas kleiner skalieren können, wenn es schon Text in ’nem Bild sein musste? Oder zumindest warnen können, dass du die vielleicht 300 Byte Text in einem Bild mit 6312664 Byte servierst? Die Mobilfunkprovider rechnen teilweise immer noch in MB ab …

Wie auch immer, die Meldungen sehen für mich nach einem Problem mit dem Kabel oder dem Controller aus. Kabel ließe sich schnell wechseln, dabei kann man auch mal andere Ports verwenden.

Offline

Schnellantwort auf dieses Thema

Schreibe deinen Beitrag und versende ihn
Deine Antwort

Fußzeile des Forums