RAID6-2016: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Root (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Root (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
Zeile 2: | Zeile 2: | ||
* 2 TB Device-Kapazität - 3,5" Formfaktor - SATA 6Gb/s - 7200 U/min | * 2 TB Device-Kapazität - 3,5" Formfaktor - SATA 6Gb/s - 7200 U/min | ||
* 4 verschiedene Hersteller wegen der vergrößerten Varianz des Zeitpunktes eines Ausfalles | * 4 verschiedene Hersteller wegen der vergrößerten Varianz des Zeitpunktes eines Ausfalles | ||
[[Datei:20191128 181955.jpg|200px]] | |||
== Serien Nummern == | == Serien Nummern == |
Version vom 29. November 2019, 16:28 Uhr
- Sicherungsserver "raib2" im RZ Ubstadt
- 2 TB Device-Kapazität - 3,5" Formfaktor - SATA 6Gb/s - 7200 U/min
- 4 verschiedene Hersteller wegen der vergrößerten Varianz des Zeitpunktes eines Ausfalles
Serien Nummern
- HGST
- S/N: P6K4TJSV sdk
- WD
- S/N: WCC4M0SC7C9R sdc
S/N: WCC4M0SC7AR1†'09.2019S/N: WCC4M0XEZ7CH†'12.2017- S/N: WCC4M4KXAVNT sdb
- SEAGATE
- S/N: Z4Z2W81E sdd
- S/N: Z4Z32SNR sdi
- S/N: Z4Z2XNWC sdf
- Toshiba
- S/N: X7T0V1LAS sdg
- S/N: X5RAD3XGSTZ5 sdh
- S/N: X5RAD2GGSTZ5 sdj
S/N: Y5GHNDBTSTZ5†'03.2018 †'11.2019- S/N: Z8K7WMMAS *'11.2019 sde
- Die Platten sind in 3 HDD-Cages zu max 4 Drives
- Das Bild zeigt 2 der 3 Cages
Array Layout
Lage\Eigenschaften | Rolle | Device | Serialnummer |
---|---|---|---|
C4 | 8 | sdk | P6K4TJSV |
C3 | 4 | sdi | X7T0V1LAS |
C2 | 2 | sdh | WD-WCC4M4KXAVNT |
C1 | System | sda | S1SMNSAG110166X |
B4 | 3 | sdg | Z4Z2XNWC |
B3 | |||
B2 | 0 | sdf | WD-WCC4M0SC7C9R |
B1 | 1 | sdb | Z4Z2W81E |
A4 | 5 | sdc | X5RAD3XGS |
A3 | 6 | sdd | Z4Z32SNR |
A2 | spare | sde | Z8K7WMMAS |
A1 | 7 | sdj | X5RAD2GGS |
Logbuch
Initialisierung 2016
- Einkauf von 9x2 TB = 18 TB, das kostet zusammen 684.93 € (Stand Feb 2016).
- 8 der Platten verwende ich im RAID, eine Platte lege ich daneben für den Fall der Fälle
- im Lager: Toshiba DT01ACA S/N: X5RAD3XGSTZ5
Störung vom 28.12.2017
[243680.637402] aacraid: Host adapter abort request (0,2,3,0) [243691.068772] sd 0:2:3:0: [sdi] tag#1 FAILED Result: hostbyte=DID_ABORT driverbyte=DRIVER_OK [243691.068778] sd 0:2:3:0: [sdi] tag#1 CDB: Synchronize Cache(10) 35 00 00 00 00 00 00 00 00 00 [243691.068786] blk_update_request: I/O error, dev sdi, sector 2064 [243691.068788] md: super_written gets error=-5 [243691.068793] md/raid:md127: Disk failure on sdi1, disabling device. md/raid:md127: Operation continuing on 7 devices. [243801.115324] aacraid: Host adapter abort request timed out [243801.115334] aacraid: Host adapter abort request (0,2,3,0) [243801.115384] aacraid: Host adapter reset request. SCSI hang ? [243921.593220] aacraid: Host adapter reset request timed out [243921.593230] sd 0:2:3:0: Device offlined - not ready after error recovery [243921.593233] sd 0:2:3:0: Device offlined - not ready after error recovery [243921.593248] sd 0:2:3:0: [sdi] tag#8 FAILED Result: hostbyte=DID_ABORT driverbyte=DRIVER_OK [243921.593252] sd 0:2:3:0: [sdi] tag#8 CDB: Read(10) 28 00 04 a0 c4 00 00 02 00 00 [243921.593256] blk_update_request: I/O error, dev sdi, sector 77644800 [243921.593289] sd 0:2:3:0: [sdi] tag#11 FAILED Result: hostbyte=DID_ABORT driverbyte=DRIVER_OK [243921.593292] sd 0:2:3:0: [sdi] tag#11 CDB: Read(10) 28 00 04 a0 c6 00 00 02 00 00 [243921.593294] blk_update_request: I/O error, dev sdi, sector 77645312 [416403.254386] hrtimer: interrupt took 29227 ns [853039.443372] sd 0:2:3:0: rejecting I/O to offline device [853039.443402] sd 0:2:3:0: rejecting I/O to offline device [853039.443411] sd 0:2:3:0: rejecting I/O to offline device [853039.443418] sd 0:2:3:0: rejecting I/O to offline device [853039.443426] sd 0:2:3:0: rejecting I/O to offline device [853039.443433] sd 0:2:3:0: rejecting I/O to offline device [853039.443440] sd 0:2:3:0: rejecting I/O to offline device [853039.443448] sd 0:2:3:0: rejecting I/O to offline device [853039.443455] sd 0:2:3:0: rejecting I/O to offline device [853039.443633] sd 0:2:3:0: rejecting I/O to offline device [853039.443646] sd 0:2:3:0: rejecting I/O to offline device [853039.443653] sd 0:2:3:0: rejecting I/O to offline device [853039.443660] sd 0:2:3:0: rejecting I/O to offline device [853039.443667] sd 0:2:3:0: rejecting I/O to offline device [853039.443674] sd 0:2:3:0: rejecting I/O to offline device [853039.443681] sd 0:2:3:0: rejecting I/O to offline device [853039.443687] sd 0:2:3:0: rejecting I/O to offline device
- Ich wollte die serial ID der Platte rausfinden, ähm, jedoch hwinfo --disk lieferte bei der Platte nur noch:
28: IDE 23.0: 10600 Disk
[Created at block.245] Unique ID: ipPt.uEhVIzZ7wdA Parent ID: B35A.VPIkJrtnW73 SysFS ID: /class/block/sdi SysFS BusID: 0:2:3:0 SysFS Device Link: /devices/pci0000:00/0000:00:01.1/0000:02:00.0/host0/target0:2:3/0:2:3:0 Hardware Class: disk Model: "WDC WD20PURX-64P" Vendor: "WDC" Device: "WD20PURX-64P" Revision: "0A80" Driver: "aacraid", "sd" Driver Modules: "aacraid", "sd_mod" Device File: /dev/sdi Device Files: /dev/sdi, /dev/disk/by-id/scsi-330000d170092e908, /dev/disk/by-id/scsi-SATA_WDC_WD20PURX-64P_WD-WCC4M0XEZ7CH, /dev/disk/by-id/wwn-0x30000d170092e908, /dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:3:0 Device Number: block 8:128-8:143 Drive status: no medium Config Status: cfg=new, avail=yes, need=no, active=unknown Attached to: #15 (Serial Attached SCSI controller)
- es hätte aber angezeigt werden sollen:
28: IDE 23.0: 10600 Disk
[Created at block.245] Unique ID: ipPt.dZvPpEVVaL9 Parent ID: B35A.VPIkJrtnW73 SysFS ID: /class/block/sdi SysFS BusID: 0:2:3:0 SysFS Device Link: /devices/pci0000:00/0000:00:01.1/0000:02:00.0/host0/target0:2:3/0:2:3:0 Hardware Class: disk Model: "WDC WD20PURX-64P" Vendor: "WDC" Device: "WD20PURX-64P" Revision: "0A80" Serial ID: "WD-WCC4M0XEZ7CH" Driver: "aacraid", "sd" Driver Modules: "aacraid", "sd_mod" Device File: /dev/sdi Device Files: /dev/sdi, /dev/disk/by-id/scsi-330000d170092e908, /dev/disk/by-id/scsi-SATA_WDC_WD20PURX-64P_WD-WCC4M0XEZ7CH, /dev/disk/by-id/wwn-0x30000d170092e908, /dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:3:0 Device Number: block 8:128-8:143 Geometry (Logical): CHS 243201/255/63 Size: 3907029168 sectors a 512 bytes Capacity: 1863 GB (2000398934016 bytes) Config Status: cfg=new, avail=yes, need=no, active=unknown Attached to: #15 (Serial Attached SCSI controller)
- ich suche also die Platte "WD-WCC4M0XEZ7CH"
raus und ersetzt durch:
28: IDE 23.0: 10600 Disk
[Created at block.245] Unique ID: ipPt.IyRYgsTsxUD Parent ID: B35A.VPIkJrtnW73 SysFS ID: /class/block/sdi SysFS BusID: 0:2:3:0 SysFS Device Link: /devices/pci0000:00/0000:00:01.1/0000:02:00.0/host0/target0:2:3/0:2:3:0 Hardware Class: disk Model: "TOSHIBA DT01ACA2" Vendor: "TOSHIBA" Device: "DT01ACA2" Revision: "ABB0" Serial ID: "X5RAD3XGS" Driver: "aacraid", "sd" Driver Modules: "aacraid", "sd_mod" Device File: /dev/sdi Device Files: /dev/sdi, /dev/disk/by-id/scsi-330000d170092e908, /dev/disk/by-id/scsi-SATA_TOSHIBA_DT01ACA2_X5RAD3XGS, /dev/disk/by-id/wwn-0x30000d170092e908, /dev/disk/by-path/pci-0000:02:00.0-scsi-0:2:3:0 Device Number: block 8:128-8:143 Geometry (Logical): CHS 243201/255/63 Size: 3907029168 sectors a 512 bytes Capacity: 1863 GB (2000398934016 bytes) Config Status: cfg=new, avail=yes, need=no, active=unknown Attached to: #15 (Serial Attached SCSI controller)
- ich schaue mal nach wie der Status des Array ist:
raib2:~ # mdadm --detail /dev/md127 /dev/md127:
Version : 1.2 Creation Time : Fri Oct 28 11:41:55 2016 Raid Level : raid6 Array Size : 11720294400 (11177.34 GiB 12001.58 GB) Used Dev Size : 1953382400 (1862.89 GiB 2000.26 GB) Raid Devices : 8 Total Devices : 7 Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Thu Dec 28 14:39:27 2017 State : clean, degraded Active Devices : 7 Working Devices : 7 Failed Devices : 0 Spare Devices : 0
Layout : left-symmetric Chunk Size : 512K
Consistency Policy : bitmap
Name : raib2:0 (local to host raib2) UUID : 500aa0db:5aca5187:5617c3ff:dc97c2c4 Events : 10316
Number Major Minor RaidDevice State 0 8 17 0 active sync /dev/sdb1 1 8 33 1 active sync /dev/sdc1 2 8 49 2 active sync /dev/sdd1 3 8 65 3 active sync /dev/sde1 - 0 0 4 removed 5 8 113 5 active sync /dev/sdh1 6 8 97 6 active sync /dev/sdg1 7 8 81 7 active sync /dev/sdf1
- also das defekte device ist nun 100% "removed!"
- dann reicht ein hinzufügen eines Spare,
mdadm /dev/md127 --add-spare /dev/sdi1
- nach dem rebuild - der durch obigen Befehl automatisch startet, da ja ein device "fehlt", wird es automatisch als vollwertiges "U"-Device hinzugefügt!
Störung vom 06.03.2018
A
Feb 10 09:15:25 raib2 kernel: ata5.00: exception Emask 0x0 SAct 0x38 SErr 0x0 action 0x0 Feb 10 09:15:25 raib2 kernel: ata5.00: irq_stat 0x40000008 Feb 10 09:15:25 raib2 kernel: ata5.00: failed command: READ FPDMA QUEUED Feb 10 09:15:25 raib2 kernel: ata5.00: cmd 60/f0:20:00:d2:11/01:00:00:00:00/40 tag 4 ncq dma 253952 in res 51/40:80:70:d2:11/00:01:00:00:00/40 Emask 0x409 (media error) <F> Feb 10 09:15:25 raib2 kernel: ata5.00: status: { DRDY ERR } Feb 10 09:15:25 raib2 kernel: ata5.00: error: { UNC } Feb 10 09:15:25 raib2 kernel: ata5.00: configured for UDMA/133 Feb 10 09:15:25 raib2 kernel: sd 5:0:0:0: [sdd] tag#4 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Feb 10 09:15:25 raib2 kernel: sd 5:0:0:0: [sdd] tag#4 Sense Key : Medium Error [current] Feb 10 09:15:25 raib2 kernel: sd 5:0:0:0: [sdd] tag#4 Add. Sense: Unrecovered read error - auto reallocate failed Feb 10 09:15:25 raib2 kernel: sd 5:0:0:0: [sdd] tag#4 CDB: Read(10) 28 00 00 11 d2 00 00 01 f0 00 Feb 10 09:15:25 raib2 kernel: blk_update_request: I/O error, dev sdd, sector 1167984 Feb 10 09:15:25 raib2 kernel: ata5: EH complete Feb 10 09:15:29 raib2 kernel: ata5.00: exception Emask 0x0 SAct 0x7fffffff SErr 0x0 action 0x0 Feb 10 09:15:29 raib2 kernel: ata5.00: irq_stat 0x40000008 Feb 10 09:15:29 raib2 kernel: ata5.00: failed command: READ FPDMA QUEUED Feb 10 09:15:29 raib2 kernel: ata5.00: cmd 60/08:08:70:d2:11/00:00:00:00:00/40 tag 1 ncq dma 4096 in res 51/40:08:70:d2:11/00:00:00:00:00/40 Emask 0x409 (media error) <F> Feb 10 09:15:29 raib2 kernel: ata5.00: status: { DRDY ERR } Feb 10 09:15:29 raib2 kernel: ata5.00: error: { UNC } Feb 10 09:15:29 raib2 kernel: ata5.00: configured for UDMA/133 Feb 10 09:15:29 raib2 kernel: sd 5:0:0:0: [sdd] tag#1 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE Feb 10 09:15:29 raib2 kernel: sd 5:0:0:0: [sdd] tag#1 Sense Key : Medium Error [current] Feb 10 09:15:29 raib2 kernel: sd 5:0:0:0: [sdd] tag#1 Add. Sense: Unrecovered read error - auto reallocate failed Feb 10 09:15:29 raib2 kernel: sd 5:0:0:0: [sdd] tag#1 CDB: Read(10) 28 00 00 11 d2 70 00 00 08 00 Feb 10 09:15:29 raib2 kernel: blk_update_request: I/O error, dev sdd, sector 1167984 Feb 10 09:15:29 raib2 kernel: ata5: EH complete Feb 10 09:15:45 raib2 kernel: md/raid:md127: read error corrected (8 sectors at 1165936 on sdd1)
- smartd hat den Read error auch mitbekommen
Feb 10 09:42:03 raib2 smartd[2004]: Device: /dev/sdd [SAT], 8 Currently unreadable (pending) sectors Feb 10 09:42:03 raib2 smartd[2004]: Device: /dev/sdd [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 253 to 200 Feb 10 09:42:04 raib2 smartd[2004]: Device: /dev/sdd [SAT], ATA error count increased from 0 to 2
- es ist die disk "ata-TOSHIBA_DT01ACA200_Y5GHNDBTS"
- mdadm hatte niemals gesagt, dass eben eine Platte rausgeschmissen wurde
- Bei einem Neustart hiess es dann einfach
Feb 10 13:00:02 raib2 mdadm[3784]: NewArray event detected on md device /dev/md127 Feb 10 13:00:02 raib2 mdadm[3784]: DegradedArray event detected on md device /dev/md127
- meine Lösung was es 2 Spares in das Array zu bringen:
- 2018: 2 Platten für zusammen 130 Euro eingebaut:
- scsi-SATA_WDC_WD20EFRX-68E_WD-WCC4M4KXAVNT
- scsi-SATA_TOSHIBA_HDWD120_X7T0V1LAS
mdadm /dev/md127 --add-spare /dev/sdf1 mdadm /dev/md127 --add-spare /dev/sdg1
- Nach dem ersten Befehl lief sofort die Recovery los, so wie ich das erwartet hatte
- Ich habe mir das kurz angesehen, er war aber noch bei "0%"
- Der 2. Befehl brauchte sehr lange - ich glaube 40 Sekunden bis er angenommen wurde, danach war aber alles OK (Recovery und ein Spare!)
- Doch nun kam es zu einer weiteren Störung
B
Mar 07 19:24:34 raib2 kernel: md: md127: recovery done. Mar 07 19:24:35 raib2 kernel: md: recovery of RAID array md127
- also unmittelbar nachdem die erste recovery fertig war startete eine 2. und zwar ging es wieder um RAID-Drive 6 - sehr komisch - scheint mir ein Bug in der md-Software zu sein
- ich werde einfach die recovery aussitzen und dann das remove-te Drive zu einem Spare machen!
Ausbau am 26.03.2018
- Ausbau "Adaptec" da ich diesen aktiv kühlen muss
- Einbau AOC SAS MC
- Kauf von
- Kabel SFF-8087 auf 4x SATA
- Kabel SFF-8087 auf 4x SAS mit 5.25" Stromstecker
- Somit war der Einbau des "herumliegen" Fehlkaufes - eines SAS Platte "" - möglich
- Nunmehr 11 Platten im System
- Raid-Grösse auf 9 Platten vergrössert
- Anzahl der Spares auf 2 erhöht
- alle Platten wieder im Gehäuse untergebracht
Störung vom 30.09.2019
- Nach dem reboot sind alle Platten da, aber "sdk1" hat die Rolle (5) von "sdi5" geklaut
- Jetzt denkt er es ist ein raid0-System es steht auf inactive
/dev/md0:
Version : 1.2 Raid Level : raid0 Total Devices : 11 Persistence : Superblock is persistent State : inactive Name : raib2:0 (local to host raib2) UUID : 500aa0db:5aca5187:5617c3ff:dc97c2c4 Events : 61369 Number Major Minor RaidDevice - 8 17 - /dev/sdb1 - 8 33 - /dev/sdc1 - 8 49 - /dev/sdd1 - 8 65 - /dev/sde1 - 8 81 - /dev/sdf1 - 8 97 - /dev/sdg1 - 8 113 - /dev/sdh1 - 8 129 - /dev/sdi1 - 8 145 - /dev/sdj1 - 8 161 - /dev/sdk1 - 8 177 - /dev/sdl1
- Ich habe mit mdadm --examine /dev/sd*1 jede einzelne Rolle angesehen
- dabei war "k" eigentlich im Verbund nicht mehr dabei, hatte aber die identität "5" wie "i"
- Erste Idee war also dass ich "k" ganz abschalte!! "WD-WCC4M0SC7AR1"
- OK, dass war das "böse" Drive zumindest mal weg, das Problem war aber nicht gelöst
- Dann habe ich das Array neu re-created:
- mdadm --create --assume-clean --verbose /dev/md0 --level=6 --raid-devices=9 /dev/sd[cdefghijk]1
- Ich habe noch gesehen dass ein Lesecheck eigentlich 100% Fehler ergibt
- Ich habe gesehen dass er gar nicht die alte Reihenfolge der Platten benutzt hat, das ist ja dumm
- Es passte also nix zusammen, ext4.fsck ergab Millionen Fehler im Dateisystem, es war hoffnungslos
- Ich habe dieses Array verloren, da ich nicht weitergeforscht habe wie man beim "re-create" die Rollen der Partitionen beibehalten kann, dann wäre das sicher gutgegangen
- Nicht so schlimm: weil das nur ein Backupsystem war
Störung vom 27.11.2019
- Y5GHNDBTS, B2 die Toshiba macht nach einem Wiedereinbau 2018 erneut Probleme
- sie war auch für das Rebuild des Arrays verantwortlich
[Wed Nov 27 14:54:39 2019] ata5.00: exception Emask 0x0 SAct 0x7ff0003f SErr 0x0 action 0x0 [Wed Nov 27 14:54:39 2019] ata5.00: irq_stat 0x40000008 [Wed Nov 27 14:54:39 2019] ata5.00: failed command: READ FPDMA QUEUED [Wed Nov 27 14:54:39 2019] ata5.00: cmd 60/40:00:00:d8:50/05:00:00:00:00/40 tag 0 ncq dma 688128 in res 51/40:40:00:d8:50/00:05:00:00:00/40 Emask 0x409 (media error) <F> [Wed Nov 27 14:54:39 2019] ata5.00: status: { DRDY ERR } [Wed Nov 27 14:54:39 2019] ata5.00: error: { UNC } [Wed Nov 27 14:54:39 2019] ata5.00: configured for UDMA/133 [Wed Nov 27 14:54:39 2019] sd 5:0:0:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE [Wed Nov 27 14:54:39 2019] sd 5:0:0:0: [sde] tag#0 Sense Key : Medium Error [current] [Wed Nov 27 14:54:39 2019] sd 5:0:0:0: [sde] tag#0 Add. Sense: Unrecovered read error - auto reallocate failed [Wed Nov 27 14:54:39 2019] sd 5:0:0:0: [sde] tag#0 CDB: Read(10) 28 00 00 50 d8 00 00 05 40 00 [Wed Nov 27 14:54:39 2019] blk_update_request: I/O error, dev sde, sector 5298176 [Wed Nov 27 14:54:39 2019] ata5: EH complete
- Routinemässig führte ich einen kompletten Lesecheck durch
- sde hat hierauf durch diverse Lesefehler geglänzt, das hab ich mi dmesg gesehen
- der Read-Mismatch Count war auf 24 gestiegen
- die Temperatur von sde war 4 Grad höher als der Durchschnitt der anderen Platten
- md hat diverse Lesefehler durch Überschreiben scheinbar gelöst
- Ich habe den "check" unterbrochen (ich denke mit "frozen") und ein --replace gemacht
[Wed Nov 27 14:36:08 2019] md/raid:md0: read error corrected (8 sectors at 5257216 on sde1) [Wed Nov 27 14:36:08 2019] md/raid:md0: read error corrected (8 sectors at 5260120 on sde1) [Wed Nov 27 14:39:48 2019] md/raid:md0: read error corrected (8 sectors at 17007032 on sde1) [Wed Nov 27 14:39:48 2019] md/raid:md0: read error corrected (8 sectors at 17000048 on sde1) [Wed Nov 27 14:39:49 2019] md/raid:md0: read error corrected (8 sectors at 17007096 on sde1) [Wed Nov 27 14:39:49 2019] md/raid:md0: read error corrected (8 sectors at 17018104 on sde1) [Wed Nov 27 14:39:49 2019] md/raid:md0: read error corrected (8 sectors at 17018232 on sde1) [Wed Nov 27 14:39:49 2019] md/raid:md0: read error corrected (8 sectors at 17018256 on sde1) [Wed Nov 27 14:41:17 2019] md: md0: data-check interrupted. [Wed Nov 27 14:41:28 2019] md/raid:md0: read error corrected (8 sectors at 18543120 on sde1) [Wed Nov 27 14:53:13 2019] md: recovery of RAID array md0 [Wed Nov 27 14:55:10 2019] md/raid:md0: read error corrected (8 sectors at 5282632 on sde1) [Wed Nov 27 14:55:10 2019] md/raid:md0: read error corrected (8 sectors at 5282640 on sde1) [Wed Nov 27 14:55:11 2019] md/raid:md0: read error corrected (8 sectors at 5282392 on sde1) [Wed Nov 27 14:56:56 2019] md/raid:md0: read error corrected (8 sectors at 17023768 on sde1) [Wed Nov 27 14:59:22 2019] md/raid:md0: read error corrected (8 sectors at 18601648 on sde1) [Wed Nov 27 14:59:22 2019] md/raid:md0: read error corrected (8 sectors at 18604832 on sde1) [Wed Nov 27 14:59:29 2019] md/raid:md0: read error corrected (8 sectors at 18604992 on sde1) [Wed Nov 27 14:59:48 2019] md/raid:md0: read error corrected (8 sectors at 18598848 on sde1) [Wed Nov 27 14:59:49 2019] md/raid:md0: read error corrected (8 sectors at 18598856 on sde1) [Wed Nov 27 14:59:49 2019] md/raid:md0: read error corrected (8 sectors at 18598880 on sde1) [Wed Nov 27 14:59:49 2019] md/raid:md0: read error corrected (8 sectors at 18598928 on sde1) [Wed Nov 27 15:00:13 2019] md/raid:md0: read error corrected (8 sectors at 18612776 on sde1)
- gebe diese Platte entgültig ins Recycling
Ausbau am 28.11.2019
- Entsorge WCC4M0SC7AR1
- Entsorge Y5GHNDBTSTZ5
- Einbau des 3. Cages, dadurch Frontblende nicht mehr verwendbar
- Neukauf Z8K7WMMAS als spare (sde)
Störung vom 29.11.2019
- Es ergeben sich Fehler beim Scrubbing
- Ich mache nach "check" jetzt einen "repair"-Lauf
raib2:~ # cat /sys/block/md0/md/mismatch_cnt 88 raib2:~ # cat /proc/mdstat Personalities : [raid6] [raid5] [raid4] md0 : active raid6 sdf1[0] sdg1[3] sdi1[4] sdk1[8] sdh1[9] sdj1[7] sde1[10](S) sdd1[6] sdb1[1] sdc1[5] 13673676800 blocks super 1.2 level 6, 512k chunk, algorithm 2 [9/9] [UUUUUUUUU] [==>..................] resync = 14.1% (276989284/1953382400) finish=203.8min speed=137064K/sec bitmap: 0/15 pages [0KB], 65536KB chunk unused devices: <none>
- Ergebnis eines "check" nach einem "repair"
- -- hier einfügen --
Zusätzliche Infos
b: 194 Temperature_Celsius 0x0022 122 107 000 Old_age Always - 25 9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 986 Rotation Rate: 7200 rpm c: 194 Temperature_Celsius 0x0022 120 106 000 Old_age Always - 27 9 Power_On_Hours 0x0032 080 080 000 Old_age Always - 14772 Rotation Rate: 5400 rpm d: 194 Temperature_Celsius 0x0022 026 040 000 Old_age Always - 26 (0 10 0 0 0) 9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14625 Rotation Rate: 7200 rpm e: 194 Temperature_Celsius 0x0002 206 206 000 Old_age Always - 29 (Min/Max 12/42) 9 Power_On_Hours 0x0012 098 098 000 Old_age Always - 14766 Rotation Rate: 7200 rpm f: 194 Temperature_Celsius 0x0022 027 040 000 Old_age Always - 27 (0 10 0 0 0) 9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14624 Rotation Rate: 7200 rpm g: 194 Temperature_Celsius 0x0002 206 206 000 Old_age Always - 29 (Min/Max 12/42) 9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 943 Rotation Rate: 7200 rpm h: 194 Temperature_Celsius 0x0002 222 222 000 Old_age Always - 27 (Min/Max 11/35) 9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 2006 Rotation Rate: 7200 rpm i: 194 Temperature_Celsius 0x0022 024 040 000 Old_age Always - 24 (0 9 0 0 0) 9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 14623 Rotation Rate: 7200 rpm j: 194 Temperature_Celsius 0x0002 222 222 000 Old_age Always - 27 (Min/Max 11/41) 9 Power_On_Hours 0x0012 098 098 000 Old_age Always - 14842 Rotation Rate: 7200 rpm k: Rotation Rate: 7200 rpm
SysFS BusID: 1:0:0:0 SysFS BusID: 2:0:0:0 SysFS BusID: 3:0:0:0 SysFS BusID: 4:0:0:0 SysFS BusID: 5:0:0:0 SysFS BusID: 6:0:0:0 SysFS BusID: 0:0:0:0 SysFS BusID: 0:0:1:0 SysFS BusID: 0:0:2:0 SysFS BusID: 0:0:3:0 SysFS BusID: 0:0:4:0
/dev/md0: Version : 1.2 Creation Time : Mon Sep 30 11:27:05 2019 Raid Level : raid6 Array Size : 13673676800 (13040.23 GiB 14001.85 GB) Used Dev Size : 1953382400 (1862.89 GiB 2000.26 GB) Raid Devices : 9 Total Devices : 10 Persistence : Superblock is persistent Intent Bitmap : Internal Update Time : Wed Oct 23 16:49:56 2019 State : clean Active Devices : 9 Working Devices : 10 Failed Devices : 0 Spare Devices : 1 Layout : left-symmetric Chunk Size : 512K
Consistency Policy : bitmap
Name : raib2:0 (local to host raib2) UUID : d014324b:85ea6d08:42120868:6465e2b2 Events : 4428 Number Major Minor RaidDevice State 0 8 33 0 active sync /dev/sdc1 1 8 49 1 active sync /dev/sdd1 2 8 65 2 active sync /dev/sde1 3 8 81 3 active sync /dev/sdf1 4 8 97 4 active sync /dev/sdg1 5 8 113 5 active sync /dev/sdh1 6 8 129 6 active sync /dev/sdi1 7 8 145 7 active sync /dev/sdj1 8 8 161 8 active sync /dev/sdk1 9 8 17 - spare /dev/sdb1