RAID6-2020: Unterschied zwischen den Versionen

Aus OrgaMon Wiki
Zur Navigation springen Zur Suche springen
 
(25 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 5: Zeile 5:




* ehemals back42, nun backup
* 5x 12TB Drive aus WD Elementes, Power-Cable: 3.3V einfach abgezwickt
* 5x 12TB Drive aus WD Elementes, Power-Cable: 3.3V einfach abgezwickt
* 1x Spare, 4x RAID6
* 1x Spare, 4x RAID6
* SSD 850 Pro mit 99 GB (sda4) als RAID-Journal
* SSD 850 Pro mit 99 GB (sda4) als RAID-Journal
* ext4 Dateisystem mit 22 TB
* RAID 6, ext4 Dateisystem mit 22 TB
* openSUSE 15.2
* openSUSE 15.5


== Hardware ==
== Hardware ==
Zeile 15: Zeile 16:
* Fractal Define 7 weiß [135,42 €]
* Fractal Define 7 weiß [135,42 €]
** https://www.alternate.de/Fractal-Design/Define-7-White-Solid-Tower-Geh%C3%A4use/html/product/1602127
** https://www.alternate.de/Fractal-Design/Define-7-White-Solid-Tower-Geh%C3%A4use/html/product/1602127
 
* Netzteil [45,00 €]
 
** Enermax Revolution Teilmodular 87+
* Supermicro Inc. X11SCL-F [153,15 €]
* Supermicro Inc. X11SCL-F [153,15 €]
** https://www.supermicro.com/en/products/motherboard/X11SCL-F
** https://www.supermicro.com/en/products/motherboard/X11SCL-F
* CPU Intel Xeon E-2124 - 3.3 GHz - 4 Kerne - 4 Threads - 8 MB Cache-Speicher - LGA1151 Socket - Box [205,44 €]
* CPU Intel Xeon E-2124 - 3.3 GHz - 4 Kerne - 4 Threads - 8 MB Cache-Speicher - LGA1151 Socket - Box [205,44 €]
** https://www.jacob.de/produkte/intel-xeon-e-2124-bx80684e2124-artnr-4775634.html
** https://www.jacob.de/produkte/intel-xeon-e-2124-bx80684e2124-artnr-4775634.html
* 32 GB Hauptspeicher Crosair cmk64gx4m4a2133c13, kein ECC [207,00 €]
* 32 GB Hauptspeicher Crosair cmk64gx4m4a2133c13, kein ECC [207,00 €]
** https://www.cyberport.de/?DEEP=2409-08X&APID=276&gclid=EAIaIQobChMIi_Ss-oza7AIVEbTVCh3P-wmcEAQYAiABEgJYBPD_BwE
** https://www.cyberport.de/?DEEP=2409-08X&APID=276&gclid=EAIaIQobChMIi_Ss-oza7AIVEbTVCh3P-wmcEAQYAiABEgJYBPD_BwE
* AHCI-Controller, asmedia 1061 PCIx 1x to 2x SATA Controller (20 €)
* AHCI-Controller, asmedia 1061 PCIx 1x to 2x SATA Controller (20 €)
** https://www.amazon.de/gp/product/B07V5MXVNW/ref=ppx_yo_dt_b_asin_title_o02_s00?ie=UTF8&psc=1
** https://www.amazon.de/gp/product/B07V5MXVNW/ref=ppx_yo_dt_b_asin_title_o02_s00?ie=UTF8&psc=1
* Samsung 850 PRO, SSD [50,00 €]
* Samsung 850 PRO, SSD [50,00 €]
** gebraucht aber neuwertig, geringes Schreibvolumen
** gebraucht aber neuwertig, geringes Schreibvolumen, neueste Firmware-Updates '11.2020
 
** sda4 ist Partition für das raid6 Journal
 
* RAID 6 HDDs [900,00 €] (5 = 4+1 Spare)
* Netzteil [45,00 €]
** <b>[1]</b> <code>WDC WD120EMFZ-11A6JA0 <b>QGKG970T</b> 81.00A81 (CMR)</code>
** Enermax Revolution Teilmodular 87+
** <b>[2]</b> <code>WDC WD120EMFZ-11A6JA0 <b>X1G0HP2L</b> 81.00A81 (CMR)</code>
 
** <b>[3]</b> <code>WDC WD120EMFZ-11A6JA0 <b>Z2JX019T</b> 81.00A81 (CMR)</code>
* HDD [900,00 €]
** <b>[4]</b> <code>WDC WD120EDAZ-11F3RA0 <b>5PH5124D</b> 81.00A81 (CMR, kein default des SCT!)</code>
** <code>WDC WD120EMFZ-11A6JA0 <b>QGKG970T</b> 81.00A81 (CMR)</code>
** <code>WDC WD120EMFZ-11A6JA0 <b>X1G0HP2L</b> 81.00A81 (CMR)</code>
** <code>WDC WD120EMFZ-11A6JA0 <b>Z2JX019T</b> 81.00A81 (CMR)</code>
** <code>WDC WD120EDAZ-11F3RA0 <b>5PH5124D</b> 81.00A81 (CMR, kein default des SCT!)</code>
*** smartctl -l scterc,70,70 /dev/sde
*** smartctl -l scterc,70,70 /dev/sde
*** diese Platte ist etwas langsamer als die EMFZ
*** diese Platte ist etwas langsamer als die EMFZ
** <code>WDC WD120EMFZ-11A6JA0 <b>Z2J4ES6T</b> 81.00A81 (CMR)</code>
** <b>[5]</b> <code>WDC WD120EMFZ-11A6JA0 <b>Z2J4ES6T</b> 81.00A81 (CMR)</code>
* HDD (360,00 €)
* HP EX900 M.2 120 GB Solid-State-Laufwerk, onboard, nvme
** <code>WDC WD120EMFZ-11A6JA0 <b>X0G75LEC</b> 81.00A81 (CMR)</code>
** https://support.hp.com/de-de/product/product-specs/hp-ex900-m.2-120gb-solid-state-drive/23815825
** <code>WDC WD120EMFZ-11A6JA0 <b>9RKSKUJD</b> 81.00A81 (CMR)</code>
 
== Funktionen ==


* Kleinteile
=== Major/Minor Sicherungen ===
**


== False Positiv Error Msg ==
#!/bin/bash
#
# minor, wöchentlich anderes Verzeichnis
#
ANZAHL_BAENDER=3
BAND=$((10#$(date +%V)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"
DEST=/srv/smb/ra6/minor/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::minor/ $DEST
touch $DEST
#
# major, täglich anderes Verzeichnis
#
ANZAHL_BAENDER=10
BAND=$((($(date +%s)/86400)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"
DEST=/srv/smb/ra6/major/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::major/ $DEST
touch $DEST


* sync, umount, reboot ->
* Zeile <code>10#$(date +%V)</code> muss gemacht werden. "10#" ergänzt den Rückgabewert 08, dieser würde sonst als oktale Ziffernfolge ausgewertet, so aber 10#08 wird es als dezimal 8 interprätiert
* <code>[Fri Nov  6 10:27:22 2020] md/raid:md127: recovering 0 data-only stripes and <b>1</b> data-parity stripes</code>


https://github.com/torvalds/linux/blob/master/drivers/md/raid5-cache.c
== raid ==
Line 2496
https://github.com/torvalds/linux/commit/b4c625c67362b3940f619c1a836b4e8329106658#diff-be24a83d195fa53b3da9c7257a0352e92dbe2318c725e0492986d425317d4e3d


* data_parity_stripes wird incrementiert, auch wenn er nichts arbeitet ist der Wert zumindest 1
      0      8      17        0      active sync  /dev/sdb1 Z2JX019T
      1       8      81        1      active sync  /dev/sdf1 X1G0HP2L
      2      8      65        2      active sync  /dev/sde1 QGKG970T
      3      8      33        3      active sync  /dev/sdc1 5PH5124D
      4      8      49        -      spare  /dev/sdd1 Z2J4ES6T
      5      8        4        -      journal  /dev/sda4 H217925W


== Logbuch ==
== Logbuch ==


* 2020-11-29 "major" / "minor" Konzept
* 2020-11-21 Installation beim Kunden
* 2020-11-06  
* 2020-11-06  
** Erster Scrub erfolgreiche beendet, dauerte 21 Stunden
** Erster Scrub erfolgreiche beendet, dauerte 21 Stunden
Zeile 72: Zeile 95:
*** Ich denke es ist ein Fehler in der md Software, mal sehen ob dies bleibt
*** Ich denke es ist ein Fehler in der md Software, mal sehen ob dies bleibt
* 2020-11-01 Zusammenbau und Dauertest
* 2020-11-01 Zusammenbau und Dauertest
* 2021-02-20 Fehler wegen 08 - Backup-Script korrigiert
* 2023-08-08 CPU überhitzt, Lüftergeräusche, Gerät kommt in Wartung
* 2023-08-16 CPU Lüfter hin lose am Board, kein Kontakt mehr zur CPU Oberfläche
** CPU Cooler montiert, mit Klebstoff gegen erneutes Ablösen gesichert
** SuperMicro BIOS-Update auf 2.0
** SuperMicro IPMI-Update von 01.23.04 auf 01.74.09
** OpenSUSE Update auf 15.5 misslungen
** HP NVME nachgerüstet, OpenSuSE 15.5 neu installiert
** "Autostart" des MD-Arrays war nicht möglich, muss mit neuer Systemd-Unit "md0.service" nachhelfen
** Scrub erfolgreich durchgeführt
** CPU Temperaturen passen wieder
* 2023-10-10 Sicherung von "Linux-Server-Config"

Aktuelle Version vom 29. Januar 2024, 15:47 Uhr


  • ehemals back42, nun backup
  • 5x 12TB Drive aus WD Elementes, Power-Cable: 3.3V einfach abgezwickt
  • 1x Spare, 4x RAID6
  • SSD 850 Pro mit 99 GB (sda4) als RAID-Journal
  • RAID 6, ext4 Dateisystem mit 22 TB
  • openSUSE 15.5

Hardware

Funktionen

Major/Minor Sicherungen

#!/bin/bash

#
# minor, wöchentlich anderes Verzeichnis
#
ANZAHL_BAENDER=3
BAND=$((10#$(date +%V)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"

DEST=/srv/smb/ra6/minor/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::minor/ $DEST
touch $DEST

#
# major, täglich anderes Verzeichnis
#
ANZAHL_BAENDER=10
BAND=$((($(date +%s)/86400)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"

DEST=/srv/smb/ra6/major/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::major/ $DEST
touch $DEST
  • Zeile 10#$(date +%V) muss gemacht werden. "10#" ergänzt den Rückgabewert 08, dieser würde sonst als oktale Ziffernfolge ausgewertet, so aber 10#08 wird es als dezimal 8 interprätiert

raid

      0       8       17        0      active sync   /dev/sdb1 Z2JX019T
      1       8       81        1      active sync   /dev/sdf1 X1G0HP2L
      2       8       65        2      active sync   /dev/sde1 QGKG970T
      3       8       33        3      active sync   /dev/sdc1 5PH5124D
      4       8       49        -      spare   /dev/sdd1 Z2J4ES6T
      5       8        4        -      journal   /dev/sda4 H217925W

Logbuch

  • 2020-11-29 "major" / "minor" Konzept
  • 2020-11-21 Installation beim Kunden
  • 2020-11-06
    • Erster Scrub erfolgreiche beendet, dauerte 21 Stunden
    • [Fri Nov 6 10:27:22 2020] md/raid:md127: recovering 0 data-only stripes and 1 data-parity stripes
      • Das ist scheinbar normal, ich hab sync und unmount und reboot gemacht, bei 0 Fehler kommt dennoch diese Meldung
      • Ich denke es ist ein Fehler in der md Software, mal sehen ob dies bleibt
  • 2020-11-01 Zusammenbau und Dauertest
  • 2021-02-20 Fehler wegen 08 - Backup-Script korrigiert
  • 2023-08-08 CPU überhitzt, Lüftergeräusche, Gerät kommt in Wartung
  • 2023-08-16 CPU Lüfter hin lose am Board, kein Kontakt mehr zur CPU Oberfläche
    • CPU Cooler montiert, mit Klebstoff gegen erneutes Ablösen gesichert
    • SuperMicro BIOS-Update auf 2.0
    • SuperMicro IPMI-Update von 01.23.04 auf 01.74.09
    • OpenSUSE Update auf 15.5 misslungen
    • HP NVME nachgerüstet, OpenSuSE 15.5 neu installiert
    • "Autostart" des MD-Arrays war nicht möglich, muss mit neuer Systemd-Unit "md0.service" nachhelfen
    • Scrub erfolgreich durchgeführt
    • CPU Temperaturen passen wieder
  • 2023-10-10 Sicherung von "Linux-Server-Config"