RAID6-2020: Unterschied zwischen den Versionen

Aus OrgaMon Wiki
Zur Navigation springen Zur Suche springen
 
(21 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 5: Zeile 5:




* ehemals back42, nun backup
* 5x 12TB Drive aus WD Elementes, Power-Cable: 3.3V einfach abgezwickt
* 5x 12TB Drive aus WD Elementes, Power-Cable: 3.3V einfach abgezwickt
* 1x Spare, 4x RAID6
* 1x Spare, 4x RAID6
* SSD 850 Pro mit 99 GB (sda4) als RAID-Journal
* SSD 850 Pro mit 99 GB (sda4) als RAID-Journal
* ext4 Dateisystem mit 22 TB
* RAID 6, ext4 Dateisystem mit 22 TB
* openSUSE 15.2
* openSUSE 15.5


== Hardware ==
== Hardware ==
Zeile 36: Zeile 37:
*** diese Platte ist etwas langsamer als die EMFZ
*** diese Platte ist etwas langsamer als die EMFZ
** <b>[5]</b> <code>WDC WD120EMFZ-11A6JA0 <b>Z2J4ES6T</b> 81.00A81 (CMR)</code>
** <b>[5]</b> <code>WDC WD120EMFZ-11A6JA0 <b>Z2J4ES6T</b> 81.00A81 (CMR)</code>
* externe HDD (360,00 €) WD Elements 12 TB, wöchentlich wechselnd
* HP EX900 M.2 120 GB Solid-State-Laufwerk, onboard, nvme
** <code>WDC WD120EMFZ-11A6JA0 <b>X0G75LEC</b> 81.00A81 (CMR)</code>
** https://support.hp.com/de-de/product/product-specs/hp-ex900-m.2-120gb-solid-state-drive/23815825
** <code>WDC WD120EMFZ-11A6JA0 <b>9RKSKUJD</b> 81.00A81 (CMR)</code>


== False Positiv Error Msg ==
== Funktionen ==


* sync, umount, reboot ->
=== Major/Minor Sicherungen ===
* <code>[Fri Nov  6 10:27:22 2020] md/raid:md127: recovering 0 data-only stripes and <b>1</b> data-parity stripes</code>


  https://github.com/torvalds/linux/blob/master/drivers/md/raid5-cache.c
  #!/bin/bash
  Line 2496
  https://github.com/torvalds/linux/commit/b4c625c67362b3940f619c1a836b4e8329106658#diff-be24a83d195fa53b3da9c7257a0352e92dbe2318c725e0492986d425317d4e3d
#
# minor, wöchentlich anderes Verzeichnis
#
ANZAHL_BAENDER=3
BAND=$((10#$(date +%V)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"
DEST=/srv/smb/ra6/minor/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::minor/ $DEST
touch $DEST
#
# major, täglich anderes Verzeichnis
#
ANZAHL_BAENDER=10
BAND=$((($(date +%s)/86400)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"
   
  DEST=/srv/smb/ra6/major/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::major/ $DEST
touch $DEST


* data_parity_stripes wird incrementiert, auch wenn er nichts arbeitet ist der Wert zumindest 1
* Zeile <code>10#$(date +%V)</code> muss gemacht werden. "10#" ergänzt den Rückgabewert 08, dieser würde sonst als oktale Ziffernfolge ausgewertet, so aber 10#08 wird es als dezimal 8 interprätiert
 
== raid ==
 
      0      8      17        0      active sync  /dev/sdb1 Z2JX019T
      1      8      81        1     active sync  /dev/sdf1 X1G0HP2L
      2      8      65        2      active sync  /dev/sde1 QGKG970T
      3      8      33        3      active sync  /dev/sdc1 5PH5124D
      4      8      49        -      spare  /dev/sdd1 Z2J4ES6T
      5      8        4        -      journal  /dev/sda4 H217925W


== Logbuch ==
== Logbuch ==


* 2020-11-29 "major" / "minor" Konzept
* 2020-11-21 Installation beim Kunden
* 2020-11-21 Installation beim Kunden
* 2020-11-06  
* 2020-11-06  
Zeile 60: Zeile 95:
*** Ich denke es ist ein Fehler in der md Software, mal sehen ob dies bleibt
*** Ich denke es ist ein Fehler in der md Software, mal sehen ob dies bleibt
* 2020-11-01 Zusammenbau und Dauertest
* 2020-11-01 Zusammenbau und Dauertest
* 2021-02-20 Fehler wegen 08 - Backup-Script korrigiert
* 2023-08-08 CPU überhitzt, Lüftergeräusche, Gerät kommt in Wartung
* 2023-08-16 CPU Lüfter hin lose am Board, kein Kontakt mehr zur CPU Oberfläche
** CPU Cooler montiert, mit Klebstoff gegen erneutes Ablösen gesichert
** SuperMicro BIOS-Update auf 2.0
** SuperMicro IPMI-Update von 01.23.04 auf 01.74.09
** OpenSUSE Update auf 15.5 misslungen
** HP NVME nachgerüstet, OpenSuSE 15.5 neu installiert
** "Autostart" des MD-Arrays war nicht möglich, muss mit neuer Systemd-Unit "md0.service" nachhelfen
** Scrub erfolgreich durchgeführt
** CPU Temperaturen passen wieder
* 2023-10-10 Sicherung von "Linux-Server-Config"

Aktuelle Version vom 29. Januar 2024, 16:47 Uhr


  • ehemals back42, nun backup
  • 5x 12TB Drive aus WD Elementes, Power-Cable: 3.3V einfach abgezwickt
  • 1x Spare, 4x RAID6
  • SSD 850 Pro mit 99 GB (sda4) als RAID-Journal
  • RAID 6, ext4 Dateisystem mit 22 TB
  • openSUSE 15.5

Hardware

Funktionen

Major/Minor Sicherungen

#!/bin/bash

#
# minor, wöchentlich anderes Verzeichnis
#
ANZAHL_BAENDER=3
BAND=$((10#$(date +%V)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"

DEST=/srv/smb/ra6/minor/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::minor/ $DEST
touch $DEST

#
# major, täglich anderes Verzeichnis
#
ANZAHL_BAENDER=10
BAND=$((($(date +%s)/86400)%$ANZAHL_BAENDER))
OPTIONS="-avK --delete --force --ignore-errors --copy-unsafe-links"

DEST=/srv/smb/ra6/major/$BAND
echo $DEST
mkdir $DEST
chmod 777 $DEST
rsync $OPTIONS 192.168.178.110::major/ $DEST
touch $DEST
  • Zeile 10#$(date +%V) muss gemacht werden. "10#" ergänzt den Rückgabewert 08, dieser würde sonst als oktale Ziffernfolge ausgewertet, so aber 10#08 wird es als dezimal 8 interprätiert

raid

      0       8       17        0      active sync   /dev/sdb1 Z2JX019T
      1       8       81        1      active sync   /dev/sdf1 X1G0HP2L
      2       8       65        2      active sync   /dev/sde1 QGKG970T
      3       8       33        3      active sync   /dev/sdc1 5PH5124D
      4       8       49        -      spare   /dev/sdd1 Z2J4ES6T
      5       8        4        -      journal   /dev/sda4 H217925W

Logbuch

  • 2020-11-29 "major" / "minor" Konzept
  • 2020-11-21 Installation beim Kunden
  • 2020-11-06
    • Erster Scrub erfolgreiche beendet, dauerte 21 Stunden
    • [Fri Nov 6 10:27:22 2020] md/raid:md127: recovering 0 data-only stripes and 1 data-parity stripes
      • Das ist scheinbar normal, ich hab sync und unmount und reboot gemacht, bei 0 Fehler kommt dennoch diese Meldung
      • Ich denke es ist ein Fehler in der md Software, mal sehen ob dies bleibt
  • 2020-11-01 Zusammenbau und Dauertest
  • 2021-02-20 Fehler wegen 08 - Backup-Script korrigiert
  • 2023-08-08 CPU überhitzt, Lüftergeräusche, Gerät kommt in Wartung
  • 2023-08-16 CPU Lüfter hin lose am Board, kein Kontakt mehr zur CPU Oberfläche
    • CPU Cooler montiert, mit Klebstoff gegen erneutes Ablösen gesichert
    • SuperMicro BIOS-Update auf 2.0
    • SuperMicro IPMI-Update von 01.23.04 auf 01.74.09
    • OpenSUSE Update auf 15.5 misslungen
    • HP NVME nachgerüstet, OpenSuSE 15.5 neu installiert
    • "Autostart" des MD-Arrays war nicht möglich, muss mit neuer Systemd-Unit "md0.service" nachhelfen
    • Scrub erfolgreich durchgeführt
    • CPU Temperaturen passen wieder
  • 2023-10-10 Sicherung von "Linux-Server-Config"