Datensicherung

Aus OrgaMon Wiki
Zur Navigation springen Zur Suche springen

Notfall Plan für die Wiederherstellung
Ausfallserver für den firebird Dienst

Datensicherung - Ein Überblick

Es wird der sehr stabile firebird SQL-Server verwendet. Dennoch sind Kopien der Datenbank und der Arbeitsverzeichnisse notwendig da die Speicherungstechnik jederzeit versagen kann. Der Datenverlust kann begrenzt werden, indem man auf Sicherungskopieen (Datensicherung) zurückgreifen kann.
Die mehrphasige Sicherung hat das Ziel ausgehend von dem letztendlich entstehenden Sicherungs-Zip die komplette OrgaMon-Umgebung neu aufsetzen zu können. Das enthält somit das Anwendungsverzeichnis, in dem OrgaMon läuft, sowie das Backup der aktuellen Datenbank.

Die Datensicherung erfolgt in 3 Phasen:

Phase A: Erstellung eines Datenbank - Backups

Jedem Backuplauf wird zunächst eine fortlaufende BACKUP_TAN zugeordnet. Nun wird der Datenbank-Server veranlasst die gesamte Datenbank in die Datei Sicherung_<BACKUP_TAN>.fbak zu sichern. Diese einzelne Datei enthält die gesamte zu sichernde Datenbank (".fdb"). Dabei kann gesteuert werden in welchem Pfad diese Datei angelegt wird. Dies erfolgt durch den Systemparameter:

#
# Beispiel 1: Linux Server speichert direkt in OrgaMon-Datensicherung
#
DatenbankBackupPfad=/srv/smb/freigabe/OrgaMon/Datensicherung/

#
# Beispiel 2: Windows Server speichert direkt in OrgaMon-Datensicherung
#
DatenbankBackupPfad=C:\Freigabe\OrgaMon\Datensicherung\

#
# best practice "Linux": fbak nach /srv/firebird
#
DatenbankBackupPfad=/srv/firebird/


Optimal ist natürlich, wenn die ".fbak" Datei sofort im .\Datensicherung Unterverzeichnis des OrgaMon landet. Dann kann Phase B übersprungen werden. Dies ist aber nur unter Voraussetzungen möglich auf die hiermit eingegangen wird: Wird das OrgaMon- Anwendungsverzeichnis durch den selben Server zur Verfügung gestellt der auch den Datenbankserver firebird betreibt, kann firebird seine Datensicherung direkt in das .\Datensicherungs - Verzeichnis des OrgaMon Anwendungsverzeichnis ablegen. Dadurch wird zusätzliches umkopieren vermieden. Beachten Sie jedoch dass die Rechte samba/firebird zusammenpassen. Ist diese Angabe leer, so wird in das selbe Verzeichnis gesichert, in dem auch die Datenbank selbst liegt. Dieses Backup wird nun durch einen Restore-Lauf in eine Zwischen- Datenbank zurückgespeichert. War dies erfolgreich, werden alle GENERATOR-Werte der "aktuellen" und der "restoreten" Datenbank verglichen. Ist der Vergleich erfolgreich wird die Zwischen- Datenbank gelöscht, das Backup wird als "GUT" markiert. Dieser Aufwand muss betrieben werden, da ein erfolgtes Backup noch lange nicht bedeutet das es auch wieder in eine funktionierende Datenbank zurückverwandelt werden kann.

  • Lebensdauer dieser fbak - Dateien = 10 Tage)

Phase B: Die Sicherung umlagern und komprimieren

Das Ziel von Datenbank- Sicherungs- Dateien ist das OrgaMon Unterverzeichnis .\Datensicherung. Kann der Datenbank-Server sein Backup nicht direkt in das .\Datensicherung Verzeichnis ablegen muss es dorthin umkopiert werden. Dieses umkopieren muss jedem Client möglich sein. Somit muss jedem Client ein Laufwerksbuchstabe + Verzeichnis zur Verfügung gestellt werden, worin er die von Server erstellen ".fbak" lesen und löschen kann (Berechtigungen beachten). Diesen Zugriffspfad kann man in den Systemparametern angeben unter:

 FreigabePfad=\\<ServerHostNameWoDieDatenbankLiegt>\<FreigabenameFuer_fbaks>\<Pfad>\

Mehrplatz: Nachdem der Server das Backup erstellt hat, will der Client die neue .fbak Datei sehen. Dazu wird der Parameter Freigabe-Pfad als Prefix für die Sicherungsdatei verwendet. Also "mv %FreigabePfad%Sicherung_<TAN>.fbak .\Datensicherung".

  • Lebensdauer dieser Dateien = 3 Tage

Phase C: Gesamtsicherung

  • Hier wird das ganze OrgaMon-Verzeichnis mit allen Unterverzeichnissen (und damit auch den .fbaks der Phase B) in ein ZIP-Archiv gepackt.
  • Aus Geschwindigkeitsgründen wird das Archiv zunächst lokal in .\Dokumente\OrgaMon\ erstellt.
  • Mit einem Systemparameter kann angegeben werden, wohin dieses Gesamtsicherungs-Zip nach Erstellung verschoben werden soll.


SicherungsPfad=<SicherungsPfad>


  • Bleibt diese Angabe leer, so erfolgt die Sicherung in das Stammverzeichnis des OrgaMon Anwendungsverzeichnisses.
  • Es sollte immer ein physikalisch anderes Laufwerk gewählt werden, als das des OrgaMon-Verzeichnisses, damit im Ausfall Moment nicht das Verzeichnis UND die Sicherungszips verloren sind.

400

// die400 
 
 // erstellt eine Dateiliste von gewissen Dateien
// die mit hinreichender Wahrscheinlichkeit nicht mehr benötigt werden
// es sind diverse Dateien aus unterschiedlichen Quellen
// die 400er-Zips sollten dauerhaft gespeichert werden

Haltbarkeit von Datensicherungen

  • Täglich entsteht ja die Gesamt-Sicherung, im Laufe der Jahre kann dies ein Datenvolumen von mehreren TB ergeben
  • Es ist eigentlich auch nicht nötig von jedem Tag der Vergangenheit eine Sicherung zu haben
    • Also wir würden jetzt den Stand vom 22.03.2017 benötigen, dann ist oft der 01.03.2017 oder der 01.04.2017 auch aussagekräftig genug
  • Je weiter der Tag entfernt ist, um so grösser dürfen "Lücken" in der Datenhaltung sein

Hohe Ansprüche aufweichen

von TÄGLICH" zu WÖCHENTLICH zu MONATLICH zu QUARTAL zu JÄHRLICH 
  • Das Prinzip ist dass wir einen Bereich definieren in dem wir täglich Datensicherungen haben wollen, sagen wir 14 Stück, also 14 Tage
  • Danach wollen wir wöchentliche Datensicherungen, dann nur noch monatliche, usw.
  • Der Trick ist, dass wir eine tägliche Datensicherung "bewerten"
    • Ist sie ein Kandidat für W, M, Q, oder gar Y?
    • Die Beantwortung der Frage im Zusammenhang mit dem Alter der Datensicherung gibt Auskunft darüber ob eine Löschung erlaubt ist

Anspruch-Phasen

  • In unserem Beispiel haben wir in T bis T-14 den Anspruch eine tägliche Sicherung vorzuhalten
  • Von T-2W bis T-16W wollen wir wöchentliche Sicherungen
  • Von T-4M bis T-12M wollen wir monatliche Sicherungen
  • Von T-4Q bis T-8Q wollen wir quartalssicherung
  • Von T-2Y bis T-11Y wollen wir Jahressicherungen
  • Ab T-12Y wollen wir keine Sicherungen mehr
  • Für den Algorithmus ist jetzt nur noch wichtig wie lange die Phasen sind
  • Und zwar wird das angegeben in der grösse des Abschnittes selbst
 T  W  M  Q  Y
14  3  3  4  10
  • Aus diesen Angaben kann die maximale Anzahl der Sicherungen berechnet werden
  • Aus diesen Abgaben kann berechnet werden bis wie lange zurück überhaupt Datensicherungen vorgehalten werden
  • Bemerkungen
    • Eine Phase kann natürlich auch "0" sein, z.B. M oder Q
    • Sind jährliche Sicherungen zu weit voneinander entfernt so könnte Q auf 40 eingestellt werden und Y auf 0
    • Ist eine zeitliche Beschränkung der Datenhaltung gar nicht gewünscht kann bei der letzten Granularität ein "*" gesetzt werden
 T  W  M  Q  Y
14  3  3  *
  • Somit haben wir auf ewig alle Quartalssicherungen erhalten
    • Ist (vorerst) endlos Plattenplatz zur Verfügung kann

Protegé

  • Sicherungen der Phasen X haben Protegé in den Phasen davor, sie spielen erst später eine Rolle in Phase X
  • Beispiel, die Sicherung in Phase T vom Freitag 01.01. gerät von der T in die W-Phase und würde gelöscht da hier nur Sonntags-Sicherungen überleben
  • Aber Phase "M" macht diese Sicherung zu seinem Protegé
  • Die Protegé haben manchmal eine Daseinsberechtigung in einer Phase, machmal nicht. Egal sie werden nie gelöscht
  • Protegés mogeln sich also durch, bis ihre grosse Stunde schlägt

Amnestie

  • Ein Stern ("*") am Ende der Parameter führt dazu, dass niemals ein Vertreter dieser Phase gelöscht wird
  • weitere Parameter (nach einem Stern) haben keine Bedeutung mehr

Unschärfe-Funktion

  • Man kann nicht davon ausgehen, dass die tägliche Sicherung gelingt oder gültig ist, wir müssen mit Lücken leben
    • Ärgerlich ist natürlich der Ausfall einer Sonntags-Sicherung am 01. des Jahres, das schmerzt!! element von (T,W,Q,M,Y)
  • Misslungene oder korrupte Sicherungen müssen allerdings konzequent gelöscht werden
    • Sie können eine falsche Sicherheit vorgaukeln, die nicht erfüllbar ist
    • sie können einen schadhaften Datenzustand darstellen, der niemals wiederherzustellen ist (Beispiel: Ein Software Release hat an d-1 schaden an der Datenbank verursacht, die Datensicherung d liegt schon vor, aus der Datensicherung d-2 konnten alle Lücken wiederhergestellt werden, unbetroffene TAbellen der Datenbank hatten sich bereits weiterentwickelt. d und d-1 sind zu löschen, da sie keinen gewünschten Stand widerspiegeln!!!)
  • Es darf nicht so sein, dass der Algorithmus versagt wenn z.B. der direkte M-Kandidat fehlt
    • Angenommen die Datensicherung vom 01.04. fehlt, es muss dann die Datensicherung mit dem kürzesten Abstand zum 01.04. als M-Kandiat betrachtet werden (z.B. die vom 29.03.)
    • Volltreffer Kandidaten heissen ("T"|"W"|"M"|"Q"|"Y") "0", also die Datensicherung vom 01.04. ist die M0 Datensicherung für März
    • Unscharfe Kandidaten heissen {"T"|"W"|"M"|"Q"|"Y"} ("+"|"-") n wobei "n" der Abstand zum M0 ist (in Tagen)
  • Ist "älter" besser als "neuer", also T+1 besser als T-1?
    • ganz sicher!!

Beispiel für "0,0,0,*"

DATE;PHASE;NUMBER;FILE;DISTANCE
01.10.2020;Q;1;hv_00001018.zip;50 (20.11.2020)
01.07.2020;Q;2;hv_00001013.zip;44 (14.08.2020)
01.04.2020;Q;3;hv_00001012.zip;32 (02.03.2020)
01.01.2020;Q;4;hv_00001012.zip;61 (02.03.2020)
01.10.2019;Q;5;hv_00001011.zip;11 (12.10.2019)
01.07.2019;Q;6;hv_00001009.zip;71 (23.04.2019)
01.04.2019;Q;7;hv_00001009.zip;22 (23.04.2019)
01.01.2019;Q;8;hv_00001009.zip;112 (23.04.2019)
01.10.2018;Q;9;hv_00001008.zip;103 (22.06.2018)
01.07.2018;Q;10;hv_00001008.zip;11 (22.06.2018)
01.04.2018;Q;11;hv_00001006.zip;45 (17.02.2018)
01.01.2018;Q;12;hv_00001004.zip;30 (04.12.2017)
01.10.2017;Q;13;hv_00001001.zip;20 (13.09.2017)
01.07.2017;Q;14;hv_00001001.zip;74 (13.09.2017)
  • Man sieht dass es eigentlich gar keine "Treffer" (DISTANCE=0) gibt, dennoch wäre es falsch Sicherungen zu löschen
  • Machmal sind die Lücken so gross dass einzelne Sicherungen mehrfach passen (hv_00001009.zip)

Anfangsphase

  • In der Anfangsphase der Datensicherungen können wir mehr T speichern als eigentlich vorgesehen
  • z.B. bei einer Konfiguration von
T W M Q Y
9,3,3,3,*
  • es ist ja mindestens Platz für 9+3+3+3=18 Datensicherungen vorgesehen
  • in der Anfangsphase werden dann - da keine Löschungen durchgeführt werden müssen - 18 T Sicherungen behalten (wobei W,M,Q,Y Kandidaten vorhanden sein können, aber es gibt keine Lücken!)

Ausblick

  • Bei Datenbanksicherungen sind Phasen der minütlichen Sicherungen denkbar (Phase "S60")
  • Es ist eine "T3"- Phase denkbar, also nicht tägliche Sicherungen sondern mit 2 Tagen ohne Sicherung

Beispiel

 #
 # Vorgabe für die Datensicherung
 # 
 SicherungenAnzahl=20,3,3,8,10

 #
 # "Perfekte Liste" für den 08.11.2020
 # NUMBER=0 bedeutet dass es ein Protegé ist
 #
 DATE;PHASE;NUMBER
 08.11.2020;W;0
 08.11.2020;T;1
 07.11.2020;T;2
 06.11.2020;T;3
 05.11.2020;T;4
 04.11.2020;T;5
 03.11.2020;T;6
 02.11.2020;T;7
 01.11.2020;M;0
 01.11.2020;W;0
 01.11.2020;T;8
 31.10.2020;T;9
 30.10.2020;T;10
 29.10.2020;T;11
 28.10.2020;T;12
 27.10.2020;T;13
 26.10.2020;T;14
 25.10.2020;W;0
 25.10.2020;T;15
 24.10.2020;T;16
 23.10.2020;T;17
 22.10.2020;T;18
 21.10.2020;T;19
 20.10.2020;T;20
 18.10.2020;W;1
 11.10.2020;W;2
 04.10.2020;W;3
 01.10.2020;Q;0
 01.10.2020;M;1
 01.09.2020;M;2
 01.08.2020;M;3
 01.07.2020;Q;1
 01.04.2020;Q;2
 01.01.2020;Y;0
 01.01.2020;Q;3
 01.10.2019;Q;4
 01.07.2019;Q;5
 01.04.2019;Q;6
 01.01.2019;Y;0
 01.01.2019;Q;7
 01.10.2018;Q;8
 01.01.2018;Y;1
 01.01.2017;Y;2
 01.01.2016;Y;3
 01.01.2015;Y;4
 01.01.2014;Y;5
 01.01.2013;Y;6
 01.01.2012;Y;7
 01.01.2011;Y;8
 01.01.2010;Y;9
 01.01.2009;Y;10