Italia

Buone pratiche per il disaster recovery di un data center

Aggiornato il 14 Lug 2022 by
510

Sebbene le aziende preparino i loro piani di disaster recovery (DR) nella speranza di non doverli mai utilizzare, gli eventi disastrosi avverranno ugualmente in maniera improvvisa, potente e causando danni su larga scala. La 2021 Global Data Center Survey dell'istituto Uptime (via Facility Executive) mostra come i blackout, sebbene meno comuni degli scorsi anni, siano diventati molto più costosi in termini di danni. Più del 60% dei rispondenti ha riportato perdite superiori ai $100,000 a causa del downtime.

Il processo di DR è perciò uno degli aspetti tecnologicamente più impegnativo e finanziariamente più essenziale per un'azienda. Di seguito abbiamo riportato alcune buone pratiche pre e post evento disastroso.

Prima dell'evento disastroso

Quando si parla di piani di disaster recovery, nulla dovrebbe essere più importante del tenere i dati e le operazioni di lavoro al sicuro, anticipando un possibile evento disastroso. Nonostante vi siano diversi modi per le aziende per tornare alla normalità nel caso di un evento catastrofico, la migliore soluzione è la prevenzione. Di seguito sono elencati alcuni modi per prevenire danni su vasta scala in caso di un evento disastroso.

Servirsi di DRaaS

Una delle migliori misure di sicurezza per le aziende è fare uso di un Disaster Recovery as a Service.

Dare in appalto i piani di disaster recovery è un'alternativa intelligente e priva di rischi per le aziende con poca esperienza IT in-house. Vi sono diverse compagnie di cloud computing che offrono servizi DRaaS per le aziende, assicurando la protezione delle tue applicazioni e dei tuoi dati nell'evenienza di un evento disastroso.

Queste compagnie creano una copia virtuale del tuo sistema che si attiva quando la versione onsite entra in down. Questo aspetto è cruciale per i sistemi mission-critical che non possono permettersi nessuna interruzione. Le infrastrutture in-house che gestiscono le operazioni nelle situazioni normali vengono dunque rimpiazzate dalle copie secondarie virtuali in caso di avaria.

Dato che la copia virtuale opera nel cloud, la funzionalità del tuo business è attiva 24*7 anche qualora l'architettura in-house fosse danneggiata.

La maggior parte dei servizi DRaaS sono flessibili, offrendo configurazioni su diverse piattaforme. È importante fare un'adeguata inchiesta per scegliere la migliore soluzione prima di servirsi dei servizi DRaaS per il tuo business.

Backup automatici e protezione dati avanzata

Gli ultimi anni hanno visto la nascita di numerose misure di protezione dati avanzata. La più popolare tra queste è rappresentata da metodi software basati su copie cloud geo-ridondanti. Queste copie tengono attivo e operativo il tuo business con back up automatici, mantenendo i tuoi dati e operazioni accessibili a prescindere dall'evento disastroso che potrebbe colpirli.

Il software di backup archivia copie dei tuoi file in diverse posizioni off-site, note come data center DR, assicurandosi che siano isolate e lontane dal sito dove è avvenuto l'evento disastroso. I provider di backup automatico di qualità utilizzano le ultime tecnologie, assicurando che il database sia di grandi dimensioni per consentire l'operatività per tutto il tempo necessario.

Si tenga presente che la qualità dei dispositivi di backup delle compagnie può variare in funzionalità. È perciò importante condurre un'accurata inchiesta riguardo gli hardware e i software utilizzati dal tuo provider prima di sceglierne uno.

Avere un piano DR dettagliato

I proprietari di aziende conoscono bene il caos che un singolo secondo di downtime può creare. Ogni secondo di blocco implica una grande quantità di denaro andato in fumo.

Il miglior modo per evitare questo è prevenire il downtime. Nel caso di un evento disastroso, un piano semplicemente tenuto a mente non può essere una misura efficace. Dopo aver creato un dettagliato piano DR, le aziende devono redigerlo in forma di documento e inviare copie a tutte le persone responsabili per la rimessa in funzione dei sistemi.

Il piano deve inoltre elencare i passi necessari a ripristinare il sistema in una modalità lavorativa tipica. Questo sarà più semplice se non si dipende per troppo tempo dalle funzioni di back-up sul cloud esterno.

Post evento disastroso

La prevenzione è la migliore cura, tuttavia il tuo sistema non può mai uscire completamente illeso da un evento disastroso. Di seguito elenchiamo cosa è necessario fare dopo che il danno è avvenuto.

Identificare la causa dell'evento disastroso

La prima cosa da fare dopo essere stati colpiti da un evento disastroso è individuarne il motivo. Vi sono cinque cause comuni che portano a un evento disastroso o a un'interruzione di sistema:

Avaria dell'hardware

Malfunzionamenti delle attrezzature sono una delle cause più comuni di downtime. Esempi noti sono le avarie di attrezzature d'archiviazione dei data center come gli hard drive. Tutti gli hardware sono inclini a malfunzionamento ad un certo punto; per questo motivo le aziende devono avere un buon backup di riserva.

Mancanza di corrente

I blackout sono un'altra causa comune di interruzione di sistema. Alcuni blackout possono danneggiare i tuoi sistemi di computer, rendendo inevitabile la sostituzione delle componenti. Le aziende senza un piano DR possono subire gravi danni in queste situazioni

Disastri naturali

Disastri naturali come terremoti, inondazioni, etc., sono un'altra causa comune che può creare interruzioni alle aziende. Sebbene impedire un evento sismico sia impossibile, un buon piano DR può minimizzarne i danni.

Errore umano

Errori umani e formazione insufficiente possono provocare grandi danni. Semplici incidenti come la cancellazione di un documento importante o il non aver salvato la corretta versione di un file possono avere conseguenze catastrofiche. I dipendenti devono essere formati accuratamente per limitare al minimo questi errori.

Malware e virus

Assicurati che i tuoi sistemi siano adeguatamente criptati e al sicuro da cattive intenzioni. Un sistema infetto può contaminare l'intera rete. Le aziende devono dunque avere adeguate contromisure per proteggersi da virus e ransomware.

Dare priorità all'identificazione e al ripristino dei sistemi mission-critical

I sistemi mission-critical sono quelli che creano i danni più importanti durante il downtime.

Per evitare il panico, è necessario preparare una lista di sistemi mission-critical più importanti in anticipo e ripristinarli con priorità. Questo aiuterà a preparare una lista sequenziale di compiti che possono essere eseguiti secondo un ordine preciso.

Il tuo team DR deve essere informato dell'importanza di questi compiti e delle priorità. I sistemi devono essere ripristinati seguendo un ordine che permetta il minimo danno e perdita di introiti.

Determinare i costi del downtime

Gli eventi disastrosi sono inevitabili e, una volta che avvengono, bisogna accettare l'inevitabilità di un periodo di downtime e di perdite finanziare, nonostante la gravità possa variare considerevolmente in base a quanto si è preparati. Elencare le conseguenze di un evento disastroso, il tempo di downtime e le conseguenti perdite può aiutarti a velocizzare la ripresa e a prendere le giuste misure per il ripristino del sistema. Una volta che si ha avuto cognizione del livello di danno, le azioni riparative possono diventare più cliniche nel minimizzare i danni.

Test e rivalutazione dei sistemi DR

Una volta che i tuoi sistemi DR sono in funzione, è necessario eseguire test e valutazioni di sistema periodici per evitare spiacevoli sorprese la prossima volta che un evento catastrofico colpirà il tuo business.

Si tenga a mente che il test del piano DR non deve semplicemente consistere nel far dare un'occhiata al documento al tuo team e spuntare poi una casella. Il tuo piano DR deve includere errori di piccola natura che possono sfuggire a un occhio non esperto. L'opzione più sicura è quella di esaminare uno scenario che testi l'efficacia del tuo piano introducendo problemi di nuova natura. Ancor meglio è eseguire i processi di ripristino per assicurarsi che non lascino nulla a desiderare.

Potresti essere interessato a

Conoscenza
See profile for Sheldon.
Sheldon
Cosa è la porta SFP di uno switch Gigabit?
22 Mag 2023
83.6k
Conoscenza
Conoscenza
See profile for Migelle.
Migelle
Switch PoE, PoE+ e PoE++: Come scegliere?
16 Mar 2023
36.8k
Conoscenza
See profile for Sheldon.
Sheldon
LACP e PAGP: Qual è la differenza?
08 Mar 2023
25.1k
Conoscenza
Conoscenza
See profile for Moris.
Moris
DHCP o IP Statico: Qual è il migliore?
08 Mag 2023
55.6k
Conoscenza
See profile for Migelle.
Migelle
Switch Attivo vs Passivo: Quale Scegliere?
07 Dic 2020
20.3k
Conoscenza
See profile for Sheldon.
Sheldon
RIP vs OSPF: Qual è la differenza?
15 Nov 2022
28.5k
Conoscenza
See profile for Vincent.
Vincent
Capire il moduli BiDi
08 Mar 2021
19.9k
Conoscenza
See profile for Vincent.
Vincent
XFP vs SFP+: Quali sono le differenze?
10 Gen 2023
14.9k
Conoscenza