Les fondamentaux de la résilience chez OVHcloud (1/5)

Jérémy Bouteraa28/02/20225 min de lecture

Expliquer mon rôle de Chief Resilience Officer signifie souvent expliquer ce qu'est la résilience chez OVHcloud, pourquoi c'est un sujet central pour l'entreprise et comment nous prévoyons de le faire dans les prochaines années. C'est l'exercice de pédagogie que je vous propose de réaliser à travers ce billet de blog.

Être Chief Resilience Officer c'est veiller à ne jamais arrêter d'innover, de questionner et d'avancer - c'est développer, améliorer les standards et continuer à construire le modèle unique d'OVHcloud, pour offrir à nos clients le niveau de service le plus exigeant.

Tout d'abord, il y a les exigences

Pour être Chief Resilience Officer, il faut savoir construire à court, moyen et long terme. Il faut aussi savoir s'adapter, réagir vite, anticiper et planifier. La majorité des missions de résilience s'intègrent dans le plan quinquennal de l'entreprise. Il ne s'agit donc pas de tout faire maintenant, mais de veiller à ce que chaque étape soit franchie à temps pour que nous puissions atteindre la bonne destination au bon moment. Notre cap et notre ambition sont clairs : relever les standards de protection/prévention et en fixer de nouveaux pour notre métier. Plus que jamais, notre objectif est d'être encore plus proche de nos clients, et de les accompagner - efficacement et au quotidien - dans le développement de leur activité en leur garantissant la continuité du service.

En tant que Chief Resilience Officer, vous contribuerez à renforcer ce qui fait la valeur d'OVHcloud : des infrastructures et des solutions, au réseau ou aux personnes qui composent notre organisation. La sécurité physique de nos équipes et la continuité de l’activité de nos clients ont toujours été et resteront nos principales préoccupations. Nous nous assurons de pouvoir relever les normes de protection et de prévention dans nos centres de données existants pour les aligner sur les normes de l'industrie ou internationales, et si nécessaire, aller encore plus loin dans le but d'être « hyper » résilient. De nombreuses mesures de sécurité physique étaient déjà en place pour limiter l'impact d'événements majeurs (pannes de courant, coupures de réseau, etc.) (sur tous nos sites de réseau en redondance, alimentation électrique en redondance, plan incendie). Nous voulons accroître leur résilience, notamment en rendant les arrêts automatiques plus répandus et systématiques sur l'ensemble de nos sites web. Nous le faisons en repensant l'urbanisation pour limiter l'impact d'un incident, en gérant l'ensemble des risques sur les serveurs et les services, et en renforçant la cloisonnement et la résistance au feu. La sécurité physique sera également renforcée.

Devenir très résilient

Lorsque nous construisons de nouveaux centres de données, nous nous inspirons des meilleurs cas pratiques et nous considérons que nous sommes la référence du marché en termes de normes de protection. Nos datacenters en projet, et nos datacenters en construction, le démontreront. Nous aurons l'opportunité de vous en dire plus dans quelques mois.

Devenir hautement résilient signifie également continuer à augmenter notre demande de solutions.

À court terme, cela signifie à la fois s'assurer que nos clients ont un bon niveau de connaissance des offres de sauvegarde et de plan de reprise d'activité (DRP) proposées dans le cadre de notre catalogue de services (par exemple, l'espace de sauvegarde gratuit de 500 Go disponible sur les gammes bare-metal, les options de sauvegarde pour VPS et les solutions de sauvegarde et de DRP sur le marché) et connecter nos clients à nos partenaires écosystémiques qui peuvent les soutenir dans leurs plans de reprise d'activité.

À moyen terme, nous développons de nouveaux services.

Nous souhaitons développer de nouvelles solutions et des partenariats pour offrir à nos clients l'un des portefeuilles de backup et de PRA les plus développés du marché. En parallèle, nous allons construire 4 datacenters qui pourront servir de back-up techniques pour les solutions d’OVHcloud, ce qui nous permettra de restaurer les services de nos clients (à partir des back-up techniques de nos services à fonctionner) en cas de perte totale d’activité (situation que notre approche de haute résilience sur l’infrastructure et le réseau vise à éviter). Nous sommes actuellement en train d'acquérir le terrain et nous pourrons vous informer dans les prochains mois de l'avancement des travaux.

Pour les applications qui nécessitent une résilience encore plus grande, nous veillerons à offrir à nos clients un service de redondance instantanée - en créant des régions dans 3 datacenters, tous situés à proximité. Le principe est simple : une copie permanente garantit la continuité de l'activité. La première région à disposer d'une telle infrastructure serait Paris.

Parallèlement aux actions communes, nous avons entrepris le projet de certification « ISO 22301 » de nos plans de continuité d’activité. La reconnaissance basée sur une norme internationale incontestable apportera encore plus de transparence et de compréhension sur les processus de résilience d’OVH.

Et ensuite ?

Au cours des prochains mois, je vais revenir avec vous sur quatre sujets spécifiques dans d'autres billets, détaillant la stratégie, les ambitions et le calendrier d'OVHcloud :

Hyper-résilience @OVHcloud : sécurité physique et continuité d’activité
Les sauvegardes @OVHcloud - rappel des solutions existantes et des rôles de la sauvegarde du DC
AZ - 2 lettres pour une triple résilience : les zones de disponibilité.
Network @OVHcloud

Partager sur :