Les fondamentaux de la résilience chez OVHcloud (1/5)

Expliquer mon poste de « Chief Resilience Officer », c’est aussi expliquer ce qu’est la Résilience chez OVHcloud, pourquoi c’est un sujet qui fait partie des fondements de l’entreprise et comment nous prévoyons de le porter les prochaines années. C’est cet exercice de pédagogie que je vous propose de réaliser à travers cet article de blog.

Les fondamentaux de la résilience chez OVHcloud (1/5)

Être Chief Resilience Officer, c’est faire en sorte que jamais nous n’arrêtions d’innover, de nous remettre en question, d’avancer – c’est faire évoluer, améliorer les standards et continuer à construire le modèle unique d’OVHcloud pour proposer à nos clients le niveau de service le plus exigeant.

Il y a d’abord des pré-requis

Être Chief Resilience Officer, c’est savoir d’abord construire sur le court, moyen et long terme, savoir s’adapter, réagir rapidement mais également anticiper et se projeter. La majorité des missions de résilience s’intègre dans le plan à cinq ans de l’entreprise. Il ne s’agit donc pas de tout réaliser tout de suite, mais de s’assurer que chaque étape est menée à temps pour que nous arrivions à la bonne destination au bon moment. Notre destination, notre ambition est claire : élever les standards de protection / prévention et définir de nouveaux standards pour notre activité. Plus que jamais, notre objectif est d’être encore plus aux côtés de nos clients et de les accompagner – efficacement et quotidiennement – dans le développement de leur business par l’assurance de continuité des services.

Être Chief Resilience Officer, c’est contribuer à renforcer ce qui fait la valeur de OVHcloud : de l’infrastructure, aux solutions, en passant par le réseau et les hommes et femmes de notre organisation. La sécurité physique de nos équipes et la continuité de l’activité de nos clients ont toujours été et resteront nos principales préoccupations. Nous nous assurons que nous pouvons augmenter les standards de protection/prévention dans nos datacenters existants – répondre à des standards de référence métiers ou internationaux et si nécessaire ne pas se limiter à ces derniers mais aller encore plus loin l’objectif étant d’être « hyper » résilience. De nombreuses mesures de sécurité physique étaient déjà en place pour limiter l’impact des pannes de courant, de réseau ou autres événements majeurs (sur tous nos sites réseau redondé, alimentation en électricité redondée, plan incendie).  Nous voulons intensifier leur résilience notamment avec la généralisation et systématisation de l’extinction automatique sur tous nos sites, en repensant l’urbanisation afin de limiter l’impact d’un incident en maitrisant l’ensemble des risques sur les serveurs et les services, et enfin en durcissant le compartimentage et la résistance au feu. La sécurité physique des lieux va également être renforcée.

Devenir hautement résilient

Lorsque nous construisons de nouveaux datacenters, c’est nous inspirer des meilleurs cas pratiques et nous hisser comme la référence du marché en matière de standards de protection. Nos futurs datacenters, qu’ils soient en projet ou en cours de construction, en seront la démonstration. Nous aurons l’occasion de vous en dire davantage dans quelques mois.

Devenir hautement résilient signifie également continuer de hausser notre niveau d’exigence côté solutions.

A court terme, c’est à la fois nous assurer que nos clients aient un bon niveau de connaissance sur les offres de back up et de « Disaster Recovery Plan » (DRP) proposés dans le cadre de notre catalogue de service (par exemple, l’espace backup gratuit de 500 Go disponible sur les gammes baremetal, les options backup pour VPS et les solutions backup et DRP du marché) et mettre nos clients en contact avec notre écosytème de partenaires qui pourront les accompagner dans leurs plans de Disaster Recovery.

A moyen terme, nous sommes en train de développer de nouveaux services.

Nous voulons ainsi construire de nouvelles solutions et de nouveaux partenariats pour offrir à nos clients l’un des portefeuilles de backup et de DRP les plus développés du marché.  Parallèlement, nous allons construire 4 DC qui pourront servir de backup technique aux solutions OVHcloud, ce qui permettra de restaurer les services de nos clients (à partir des backups techniques réalisés pour le fonctionnement de nos services) en cas de perte totale d’activité (une situation que notre démarche de haute résilience sur l’infrastructure et le réseau a pour but d’éviter). Nous sommes pour le moment en train d’acquérir les terrains et nous pourrons vous informer dans les prochains mois de l’avancée des travaux.

Pour les applications ayant besoin d’une résilience encore plus forte, nous allons faire en sorte de pouvoir proposer à nos clients un service de redondance instantanée – en créant des régions de 3 datacenters proches les uns des autres. Le principe : avoir une copie permanente et s’assurer ainsi de la continuité de l’activité. La première région à disposer d’une telle infrastructure sera Paris.

En parallèle des mesures partagées, nous avons entrepris le projet de certifier « ISO 22301 » nos plans de continuité d’activé. Une reconnaissance sur un standard international non discutable permettra encore davantage de transparence et compréhension des processus de résilience d’OVHcloud.

La suite

Je vous propose de partager dans une série de 4 blogs la stratégie, les ambitions et le calendrier OVHcloud par thématique dans les mois à venir.

  • L’Hyper résilience @OVHcloud : sécurité physique et continuité d’activité
  • Les back-up @OVHcloud  – rappel des solutions existantes et rôles du DC Back-up
  • AZ – 2 lettres pour une triple résilience : l’Availability Zone
  • Network @OVHcloud

Être Chief Resilience Officer, finalement, c’est faire en sorte que jamais nous n’arrêtions d’innover, de nous remettre en question, d’avancer – c’est faire évoluer, améliorer les standards et continuer à construire le modèle unique d’OVHcloud pour proposer à nos clients le niveau de service le plus exigeant.

+ posts

Chief Resilience Officer