33 0 4MB
12 mai 2014
QSE : qualité et gouvernance des systèmes d’information Module n°2 : Plans de Continuité d'Activité (PCA)
Agenda
► 1. Introduction à la continuité d'activité 1. 1 Concepts clés 1. 2 Démarche de mise en place d'un PCA
2. Plan de Continuité Informatique 3. Plan de Continuité des Opérations
12 mai 2014 - Propriété de Solucom, reproduction interdite
2
Introduction à la continuité d’activité
Des menaces pèsent sur les entreprises Panne Grèves logicielle Inondation Panne Panne matérielle électrique Incendie
Séisme
...
Coupure informatique Défaillance de prestataires
Les entreprises
12 mai 2014 - Propriété de Solucom, reproduction interdite
3
Introduction à la continuité d’activité
Des menaces bien réelles ! 11 septembre 2001
21 septembre 2001
17 novembre 2004
11 mars 2011
Attentats du World Trade Center
Explosion de l’usine AZF
Panne nationale du réseau Bouygues Telecom
Séisme au large du Japon
2750 morts, 800 000 m² de bureaux rasés. 350 entreprises et 40 000 personnes étaient présentes sur le site.
31 morts, des milliers de blessés. Destruction du site et des alentours (150 bus de transport public, plusieurs entreprises touchées, un lycée, une salle de concert, …)
Impossible de passer et recevoir des appels pendant 1 journée suite à une panne informatique. Coût estimé de 20 millions d’euros et dégâts d’image considérables.
Séisme puis tsunami et catastrophe nucléaire. 20 000 morts, conséquences majeures sur les infrastructures, forte perturbation de l’activité économique du pays.
17 avril 2011
2011
24 avril 2013
Intrusion sur le Playstation Network
Printemps arabe
Catastrophe de Dacca au Bengladesh
…et 2014 ? Vol de données personnelles et bancaires. Mise hors ligne du service pendant 1 mois. Un coût évalué à plusieurs centaines de millions d’euros.
Révoltes importantes dans une quinzaine de pays arabes. Instabilité sociale et politique entraînant la suspension des activités de plusieurs entreprises internationales dans certaines zones.
1127 morts, 2500 rescapés, destruction de plusieurs ateliers de confection, de commerce et une banque.
12 mai 2014 - Propriété de Solucom, reproduction interdite
4
Introduction à la continuité d’activité
Des menaces qui ont des impacts multiples L’indisponibilité d’activités clés peut causer des impacts majeurs et multiples pour les organisations Exemples d’impacts pour une grande banque
Financier Ex : la perturbation de certaines activités critiques (ex : salles de marchés) peut entraîner rapidement des impacts de plusieurs millions d’euros.
Client
Juridique
Ex : un incident informatique pourrait entraîner la perception avec retard des prestations sociales.
Ex : la continuité des activités vitales des banques est rendue obligatoire par la règlementation (CRBF 97-02).
Image Ex : une perturbation importante des activités entraînerait une dégradation de l’image de marque de la banque vis-à-vis du public et des autres acteurs de la place.
Interne Ex : des incidents à répétition sur les systèmes informatiques pourraient entraîner des mécontentements clients en agences et une dégradation des conditions de travail des agents.
12 mai 2014 - Propriété de Solucom, reproduction interdite
5
Introduction à la continuité d’activité
Exemple de menace : la crue de Seine… Une menace ancrée dans l’histoire de Paris Plus grandes crues connues
Différents scénarios à envisager, pas uniquement celui de la crise extrême
Crues les plus récentes
27 février 1658 : 8,96 m
06 janvier 1924 : 7,32 m
28 janvier 1910 : 8,62 m
23 janvier 1955 : 7,12 m
26 décembre 1740 : 8,05 m
14 janvier 1982 : 6,16 m
09 février 1799 : 7,65 m
24 mars 2001 : 5,21 m
28 janvier 1802 : 7,62 m
60% du débit de 1910
Une crise dont l’ampleur n’est pas prévisible
Une dynamique de crise relativement lente, mais une crise de longue durée Crue « lente » : 10 à 15 jours entre l’atteinte de la cote d’alerte et la cote maximale
Décrue tout aussi lente, de l’ordre de 15 jours…
… mais qui peut aller jusqu’à 40 jours (1910)
115% du débit de 1910
Au moment de l’alerte, le pic de crue ne peut pas encore être déterminé Pour les crues majeures, les fortes évolutions de l’urbanisme en Ile de France depuis 1910 rendent difficile toute prévision
Une menace dont on ne peut se prémunir totalement 12 mai 2014 - Propriété de Solucom, reproduction interdite
6
Introduction à la continuité d’activité
…aux impacts significatifs Impacts sur la région Ile-de-France Électricité :
Transports en commun :
870 000 foyers et 2 640 sites de haute tension sont concernés par le risque de coupure électrique
Arrêt de fonctionnement des RER A, B et C, des gares de Lyon et d’Austerlitz et des lignes de métro (par tronçons)
Transport routier : • 100% des ponts à Paris et en Petite Couronne seront inaccessibles
Télécommunications : Sous-répartiteurs situés dans les soussols inondables
• Les autoroutes A86, A4 et A6 coupées à certains endroits
Réseau dépendant de l’alimentation électrique
• Engorgement des voies de circulation
Eau potable : Énergie : Usagers ne seraient plus alimentés par le chauffage urbain De nombreux centres de distribution d’hydrocarbures sont inondés
Assainissement :
5 000 000 de personnes seraient privées d’eau potable
Les égouts débordent et l’élimination des déchets ménagers est rendue très difficile 12 mai 2014 - Propriété de Solucom, reproduction interdite
7
Introduction à la continuité d’activité
Des risques que l’on peut traiter de différentes manières Accepter Accepter la menace et ses impacts potentiels pour l’entreprise
Éviter Ne pas lancer ou arrêter une activité à cause des risques encourus
Accepter
Transférer
Transférer Déporter le risque sur un tiers (prise d’une assurance, transfert d’une activité à un prestataire, …)
Éviter
Scénario de risque
Réduire probabilité
Limiter impacts
Réduire la probabilité Traiter le risque en amont, en réduisant sa probabilité d’occurrence
Limiter les impacts Plan de Continuité d’Activité (PCA) : ensemble de dispositifs permettant de limiter les impacts lorsqu’un ou plusieurs scénarios de risques sont avérés Un dispositif relevant d’un équilibre coût / couverture de risques
Couverture de risques
12 mai 2014 - Propriété de Solucom, reproduction interdite
Coût
8
Introduction à la continuité d’activité
Quelques définitions : PCA, PCO et PCI Le Plan de Continuité d’Activité englobe l’ensemble des actions, processus et organisations permettant la continuité des activités critiques de l’Entreprise Le PCA est une démarche qui couvre à la fois les métiers et l’informatique
PCA PCI
SI
PCO
Le PCI (Plan de Continuité Informatique) se focalise sur la disponibilité des données et des ressources informatiques
Ex. de sinistre : incendie ou inondation d’un datacenter
Métier
Le PCO (Plan de Continuité des Opérations) se focalise sur les actions des Métiers pour la poursuite de leurs opérations vitales
Ex. de solutions : site de secours, solutions de haute disponibilité ou de reprise informatique
Ex. de sinistre : indisponibilité du siège ou d’une agence, pandémie
12 mai 2014 - Propriété de Solucom, reproduction interdite
Ex. de solutions : site de repli utilisateurs, modes de fonctionnement dégradés
9
Introduction à la continuité d’activité
Définitions : DIMA et PDMA
Deux critères essentiels sont utilisés pour l’expression des besoins de continuité. Ils permettent de déterminer la criticité des applications et des infrastructures informatiques sous-jacentes
Délai d’Interruption Maximal Admissible, DIMA (Métiers et informatique) Durée maximale d’interruption d’une ressource que peuvent tolérer les Métiers utilisateurs de la ressource On parle également de Recovery Time Objective (RTO)
Perte de Données Maximale Admissible, PDMA (Informatique) Durée maximale acceptable entre la dernière sauvegarde et l’incident survenu, quantifiant ainsi les données que les Métiers tolèrent de perdre au maximum On parle également de Recovery Point Objective (RPO) Dernière Incident Sauvegarde majeur à T T-x Période non présente sur les sauvegardes
PDMA
Reprise T+y Période de reprise
Application disponible à nouveau
DIMA
Un autre critère à ne pas oublier : le niveau de performance retrouvée (Informatique) 12 mai 2014 - Propriété de Solucom, reproduction interdite
10
Introduction à la continuité d’activité
Les différentes composantes d’un PCA Organisation de crise (Cellules de crise, moyens, procédures, …) Engagement (contractuel) des fournisseurs clés, stratégie achat multifournisseurs, capacité à ré-internaliser…
Procédures RH exceptionnelles
Fournisseurs
Suppléance du personnel Acheminement du personnel
Sites de repli et d’hébergement
Organisation et personnel
Sites
ACTIVITE METIER
Procédures
Informatique et télécoms
Positions de travail
Référentiel documentaire Mesures d’anticipation, de contournement, formulaires Métiers
Plan de Continuité Informatique et Télécoms • Stratégie de secours • Procédures • Organisation • Ressources humaines • Ressources techniques
Stockage ou approvisionnement des ressources matérielles nécessaires, …
Coordination / Maintenance du PCA (Responsables, correspondants, …) Ressources à secourir 12 mai 2014 - Propriété de Solucom, reproduction interdite
Secours 11
Introduction à la continuité d’activité
Une norme pour le PCA : ISO 22301… Publié en 2012, l’ISO 22301 est la référence en matière de management de la continuité d’activité. Elle spécifie les exigences pour mettre en place et améliorer un Système de management de la Continuité d’activité (SMCA) Piloter et améliorer le SMCA Conduire l’analyse des risques, le BIA (Bilan d’Impact sur Activité)
Gérer la documentation et les enregistrements
Contrôler et mesurer l’efficacité
Plan Act Do
Définir et mettre en œuvre les plans d’action
Check
Gérer les incidents et crises de continuité
Sensibiliser et former à la continuité d’activité
Système de Management de la Continuité d’Activité (SMCA) 12 mai 2014 - Propriété de Solucom, reproduction interdite
12
Introduction à la continuité d’activité
…qui met en place un SMCA
Et répondre à des objectifs :
De confiance , à la demande des parties prenantes et pour les parties prenantes Clients, actionnaires, partenaires, direction, employés, public…
D’amélioration permanente de la sécurité du SI, sur un périmètre bien défini
En intégrant :
12 mai 2014 - Propriété de Solucom, reproduction interdite
Un engagement du management Une amélioration continue
13
Agenda
► 1. Introduction à la continuité d'activité 1. 1 Concepts clés 1. 2 Démarche de mise en place d'un PCA
2. Plan de Continuité Informatique 3. Plan de Continuité des Opérations
12 mai 2014 - Propriété de Solucom, reproduction interdite
14
Démarche générale de mise en place d’un PCA
Tester régulièrement Mettre à jour la stratégie de secours Mettre à jour les solutions techniques Mettre à jour les procédures
PCO Valider le fonctionnement des moyens de secours Valider le caractère applicable des procédures et de l’organisation
1 Maintenance et amélioration
Cadrage
5 2
Test & recette
4
PCI Valider le fonctionnement des solutions techniques Valider le caractère applicable des procédures et de l’organisation
3
Analyser les risques Définir les besoins
Stratégie
Recenser les solutions Évaluer les scénarios
Conception et mise en œuvre
PCO Organisation Moyens de secours Procédures dégradées Site(s) de repli utilisateurs
12 mai 2014 - Propriété de Solucom, reproduction interdite
PCI Organisation Infrastructure technique Procédures de reprise du SI Site(s) de secours informatique
15
ETAPE 1 : Cadrage
1.A – Analyser les risques 1 Maintenance et amélioration Test & recette
Cadrage
Analyser les risques Définir les besoins
5 2 4
3
Stratégie
Conception et mise en œuvre
Recensement des menaces
Élaboration et sélection des scénarios de risques à couvrir
2
Facteurs naturels
Indisponibilité totale ou partielle du système d’information
Séismes, inondations, éboulements, glissements de terrain, …
Indisponibilité des prestataires critiques
Panne électrique du Datacenter
Sinistre dans les locaux du prestataire
Facteurs environnementaux
Propagation d’un virus informatique
Indisponibilité du SI du prestataire
Proximité de sites industriels, d’infrastructures ou de voies de communication à risque
…
…
Facteurs techniques
Indisponibilité totale ou partielle d’un site hébergeant du personnel
Pannes matérielles, indisponibilité d’équipements, défaillances logicielles, infections virales…
Facteurs humains Phénomènes sociétaux, mouvements sociaux, dégradations volontaires, erreurs humaines, …
Indisponibilité de collaborateurs
Incendie / Inondation
Pandémie
Périmètre de sécurité autour du bâtiment
Mouvement social
…
….
12 mai 2014 - Propriété de Solucom, reproduction interdite
16
ETAPE 1 : Cadrage
1.B – Définir les besoins 1 Maintenance et amélioration Test & recette
3
Cadrage
Analyser les risques Définir les besoins
5 2 4
3
Stratégie
Conception et mise en œuvre
Outil utilisé : le BIA*
Identification des activités critiques
* Bilan d’Impact sur l’Activité
Quelles sont les activités dont l’interruption provoquerait un impact fort pour l’entreprise ? Quel est le délai d’interruption maximal?
D0
D1
D2
D3
D4
D5
1H
4H
1J
2 /3 J
1S
2 /3 S
Questionnaire rempli et mis à jour par les Métiers, en collaboration avec les équipes PCA PLAN DE CONTINUITE DES ACTIVITES DU SIEGE (PCA) SYNTHESE DES ACTIVITES CRITIQUES DE LA DIRECTION
4
Recensement des ressources nécessaires Combien et quels sont les collaborateurs à replier en priorité pour réaliser ces activités critiques?
?
Dénomination de la Direction
Principaux pôles
Direction Marketing et Commerciale (DMC)
- Définition de l'Offre Commerciale - Mise en Marché - Relation Clientèle (support agences, télévente, SAV, développement, etc.) - Administration des Ventes (facturation/recouvrement, stratégie, etc.) - MOA du Système d'Information DMC
Directeur
Suppléant 2
Suppléant 1
M.DUPONT Personnels-clef Directeur des Marchés Directeur Opérations ADV
Directeur de Marchés Suppléant 1 Directeur Marché VAD Responsabe Dept. Support
Mme DURAND
Localisation
Effectifs sur site
Crossing Sèvres Aphelion
107
0 0 210
autre site : à préciser
sans objet
Objectifs clef de la direction - Définition de l’offre marketing destinée aux Professionnels et aux Entreprises - Mise en marché de nouveaux produits (déclinaison, définition et mise à disposition d’outils) - Animation fonctionnelle des forces de ventes et relation commerciale pour les
Activités-clef pour La Banque Postale
DMC.1. Administration des Ventes : Opérations
DMC.2. Définition de l’Offre Commerciale
DMC.3. Relation Client : Développement
Quelles applications sont nécessaires ? Sous quels délais (DIMA/PDMA) ?
Effectifs
Directeur des Ventes Suppléant 2 Directeur Marché Industrie
DMC.0. Pilotage de la Filiale
De quel matériel a-t-on besoin ?
RLCA
DMC.4. Relation Client : Service Client
DMC.5. Mise en Marché / Communication
Impact d'une suspension d'activité / Effectif de reprise
Effectif nominal
1 jour
2/3 jours
1 semaine
2/3 sem.
Impact
2
3
4
5
Effectif
4h
1
1
3
3
1 mois
Impact
2
3
4
5
5
Effectif
5
10
15
18
18
Impact
3
4
5
Effectif
7
15
20
Impact
1
1
Effectif
1
2
5
7 7
20
30
2 Impact
1
2
3
4
5
Effectif
1
3
4
5
5
Impact
2
3
3
4
4
Effectif
1
1
1
2
2
8
15
30
44
54
7
2 Impact
DMC.6. Autres activités non critiques
39 Effectif
Total
107
Effectif
0
Commentaire / Remarque particulière
Quels sont les prestataires indispensables ?
La DMC dispose de sa propre Cellule de Crise Métier composée de 4 personnes.
12 mai 2014 - Propriété de Solucom, reproduction interdite
17
ETAPE 2 : Stratégie
2.A – Définir la stratégie PCI (1/2) 1 Maintenance et amélioration Test & recette
Cadrage
5 2 4
3
Stratégie
Recenser les solutions Évaluer les scénarios
Conception et mise en œuvre
1
Définition des solutions possibles pour le secours
Pour chaque couche technique SI, étude des solutions disponibles pour le secours.
Applications Services d’infrastructure (annuaires, DNS, hyperviseur…)
Stockage / Sauvegarde des données Réseau
Hébergement
Matériel dédié
Actif (Clustering, partage de charge,…)
Activable
Dormant
Matériel mutualisé
Mutualisé interne (Pré-production, Intégration, Tests,…)
Mutualisé externe (chez un prestataire)
Matériel approvisionné
Commande lors du sinistre
Pré-contractualisation
Réplication baie Synchrone Asynchrone Réseau dupliqué
Nombre de sites
Réplication serveurs
Réseau distincts
Réseau étendu
Hébergement interne ou externe
12 mai 2014 - Propriété de Solucom, reproduction interdite
Sauvegarde Bandes magnétiques VTL
Réseau mixte
Résilience du datacenter 18
ETAPE 2 : Stratégie
2.A – Définir la stratégie PCI (2/2) Présentation du sujet de stage 2
Construction des scénarios choix du secours cible Un travail à poursuivre pouretprésenter les grandes stratégies de secours Construction des différents scénarios pour le secours, et choix du scénario cible sur la base de Différents scénarios à choisir en fonction des performances, de la couverture de risques souhaitée et du coût. la réponse aux besoins et des coûts. Scénario A Continuité distante
Hébergement et réplication
Scénario B1
Scénario B2
Scénario B3
Scénario C
Reprise distante
Reprise distante Continuité locale
Reprise distante (Continuité locale)
Continuité distante Reprise distante
Bi-site proche
Bi-site éloigné
Rép. synch.
Rép. asynch.
200 km
S1
Secours de la majorité du SI
Haute-disponibilité distante
Mutualisé interne
Couverture de risques
Rép. asynch.
S2
>200 km
Mutualisation interne
Mutualisé interne
1
1
Aspect financier
Performances
0
Faisabilité technique
S1
>200 km
Aspect financier
Performances
Eventuellement haute-disponibilité locale
Mutualisation (interne ou externe)
Mutualisé externe
Mutualisé interne et/ou externe
Faisabilité organisationnelle
2
Faisabilité technique
Couverture de risques 5
4
Faisabilité organisationnelle
3 2 1
Aspect financier
Performances
S2
Haute-disponibilité distante
5
3
0