SLI, SLO, SLA, RTO, RPO : Définition
Publié le
Do not index
Do not index
Primary Keyword
Lié à Analyse sémantique (Articles liés) 1
Lié à Analyse sémantique (Articles liés)
Statut rédaction
Idée
Lié à Analyse sémantique (Articles liés) 2
Recovery Point Objective (RPO)Recovery Time Objective (RTO)Service Level Indicator (SLI)Service Level Agreements (SLA)Service Level Objectives (SLO)Exemple de définition de SLO / SLI / SLATable des disponibilités
Recovery Point Objective (RPO)
RPO : fait généralement référence à la quantité de données qui peuvent être perdues au cours de la période la plus opportune pour une entreprise, avant qu'un préjudice important ne se produise, à partir d'un événement critique jusqu'à la sauvegarde la plus précédente.
Recovery Time Objective (RTO)
RTO : fait souvent référence au temps pendant lequel une application, un système et/ou un processus peut être en panne sans causer de dommages importants à l'entreprise, ainsi qu'au temps passé à restaurer l'application et ses données.
Service Level Indicator (SLI)
Mesure quantitative des performances ou de la fiabilité d’un service. Dans les SLO Datadog, un SLI est une métrique ou une agrégation d’un ou de plusieurs monitors.
Service Level Agreements (SLA)
Un SLA (accord de niveau de service) est un accord entre le fournisseur et le client sur des mesures mesurables telles que la disponibilité, la réactivité et les responsabilités.
Service Level Objectives (SLO)
Un SLO (objectif de niveau de service) est un accord au sein d'un SLA sur une métrique spécifique comme le temps de disponibilité ou le temps de réponse. Ainsi, si le SLA est l'accord formel entre vous et votre client, les SLO sont les promesses individuelles que vous faites à ce client. Les SLO définissent les attentes des clients et indiquent aux équipes informatiques et DevOps les objectifs qu'ils doivent atteindre et par rapport auxquels ils doivent se mesurer.
Exemple de définition de SLO / SLI / SLA
Service Level Indicator (SLI) | Description | SLO | SLA | Marge d’erreur | Comment mesurer l’indicateur |
Website up | Correspond au pourcentage de temps up du frontend de l’application | 99% | 95% | 5% | Utiliser un Synthetics dans Datadog qui ping de façon régulière le site afin de vérifier que le site est toujours up |
Api up | Correspond au pourcentage de temps up de l’api de l’application | 99% | 95% | 5% | Utiliser un Synthetics dans Datadog qui ping de façon régulière le site afin de vérifier que l’app est toujours up |
Latency low | Correspond au pourcentage de temps pour laquelle les temps de réponses moyen sont en dessous d’un certain temps en ms | 99% | 95% | 5% | Utiliser un monitor dans Datadog qui vérifie la latence moyenne sur une période de temps pour les uploads |
Temps de traitement fichier upload | Correspond au pourcentage de temps pour laquelle les temps de traitement sont en dessous d’un certain temps en seconde | 95% | 90% | 10% | Les uploads sont stockés dans une queue Rabbitmq. On peut analyser la taille de la queue d’upload en question et lancer une alerte si un message reste dans la queue au dela d’un certain temps défini |
Api error rate (5xx) | Correspond au pourcentage de requêtes ne retournant pas de statut 5xx | 95% | 90% | 5% | Utiliser les métriques remontées dans Datadog lié à au error rate |
Table des disponibilités
Availability % | Downtime par an | Downtime par trimestre | Downtime par mois | Downtime par semaine | Downtime par jour (24 hours) |
90% ("one nine") | 36.53 days | 9.13 days | 73.05 hours | 16.80 hours | 2.40 hours |
95% ("one and a half nines") | 18.26 days | 4.56 days | 36.53 hours | 8.40 hours | 1.20 hours |
97% ("one and three quarters nines") | 10.96 days | 2.74 days | 21.92 hours | 5.04 hours | 43.20 minutes |
98% ("one and seven eights nines") | 7.31 days | 43.86 hours | 14.61 hours | 3.36 hours | 28.80 minutes |
99% ("two nines") | 3.65 days | 21.9 hours | 7.31 hours | 1.68 hours | 14.40 minutes |
99.5% ("two and a half nines") | 1.83 days | 10.98 hours | 3.65 hours | 50.40 minutes | 7.20 minutes |
99.8% ("two and seven eighths nines") | 17.53 hours | 4.38 hours | 87.66 minutes | 20.16 minutes | 2.88 minutes |
99.9% ("three nines") | 8.77 hours | 2.19 hours | 43.83 minutes | 10.08 minutes | 1.44 minutes |
99.95% ("three and a half nines") | 4.38 hours | 65.7 minutes | 21.92 minutes | 5.04 minutes | 43.20 seconds |
99.99% ("four nines") | 52.60 minutes | 13.15 minutes | 4.38 minutes | 1.01 minutes | 8.64 seconds |
99.995% ("four and a half nines") | 26.30 minutes | 6.57 minutes | 2.19 minutes | 30.24 seconds | 4.32 seconds |
99.999% ("five nines") | 5.26 minutes | 1.31 minutes | 26.30 seconds | 6.05 seconds | 864.00 milliseconds |
99.9999% ("six nines") | 31.56 seconds | 7.89 seconds | 2.63 seconds | 604.80 milliseconds | 86.40 milliseconds |
99.99999% ("seven nines") | 3.16 seconds | 0.79 seconds | 262.98 milliseconds | 60.48 milliseconds | 8.64 milliseconds |
99.999999% ("eight nines") | 315.58 milliseconds | 78.89 milliseconds | 26.30 milliseconds | 6.05 milliseconds | 864.00 milliseconds |
99.9999999% ("nine nines") | 31.56 milliseconds | 7.89 milliseconds | 2.63 milliseconds | 604.80 microseconds | 86.40 microseconds |
Sujets