INTERVIEW En attendant l’audit demandé par la ministre des PME et de l’économie numérique, André Pérez, consultant réseaux et télécoms, apporte son éclairage sur les raisons de la panne subie par Orange la semaine passée.
André Pérez, consultant réseaux et Télécoms (DR)
Comment expliquez-vous la panne d’Orange ?
Je ne détiens pas plus d’éléments que ceux dont on peut disposer en prenant connaissance des déclarations des dirigeants d’Orange, ou de ce qu’on peut lire dans la presse grand public ou professionnelle. Apparemment, la panne viendrait donc du HLR, un élément du cœur de réseau chargé d’identifier les clients de l’opérateur. Il s’agit d’une base de données, chargée notamment de savoir si l’usager qui tente de se connecter au réseau d’Orange est bien client de l'opérateur ou autorisé par Orange à utiliser son réseau. Par exemple, un abonné Deutsche Telekom ou Telefonica qui utilise en France, en roaming, le réseau Orange, passera lui aussi par le HLR d’Orange pour être identifié.
Donc le fait que le HLR tombe en panne suffirait à perturber la totalité des clients d’un opérateur ?
En fait, une entreprise comme Orange ne possède pas un seul HLR, bien sûr, mais plusieurs - sans doute une dizaine. Or si un HLR tombe en panne, cela n’affecte que 2 millions de clients, au maximum, pas 28 millions. Dans un réseau, la seule entité qui puisse impacter 28 millions d’abonnés à la fois, c’est le HLR virtuel, une sorte de “super HLR” chargé de coordonner tous les autres. En fait, c’est l’ampleur même de la panne qui nous renseigne sur sa nature : non seulement l’hypothèse d’un problème au niveau du HLR est plus que vraisemblable, mais on peut même penser que c’est le HLR virtuel qui est tombé en rade.
La surcharge créée par l’itinérance de Free Mobile sur le réseau Orange peut-elle expliquer cette panne ?
Non, je ne crois pas. Free Mobile a son propre HLR, et c’est le HLR d’Orange qui a été affecté. Ceci dit, il est vrai que tous les abonnés de Free Mobile sont amenés à contacter le HLR d’Orange à chaque fois qu’ils passent un appel, ne serait-ce que pour le HLR d’Orange les autorise à utiliser le réseau de l’opérateur historique, en vertu des accords d’itinérance ! Cela explique d’ailleurs pourquoi les clients de Free Mobile ont aussi été impactés, puisqu’en principe, en toute logique, plus les clients de Free Mobile passent par le réseau Free Mobile, plus ils utilisent le HLR de Free, et moins ils ont besoin d’utiliser le HLR d’Orange. Par ailleurs, il est possible qu’une augmentation de la charge, c’est-à-dire un afflux soudain de requêtes, puisse provoquer une coupure du HLR virtuel : si le processeur est sur-sollicité en raison d’un trop grand nombre de requêtes, il peut décider de s’arrêter. Et quand il s’arrête, il faut relancer toute la machine pour remonter le réseau, ce qui peut prendre beaucoup de temps.
Malgré tout, je ne pense pas que l’afflux provoqué par les 4 ou 5 millions d’abonnés de Free Mobile soit à l’origine de la panne : certes, les départs en vacance et les résultats du bac ont créé un pic de consommation, mais un pic qui n’a sans doute rien à voir avec celui du 31 décembre, durant lequel tous les réseaux tiennent le coup tous les ans.
Comment une telle panne est-elle possible ?
En principe, chaque HLR dispose d’un “back up”, c’est-à-dire d’une solution de secours. Là, visiblement, elle n’a pas marché. C’est une question sur laquelle Orange devra bien sûr se pencher. Pour ce qui concerne les explications possibles, j’en vois essentiellement deux : une coupure d’alimentation du processeur due à une augmentation de la charge, comme je l’ai évoqué il y a quelques instants, ou une erreur humaine. Il faut également citer la piste de l’attaque terroriste, mais je n’y crois guère : attaquer un HLR est si compliqué qu’il ne pourrait s’agit que d’une attaque de niveau gouvernemental… L’hypothèse est très peu plausible.
Que faire pour qu’un tel incident ne se reproduise pas ?
Bien sûr, il faut attendre la fin de l’audit pour apporter une réponse précise. En attendant, ce qu’on peut dire c’est que si c’est un problème de charge, il faut se demander pourquoi les mécanismes de défense chargés de contrôler les flux n’ont pas marché. Si c’est une erreur humaine... alors on ne pourra pas empêcher qu’une autre erreur humaine puisse de nouveau survenir un jour... A moins de reconfigurer l’espèce humaine !
http://www.challenges.fr/high-tech/20120710.CHA8759/free-mobile-n-est-sans-doute-pas-a-l-origine-de-la-panne-d-orange.html
André Pérez, consultant réseaux et Télécoms (DR)
Comment expliquez-vous la panne d’Orange ?
Je ne détiens pas plus d’éléments que ceux dont on peut disposer en prenant connaissance des déclarations des dirigeants d’Orange, ou de ce qu’on peut lire dans la presse grand public ou professionnelle. Apparemment, la panne viendrait donc du HLR, un élément du cœur de réseau chargé d’identifier les clients de l’opérateur. Il s’agit d’une base de données, chargée notamment de savoir si l’usager qui tente de se connecter au réseau d’Orange est bien client de l'opérateur ou autorisé par Orange à utiliser son réseau. Par exemple, un abonné Deutsche Telekom ou Telefonica qui utilise en France, en roaming, le réseau Orange, passera lui aussi par le HLR d’Orange pour être identifié.
Donc le fait que le HLR tombe en panne suffirait à perturber la totalité des clients d’un opérateur ?
En fait, une entreprise comme Orange ne possède pas un seul HLR, bien sûr, mais plusieurs - sans doute une dizaine. Or si un HLR tombe en panne, cela n’affecte que 2 millions de clients, au maximum, pas 28 millions. Dans un réseau, la seule entité qui puisse impacter 28 millions d’abonnés à la fois, c’est le HLR virtuel, une sorte de “super HLR” chargé de coordonner tous les autres. En fait, c’est l’ampleur même de la panne qui nous renseigne sur sa nature : non seulement l’hypothèse d’un problème au niveau du HLR est plus que vraisemblable, mais on peut même penser que c’est le HLR virtuel qui est tombé en rade.
La surcharge créée par l’itinérance de Free Mobile sur le réseau Orange peut-elle expliquer cette panne ?
Non, je ne crois pas. Free Mobile a son propre HLR, et c’est le HLR d’Orange qui a été affecté. Ceci dit, il est vrai que tous les abonnés de Free Mobile sont amenés à contacter le HLR d’Orange à chaque fois qu’ils passent un appel, ne serait-ce que pour le HLR d’Orange les autorise à utiliser le réseau de l’opérateur historique, en vertu des accords d’itinérance ! Cela explique d’ailleurs pourquoi les clients de Free Mobile ont aussi été impactés, puisqu’en principe, en toute logique, plus les clients de Free Mobile passent par le réseau Free Mobile, plus ils utilisent le HLR de Free, et moins ils ont besoin d’utiliser le HLR d’Orange. Par ailleurs, il est possible qu’une augmentation de la charge, c’est-à-dire un afflux soudain de requêtes, puisse provoquer une coupure du HLR virtuel : si le processeur est sur-sollicité en raison d’un trop grand nombre de requêtes, il peut décider de s’arrêter. Et quand il s’arrête, il faut relancer toute la machine pour remonter le réseau, ce qui peut prendre beaucoup de temps.
Malgré tout, je ne pense pas que l’afflux provoqué par les 4 ou 5 millions d’abonnés de Free Mobile soit à l’origine de la panne : certes, les départs en vacance et les résultats du bac ont créé un pic de consommation, mais un pic qui n’a sans doute rien à voir avec celui du 31 décembre, durant lequel tous les réseaux tiennent le coup tous les ans.
Comment une telle panne est-elle possible ?
En principe, chaque HLR dispose d’un “back up”, c’est-à-dire d’une solution de secours. Là, visiblement, elle n’a pas marché. C’est une question sur laquelle Orange devra bien sûr se pencher. Pour ce qui concerne les explications possibles, j’en vois essentiellement deux : une coupure d’alimentation du processeur due à une augmentation de la charge, comme je l’ai évoqué il y a quelques instants, ou une erreur humaine. Il faut également citer la piste de l’attaque terroriste, mais je n’y crois guère : attaquer un HLR est si compliqué qu’il ne pourrait s’agit que d’une attaque de niveau gouvernemental… L’hypothèse est très peu plausible.
Que faire pour qu’un tel incident ne se reproduise pas ?
Bien sûr, il faut attendre la fin de l’audit pour apporter une réponse précise. En attendant, ce qu’on peut dire c’est que si c’est un problème de charge, il faut se demander pourquoi les mécanismes de défense chargés de contrôler les flux n’ont pas marché. Si c’est une erreur humaine... alors on ne pourra pas empêcher qu’une autre erreur humaine puisse de nouveau survenir un jour... A moins de reconfigurer l’espèce humaine !
http://www.challenges.fr/high-tech/20120710.CHA8759/free-mobile-n-est-sans-doute-pas-a-l-origine-de-la-panne-d-orange.html