Un défaut de code dans les serveurs DNS Microsoft Azure provoque l’indignation mondiale

Récemment, Microsoft a révélé une panne mondiale due à un défaut de code à la suite de laquelle le service DNS Azure a été submergé et a commencé à ne plus répondre aux requêtes DNS.

L’indignation mondiale a été ressentie mardi après-midi vers 5 h 21. En raison de cela, un utilisateur a rencontré des difficultés pour se connecter à de nombreux services. Ces services comprennent:

  • Xbox Live,
  • Microsoft Office,
  • SharePoint Online,
  • Microsoft Intune,
  • Dynamics 365,
  • Microsoft Teams,
  • Skype,
  • Exchange en ligne,
  • OneDrive,
  • Yamer,
  • Power BI,
  • Power Apps,
  • Une note,
  • Microsoft Managed Desktop,
  • Et Microsoft Streams.

Ces services sont si répandus dans l’infrastructure de Microsoft. C’est pourquoi, la page azure chargée de prouver les informations de panne aux utilisateurs est devenue inaccessible.

Si nous parlons de son état actuel, la panne a été résolue. Le Microsoft a finalement résolu le problème le même jour à environ 18h30 HNE. Cependant, certains services mettent un peu de temps à fonctionner à nouveau.

En demandant plus d’informations sur la panne, Microsoft a seulement dit qu’elle était due à un problème DNS.

Hier, cependant, la société a publié en tant que RCA ou analyse des causes profondes. Cela explique que la panne de la semaine est due à une surcharge des services DNS Azure.

Selon Microsoft, Azure DNS, qui est chargé de fournir une haute disponibilité et des services DNS rapides, a commencé à recevoir une augmentation anormale de toutes les requêtes DNS reçues dans le monde entier.

Bien que la nature de cette poussée anormale ne soit pas claire, il peut s’agir d’une attaque DDoS ciblant certains domaines.

 C’est à cause d’un défaut de code, que le service DNS qui gère généralement un grand nombre de requêtes ne fonctionnerait pas correctement, précise le Microsoft.

«Les serveurs DNS Azure ont connu une augmentation anormale des requêtes DNS du monde entier ciblant un ensemble de domaines hébergés sur Azure. Normalement, les couches de caches d’Azure et la mise en forme du trafic atténueraient cette augmentation. Dans cet incident, une séquence spécifique d’événements a exposé un code défaut de notre service DNS qui a réduit l’efficacité de nos caches DNS Edge. « 

«Alors que notre service DNS devenait surchargé, les clients DNS ont commencé de fréquentes tentatives de leurs requêtes, ce qui a ajouté une charge de travail au service DNS. Étant donné que les tentatives des clients sont considérées comme du trafic DNS légitime, ce trafic n’a pas été abandonné par nos systèmes d’atténuation des pics volumétriques. Cette augmentation du trafic a conduit à une disponibilité réduite de notre service DNS », explique Microsoft dans le RCA publié.

Presque tous les domaines Microsoft sont résolus via Azure DNS. Le service DNS étant surchargé, la résolution des noms d’hôte sur ces domaines et l’accès associé aux services n’étaient pas possibles.

Par exemple, xboxlive.com utilise les serveurs de noms Azure DNS suivants pour résoudre les noms d’hôte de ce domaine:

NS1-205.AZURE-DNS.COM

NS2-205.AZURE-DNS.NET

NS3-205.AZURE-DNS.ORG

NS4-205.AZURE-DNS.INFO

Ainsi, lorsque le service n’était pas disponible, les utilisateurs ne pouvaient plus se connecter à la X-box Live.

Microsoft est en train de réparer le défaut de code afin que le DNS puisse gérer un grand nombre de requêtes.