Codefehler in Microsoft Azure DNS-Servern führen zu globaler Empörung

Vor kurzem hat Microsoft einen weltweiten Ausfall festgestellt, der aufgrund eines Codefehlers verursacht wurde, wodurch der Azure-DNS-Dienst überlastet wurde und nicht mehr auf DNS-Abfragen reagierte.

Die weltweite Empörung wurde am Dienstagnachmittag ungefähr um 5:21 Uhr erlebt. Aus diesem Grund hatten viele Benutzer Schwierigkeiten, sich bei zahlreichen Diensten anzumelden. Diese Dienstleistungen umfassen:

  • XBox Live,
  • Microsoft Office,
  • SharePoint Online,
  • Microsoft Intune,
  • Dynamics 365,
  • Microsoft-Teams,
  • Skype,
  • Online austauschen,
  • Eine Fahrt,
  • Yamer,
  • Power BI,
  • Power Apps,
  • Eine Note,
  • Microsoft Managed Desktop,
  • Und Microsoft Streams.

Diese Dienste sind in der Microsoft-Infrastruktur so weit verbreitet. Aus diesem Grund wurde der Zugriff auf die Azure-Seite, die für den Nachweis von Ausfallinformationen für die Benutzer verantwortlich ist, unzugänglich.

Wenn wir über den aktuellen Status sprechen, wurde der Ausfall behoben. Microsoft löste das Problem schließlich am selben Tag um ca. 18.30 Uhr EST. Einige Dienste benötigen jedoch etwas Zeit, um wieder zu funktionieren.

Auf die Frage nach weiteren Informationen zum Ausfall sagte Microsoft nur, dass dies auf ein DNS-Problem zurückzuführen sei.

Gestern veröffentlichte das Unternehmen jedoch als RCA oder Ursachenanalyse. Dies erklärt, dass der Ausfall der Woche darauf zurückzuführen ist, dass die Azure-DNS-Dienste überlastet wurden.

Laut Microsoft erhielt Azure DNS, das für die Bereitstellung von Hochverfügbarkeit und schnellen DNS-Diensten verantwortlich ist, einen anomalen Anstieg aller weltweit eingegangenen DNS-Anfragen.

Es ist zwar nicht klar, um welchen anomalen Anstieg es sich handelt, es kann sich jedoch um einen DDoS-Angriff handeln, der auf bestimmte Domänen abzielt.

 Aufgrund eines Codefehlers würde der DNS-Dienst, der normalerweise eine große Anzahl von Anforderungen verarbeitet, nicht ordnungsgemäß funktionieren, so Microsoft.

“Bei Azure-DNS-Servern kam es zu einem ungewöhnlichen Anstieg von DNS-Abfragen aus der ganzen Welt, die auf eine Reihe von auf Azure gehosteten Domänen abzielten. Normalerweise würden die Cache- und Traffic-Shaping-Schichten von Azure diesen Anstieg abschwächen. Bei diesem Vorfall wurde durch eine bestimmte Folge von Ereignissen ein Code angezeigt Fehler in unserem DNS-Dienst, der die Effizienz unserer DNS-Edge-Caches verringert. “

“Als unser DNS-Dienst überlastet wurde, begannen DNS-Clients häufige Wiederholungsversuche ihrer Anforderungen, wodurch die Arbeitsbelastung des DNS-Dienstes erhöht wurde. Da Client-Wiederholungsversuche als legitimer DNS-Verkehr angesehen werden, wurde dieser Verkehr von unseren volumetrischen Spike-Mitigation-Systemen nicht gelöscht. Dieser Anstieg des Verkehrs führte dazu um die Verfügbarkeit unseres DNS-Dienstes zu verringern “, erklärte Microsoft in der veröffentlichten RCA.

Fast alle Microsoft-Domänen werden über Azure DNS aufgelöst. Da der DNS-Dienst überlastet wurde, war das Auflösen der Hostnamen in diesen Domänen und der mit den Diensten verbundene Zugriff nicht möglich.

Beispielsweise verwendet xboxlive.com die folgenden Azure DNS-Nameserver, um die Hostnamen dieser Domäne aufzulösen:

NS1-205.AZURE-DNS.COM

NS2-205.AZURE-DNS.NET

NS3-205.AZURE-DNS.ORG

NS4-205.AZURE-DNS.INFO

Wenn der Dienst nicht verfügbar war, konnten sich die Benutzer nicht mehr bei der X-Box Live anmelden.

Microsoft repariert derzeit den Codefehler, damit der DNS eine große Anzahl von Anforderungen verarbeiten kann.