Prosjekt tardigrade beskytter vms mot vertsfeil

Innholdsfortegnelse:

Video: Вызывает крайнее удивление в МИД прокомментировали отказ Эстонии пропускать российские 2024

Video: Вызывает крайнее удивление в МИД прокомментировали отказ Эстонии пропускать российские 2024
Anonim

Etter flere Azure-endringer og sikkerhetsforbedringer de siste par månedene, introduserer Microsoft Project Tardigrade som deres nyeste forsøk på å gjøre Azure mer pålitelig.

Project Tardigrade forhindrer plattformfeil

Project Tardigrade er en ny tjeneste som tar sikte på å forbedre Azure elastisitet. Det inkluderer avbøtningsstrategier som beskytter Azure VMs mot plattformfeil.

Slik beskriver Mark Russinovich, teknologisjef hos Microsoft Azure, det nåværende arbeidet med Azure:

Målet vårt er å styrke organisasjoner til å kjøre arbeidsmengden pålitelig på Azure. Med dette som vårt ledende prinsipp investerer vi kontinuerlig i å utvikle Azure-plattformen til å bli feilfjærende, ikke bare for å øke virksomhetens produktivitet, men også for å gi en sømløs kundeopplevelse.

For å forhindre innvirkning på arbeidsmengden, gjør tjenesten komponentene til å helbrede seg og raskt komme seg etter potensielle feil, selv i kritiske vertsfeil.

Hvordan fungerer Project Tardigrade?

Her er et eksempel på hvordan Tardigrade-gjenvinningsarbeidsflyten fungerer:

  • Fase 1: Dette trinnet har ingen innvirkning på å kjøre kunde-VM-er. Den resirkulerer ganske enkelt alle tjenester som kjører på verten. I sjeldne tilfeller at den feilte tjenesten ikke starter på nytt, fortsetter vi til fase 2.
  • Fase 2: Diagnostiseringstjenesten vår kjører på verten for å samle inn alle relevante logger / dumps systematisk, for å sikre at vi grundig kan diagnostisere årsaken til feil i fase 1. Denne omfattende analysen gjør at vi kan "føre til" problemet og dermed forhindre gjentakelser i fremtiden.
  • Fase 3: På et høyt nivå tilbakestiller vi operativsystemet til en sunn tilstand med minimal kundepåvirkning for å dempe vertsproblemet. I løpet av denne fasen bevarer vi tilstandene til hver VM til RAM, hvoretter vi begynner å tilbakestille operativsystemet til en sunn tilstand. Mens operativsystemet raskt tilbakestilles under, "kjører applikasjoner på alle VM-er som er hostet på serveren, kort, mens CPU-en er midlertidig suspendert. Denne opplevelsen ligner på en nettverkstilkobling som midlertidig er mistet, men raskt gjenopptatt på grunn av logg på nytt. Etter at operativsystemet er tilbakestilt, forbruker VM-er sin lagrede tilstand og fortsetter normal aktivitet, og omgår dermed eventuelle VM-omstarter.

Med dette i bakhodet vil Project Tardigrade sikre at svikt i noen enkelt komponent i verten ikke påvirker hele systemet. Som sådan vil ikke kunde-VM-er bli påvirket av vertsfeil.

Microsoft jobber hardt for å forbedre og utvide de forskjellige vertsfeil-scenariene for å sikre at deres cloud computing-plattform er mer pålitelig enn noen gang.

Forvent nye utbygginger og andre pålitelighetsimplementeringer i nærmeste fremtid.

Prosjekt tardigrade beskytter vms mot vertsfeil