Splunk On-Call (tidligere VictorOps) anmeldelse og alternativer
VictorOps er en hændelsespakke. Tjenesten kan integreres til at arbejde med andre IT-styringssystemer. VictorOps er nu en afdeling af Splunk .
Om VictorOps
VictorOps blev grundlagt i 2012 og havde sit hovedkvarter i Boulder, Colorado, i USA. I juni 2018 blev virksomheden købt af Splunk.
VictorOps-systemet er klassificeret som en Hændelseshåndtering service. Det fungerer som et knudepunkt for advarsler. Den har grænseflader til problemdetektionssystemer og sender dem derefter til udviklingsteams som advarsler. VictorOps-systemet identificerer ikke problemer, og det administrerer heller ikke deres løsning. Hovedmarkedet for VictorOps er til brug i DevOps.
Systemet er ikke designet til brug som et Help Desk-miljø. VictorOps inkluderer ikke et billetsystem eller teamstyringsfunktioner. Det er dog muligt at indtaste specialistkompetencer for individuelle teammedlemmer eller grupper, som gør det muligt for systemet at sende meddelelser til kontakter, når der opstår et problem.
Siden VictorOps blev en del af Splunk, er dens navn blevet ændret til Splunk On-Call . Så hvis du leder efter VictorOps, vil det nye navn forklare, hvorfor det har været svært at finde.
Splunk On-Call
Splunk On-Call er især nyttig til IT drift teams, der understøtter vitale 24-timers operationer – systemer, der fungerer døgnet rundt, såsom beredskabets it-infrastruktur, et procesflowkontrolsystem til gasforsyning eller en døgnåben automatiseret fabrik. I disse miljøer eksisterer 'uden for arbejdstid' ikke. Men for realistisk ansættelsesledelse vil nattevagten muligvis ikke fuldt ud supplere systemekspertise. Disse specialister vil ikke være på kontoret i disse tilfælde, men vil være ' på vagt .'
Et andet scenario ligger med outsourcede tjenester. For eksempel lægger ledelsesteamene i vitale systemer ofte kontrakter til vedligeholdelsesstøtte med specialiserede konsulenter. Der er forskellige kontakter til forskellige systemspecialiseringer eller en række kontakter med forskellige serviceudbydere for forskellige aspekter af systemet; at skifte hændelsesmeddelelsen til en anden destination er en vigtig opgave.
Det er de funktioner, som Splunk On-Call udfører. Det kræver, at disse forbindelser mellem incidenstyper og respondere er Opsætning . At tilpasse tjenesten for komplicerede systemer kan gøre den opsætningsopgave til et tidskrævende trin. Dette er dog blot en måde at kodificere hukommelsen af kontrakter, aftaler og planer på, som mange systemadministratorer har i deres hoveder.
Centralisering og dokumentere kontaktoplysningerne og beslutningsprocesserne for IT-driftsledere, når de beslutter, hvem der skal ringes til i en nødsituation, giver kontinuitet i hændelsen. Som et resultat er de mennesker, der bærer den viden, fraværende på grund af orlov eller sygdom eller forlader virksomheden pludselig.
Procesflowet for Splunk On-Calls operationer er vist nedenfor.
Som det fremgår af diagrammet, kan systemet modtage alarmbeskeder igennem Slap og Hold . Det betyder, at enhver overvågningstjeneste, der kan generere notifikationer af Slack, kan arbejde med Splunk On-Call. Notifikationer kan også modtages fra Microsoft Teams.
Når Splunk On-Call modtager en notifikation, tjekker den sin database over handlinger for at udføre og videresender disse advarsler til den relevante person. De der videresendte advarsler kan også sendes med Slack eller Microsoft Teams.
On-Call Essentials
Hjertet af Splunk On-Call service er dens database over kontakter. Den rigtige person at ringe til for et specifikt problem kan være anderledes på forskellige tidspunkter af dagen. Det kan lejlighedsvis være nødvendigt at kontakte en anden person, hvis den primære kontakt er væk. Splunk On-Call gør det muligt at optage flere forskellige personer som personen for at komme igennem en tidsplan. Så det er ikke kun nødvendigt at indtaste kontaktoplysninger, men systemet skal også vide, hvornår denne person er ansvarlig. En tidsplanskalender håndterer dette problem i indstillingerne af On-Call-systemet.
Et andet problem, som systemadministratorer står over for, er, at den primære kontakt ikke altid reagerer. On-Call-pakken inkluderer automatiseret eskalering , som implementerer en anden notifikation efter en tidsforsinkelse. Dette kan involvere at kontakte den ansvarlige for den organisation eller afdeling, som den primære kontakt tilhører.
Webhooks tillade, at yderligere handlinger udføres automatisk på samme tid, som en advarsel videresendes. Sådanne handlinger kunne f.eks. være at hoppe på serveren eller vise en statusside på et websted.
Hurtig respons
Det hændelses dashboard of Splunk On-Call giver en live log over alle hændelser, der relaterer til den alarm, der blev sendt gennem systemet. Denne rapport viser de personer i teamet, der har fået tildelt alarmen til at håndtere, og en log over kommunikation foretaget via et meddelelsessystem, der er forbundet til On-Call-systemet.
Lederen med ansvar for det truede system kan aktivere et telefonmøde gennem On-Call-dashboardet for at tjekke fremskridt. Systemet gemmer telefonnumrene på hvert tildelt teammedlem og grupperer og ringer automatisk til dem, uden at lederen behøver at se hvert nummer.
Systemlederen kan også informere interessenter af bevidsthed om problemet og fremskridt med en løsning. Alle de personlige og automatiserede handlinger, der udføres af det truede systems ledelsesteam, bliver logget på en tidslinje, som er en afgørende log, der vil for en del af SLA overensstemmelse dokumentation.
Hændelsesautomatisering
Kerneværdien af VictorOps er dens evne til at centralisere fordelingen af ansvar i forbindelse med et systemproblem. Dette centrale behandlingspunkt for advarsler gør det muligt for værktøjet at identificere lignende meddelelser. For eksempel, hvis en produktionslinje holder op med at bevæge sig, vil sensorer flere steder på fabriksgulvet udløse advarsler. I stedet for blot at passere gennem en strøm af advarsler, er VictorOps-systemet smelter sammen dem alle i én notifikation.
Rapporterne tildelt en gruppe af alarmer bevare alle de oprindelige indgående alarmer. Disse oplysninger er nyttige, da de kommer fra live-overvågningssystemer. En systemingeniør kan hurtigt anvende logik til at identificere det faktiske fejlpunkt ved at se på, hvor alle meddelelserne kom fra.
Driveren for underretningsdirigeringen kommer fra Advarselsregler i VictorOps. Disse regler skal alle konfigureres, så den operatør, der er ansvarlig for at sætte disse regler, skal vide præcis, hvordan advarselsformatet og relaterede triggere skal udformes. Regler er et par hændelser og handlinger, der skal udføres som reaktion.
Selvom automatisering videresender alarmer uden manuel indgriben, kan systemadministratoren tilføje noter til hver, efterhånden som de leveres til den ansvarlige kontakt. Det er også muligt at sætte op vedhæftede filer og kedeltekst for hver advarselstype. Disse bemærkninger kan omfatte sikkerhedsinstruktioner og ansvarsmeddelelser eller trænings- og fejlfindingsvejledninger.
Leveringsindsigt
Delivery Insights-modulet er en attraktiv funktion for DevOps-teams, der opererer en CI/CD-pipeline . Denne analytiske funktion hjælper udviklingsteamledere med at se, om virksomheden spilder for mange penge på dårligt testet kode, der går i produktion, før den er blevet verificeret.
Det kan være dyrt at lade rettelser ligge, indtil et modul allerede er i produktion. Fjernelse af eksisterende systemer for at komme ned til en procedurefejl og omdanne den kan påvirke relaterede systemer. De lod forkert kode go live skader virksomhedens omdømme ved at efterlade kunder og offentlige medlemmer med det indtryk, at virksomheden ikke kan levere sine ydelser. I lyset af disse fejl kan potentielle kunder undre sig over kvaliteten af den service, de kan forvente.
VictorOps-implementeringsmuligheder
VictorOps er ikke længere tilgængelig som et selvstændigt produkt. Du skal se på Splunk On-Call i stedet.
Splunk On-Call er en SaaS platform . Der er ingen on-premises version. On-Call-tjenesten inkluderer VictorOps-softwaren, processorkraften til at køre den og lagerplads til at opbevare logfiler og statistik. Abonnenter på AWS og Azure virtuelle serverplaner kan tilføje Splunk-tjenester på markedspladsen på deres foretrukne platform.
Splunk On-Call pris
Prisen på Splunk On-Call er lidt kompliceret, fordi den ikke tilbydes som et separat modul. I stedet er det en tilføjelsesfunktion til Splunk Observability Cloud pakke.
Splunk Observability Cloud er en pakke, der inkluderer Splunk Infrastructure Monitoring og Splunk APM , en applikationsydelsesmonitor. Bundtet involverer også Splunk Log Observer , som er et logmanager og datasøgningsprodukt.
Der er to planer for Splunk Observability Cloud og den laveste af disse, kaldet Standard , starter ved $95 pr. måned pr. vært, når den faktureres årligt. Den højere plan, kaldet Plus , omfatter også Splunk RUM , en pakke af værktøjer til at analysere live-websteder, og dens startpris er $110 pr. måned pr. vært, når den faktureres årligt.
Splunk On-Call-tilføjelsen har en startpris på $5 pr. bruger pr. måned, når den faktureres årligt. Derudover kan du få en 14 dages gratis prøveperiode af Splunk On-Call og alle andre Splunk-moduler.
Splunk On-Call styrker og svagheder
VictorOps, nu kaldet Splunk On-Call , har sin niche som notifikationsmanager til systemfejlshåndtering. Dette værktøj fungerer dog ikke uafhængigt. Det eneste, det gør, er at passere gennem advarsler, som andre softwarepakker har rejst. Vi har identificeret nogle styrker og svagheder i Splunk On-Call.
Fordele:
- Velegnet til brug af DevOps-teams, der tjekker interne funktioner, når de går live
- Automatiserer underretningsprocessen for personer, der er ansvarlige for at understøtte systemer, der er fejlbehæftede
- Integreres med andre Splunk-produkter og enhver skærm, der kan sende notifikationer ud gennem Slack eller Teams
- Omfattende aktivitetsdokumentation for SLA compliance-rapportering
- Registrerer lignende rapporter, der vedrører den samme hændelse
Ulemper:
- Giver funktionalitet, som overvågningsværktøjer til alarmering allerede implementerer
- Kvaliteten af systemets hændelsesruting afhænger af brugerens evne til at skabe nøjagtige regler
Alternativer til VictorOps
At finde alternativer til VictorOps er en vanskelig opgave, fordi muligheden for VictorOps i mange tilfælde er ikke at bruge noget. I stedet VictorOps ruteadvarsler til bestemte personer og optage underretningsbegivenhederne. Imidlertid tilbyder mange af de overvågningsværktøjer, der kunne indgå i VictorOps, også skriverutingsregler for at dirigere advarsler til den rigtige person.
Vi har fundet flere værktøjer, der er meget gode til at understøtte DevOps teams i fejlfinding under overgangen til produktion og når nye funktioner og websider er live.
Her er vores liste over de fem bedste alternativer til VictorOps.
- SolarWinds Service Desk (GRATIS PRØVE) Denne pakke inkluderer teamstyring og opgavestyringsfunktion i sit billetsystem. Ligesom VictorOps kan SolarWinds Service Desk integreres med Jira til projektstyring og Slack til notifikationer. Du kan få overvågningsalarmer indført i billetsystemet og oprette ruter for at lade systemet automatisk tildele arbejde. Derudover vil den spore fremskridt og give hver tekniker en opgaveliste med deadlines. SolarWinds Service Desk er et SaaS-system, og du kan få adgang til det på en 30-dages gratis prøveperiode.
- Datadog APM + Continuous Profiler Datadogs Application Performance Monitor har to planer, og den højeste af disse inkluderer en Continuous Profiler og en Error Tracker. Disse funktioner sporer dem i Splunk Observability Cloud-pakken med Splunk On-Call-tilføjelsen. Ud over at opdage problemer i live-kode vil dette værktøj cirkulere det tilbage til udviklingsteamet. Abonner på det nye Datadog CI Visibility-modul for at tilføje CI/CD-pipeline-styring og se på Incident Management-modulet for at fuldende alternativet til VictorOps. Dette er en SaaS platform, og alle moduler tilbydes en 14 dages gratis prøveperiode .
- PagerDuty er en meget tæt rival til Victor Ops. Den er afhængig af integrationer med Slack og ServiceNow til at formidle advarsler rejst af andre overvågningsværktøjer og videresende advarsler i henhold til regelbøger opsat i værktøjet. Men igen, dette er en SaaS-pakke, og du kan få den på en 14 dages gratis prøveperiode .
- Uovervindelig En kontinuerlig testtjeneste, der sporer udviklingen af kode gennem test og fortsætter med at undersøge dens ydeevne og opdager fejl, når den er live. Denne pakke kan integreres med JIRA for at fuldføre arbejdsfordeling og opgavestyring for identificerede præstationsproblemer. Denne pakke er tilgængelig som en SaaS-platform eller til installation på Windows Server. Anmod om en demo .
- OpsGenie er et vagt- og alarmstyringssystem fra Atlassian, skaberne af Jira, projektstyringsværktøjet. OpsGenie sørger for omhyggelig routing og integreres med Jira for at levere komplet udviklings- og ombygningsplanlægning og overvågning. Prøv det gratis i 14 dage .