Du är här: > > Frågor & Svar > Hur lång 'livslängd' har en server?

Hur lång 'livslängd' har en server?

Många av våra system står i oerhört krävande driftsituationer. Servrar som konstruerats varsamt och med lång erfarenhet och goda kunskaper kring just hur en server ska konstrueras på bästa sätt för att tåla riktigt krävande situationer går naturligtvis sönder förr eller senare - det är ju trots allt elektronikkomponenter som utsätts för en hel del slitage.

Vi är ändå stolta över vår goda historik, vi vet att väldigt många av "våra" serversystem stått i drift i många tusentals dygn i streck utan en enda omstart och än mindre ett hårdvarurelaterat problem. Nu senast hörde vi om ett system som vi tog in 2006 som hade börjat uppvisa lite tecken på slitage och att ett haveri var nära förestående om inte lite planerat systemunderhåll kunde utföras.

Detta system, en OfficeServer Tower Server med en fin gammal hederlig Intel Celeron 478 Socket hade jobbat som webserver och stått i tre olika serverhallar under loppet av hela sju år. Tack vare att vi skött övervakningen av systemet i alla år så vet vi precis hur systemet "mått" i sina olika arbetsituationer. Bortsett från en diskkrash vintern 2011 som enkelt kunde avhjälpas då diskarna använde så kallad diskspegling, dvs RAID-1 där man låter två olika fysiska hårddiskar "göra samma sak" för att få högre datasäkerhet och slippa förlora datat på en hårddisk när den går sönder, så var detta problem ingenting som ens orsakade att servern behövde stängas av - det var bara att byta disken under drift och låta filerna kopieras över till den nya disken igen. Värt att notera är att den andra disken, den som var hel, än idag är i drift.

 

Livslängden på en server avgörs naturligtvis hur den 'behandlas' och servrar är precis som mycket annan elektronikutrustning mycket ömtålig och känslig. En server har ju dessutom i regel en livsviktig funktion och i det här fallet var det ett flertal olika websidor som ju naturligtvis måste vara tillgängliga till varje pris, varje timma, varje dygn, året om.

 

Några saker som minskar nedtiden och förebygger problem är:

  • Redundant ström.
    Med ett 'dubbelt' nätaggregat i er server som man kan byta ut under drift så innebär ett haveri på den ena nätdelen i servern inte ett avbrott - ni beställer bara hem ett ersättningsnätaggregat från oss och byter ut det under drift. Sannolikheten att båda nätdelarna i en server ska gå sönder samtidigt är mycket låg.
  • Redundant nätverk.
    Med minst två nätverkskort i er server har ni alltid ett fungerande kort om det ena går sönder - något som faktiskt händer ibland pga slitage och lång och trogen tjänst. Riskera inte att tappa kontakten med en server som står i produktion bara för att ett nätverkskort går sönder. Dessutom går det att lägga till virtuella IP-adresser på ett nätverkskort så tjänsterna som körs på servern behöver inte ens påverkas av att ett kort är trasigt. Eftersom byte av nätverkskort alltid innebär att servern måste stängas av så innebär det en risk för ett onödigt driftavbrott om ni bara använder ett enda nätverkskort i er server.
  • Diskspegling.
    Livsviktigt. Använd aldrig en server utan RAID-1 på systemdiskarna. RAID-1 ger ett fullgott skydd och ofta förbättrad prestanda tack vare att två olika hårddiskar gör ett jobb tillsammans och uppträder för systemet (tex operativsystemet i er server) som om det vore en enda disk.
    Går en hårddisk sönder så byter ni bara ut den trasiga disken, under drift, och kopierar över filerna från den hela disken till den trasiga disken.
    Sannolikheten att två diskar ska gå sönder samtidigt är mycket låg. Är det dock en risk som ni behöver hantera så finns det exempelvis RAID-5 där man använder minst tre men helst fyra hårddiskar för att "jobba tillsammans", här kan två diskar gå sönder samtidigt utan dataförlust.

  • UPS.
    Livsviktigt. Inte bara är en serverkrash till följd av plötsligt, oväntat spänningsbortfall en katastrof för er server och datat på hårddiskar mm som hamnar i en "limbo"-situation utan en UPS "renar" strömmen, något som många underskattar betydelsen av - en server som får jämn och fin strömtillförsel hela tiden "mår" betydligt bättre. Skadliga "strömspikar" och får lång spänning, något som ofta inträffar i Sverige, inte minst under sommarmånaderna i samband med åskoväder, kan faktiskt slå ut hela nätverk på en sekund. Skadorna blir ofta tidskrävande att åtgärda och inte sällan är det åter igen de känsliga hårddiskarna som får ta den värsta skadan - med dataförlust som följd. Att inte använda UPS är direkt dumdristigt och det är bara en tidsfråga innan problem kommer att uppstå.
    Våra servrar och de UPS:er vi säljer klarar dessutom av att hålla reda på hur lång tid det är kvar på drifttiden vid ett strömavbrott och kan starta en kontrollerad avstängning om det är en överhängande risk att avbrottet kommer att pågå så lång tid så att UPS:ens inbyggda batterier inte räcker till.
    Vid en kontrollerad nedstängning synkroniseras alla hårddiskar och data sparas mm vilket innebär att servern kan startas normalt så snart strömmen kommer tillbaks.
    Varför inte konfigurera er server så den startar automatiskt när strömmen kommer tillbaks eller lägga till fjärrstyrning och wake on lan så att servern kan startas direkt och/eller på distans. Vi har exempelvis brandväggar som kan "skicka ut" en "vakna"-signal till servern via nätverkskortet och väcka en server när strömmen kommit igång igen.

  • Övervakning.
    A och O. Att övervaka servern med en monitoreringssvit som vår tjänst 'SirV' eller motsvarande är oerhört viktigt. Det talar om för er när ett fel inträffat, när ett fel återställts, men framför allt så får ni viktiga systemdata och förvarningar om att tex en hårddisk uppvisar tecken på slitage och bör bytas ut. Ni kan med andra ord utföra ett planerat underhållsarbete på ett sätt som inte påverkar de tjänster som ni kör på servern redan innan ett problem har hunnit inträffa. Ni ser även belastning och hur servern "mår", något som är viktigt för att tex belasta systemen rätt, en server som jobbar för hårt slits ut i förtid. Kanske behöver er server kompletteras med en till server och ingå i en lastbalanseringspool. I en lastbalanserad miljö får nämligen den ena servern tas ur drift och den andra tar hand om all trafik, med lastbalansering KAN ni utföra underhåll och stänga av ett system helt och hållet utan att era kunder eller användare märker av det.

    Tips: ta hjälp av våra experter och dimensionera hela ert nätverk på ett smart sätt, från brandväggen ned till slutanvändarsupporten

 

Vad hände då med tornservern från 2006? Jo, ett cache-minne blev utslitet, det är faktiskt det vanligaste felet vi ser på våra äldre servrar idag och är ett mycket gott betyg för det innebär att alla andra komponenter klarat av allt de utsatts för och i princip allt servern gjort har på något vis passerat cache-minnena. När de slits ut efter många års trogen tjänst så innebär det två saker: systemet kan bli instabilt, du märker ofta problemet på att servern plötsligt krashar och startar om helt utan anledning. I någon systemlogfil kan du om du har tur hinna snappa upp att kärnan i ditt operativsystem klagar på något, det kan vara en DMA-koppling eller något annat men det har sannolikt med systembussen eller något annat "centralt" på servern att göra. I det här systemet var det till slut ett integrerat nätverkskort på moderkortet som började krångla, byte mot nya PCI-kort hjälpte föga eftersom cache-minnena började ta slut så vad gör man?

 

Hjärt och lungräddning - rädda er gamla server.

Här är ett bra upplägg om er gamla server börjar krångla och behöver bytas ut:

 - Gör en backup. Eller spara viktiga filer på någon typ av storage-tjänst där ni enkelt har tillgång till filerna.

Är det hårddiskarna som börjar krångla så är det inte värt att riskera dataförlust, hellre en säkerhetskopia för mycket. Står er maskin hos oss kan vi hjälpa er att göra en backup där vi läser av sektor för sekter så att hela servern kan klonas till en ny disk.

 - Ta in maskinen till oss så att vi får göra underhåll eller be oss komma ut på-platsen hos er. Att hantera servern så varsamt som möjligt och undvika att flytta på den kan vara viktigt om det är en eller flera hårddiskar osm krashat. Var alltid noga med att stänga av servern på ett kontrollerat sätt (inget hålla in start-knappen i fyra sekunder - för då hinner inte hårddiskarna synka). Flytta aldrig på en server som du "slagit ihjäl" med startknappen eller genom att rycka ur strömsladden (gör aldrig så!) - läsarmarna är "ute" på hårddiskarna och åker runt och repar sönder hela hårddiskarna!

 - Kontrollera loggfiler, testa komponent för komponent tills du ringat in var felet ligger. Är det tex ett moderkort som gett upp till slut så är det bäst att göra en komplett hjärntransplantation - dvs att flytta hårddiskarna till ett nytt system. Använder du RAID kan detta vara oerhört svårt att göra rätt. Gör en säkerhetskopia och var beredd att installera om systemet på nytt och läsa in din backup i det "nya systemet". Säklrast är såklart att lägga undan originaldiskarna och köpa in nya som ni läser över innehållet till manuellt i lugn och ro.

Skaffa en separat lokal lagringsserver eller diskkabinett. Schemalägg säkerhetskopiering till er moln-lagringstjänst hos oss tex varje natt.

 - Ska ni ändå stänga ned server och utföra diagnoser - kontrollera RAM-minnena, inte sällan tar de stryk efter lång trogen tjänst och det kan finnas "dåliga sektorer" som orsakar problem men bara upptäcks vid en total diagnosticering. Ett sådan test kan ta många timmar att köra, så låt det stå under natten. Byte av RAM-minnen innebär alltid ett avbrott eftersom servern måste vara avstängd när kort byts ut.

 - Antistatarmaband. Stäng alltid av en server som du ska öppna och utföra service på. När servern stängt ned, kontrollerat, så kopplar du bort strömsladdar och andra sladdar. Därfefter stänger du av nätdelarna. Spänning lagras i serverns nätdelar, var försiktig. Anslut antistatarbandet och koppla ihop dig med servern. Först nu kan du, varsamt öppna serverns chassie. Undvik att ta i några komponenter, hantera dem så lite som möjligt och var mycket försiktig. Utan att du märker det kan du ha råkat föra över statisk elektricitet som skadar eller förkortar livslängden på de känsliga datorkomponenterna.

 - Kommer det rök ur en server, något som är mycket ovanligt men som nästan alltid beror på att en komponent i en nätdel håller på att gå sönder; bryt strömmen eller koppla loss den komponenten. Vädra. Det är oerhört ovanligt att en modern dator eller server faktiskt brinner, det som kan hända och som tar många, många år att drabbas av, är just att en nätdel blir utsliten. De är dock så bra flamskyddade så det är i princip aldrig någon risk att det ska uppstå en brand men det som händer om du ser rök, hör konstiga ljud och känner lukten av bränd datorkomponent är att du bryter strömmen för att undvika att störningar i strömmen ska skada andra komponenter. Tänk på att röken sannolikt är ohälsosam att andas in. Flamskyddsmedel är giftigt. Ventillera ordentligt innan du kommer tillbaks och byter ut den trasiga nätdelen. Markera den direkt med "ELBRAND" eller liknande så att ingen tror att den går att använda i något sammanhang - trasiga komponenter ska lämnas till återvinning.

 - Ska ni utföra en "hjärt och lungräddning", dvs flytta en eller flera komponenter från ett defekt system till en ny server så kan det vara en god idé att koppla bort hårddiskarna först och lägga dem åt sidan på en säker plats. Testa att starta det nya systemet med en annan disk först och se att allt fungerar som det ska. Nu kan du välja på att kopiera över filerna till den nya disken eller att starta det nya systemet med den gamla disken.

Ett Linux-system klarar i regel alltid att starta även om all grundläggande hårdvara som CPU, RAM, moderkort mm har bytts ut - använder du "vanilla"-kärnan, dvs en 'standard'-linuxkärna så har du drivrutiner som tex klarar att köra en ny Intel Xeon processor även om du tidigare kört på en gammal modell. Det är ändå en god idé att optimera ditt system för just den hårdvara du använder. Har ni flera system med snarlik eller identisk hårdvara är detta inget problem.

Ett Windows-system däremot kan drabbas av alla möjliga problem när du börjar byta ut hårdvara, drivrutiner kan innebära riktigt allvarliga problem men de mest svårlösta problemen har med Microsofts licensieringsmodell att göra. Har du ett annat nätverkskort i din nya server än vad den gamla hade så kan du inte använda systemet utan att uppgradera drivrutinerna - något som ofta ställer till problem i en windows server - MEN om du dessutom har ett nytt moderkort, annan CPU eller något annat som "triggar" Microsofts licens-funktion så kommer du att behöva aktivera licensen på nytt först av allt - något som kräver nätanslutning.

Har du inga drivrutiner så KAN du inte aktivera licensen på nytt. Kan du inte aktivera licensen så kan du inte logga in in servern. Ibland kan de här problemen bli så allvarliga att inget annat än en ominstallation är aktuellt, något som innebär extra nedtid och att du behöver lägga dina hårddiskar med det gamla datat på åt sidan och sätta in en ny uppsättning diskar och därefter återkopiera filerna från de gamla diskarna - något som tar ännu mer tid.

Vill du slippa hamna i den här typen av tidskrävande och kostsamma problem kan du välja att antingen använda en annan plattform än Microsoft eller att alltid ha minst två identiska system så att du kan plocka delar från den ena till den andra.

Annonsplatser:
co-location