Roland Kamphuis Rotating Header Image

Posts Tagged ‘storing’

falende optic in het netwerk

Sinds zaterdag bleek dat ieder uur het netwerk voor 1-3 seconde keer offline ging. De storing was zo klein dat het bijna niet te merken was. Door een klant van streaming werd ik op de hoogte gebracht (want hij zag ieder uur de luisteraars met de helft zakken). Met veel moeite heb ik kunnen vinden dat de problemen veroorzaakt werden door een defecte laser optic in de coreswitch. Een optic is een lasermodule in de switch waarop de glasvezel aangesloten kan worden. De laser is een aparte module zodat je zelf de juiste laser kan kopen voor de gewenste afstand van de glasvezel.

Gelukkig was ik net vrijdag in Amsterdam geweest om een nieuwe coreswitch op te hangen en de verbinding weer redundant uit te voeren. (dit was tijdelijk uitgeschakeld sinds het vorige onderhoud). Met de nieuwe redundant opstelling kon ik vandaag de defecte optic uitschakelen. Door de opstelling werd het verkeer automatisch om gerouteerd. Hieronder een netwerkschema van deze wijziging.

       

Ziggo zakelijk

Op kantoor maken we gebruik van internet van Ziggo Zakelijk. Alles leek bij aanvraag zeer professioneel te gaan. Ziggo stuurt keurig een monteur langs die een standaard modem en Juniper router ophangen.
Na 2 weken actief gebruik te maken van het internet kregen hadden we opeens last dat iedere middag tussen 12:00 en 15:00 internet plat ging (oktober 2010). De reden van de downtime was heel veel packetlos op de download link. Iedere keer dat het optrad belde ik keurig het storingsnummer van Ziggo. Iedere keer kreeg ik een tijdelijke oplossing om de modem en Juniper te resetten, waarna het probleem weg was voor soms enkele minuten tot de volgende middag.
Het duurde een week voordat Ziggo eindelijk verder ging kijken en een monteur langs stuurde om de coaxkabel te controleren, zonder resultaat. Pas na 3 weken deze problemen te hebben kwamen ze op het idee dat het wellicht bij de modem lag. Immers moesten we die ook iedere keer resetten. De dag erop stond er een monteur die de modem verving. Tijdens het vervangen bleef de Ziggo monteur naast de modem ook onze apparatuur herstarten. Wat zeer vervelend was omdat hij immers niet de toestemming hiervoor en bovendien niet luisterde toen ik de monteur verzocht niet aan onze apparatuur te zitten. Hij resetten namelijk de gateway en switch waardoor het interne bedrijfsnetwerk iedere keer plat ging. (lokale verbinding naar de servers ed).
Nadat de modem was vervangen werkte alles weer zonder problemen en heb ik ook een schadeclaim ingediend.

Na meer dan 3 maanden na het indienen van de klacht kreeg ik eindelijk bericht (februari 2010). Daarin verschuilt Ziggo achter de algemene voorwaarden omdat de storing per keer niet langer was dan 16 uur en dat ze ons niks verschuldigd zijn. Uit coulantie willen ze 1 maand gratis aanbieden. Wel vergeten ze te vermelden dat het totaal van de storingen wel de 16 uur hebben gepasseerd.
Vandaag kreeg ik eindelijk een creditnota van de gratis maand.

Sinds de modem is vervangen is de verbinding stabiel en hebben we sinds oktober 2010 geen storing meer gehad. Echter mag Ziggo in de toekomst zulke problemen sneller verhelpen ipv iedere keer zeggen om de modem/router te resetten. Ook mogen de klachten wel sneller afgehandeld worden.

Sidn en softwareontwikkeling

Vorige week is Sidn 15 jaar geworden en direct de dag na hun 15 jarig bestaan plannen ze onderhoud in. Als registrar weet je al van te voren dat dit uit de hand gaat lopen. En zo vorige week ook weer. Tijdens de storing van 1,5 dag was het niet mogelijk om domeinen te registreren, verhuizen of te bewerken.

Toch vind ik het knap dat sidn technisch probeert uit te leggen wat er fout is gegaan.

“Na het Onderhoudsvenster is er in verband met deze bug fix een herstelscript gestart. Dit herstelscript leidt nu tot problemen bij transacties die voorzien zijn van een timer (opheffen en verhuizen). Het script is inmiddels beëindigd, maar dit heeft het probleem met het verhuis- en opheffingsproces nog niet verholpen.”

Daar valt uit te begrijpen dat het herstelscript het systeem offline heeft gehaald. Dan vraag ik me toch af of SIDN ooit gehoord heeft van een test systeem. Waar je eerst rustig kan testen (met bijvoorbeeld dit herstelscript) voordat je de productieomgeving offline haalt.

Ook viel mij vandaag het volgende in de API documentatie van SIDN op. Ik heb het even vertaald naar begrijpbare taal:

API vraag: Staat nameserver ns1.eenwillekeurigdomein.nl in de drs?
Antwoord sidn: Ja, de nameservers is niet bekend in het systeem (true)

Ik heb het idee dat ze daar nooit gehoord hebben van een SOM of Quality-manager.