XHTML.net

Technology talks by Loïc d’Anterroches

News, articles, PHP, scripts, XHTML/CSS, …

  1. Home
  2. News

Système supportant le crash d'un centre de données

The 2008-02-07 at 22:54 by Loïc d'Anterroches filed under News.

Vous avez compris, je joue avec puppet.

Pour Céondo, je fais de l’hébergement de services web. Il faut que ces services tournent tranquillement 24h/24 et 7j/7 toute l’année. Jusque là tout va bien, c’est normal. Maintenant, que se passe t’il si votre centre de données (datacenter, le lieu où sont vos serveurs) crâme ? Vous savez, la foudre au mauvais endroit au mauvais moment, un problème hardware ou une erreur humaine.

Pour pouvoir assurer la qualité de service, il faut donc avoir une infrastructure qui repose sur au moins 2 centres.

Voici donc l’architecture que je suis en train de mettre en place.

  • 2 centres avec dans chacun des centres la quantité suffisante de serveurs pour assurer la totalité du service si l’un des centres tombe (maximum 50% de charge), ce sont les centres app.
  • 2 serveurs dns dans 2 autres centres que les centres app.
  • 1 serveur de contrôle (puppetmaster) dans un autre centre que les centres app.
  • 2 serveurs de backup dans 2 centres distincts des centres app.

Le but est de fonctionner ainsi :

  • Les données entre les 2 centres app sont synchronisées, c’est à dire que un centre est le backup chaud de l’autre.
  • Les 2 serveurs de backup permettent de faire du backup mort avec une conservation des données sur les 15 derniers jours. En gros, les 15 derniers dumps quotidiens des bases de données et une copie du dépôt git qui permet de garder l’évolution des fichiers.
  • Le serveur de contrôle permet de contrôler la mise à jour des serveurs en utilisant puppet.
  • Les serveurs dns permettent de faire un transfert d’un centre à un autre en cas de plantage.

Pour le moment, j’ai un serveur applicatif, 2 serveurs de backup et un serveur de contrôle. Je suis en train de monter un deuxième serveur applicatif dans un autre centre de données et je dois passer le serveur actuel sous contrôle du puppetmaster. Cela représente un investissement assez important mais une fois bien mis en place et testé régulièrement, cela devrait me permettre de dormir tranquillement la nuit, en sachant que si cela plante grave, mon téléphone sonne et je peux en un clique passer sur le backup ou simplement attendre un peu.

Comments from readers

loïc m. said:

et tu comptes utilisés quels services pour tout ça ?
quel(s) prestataire(s) ?

Loïc said:

J'ai accumulé des serveurs au fil des années, il faudrait que je fasse une nouvelle évaluation de la qualité/service etc. Mais pour le moment voici ce que j'ai :

* Backup "mort" *
- Strongspace 50Go (www.strongspace.com), le service n'est plus proposé, mais j'ai un compte "à vie".
- Dedibox (www.dedibox.fr)

* Serveurs d'application *
- OVH (www.ovh.com)
- Hetzner (www.hetzner.de)

* Serveur puppet master *
- Zone solaris (www.joyent.com/accelerator)

* DNS *
Pas encore mis en place, je pense utiliser la dedibox pour le dns secondaire pour le primaire un des serveurs d'application. Où les deux sur les serveurs d'application avec un dans chaque centre de données.

Voice your ideas

It is painless and I try not to kill electrons in the process.


Your email is required but will not be shared nor displayed.


Do you think your comment will force me to write even better stuff next time? If so, you simply rock.


Logo of Plume CMS