Gestión eléctrica de sala de redes de servidores de internet

Equipos de alta tecnología electrónica y de la informática e Internet. Un mejor uso de la electricidad, ayuda con el trabajo y las especificaciones, la selección del equipo. Presentaciones accesorios y planes. Las olas y la contaminación electromagnética.
Christophe
modérateur
modérateur
Publicaciones: 79126
Inscripción: 10/02/03, 14:06
Localización: planeta Serre
x 10974

Gestión eléctrica de sala de redes de servidores de internet




por Christophe » 12/05/07, 13:09

Hace dos días, uno de los hosts con los que tengo un servidor experimentó una falla eléctrica.

Aquí os dejo el informe final: es interesante porque explica (a grandes rasgos) cómo se gestiona energéticamente una sala de red y cuáles son los problemas de alimentación que pueden surgir en caso de incidencia. También muestra que un accidente es a menudo una sucesión de incidentes menores y que un simple cheque faltante (en este caso, la liberación mundial automática) puede conducir a una "catástrofe".

Querido cliente,

Después de más de las 20 p.m. de la guerra, finalmente podemos darle algunas explicaciones sobre el incidente técnico principal que encontramos entre el 10 de mayo a las 17 p.m. y el 11 de mayo a las 15:30 p.m. (hora en que todos los servicios están 100% operativos) ).
Este es un incidente excepcional en su naturaleza, así como en sus consecuencias ...

El resumen :

Alrededor de las 16:15 p.m. de ayer, el suministro de energía del EDF (GEG) al edificio se había disparado al nivel de la celda ubicada fuera del edificio. No lo sabemos (y GEG no conoce las razones específicas por las que se cortó la energía).

En tal situación, el suministro de energía a los servidores no debe cortarse ya que el edificio está asegurado por 3 grandes inversores, así como un generador diesel de 400kva. El sistema funciona normalmente bien ya que ya experimentamos un corte de EDF hace una semana y eso no tuvo ningún impacto.

No sucedió de esa manera ayer como se podía ver.

El personal de Cogent (grupo internacional que opera este centro de datos) intervino al comienzo de la semana para llevar a cabo tareas de mantenimiento y pruebas en el generador diesel. Obviamente, las personas que intervinieron no han regresado al grupo en modo de inicio automático, por lo que comienza tan pronto como detecta que no hay más corriente EDF.

El resultado fue final: el grupo no comenzó, los inversores se vaciaron por completo y los servidores dejaron de funcionar.

Además, el sitio normalmente es monitoreado desde varios nocs ubicados en París, Nueva York y desde España para que Cogent pueda detectar este tipo de problema muy rápidamente y puedan intervenir. Esta vez no funcionó ya que hubo un incidente en el sistema de monitoreo durante unos días. (que debe resolverse hoy o mañana).

PHPNET estuvo presente en el sitio menos de 10 minutos después del corte de energía eléctrica de los servidores para iniciar el generador manualmente para restaurar la energía y, por otro lado, reiniciar todos los servidores.
Como un problema nunca sucede solo ... Cuando GEG restableció la alimentación de la red eléctrica, el sistema de conmutación automática intentó volver a conectarse y aquí es donde conocimos
segundo apagón ...

De hecho, el procedimiento de conmutación normal es: edf => inversores => grupo electrógeno, a la inversa, para volver a cambiar a edf, el circuito es grupo electrogénico => inversores => edf.
Los inversores no tuvieron tiempo de recargar lo suficiente, la fuente de alimentación se cortó nuevamente para los servidores.

Para colmo, la fuente de alimentación EDF nuevamente se disparó unos minutos después del cambio porque el consumo eléctrico del sitio era demasiado alto. Las unidades de aire acondicionado y los servidores que consumen de dos a tres veces más electricidad al inicio, el consumo excedió la configuración presente fuera del edificio, causando un nuevo corte en los servidores.

Por lo tanto, tuvimos que apagar los sistemas de aire acondicionado y reiniciar cada parte del edificio dentro de un cierto límite de tiempo, para no causar el interruptor de circuito.

Estos numerosos cortes de energía causaron la pérdida de muchos discos duros en los servidores y (sobre todo) la pérdida de varios sistemas de archivos. Sin embargo, anoche cambiamos exitosamente a nuestro sistema de respaldo por algunas horas.

El servidor de correo 1 (cluster1) tuvo que ser restaurado en nuestra última copia de seguridad ya que sus datos no eran recuperables. La situación está arreglada ahora.

Hoy, la responsabilidad de este incidente debe transferirse a Cogent, quien debería haberse asegurado de que el grupo estuviera en modo de inicio automático y, sobre todo, para monitorear correctamente
el centro de datos para intervenir antes de que los inversores estén vacíos.

Iniciaremos las negociaciones necesarias para obtener una compensación financiera que se reflejará en su suscripción PHPNET hasta el corte que haya sufrido.

Se están estudiando varias soluciones relacionadas con el desarrollo de un centro de datos en el lado de PHPNET porque ya no queremos depender de la buena voluntad de proveedores como Cogent o Redbus.
Le mantendremos informado sobre este proyecto que debe completarse dentro de los próximos 12 meses.

Todo el equipo de PHPNET se une a mí para agradecerle su comprensión y disculparse por las molestias que esto pueda haberle causado.

Que tengan un buen fin de semana
----
phpnet
123 ter Curso de liberación
38100 GRENOBLE
0 x
Avatar de l'utilisateur
nonoLeRobot
maestro Kyot'Home
maestro Kyot'Home
Publicaciones: 790
Inscripción: 19/01/05, 23:55
Localización: Beaune 21 / París
x 13




por nonoLeRobot » 12/05/07, 14:10

No solemos hablar de eso, pero el consumo de centros de datos es un problema real. (Aquí aparentemente alrededor de 400 kW considerando el generador).

IBM está lanzando un proyecto importante para reducir o, en cualquier caso, no aumentar a pesar de un aumento en el consumo de energía:

http://www.presence-pc.com/actualite/IBM-Green-project-23275/
0 x
Colmant
Entiendo econológico
Entiendo econológico
Publicaciones: 101
Inscripción: 05/09/06, 10:40
Localización: Vaucluse




por Colmant » 12/05/07, 14:11

en realidad "ca" gritó mientras escribía mensajes y al mismo tiempo tuve una falla en la batería de mi mouse inalámbrico

fue durante o justo después del despido de jérome -dominique 234, pensé que desde la parte superior de su coeficiente intelectual había logrado virosear el sistema ...
Me tranquiliza ver mis capacidades informáticas limitadas.
a+
0 x
Christophe
modérateur
modérateur
Publicaciones: 79126
Inscripción: 10/02/03, 14:06
Localización: planeta Serre
x 10974




por Christophe » 12/05/07, 14:56

No Colmant, este incidente concierne al servidor que aloja el blog: www.econologie.info y no el sitio y qué forum :)

Por lo tanto, todos sus comentarios son pura coincidencia (excepto que el servidor .com está comenzando a saturarse en gran medida ... se están llevando a cabo investigaciones para resolver el problema de saturación)
0 x
Avatar de l'utilisateur
Citro
experto Econologue
experto Econologue
Publicaciones: 5129
Inscripción: 08/03/06, 13:26
Localización: Burdeos
x 11




por Citro » 13/05/07, 16:37

Es cierto que a veces, tengo la impresión de que el .com está remando duro ... pero a medida que mi velocidad de adsl fluctúa a veces de 300 kb / s a ​​3000 kb / s, puse esto en la parte posterior de mi ISP ... hasta 'de lo que aprendo (tengo mis fuentes :? ) que el servidor está saturando. :?
0 x

 


  • temas similares
    Respuestas
    vistas
    último mensaje

Volver a "La electricidad, la electrónica y la alta tecnología, Internet, bricolaje, iluminación, materiales, y el nuevo"

¿Quién está en línea?

Usuarios navegando por este forum : No hay usuarios registrados e invitados 128