Barcelona, ​​8 de febrero de 2023 – Científicos e ingenieros de HPCNow! han desarrollado una solución para monitorizar el estado de los clusters HPC en tiempo real. Este pack de monitorización incluye soluciones de código abierto como Grafana, Elasticsearch y Prometheus, para visualización y almacenamiento de datos, y plugins de Slurm, además de scripts personalizados para recopilar toda la información que necesita el administrador de sistemas. La solución se provee usando Docker Compose para escenarios de monitorización de un solo nodo, o usando Docker Swarm si el cliente solicita alta disponibilidad. Además, incluye los paneles necesarios para ver la información recopilada, algunos de ellos son:

  • Trabajos de Slurm: contabiliza todos los trabajos de Slurm de un intervalo de tiempo.
  • Detalles del trabajo: devuelve los detalles de cada trabajo (envío, fecha de inicio y finalización, CPUs utilizadas y su eficiencia, memoria utilizada y su eficiencia, script Slurm, etc.)
  • Contabilidad de Slurm: descripción general de la carga de trabajo de HPC.
  • Supervisión de la eficiencia del trabajo (CPU y memoria): recursos solicitados, utilizados y desperdiciados.

La solución de monitorización de HPCNow! es flexible. Se ofrece teniendo en cuenta las necesidades del cliente en cuanto a disponibilidad de equipos, variables a examinar y opciones de visualización.

Esta nueva tecnología es imprescindible para aquellas instituciones que se enfrentan a problemas de saturación de clusters, que desean maximizar su retorno de la inversión y/o mantener bajo control el presupuesto de cloud bursting. Además, esta solución ayuda al centro de HPC a trazar una línea para definir lo que es razonable con respecto al uso de recursos y concienciar a los usuarios sobre el uso adecuado del cluster si están reservando más recursos de los necesarios.

Si tienes alguna pregunta puedes contactarnos en info@hpcnow.com!

Más información: 

Improving efficiency in HPC clusters using monitoring tools

* Descargar la nota de prensa en pdf aquí

Oficinas centrales

Parc Tecnològic
Marie Curie, 8 08042 Barcelona
+34 931640488
info@hpcnow.com
Ver localización


Oficina NZ

Level 8
139 Quay Street
1010 - Auckland (New Zealand)
+64 (0) 22 344 2801
info@hpcnow.com

Contacto

Ponte en contacto con nosotros y te ayudaremos.


    Acepto los términos y condiciones