L’uso intensivo dei supercomputer per addestrare modelli complessi di IA comporta consumi energetici elevati, difficili da stimare nei moderni sistemi HPC in cui le risorse sono condivise. Il seminario presenta EfiMon, una libreria basata su eBPF che misura in modo non invasivo l’attività dei processi (istruzioni eseguite, uso di CPU e RAM) insieme ai dati energetici del sistema. Queste informazioni permettono di costruire modelli predittivi capaci di stimare il consumo energetico dei singoli processi anche senza isolamento. I risultati mostrano un’accuratezza elevata, con un errore massimo del 2,2% su macchine Intel e del 4,4% su sistemi AMD, evidenziando il potenziale di EfiMon per una gestione energetica più precisa ed efficiente nel supercalcolo.
(Per maggiori informazioni si prega di consultare la versione in inglese del sito)