Reducing Power Consumption of the LU Factorization with Partial Pivoting on Multi-Core Processors
Visualitza/
Impacte
Scholar |
Altres documents de l'autoria: Alonso-Jordá, Pedro; Dolz, Manuel F.; Mayo, Rafael; Quintana-Orti, Enrique S.
Metadades
Mostra el registre complet de l'elementcomunitat-uji-handle:10234/9
comunitat-uji-handle2:10234/7036
comunitat-uji-handle3:10234/27725
comunitat-uji-handle4:
INVESTIGACIONMetadades
Títol
Reducing Power Consumption of the LU Factorization with Partial Pivoting on Multi-Core ProcessorsData de publicació
2011-07Editor
Departament d' Enginyeria i Ciència dels Computadors, Universitat Jaume ITipus de document
info:eu-repo/semantics/reportParaules clau / Matèries
Resum
In this paper we analyze the trade-off between energy and performance for a data-
parallel execution of the LU factorization with partial pivoting on a multi-core proces-
sor. To improve power efficiency, we adapt ... [+]
In this paper we analyze the trade-off between energy and performance for a data-
parallel execution of the LU factorization with partial pivoting on a multi-core proces-
sor. To improve power efficiency, we adapt the runtime in charge of controlling the
concurrent execution of the algorithm so as to leverage DVFS by activating/blocking
idle threads. For a CPU-bounded operation like the LU factorization, experiments on
an AMD 8-core processor report an average reduction around 5% in energy consump-
tion in exchange for a minor, in some cases negligible, increase in the execution time. [-]
En este trabajo se analiza el compromiso entre el consumo de energía y el rendimiento de la ejecución paralela del algoritmo que implementa la factorización LU con pivotamiento parcial en procesadores multinúcleo. ... [+]
En este trabajo se analiza el compromiso entre el consumo de energía y el rendimiento de la ejecución paralela del algoritmo que implementa la factorización LU con pivotamiento parcial en procesadores multinúcleo. Para mejorar la eficiencia energética, se ha adaptado el runtime encargado de controlar la ejecución concurrente del algoritmo
con el fin de aprovechar la técnica DVFS a través de la activación y el bloqueo de los hilos que se encuentran en estado ocioso. Para un algoritmo limitado por CPU tal como la factorización LU, los experimentos con un procesador AMD de 8 núcleos proporcionan una reducción promedio de alrededor del 5% en el consumo de energía a cambio de un menor, en algunos casos insignificante, aumento del tiempo de ejecución. [-]
Drets d'accés
http://rightsstatements.org/vocab/CNE/1.0/
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
Apareix a les col.leccions
- ICC_Reports [18]