Reducing Power Consumption of the LU Factorization with Partial Pivoting on Multi-Core Processors
View/ Open
Impact
Scholar |
Other documents of the author: Alonso-Jordá, Pedro; Dolz, Manuel F.; Mayo, Rafael; Quintana-Orti, Enrique S.
Metadata
Show full item recordcomunitat-uji-handle:10234/9
comunitat-uji-handle2:10234/7036
comunitat-uji-handle3:10234/27725
comunitat-uji-handle4:
INVESTIGACIONMetadata
Title
Reducing Power Consumption of the LU Factorization with Partial Pivoting on Multi-Core ProcessorsDate
2011-07Publisher
Departament d' Enginyeria i Ciència dels Computadors, Universitat Jaume IType
info:eu-repo/semantics/reportSubject
Abstract
In this paper we analyze the trade-off between energy and performance for a data-
parallel execution of the LU factorization with partial pivoting on a multi-core proces-
sor. To improve power efficiency, we adapt ... [+]
In this paper we analyze the trade-off between energy and performance for a data-
parallel execution of the LU factorization with partial pivoting on a multi-core proces-
sor. To improve power efficiency, we adapt the runtime in charge of controlling the
concurrent execution of the algorithm so as to leverage DVFS by activating/blocking
idle threads. For a CPU-bounded operation like the LU factorization, experiments on
an AMD 8-core processor report an average reduction around 5% in energy consump-
tion in exchange for a minor, in some cases negligible, increase in the execution time. [-]
En este trabajo se analiza el compromiso entre el consumo de energía y el rendimiento de la ejecución paralela del algoritmo que implementa la factorización LU con pivotamiento parcial en procesadores multinúcleo. ... [+]
En este trabajo se analiza el compromiso entre el consumo de energía y el rendimiento de la ejecución paralela del algoritmo que implementa la factorización LU con pivotamiento parcial en procesadores multinúcleo. Para mejorar la eficiencia energética, se ha adaptado el runtime encargado de controlar la ejecución concurrente del algoritmo
con el fin de aprovechar la técnica DVFS a través de la activación y el bloqueo de los hilos que se encuentran en estado ocioso. Para un algoritmo limitado por CPU tal como la factorización LU, los experimentos con un procesador AMD de 8 núcleos proporcionan una reducción promedio de alrededor del 5% en el consumo de energía a cambio de un menor, en algunos casos insignificante, aumento del tiempo de ejecución. [-]
Rights
http://rightsstatements.org/vocab/CNE/1.0/
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
This item appears in the folowing collection(s)
- ICC_Reports [18]