DVFS-Technique for Dense Linear Algebra Operations on Multi-Core Processors
Ver/ Abrir
Impacto
Scholar |
Otros documentos de la autoría: Alonso-Jordá, Pedro; Dolz, Manuel F.; Mayo, Rafael; Quintana-Orti, Enrique S.
Metadatos
Mostrar el registro completo del ítemcomunitat-uji-handle:10234/9
comunitat-uji-handle2:10234/7036
comunitat-uji-handle3:10234/27725
comunitat-uji-handle4:
INVESTIGACIONMetadatos
Título
DVFS-Technique for Dense Linear Algebra Operations on Multi-Core ProcessorsFecha de publicación
2011-05Editor
Departament d' Enginyeria i Ciència dels Computadors, Universitat Jaume ITipo de documento
info:eu-repo/semantics/reportPalabras clave / Materias
Resumen
This paper addresses the efficient explotation of task-level parallelism, present in
many dense linear algebra operations, from the point of view of both computational
performance and energy consumption. In particular, ... [+]
This paper addresses the efficient explotation of task-level parallelism, present in
many dense linear algebra operations, from the point of view of both computational
performance and energy consumption. In particular, we consider a procedure, the Slack
Reduction Algorithm (SRA), to optimize the execution frequency of a collection of
tasks (in which many dense linear algebra algorithms can be decomposed) on multicore
architectures. The results from this procedure are modulated by an energy-aware
simulator, which is in charge of scheduling/mapping the execution of these tasks to
the cores, leveraging dynamic frequency voltage scaling featured by current technology.
Simultaneously, the simulator evaluates the performance benefits of the solution.
Experiments with these tools show significant energy gains for two key dense linear
algebra operations: the Cholesky and QR factorizations [-]
En este trabajo se aborda la explotación eficiente del paralelismo a nivel de tareas,
presente en muchas de las operaciones de álgebra lineal densa desde el punto de vista
del rendimiento y el consumo de energía. ... [+]
En este trabajo se aborda la explotación eficiente del paralelismo a nivel de tareas,
presente en muchas de las operaciones de álgebra lineal densa desde el punto de vista
del rendimiento y el consumo de energía. En particular, se presenta el Algoritmo de Reducción
de Holguras, para optimizar la frecuencia de ejecución de un conjunto de tareas
(en la que muchos algoritmos de álgebra lineal densa pueden ser descompuestas) en las
arquitecturas multinúcleo. Los resultados de este procedimiento son procesados por un
simulador de consciente del consumo, encargado de la planificación/asignación a ejecución de estas tareas en los núcleos, aprovechando la escalada dinámica del voltaje y la
frecuencia presente en los procesadores actuales. Al mismo tiempo, el simulador evalúa
las ventajas de rendimiento del algoritmo presentado. Los experimentos con estas herramientas
muestran significativos ahorros de energía para dos importantes operaciones
de álgebra lineal densa: la factorización de Cholesky y QR. [-]
Derechos de acceso
http://rightsstatements.org/vocab/CNE/1.0/
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
Aparece en las colecciones
- ICC_Reports [18]