Evaluation and Tuning of the Level 3 CUBLAS for Graphics Processors
View/ Open
Impact
Scholar |
Other documents of the author: Barrachina Mir, Sergio; Castillo Catalán, María Isabel; Igual, Francisco; Mayo, Rafael; Quintana-Orti, Enrique S.
Metadata
Show full item recordcomunitat-uji-handle:10234/9
comunitat-uji-handle2:10234/7036
comunitat-uji-handle3:10234/27725
comunitat-uji-handle4:
INVESTIGACIONMetadata
Title
Evaluation and Tuning of the Level 3 CUBLAS for Graphics ProcessorsAuthor (s)
Date
2008-01Publisher
Departament d' Enginyeria i Ciència dels Computadors, Universitat Jaume IType
info:eu-repo/semantics/reportSubject
Abstract
The increase in performance of the last generations of graphics processors (GPUs) has made this class of platform a
coprocessing tool with remarkable success in certain types of operations. In this paper we evaluate ... [+]
The increase in performance of the last generations of graphics processors (GPUs) has made this class of platform a
coprocessing tool with remarkable success in certain types of operations. In this paper we evaluate the performance of the
Level 3 operations in CUBLAS, the implementation of BLAS for NVIDIA(R) GPUs with unified architecture. From this
study, we gain insights on the quality of the kernels in the library and we propose several alternative implementations that are
competitive with those in CUBLAS. Experimental results on a GeForce 8800 Ultra compare the performance of CUBLAS
and the new variants [-]
El incremento en las prestaciones de las últimas generaciones de procesadores gráficos (GPUs), ha convertido a este tipo
de plataformas en herramientas de coprocesamiento con notable éxito frente a cierto tipo de ... [+]
El incremento en las prestaciones de las últimas generaciones de procesadores gráficos (GPUs), ha convertido a este tipo
de plataformas en herramientas de coprocesamiento con notable éxito frente a cierto tipo de aplicaciones.
En el presente artículo, se evalua el rendimiento de las operaciones de Nivel 3 de CUBLAS, la implementación de BLAS
desarrollada por NVIDIA(R) para sus procesadores gráficos con arquitectura unificada.
A partir del estudio, se extraen conclusiones acerca de la calidad de las implementaciones de la biblioteca, y se proponen
implementaciones alternativas que mejoran el rendimiento de las implementaciones originales. Los resultados experimentales
sobre una GeForce 8800 Ultra comparaen el rendimiento de CUBLAS y las nuevas variantes propuestas [-]
Rights
http://rightsstatements.org/vocab/CNE/1.0/
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
This item appears in the folowing collection(s)
- ICC_Reports [18]