Evaluation and Tuning of the Level 3 CUBLAS for Graphics Processors
Ver/ Abrir
Impacto
Scholar |
Otros documentos de la autoría: Barrachina Mir, Sergio; Castillo Catalán, María Isabel; Igual, Francisco D.; Mayo, Rafael; Quintana-Orti, Enrique S.
Metadatos
Mostrar el registro completo del ítemcomunitat-uji-handle:10234/9
comunitat-uji-handle2:10234/7036
comunitat-uji-handle3:10234/27725
comunitat-uji-handle4:
INVESTIGACIONMetadatos
Título
Evaluation and Tuning of the Level 3 CUBLAS for Graphics ProcessorsAutoría
Fecha de publicación
2008-01Editor
Departament d' Enginyeria i Ciència dels Computadors, Universitat Jaume ITipo de documento
info:eu-repo/semantics/reportPalabras clave / Materias
Resumen
The increase in performance of the last generations of graphics processors (GPUs) has made this class of platform a
coprocessing tool with remarkable success in certain types of operations. In this paper we evaluate ... [+]
The increase in performance of the last generations of graphics processors (GPUs) has made this class of platform a
coprocessing tool with remarkable success in certain types of operations. In this paper we evaluate the performance of the
Level 3 operations in CUBLAS, the implementation of BLAS for NVIDIA(R) GPUs with unified architecture. From this
study, we gain insights on the quality of the kernels in the library and we propose several alternative implementations that are
competitive with those in CUBLAS. Experimental results on a GeForce 8800 Ultra compare the performance of CUBLAS
and the new variants [-]
El incremento en las prestaciones de las últimas generaciones de procesadores gráficos (GPUs), ha convertido a este tipo
de plataformas en herramientas de coprocesamiento con notable éxito frente a cierto tipo de ... [+]
El incremento en las prestaciones de las últimas generaciones de procesadores gráficos (GPUs), ha convertido a este tipo
de plataformas en herramientas de coprocesamiento con notable éxito frente a cierto tipo de aplicaciones.
En el presente artículo, se evalua el rendimiento de las operaciones de Nivel 3 de CUBLAS, la implementación de BLAS
desarrollada por NVIDIA(R) para sus procesadores gráficos con arquitectura unificada.
A partir del estudio, se extraen conclusiones acerca de la calidad de las implementaciones de la biblioteca, y se proponen
implementaciones alternativas que mejoran el rendimiento de las implementaciones originales. Los resultados experimentales
sobre una GeForce 8800 Ultra comparaen el rendimiento de CUBLAS y las nuevas variantes propuestas [-]
Derechos de acceso
http://rightsstatements.org/vocab/CNE/1.0/
info:eu-repo/semantics/openAccess
info:eu-repo/semantics/openAccess
Aparece en las colecciones
- ICC_Reports [18]