Show simple item record

dc.contributorUniversitat Jaume I. Departament d'Enginyeria i Ciència dels Computadors
dc.contributorUniversitat Jaume I. Escola de Doctorat
dc.contributor.authorFlegar, Goran
dc.date.accessioned2019-07-03T07:51:59Z
dc.date.accessioned2019-12-09T07:07:32Z
dc.date.available2019-07-03T07:51:59Z
dc.date.available2019-12-09T07:07:32Z
dc.date.issued2019-06-21
dc.identifier.urihttp://hdl.handle.net/10803/667096
dc.description.abstractWith the breakdown of Dennard scaling in the mid-2000s and the end of Moore's law on the horizon, the high performance computing community is turning its attention towards unconventional accelerator hardware to ensure the continued growth of computational capacity. This dissertation presents several contributions related to the iterative solution of sparse linear systems on the most widely used general purpose accelerator - the Graphics Processing Unit (GPU). Specifically, it accelerates the major building blocks of Krylov solvers, and describes their realization as part of a software library of reusable building blocks. The first part of the dissertation focuses on the sparse matrix-vector product and effective load balancing in the presence of irregular sparsity patterns. The second part describes the design of high-performance preconditioners. Finally, the third part demonstrates the potential of adaptive precision techniques for constructing preconditioners with lower memory footprint, and accuracy comparable to their full precision equivalents.
dc.description.abstractCon el final de la ley de Dennard y el cercano fin de la ley de Moore, la comunidad en computación de altas prestaciones se está centrando en tecnologías de aceleración no convencionales para asegurar el crecimiento exponencial de la capacidad de computación. Esta tesis contribuye a la solución iterativa de sistemas lineales dispersos en el acelerador más difundido: el procesador gráfico. Específicamente, el trabajo acelera los bloques fundamentales de los métodos de Krylov, y describe su implementación como parte de una biblioteca de bloques reutilizables. La primera parte del trabajo se centra en el producto matriz-vector disperso y el equilibrado de la carga ante patrones de dispersidad irregulares. La segunda parte describe el diseño de precondicionadores de alto rendimiento. Finalmente, la tercera parte demuestra el potencial de las técnicas de precisión adaptativa para construir precondicionadores con menor consumo de memoria, y fiabilidad comparable con las versiones de precisión completa.
dc.format.extent146 p.
dc.format.mimetypeapplication/pdf
dc.language.isoeng
dc.publisherUniversitat Jaume I
dc.sourceTDX (Tesis Doctorals en Xarxa)
dc.subjectHigh Performance Computing
dc.subjectGraphics Processing Units
dc.subjectAdaptive Precision
dc.subjectKrylov Methods
dc.subjectSparse Matrix-Vector Product
dc.subjectPreconditioning
dc.subject.otherTecnologies de la informació i les comunicacions (TIC)
dc.titleSparse Linear System Solvers on GPUs: Parallel Preconditioning, Workload Balancing, and Communication Reduction
dc.typeinfo:eu-repo/semantics/doctoralThesis
dc.typeinfo:eu-repo/semantics/publishedVersion
dc.identifier.doihttp://dx.doi.org/10.6035/14101.2019.709084
dc.subject.udc004
dc.contributor.directorQuintana Ortí, Enrique S.
dc.contributor.directorAnzt, Hartwig
dc.rights.licenseL'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/
dc.contributor.authoremailflegar@uji.es
dc.contributor.authoremailshowfalse
dc.rights.accessLevelinfo:eu-repo/semantics/openAccess
dc.embargo.termscap


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record