High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

Castelló, Adrián; Barrachina Mir, Sergio; Dolz, Manuel F.; Quintana-Orti, Enrique S.; San Juan, Pau; Tomás Domínguez, Andrés Enrique

Ver/Abrir

castello_2022_high.pdf (732.2Kb)

Impacto

Scholar | Otros documentos de la autoría: Castelló, Adrián; Barrachina Mir, Sergio; Dolz, Manuel F.; Quintana-Orti, Enrique S.; San Juan, Pau; Tomás Domínguez, Andrés Enrique

Mostrar METS | MarcXML

Exportar a

Metadatos

Mostrar el registro completo del ítem

Metadatos

Título

High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS

Autoría

Castelló, Adrián;

Barrachina Mir, Sergio;

Dolz, Manuel F.

;

Quintana-Orti, Enrique S.;

San Juan, Pau;

Tomás Domínguez, Andrés Enrique

Fecha de publicación

2022-03-22

Editor

Elsevier; North-Holland

URI

http://hdl.handle.net/10234/197784

DOI

https://doi.org/10.1016/j.sysarc.2022.102459

ISSN

1383-7621

Cita bibliográfica

Castelló, A., Barrachina, S., Dolz, M. F., Quintana-Ortí, E. S., San Juan, P., & Tomás, A. E. (2022). High performance and energy efficient inference for deep learning on multicore ARM processors using general optimization techniques and BLIS. Journal of Systems Architecture, 125, 102459.

Tipo de documento

info:eu-repo/semantics/article

Versión

info:eu-repo/semantics/publishedVersion

Palabras clave / Materias

convolutional neural network |

inference |

multicore low-power processors

Resumen

We evolve PyDTNN, a framework for distributed parallel training of Deep Neural Networks (DNNs), into an efficient inference tool for convolutional neural networks. Our optimization process on multicore ARM processors ... [+]

Publicado en

Journal of Systems Architecture. 125 (2022) 102459

Entidad financiadora

Ministerio de Ciencia, Innovación y Universidades (Spain) | Generalitat Valenciana

Código del proyecto o subvención

TIN2017-82972-R | Prometeo/2019/109 | FJC2019-039222-I | CDEIGENT/2018/014

Derechos de acceso

Aparece en las colecciones

ICC_Articles [419]

Repositori Universitat Jaume I