Mostrar el registro sencillo del ítem

dc.contributor.authorGuzmán-Ponce, Angélica
dc.contributor.authorFerri Ramírez, Cèsar
dc.contributor.authorSánchez Garreta, Josep Salvador
dc.contributor.authorMarcial-Romero, J. Raymundo
dc.date.accessioned2024-05-10T10:41:40Z
dc.date.available2024-05-10T10:41:40Z
dc.date.issued2022-10-10
dc.identifier.citationGUZMÁN PONCE, Angélica et al. Comportamiento de algoritmos de sobre-muestreo en Big Data. Ideas en Ciencias de la Ingeniería, [S.l.], v. 1, n. 2, p. 53-69, oct. 2022. ISSN 2992-7447. Disponible en: <https://ideasencienciasingenieria.uaemex.mx/article/view/19810>.ca_CA
dc.identifier.issn2992-7447
dc.identifier.urihttp://hdl.handle.net/10234/207280
dc.description.abstractEl desbalance de clases es una de las complejidades de los datos ampliamente estudiada en el campo de la ciencia de datos. A menudo dificulta el proceso de extracción de conocimiento, sesgando el aprendizaje hacia instancias de clase mayoritaria. La creciente generación de datos que estamos viviendo agrava el escenario anterior. Los desafíos en Big Data implica la necesidad de adaptar o crear nuevas técnicas para las restricciones de escalabilidad, dando lugar al desarrollo de técnicas que solventen el desbalance de clases en grandes volúmenes de datos, siendo la mayoría de estas basadas en el algoritmo SMOTE, en razón de tener un mejor desempeño en conjuntos “pequeños”. En este trabajo realizamos un análisis del comportamiento de los métodos de sobre-muestreo en Big Data, a través de medidas de complejidad que permiten conocer las características de los conjuntos de datos procesados. Los resultados obtenidos corroboran que el problema de desbalance de clases en Big Data no es el único problema que debe abordarse; por otro lado, el comportamiento de SMOTE en Big Data no es comparable al logrado en conjuntos de datos pequeños, debido a la presencia de redundancia por parte del proceso de interpolación.ca_CA
dc.format.extent17 p.ca_CA
dc.format.mimetypeapplication/pdfca_CA
dc.language.isospaca_CA
dc.publisherUniversidad Autónoma del Estado de Méxicoca_CA
dc.relation.isPartOfIdeas en Ciencias de la Ingeniería, [S.l.], v. 1, n. 2, oct. 2022. ISSN 2992-7447.ca_CA
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/ca_CA
dc.subjectBid dataca_CA
dc.subjectalgoritmosca_CA
dc.titleComportamiento de algoritmos de sobre-muestreo en Big Dataca_CA
dc.typeinfo:eu-repo/semantics/articleca_CA
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessca_CA
dc.relation.publisherVersionhttps://ideasencienciasingenieria.uaemex.mx/article/view/19810ca_CA
dc.type.versioninfo:eu-repo/semantics/publishedVersionca_CA
project.funder.nameUnión Europea-NextGenerationEUca_CA
oaire.awardNumberMGS/2021/23(UP2021-021ca_CA


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

  • LSI_Articles [362]
    Articles de publicacions periòdiques escrits per professors del Departament de Llenguatges i Sistemes Informàtics

Mostrar el registro sencillo del ítem

http://creativecommons.org/licenses/by-nc-nd/4.0/
Excepto si se señala otra cosa, la licencia del ítem se describe como: http://creativecommons.org/licenses/by-nc-nd/4.0/