Mostrar el registro sencillo del ítem
Comportamiento de algoritmos de sobre-muestreo en Big Data
dc.contributor.author | Guzmán-Ponce, Angélica | |
dc.contributor.author | Ferri Ramírez, Cèsar | |
dc.contributor.author | Sánchez Garreta, Josep Salvador | |
dc.contributor.author | Marcial-Romero, J. Raymundo | |
dc.date.accessioned | 2024-05-10T10:41:40Z | |
dc.date.available | 2024-05-10T10:41:40Z | |
dc.date.issued | 2022-10-10 | |
dc.identifier.citation | GUZMÁN PONCE, Angélica et al. Comportamiento de algoritmos de sobre-muestreo en Big Data. Ideas en Ciencias de la Ingeniería, [S.l.], v. 1, n. 2, p. 53-69, oct. 2022. ISSN 2992-7447. Disponible en: <https://ideasencienciasingenieria.uaemex.mx/article/view/19810>. | ca_CA |
dc.identifier.issn | 2992-7447 | |
dc.identifier.uri | http://hdl.handle.net/10234/207280 | |
dc.description.abstract | El desbalance de clases es una de las complejidades de los datos ampliamente estudiada en el campo de la ciencia de datos. A menudo dificulta el proceso de extracción de conocimiento, sesgando el aprendizaje hacia instancias de clase mayoritaria. La creciente generación de datos que estamos viviendo agrava el escenario anterior. Los desafíos en Big Data implica la necesidad de adaptar o crear nuevas técnicas para las restricciones de escalabilidad, dando lugar al desarrollo de técnicas que solventen el desbalance de clases en grandes volúmenes de datos, siendo la mayoría de estas basadas en el algoritmo SMOTE, en razón de tener un mejor desempeño en conjuntos “pequeños”. En este trabajo realizamos un análisis del comportamiento de los métodos de sobre-muestreo en Big Data, a través de medidas de complejidad que permiten conocer las características de los conjuntos de datos procesados. Los resultados obtenidos corroboran que el problema de desbalance de clases en Big Data no es el único problema que debe abordarse; por otro lado, el comportamiento de SMOTE en Big Data no es comparable al logrado en conjuntos de datos pequeños, debido a la presencia de redundancia por parte del proceso de interpolación. | ca_CA |
dc.format.extent | 17 p. | ca_CA |
dc.format.mimetype | application/pdf | ca_CA |
dc.language.iso | spa | ca_CA |
dc.publisher | Universidad Autónoma del Estado de México | ca_CA |
dc.relation.isPartOf | Ideas en Ciencias de la Ingeniería, [S.l.], v. 1, n. 2, oct. 2022. ISSN 2992-7447. | ca_CA |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | ca_CA |
dc.subject | Bid data | ca_CA |
dc.subject | algoritmos | ca_CA |
dc.title | Comportamiento de algoritmos de sobre-muestreo en Big Data | ca_CA |
dc.type | info:eu-repo/semantics/article | ca_CA |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | ca_CA |
dc.relation.publisherVersion | https://ideasencienciasingenieria.uaemex.mx/article/view/19810 | ca_CA |
dc.type.version | info:eu-repo/semantics/publishedVersion | ca_CA |
project.funder.name | Unión Europea-NextGenerationEU | ca_CA |
oaire.awardNumber | MGS/2021/23(UP2021-021 | ca_CA |
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(ones)
-
LSI_Articles [362]
Articles de publicacions periòdiques escrits per professors del Departament de Llenguatges i Sistemes Informàtics