Adabag 2.0: una libreria de R para adaboost.m1 y bagging
Esteban Alfaro Cortés, Matías Gámez Martínez y Noelia García Rubio
Universidad de Castilla-La Mancha
Boosting y Bagging son dos de los métodos de combinación de
clasificadores más utilizados. El objetivo es conseguir mejorar la
precisión del clasificador mediante la combinación de clasificadores
individuales con una precisión baja. De la familia de algoritmos
boosting, Adaboost es el más conocido aunque sólo se puede utilizar
en problemas dicotómicos. Adaboost.M1 es una extensión sencilla y
natural al caso general de dos o más clases. La librería adabag 2.0
de R implementa los algoritmos Adaboost.M1 y Bagging utilizando
árboles de clasificación (CART) como clasificadores individuales.
Una vez que estos clasificadores han sido entrenados se pueden
utilizar para predecir la clase de observaciones nuevas. Como
elementos de validación, la librería permite estimar la precisión
de estos clasificadores en un conjunto mediante validación cruzada;
el cálculo del margen con que se asigna la clase para las
observaciones, y también proporciona una medida de la importancia de
cada una de las variables utilizadas. Por último, se utilizan varios
ejemplos habituales de la literatura de clasificación para ilustrar
el uso de esta librería.
Palabras clave: Adaboost.M1, Bagging, R, árboles de clasificación,
clasificación
organizacion@usar.org.es