useR

Adabag 2.0: una libreria de R para adaboost.m1 y bagging


Esteban Alfaro Cortés, Matías Gámez Martínez y Noelia García Rubio
Universidad de Castilla-La Mancha


Boosting y Bagging son dos de los métodos de combinación de clasificadores más utilizados. El objetivo es conseguir mejorar la precisión del clasificador mediante la combinación de clasificadores individuales con una precisión baja. De la familia de algoritmos boosting, Adaboost es el más conocido aunque sólo se puede utilizar en problemas dicotómicos. Adaboost.M1 es una extensión sencilla y natural al caso general de dos o más clases. La librería adabag 2.0 de R implementa los algoritmos Adaboost.M1 y Bagging utilizando árboles de clasificación (CART) como clasificadores individuales. Una vez que estos clasificadores han sido entrenados se pueden utilizar para predecir la clase de observaciones nuevas. Como elementos de validación, la librería permite estimar la precisión de estos clasificadores en un conjunto mediante validación cruzada; el cálculo del margen con que se asigna la clase para las observaciones, y también proporciona una medida de la importancia de cada una de las variables utilizadas. Por último, se utilizan varios ejemplos habituales de la literatura de clasificación para ilustrar el uso de esta librería.

Palabras clave: Adaboost.M1, Bagging, R, árboles de clasificación, clasificación


organizacion@usar.org.es