¿Qué es el algoritmo de bosque aleatorio?
En el aprendizaje automático, un bosque aleatorio es un clasificador que contiene múltiples árboles de decisión. La categoría de su salida está determinada por el patrón de la salida de categoría de cada árbol. Leo Breiman y Adele Cutler desarrollaron un algoritmo para inferir bosques aleatorios. ?
"Random Forest" es su marca registrada. El término proviene de bosques de decisión aleatoria propuestos por Tin Kam Ho de Bell Laboratories en 1995. Este método combina la idea de "agregación guiada" de Breimans y el "método del subespacio aleatorio" de Ho para construir un conjunto de árboles de decisión.
El algoritmo de bosque aleatorio construye cada árbol de acuerdo con el siguiente algoritmo:
n representa el número de casos de entrenamiento (muestras) y m representa el número de características.
Ingrese el número de características m, que se utiliza para determinar el resultado de la decisión de un nodo en el árbol de decisión, debe ser mucho menor que m.
Extraiga n veces de n casos de entrenamiento (muestras) con muestras de reemplazo para formar un conjunto de entrenamiento (muestreo de arranque), use casos de uso no extraídos (muestras) para hacer predicciones y evaluar sus errores.
Para cada nodo, se seleccionan aleatoriamente m características y la decisión de cada nodo en el árbol de decisión se determina en función de estas características. En función de estas m características, se calcula el método de división óptimo.
Cada árbol crecerá completamente sin poda, lo que se puede adoptar después de construir un clasificador de árboles normal.