Constellation Knowledge Network - Conocimiento de adivinación - Regla de Bayes

Regla de Bayes

Fórmula de probabilidad total: supongamos que el espacio muestral para probar E es S, A es el evento de E, B1, B2..., Bn es un divisor de S, P(BI)>0 (I = 1, 2,... , n) Entonces:

P(A)= P(A | b 1)P(b 1)+P(A | B2)PB2)+...+P(A|Bn) P (Bn)

Fórmula de prueba básica de probabilidad total: p (a) = p (as) = ​​​​p (ab1)+p (ab2)...+p(ABN)= p( a | b 1)p(b 1)+p(a | B2)p

s es el espacio muestral, B1, B2,..., Bn es la división de s.

Fórmula bayesiana: Supongamos que el espacio muestral para probar E es S, A es el evento de E, B1, B2..., Bn es un divisor de S, P(a)>0, P( Bi)>0(i=1, 2, 3,..., n) entonces:

La base de prueba molecular de la fórmula bayesiana (fórmula de probabilidad condicional): p(bi|a)= p ( bia)/p(bia)= p(a | bi)p(bi)

Prueba básica del denominador de la fórmula de Bayes (fórmula de probabilidad total)

Regla de Bayes Nombrada después del obispo Thomas Bayes.

Se utiliza para estimar algunas propiedades de la estadística.

Bayes utiliza la probabilidad para reflejar la certeza del estado del conocimiento. El conjunto de datos se puede observar directamente, por lo que no es aleatorio.

La inferencia bayesiana es muy diferente de otros métodos de inferencia estadística. Se basa en un juicio subjetivo, lo que significa que se puede estimar un valor sin evidencia objetiva y luego revisarlo constantemente en función de los resultados reales. La inferencia bayesiana requiere muchos cálculos.

/blog/2011/08/Bayesian_inference_part_one html

Es una probabilidad condicional. Por ejemplo, cuando sucede B, existe la posibilidad de que suceda A.

La fórmula es:

En la fórmula, la probabilidad del evento Bi es P(Bi), y la probabilidad del evento A cuando el evento Bi ha ocurrido es P(A│Bi ). El evento A ocurre. La probabilidad del evento Bi es P(Bi│A).

Se utiliza para calcular eventos complejos que ocurren bajo condiciones simples.

Como se mencionó anteriormente: cuando sucede B, existe la posibilidad de que suceda A. P(A|B)

A través del diagrama de Venn, podemos ver:

Cuando ocurre B, la probabilidad de que ocurra A: P(A|B)=P(A ∩ B)/P(B)

El proceso de derivación de la probabilidad condicional se puede obtener de la siguiente manera:

Combinación de ecuaciones:

Finalmente:

P(categoría|característica) = P(característica|categoría)P(categoría)/P(característica)

Probabilidad basada en análisis y experiencias pasadas. En los problemas de encontrar un efecto a partir de una causa, a menudo se piensa en la probabilidad de que ocurra la causa. También conocida como: probabilidad clásica

(Antes de observar los datos, representamos el conocimiento conocido como una distribución de probabilidad previa, pero en términos generales, elegiremos una distribución previa bastante amplia (alta entropía) para reflejar el alto grado. de incertidumbre en los parámetros que preceden a cualquier dato observado)

(Por lo general, las probabilidades anteriores comienzan con una distribución relativamente uniforme o una distribución gaussiana con alta entropía, y los datos observados generalmente reducen la entropía posterior).

En la fórmula bayesiana anterior, llamamos P(A) la probabilidad previa. (Juicio de la probabilidad del evento A antes de que ocurra el evento B)

P(A|B) se llama probabilidad posterior. (Reevaluar la probabilidad del evento A después de que ocurra el evento B)

P(B|A)/P(B) se llama función de posibilidad. Este es un factor de ajuste que acerca las probabilidades estimadas a las probabilidades reales.

En un sistema de comunicación, después de recibir un mensaje, la probabilidad de enviar el mensaje se llama probabilidad posterior.

Después de dar evidencia o datos relevantes, derivó la probabilidad condicional.

Se refiere a la probabilidad de que la información resultante sea modificada nuevamente. El cálculo de la probabilidad posterior debe basarse en la probabilidad previa.

Probabilidad posterior = probabilidad anterior * factor de ajuste

El factor de ajuste anterior también se denomina función de probabilidad.

Es una función de los parámetros del modelo estadístico.

Supongamos que se da una variable aleatoria X con una distribución de probabilidad discreta P sobre el parámetro Y, entonces la función de probabilidad sobre el parámetro Y es: L(y|x) es igual a la probabilidad de la variable X dado el parámetro Y:

L(y|x) = P(X=x|y) = Py(x)

Probabilidad: se utiliza para predecir cuándo se conocen ciertos parámetros. resultados de la siguiente observación.

Verosimilitud: Se utiliza para estimar parámetros relacionados con las propiedades de los alimentos cuando se conocen determinadas observaciones.

La función de verosimilitud puede entenderse como la inversa de la probabilidad condicional.

Materiales:

1: Probabilidad previa: calculada a partir de materiales existentes.

2. Probabilidad posterior: calculada utilizando probabilidad previa y materiales complementarios.

Cálculo:

1: Probabilidad previa: probabilidad clásica.

2. Probabilidad posterior: la fórmula bayesiana se utiliza para calcular la probabilidad lógica utilizando datos de muestra y también utiliza distribución de probabilidad y estadísticas matemáticas.

La solución a la probabilidad de eventos complejos se transforma en la suma de las probabilidades de eventos simples bajo diferentes circunstancias.

Se utiliza para calcular la probabilidad de eventos complejos.

Definición: Supongamos que {Bn:n=1, 2, 3,...} es una división finita o infinita del espacio de probabilidad (es decir, BN es un grupo de eventos completo) y cada conjunto Bn es un conjunto medible, entonces existe una fórmula de probabilidad total para cualquier momento a:

A través de la derivación de la probabilidad condicional, podemos ver: P(A∩B) = P(A|B)P( B) = P(B|A)P(A).

Incorpore la fórmula anterior.

La fórmula de probabilidad total transforma el problema de resolver la probabilidad del evento complejo A en el problema de suma de probabilidades simples Bn que ocurren bajo diferentes circunstancias o por diferentes razones.

Ahora tenemos el espacio muestral s, los eventos a, a' y b.

Diagrama de Venn:

Del diagrama anterior:

P(B) = P(B∩A) + P(B∩A ')

La fórmula en probabilidad condicional es la siguiente:

P(B∩A) = P(B|A)P(A)

Combinado con la fórmula anterior :

P(B) = P(B|A)P(A) + P(B|A')P(A ')

Explicación: Si A y A ' forma un espacio muestral, entonces la probabilidad del evento B es la suma de las probabilidades de A y A' multiplicada por las probabilidades condicionales B de estos dos eventos.

Otra forma de escribir la fórmula:

El algoritmo Naive Bayes supone que cada característica es independiente entre sí.

Supongamos que la tasa de incidencia de un cáncer concreto es del 1% de la población.

Si tienes este cáncer, los resultados de la prueba pueden ser positivos el 90% de las veces.

Pero usted no tiene cáncer y el resultado de la prueba sigue siendo positivo. Entonces, suponiendo que usted no tenga este cáncer en particular, hay un 90% de posibilidades de que su resultado sea negativo. A esto se le suele llamar especificidad.

P: Le hicieron la prueba sin ningún síntoma y la prueba resultó positiva, entonces, ¿qué probabilidad cree que tiene de tener este cáncer en particular?

La probabilidad de cáncer previo es del 1%, y la sensibilidad y especificidad son del 90%. ¿Cuál es la probabilidad de que alguien que da positivo en la prueba de cáncer desarrolle la enfermedad?

Es: 8% y 1/3

Supongamos que el evento A representa una enfermedad, P(A)=0,001, que es una probabilidad previa. (Nuestra tasa de ocurrencia esperada antes del experimento)

Suponiendo que el evento B es positivo, calcule P=(A|B), que es una probabilidad posterior. (Estimación de la tasa de incidencia después del experimento)

P(A|B)=P(A)P(B|A)/P(B)

Reescribe el denominador usando el total fórmula de probabilidad:

P(A | b)= p(A)p(b | A)/(p(b | A)p(A)+p(b | A inversa)p(A inverso) )

Supuesto: Ahora tenemos dos personas, A y B. Ambas personas usarán las palabras amor, transacción y vida al escribir correos electrónicos.

aLa frecuencia de uso de tres palabras es: amor = 0,1, transacción = 0,8, vida = 0,1.

bLa frecuencia de uso de tres palabras es: amor=0,5, transacción=0,2 y vida=0,3.

Ahora tenemos muchos correos electrónicos. Supongamos que el autor de este correo electrónico es a o b con la misma probabilidad.

Ahora hay un correo electrónico que solo contiene las palabras vida y transacción. , entonces este correo electrónico La probabilidad de que el autor del correo electrónico sea A o B.

Calcular probabilidad previa

P(emailA)= P(lifeA)P(dealA)P(A)= 0.1 * 0.8 * 0.5 = 0.04

P (emailB)= P(lifeB)P(dealB)P(B)= 0.3 * 0.2 * 0.5 = 0.03

Al observar las dos palabras vida y transacción, la probabilidad de que el autor sea A o B.

Calcular probabilidad posterior

P (correo electrónico | "Vida, Transacción")= p (correo electrónico) * f (x) (función de probabilidad) = 0,04 *(1/( 0,04+ 0,03))= 0,57.

P(emailB| "Vida, Transacción")= P(emialB)* f(x)= 0.03 *(1/(0.04+0.03))= 0.43

Probabilidad completa :

P(emailA| "Vida, Transacción")+ P(emailB| "Vida, Transacción")= 1

上篇: 下篇: ¿Cuál es el significado de "El hombre hada de los sueños del tigre"?
Artículos populares