Constellation Knowledge Network - Conocimiento de chismes - 2021-04-09: Índice de Consistencia Índice C

2021-04-09: Índice de Consistencia Índice C

& ltmeta charset="utf-8 "

¿Qué es el índice de coherencia?

El nombre en inglés de C-index es índice de concordancia y la traducción al chino es índice de concordancia. Fue propuesto por primera vez por Frank Harrell Jr, profesor de bioestadística en la Universidad de Vanderbilt en 1996. Se utiliza principalmente para calcular la diferencia entre el valor predicho del modelo COX y el valor real en el análisis de supervivencia. En realidad, es similar al conocido AUC. . Se utiliza ampliamente para evaluar la precisión de la predicción de modelos de pronóstico para pacientes con cáncer. Hay dos aspectos principales del modelo de evaluación general. Uno es la bondad de ajuste del modelo. Los indicadores de evaluación comúnmente utilizados incluyen R cuadrado, -2logL, AIC, BIC, etc.

El otro es la precisión de la predicción del modelo. Como sugiere el nombre, es la diferencia, el error cuadrático medio y el error relativo entre el valor real y el valor predicho del modelo. En aplicaciones clínicas, se presta más atención a la precisión de la predicción. El objetivo principal del modelado es la predicción. El índice C pertenece a la precisión de la predicción entre los indicadores de evaluación del modelo.

El índice C se calcula emparejando aleatoriamente todos los sujetos de la investigación en los datos de la investigación. Tomando el análisis de supervivencia como ejemplo, si uno de los dos pacientes tiene un tiempo de supervivencia previsto más largo que el otro paciente, o el paciente con una mayor probabilidad de supervivencia tiene un tiempo de supervivencia previsto más largo que el otro paciente, se dice que los resultados previstos son consistente con los resultados reales. Se llama consenso.

Calcular índice c = k/m.

Como se puede ver en el método de cálculo anterior, el índice C está entre 0,5 y 1 (en el caso de emparejamiento aleatorio, la probabilidad de coherencia e inconsistencia es exactamente 0,5). 0,5 es completamente inconsistente, lo que indica que el modelo no tiene función de predicción, y 1 es completamente consistente, lo que indica que los resultados de la predicción del modelo son completamente consistentes con la situación real. En términos generales, el índice C tiene una precisión baja cuando está entre 0,50 y 0,70 y una precisión media cuando está entre 0,71 y 0,90. Y superior a 0,90 es una alta precisión, que es algo similar al coeficiente de correlación.

Todavía es difícil medir si la precisión es alta o baja solo a partir del índice C numérico, por lo que la gente quiere utilizar una prueba estadística para convencer y probar este nivel, como simplemente mirar las diferencias. al detectar diferencias genéticas Usar múltiplos para juzgar las diferencias de expresión es demasiado arbitrario. En este momento, se introduce la tecnología Bootstrap para probar la precisión del modelo de predicción. Bootstrap es un método estadístico importante en estadísticas no paramétricas, que se utiliza para estimar la varianza de las estadísticas y luego estimar el intervalo.

La idea central y los pasos básicos del método Bootstrap son los siguientes:

(1) Utilice tecnología de remuestreo para extraer una cierta cantidad de muestras de las muestras originales. Este proceso permite repetir. muestreo.

(2) Calcule la estadística t dada en función de las muestras extraídas.

(3) Repita lo anterior n veces (generalmente mayor que 1000) y obtenga n estadísticas t.

(4) Calcule la varianza del árbol de muestra de n estadísticas t, y obtener La varianza de la estadística.

Además, si el conjunto de datos es grande, se puede dividir en diferentes proporciones: una parte se utiliza para modelar y la otra parte se utiliza para verificación. Validación cruzada, como 5x, 10x, etc.

Aunque parezca complicado, en realidad, algunas personas han hecho estas cosas. Hay paquetes en R que pueden calcular directamente el índice de consistencia: Hmisc y compareC, los cuales pueden calcular el índice c.

上篇: Adivino en el Círculo Yishui_Adivino en el Círculo Yishui 下篇: 40 ensayos cortos de unas 70 palabras.
Artículos populares