Constellation Knowledge Network - Preguntas y respuestas sobre la interpretación de los sueños - Cuando GPT se encuentre con la conducción autónoma, se lanzará el primer DriveGPT.

Cuando GPT se encuentre con la conducción autónoma, se lanzará el primer DriveGPT.

¿Qué significa GPT para la conducción autónoma?

Wang Huanghuadan de Wen Shuzhijia

ChatGPT prende fuego a la IA, entonces, ¿qué tipo de reacción química ocurrirá cuando GPT se encuentre con la conducción autónoma?

El nombre completo de GPT es Transformador de preentrenamiento generativo, es decir, Transformador de preentrenamiento generativo. Simple Generalization es un modelo de aprendizaje profundo de generación de texto entrenado con datos disponibles en Internet.

El 11 de abril, en la 8ª edición de Millicent AI? Hoy, el CEO Gu lanzó oficialmente el DriveGPT basado en tecnología, cuyo nombre chino es Xuehu.

¿Qué puede hacer DriveGPT? ¿Cómo se construye? ¿Está Gu en Ai? Ese día di una interpretación detallada. Además, ¿IA? DAY también demostró la actualización del sistema de datos de conducción autónoma MANA, principalmente su progreso en la percepción visual.

01.

¿Qué es DriveGPT? ¿Qué propósito se puede lograr?

Gu explicó primero el principio. La esencia del modelo transformador generativo preentrenado es resolver la probabilidad de la siguiente palabra. Cada llamada toma una muestra de la distribución de probabilidad y genera una palabra. De esta manera, se puede generar una secuencia de caracteres para una variedad de tareas posteriores.

Tomemos el lenguaje natural chino como ejemplo. Una sola palabra o palabra es un token, y hay alrededor de 50.000 palabras simbólicas chinas. Cuando se introduce un token en el modelo, el resultado es la probabilidad de la siguiente palabra. Esta distribución de probabilidad refleja el conocimiento y la lógica del lenguaje. Cuando el modelo grande genera la siguiente palabra, es el resultado del conocimiento del lenguaje y el razonamiento lógico, al igual que inferir quién es el asesino basándose en pistas complejas en una novela de detectives.

Como vehículo grande adecuado para el entrenamiento de conducción autónoma, DriveGPT Xuefu Hairuo tiene tres capacidades:

1. Muchas secuencias de escenas de este tipo se pueden generar mediante probabilidad, y cada escena puede ser. un escenario global, y cada secuencia de escenario es una situación real que puede ocurrir en el futuro.

2. Cuando se generan todas las secuencias de escenas, podemos cuantificar la trayectoria de comportamiento más preocupante del vehículo en la escena, es decir, cuando se genera la escena, se generará la información de la trayectoria futura del vehículo. .

3. Con esta trayectoria, DriveGPT Xuehu Hairuo puede generar toda la cadena lógica de decisión mientras genera secuencias de escenas y trayectorias.

En otras palabras, con DriveGPT Xuehu Hairuo, la planificación, la toma de decisiones y el razonamiento se pueden completar bajo un marco de generación unificado.

Específicamente, el diseño de DriveGPT Xuehu Hairuo es tokenizar la escena y llamarla Drive. Idioma.

El idioma de conducción discretiza el espacio de conducción y cada Token representa una pequeña parte de la escena. Actualmente, Millie tiene aproximadamente 500.000 espacios de léxico simbólico. Si ingresa una secuencia de tokens de escenarios que sucedieron en el pasado, el modelo puede generar todos los escenarios futuros posibles basados ​​en el historial.

En otras palabras, Hai Ruo también es como una máquina de razonamiento. Cuéntale lo que pasó en el pasado y podrá deducir muchas posibilidades para el futuro basándose en probabilidades.

Una serie de Tokens juntos forman una secuencia temporal completa de la escena de conducción, incluido el estado de todo el entorno del tráfico y el estado de su propio automóvil en un momento determinado en el futuro.

¿Con conductor? Idioma, DriveGPT se puede entrenar.

El proceso de entrenamiento de DriveGPT comienza primero con un preentrenamiento a gran escala basado en datos de conducción e intentos de conducción previamente definidos.

Luego, al utilizar los escenarios de asumir o no asumir el control, los resultados previos al entrenamiento se clasifican y clasifican para entrenar el modelo de retroalimentación. En otras palabras, sustituir los métodos incorrectos de conducción autónoma por métodos correctos de conducción humana.

El seguimiento consiste en utilizar la idea del aprendizaje por refuerzo para optimizar continuamente el modelo iterativo.

En el modelo de preentrenamiento, se utiliza el modelo GPT con una estructura de solo decodificación y cada token se usa para describir el estado de la escena en un momento determinado, incluido el estado del obstáculo, el estado del vehículo propio, líneas de carril, etc.

Actualmente, el modelo preentrenado de Millimeter tiene 65.438+02 mil millones de parámetros y puede realizar diversas tareas de generación de escenarios utilizando los datos de conducción de 40 millones de vehículos producidos en masa.

Estos resultados generados se optimizarán según las preferencias de las personas, sopesando la seguridad, la eficiencia, el confort y otras dimensiones. Al mismo tiempo, Milly utilizará algunos datos humanos filtrados, alrededor de 50.000 clips, para entrenar el modelo de retroalimentación y optimizar continuamente el modelo previamente entrenado.

Al generar la cadena lógica de decisión, DriveGPT Xuehu Hairuo utiliza tecnología rápida. La terminal de entrada le da al modelo un mensaje, diciéndole "adónde ir, más lento o más rápido, y déjelo razonar paso a paso". Después de este mensaje, producirá resultados en la dirección esperada y cada resultado tiene una cadena lógica de decisión. Cada resultado también tendrá una probabilidad de ocurrir en el futuro. De esta manera podemos elegir la estrategia impulsada por la cadena más probable y lógica para el futuro.

Se puede utilizar un ejemplo vívido para ilustrar la capacidad de razonamiento de Hairuo. Supongamos que al modelo se le solicita "alcanzar un determinado punto objetivo", DriveGPT Xuehu Hairuo generará muchos estilos de conducción posibles, algunos son radicales y cambiarán de carril y adelantarán continuamente para alcanzar rápidamente el punto objetivo, y algunos son estables y siguen el coche hasta el final.

En este momento, si no hay otras instrucciones adicionales en el mensaje, DriveGPT optimizará el efecto basándose en el entrenamiento de retroalimentación y finalmente dará un efecto que esté más en línea con las preferencias de conducción de la mayoría de las personas.

02.

¿Cómo implementaron DriveGPT?

En primer lugar, la capacitación e implementación de DriveGPT Xuehu Hairuo no se puede separar del soporte de la potencia informática.

En junio de 5438 + octubre de este año, Mohao y Volcano Engine lanzaron conjuntamente su centro de computación inteligente de construcción propia: Mohao Snow Lake Oasis MANA OASIS. OASIS tiene una potencia informática de 6.700 millones de operaciones por segundo, un ancho de banda de almacenamiento de 2T/segundo y un ancho de banda de comunicación de 800G/segundo.

Por supuesto, la potencia informática por sí sola no es suficiente. También requiere el apoyo de marcos de capacitación e inferencia. Por lo tanto, Millie también realizó las siguientes tres actualizaciones.

El primero es asegurar y mejorar la estabilidad del entrenamiento.

El entrenamiento de modelos a gran escala es una tarea muy difícil. A medida que el tamaño de los datos, el tamaño de la agrupación y el tiempo de entrenamiento aumentan en órdenes de magnitud, los pequeños problemas con la estabilidad del sistema se magnificarán infinitamente. Si no se manejan, las tareas de capacitación a menudo salen mal, provocando interrupciones anormales y desperdiciando muchos recursos invertidos en la etapa inicial.

Basado en el marco de capacitación modelo a gran escala, Millie y Volcano Engine han establecido conjuntamente un marco completo de soporte de capacitación. A través del marco de soporte de capacitación, Millie ha logrado capacidades de captura y recuperación a nivel de minutos para tareas anormales, lo que puede garantizar el entrenamiento continuo de tareas de kilocalorías durante varios meses sin ninguna interrupción anormal, asegurando efectivamente la estabilidad del entrenamiento del modelo a gran escala de DriveGPT Xuefu Hairuo.

El segundo es la actualización de los recursos de programación flexible.

MM tiene una gran cantidad de datos reales aportados por automóviles producidos en masa y puede utilizar los datos devueltos para aprender automáticamente sobre el mundo real. Dado que la cantidad de datos enviados en diferentes momentos cada día varía mucho, la plataforma de capacitación debe tener capacidades de programación flexibles para adaptarse al tamaño de los datos.

Al final, la tecnología de aprendizaje incremental se extendió a la capacitación de modelos a gran escala, se construyó un sistema de aprendizaje continuo de modelos a gran escala, se desarrolló un programador flexible a nivel de tareas, los recursos se programaron en minutos y la tasa de utilización de recursos informáticos del clúster alcanzó el 95%.

El tercero es la mejora de la eficiencia del rendimiento.

En términos de eficiencia de entrenamiento, en el cálculo matricial grande del transformador, al dividir los datos de los bucles interno y externo, los datos se guardan en SRAM tanto como sea posible, lo que mejora la eficiencia del cálculo. Bajo el marco de capacitación tradicional, el proceso del operador es muy largo. Al introducir la biblioteca Lego proporcionada por Volcano Engine, el rendimiento de un extremo a otro aumenta en un 84%.

Con la actualización de la potencia informática y estos tres aspectos, DriveGPT Xuehu Hairuo puede obtener una mejor capacitación y actualizaciones iterativas.

03.

Actualización de maná, la cámara reemplaza al radar ultrasónico

¿La cuarta IA en 2021 y 65438+febrero? MANA es un sistema inteligente para datos de conducción autónoma, que se lanzó el 15 de noviembre. Después de más de un año de iteración de la aplicación, MANA ahora ha recibido una actualización integral.

Según Gu, esta actualización incluye principalmente:

1. Las capacidades de modelos grandes relacionadas con la percepción y la cognición están integradas en DriveGPT.

2. El servicio básico de computación está optimizado específicamente para el entrenamiento de modelos a gran escala en términos de escala de parámetros, estabilidad y eficiencia, y está integrado en OASIS.

3. Se agregó un servicio de síntesis de datos utilizando tecnología NeRF, lo que reduce el costo de recopilar datos de casos extremos.

4. Para abordar el problema de la entrega rápida de múltiples chips y modelos, se han optimizado herramientas de implementación heterogéneas y herramientas de adaptación de vehículos.

Hemos presentado el contenido relevante de DriveGPT en detalle. Veamos principalmente el progreso de MANA en la percepción visual.

Gu dijo que el propósito principal de las tareas de percepción visual es restaurar la información dinámica y estática y la distribución de texturas en el mundo real. Por lo tanto, Millimeter ha actualizado la arquitectura del modelo de autocontrol visual para integrar la estructura tridimensional prevista, el campo de velocidad y la distribución de textura del entorno en un objetivo de entrenamiento, lo que le permite manejar varias tareas específicas con calma. Actualmente, el conjunto de datos del modelo de autocontrol de visión milimétrica tiene más de 4 millones de segmentos y el rendimiento de la percepción ha mejorado en un 20%.

En la escena del estacionamiento, Millimeter utiliza la medición de distancia visual pura de la lente ojo de pez para lograr los requisitos de estacionamiento. La precisión de la medición puede alcanzar los 30 cm dentro de un rango de 15 m, y la precisión es superior a 10 cm dentro de 2 m. . Reemplazar el radar ultrasónico por visión pura reduce aún más el costo de toda la solución.

Además, en términos de reconstrucción visual 3D pura, a través de la tecnología de modelos grandes de autocontrol visual, los videos de retorno producidos en masa se pueden convertir en datos reales anotados en 3D que se pueden usar para el entrenamiento del modelo BEV sin depender en láseres.

Al actualizar NeRF, el error de reconstrucción puede ser inferior a 10.

Este artículo proviene del autor Zhijia. com, los derechos de autor pertenecen al autor. Si se reproduce de cualquier forma, comuníquese con el autor. El contenido sólo representa la opinión del autor y no tiene nada que ver con la modificación del coche.

上篇: ¿Jianye es otro nombre para qué ciudad? 下篇: No puedo entenderlo, ¿qué signos del zodíaco están siempre enredados?
Artículos populares