Observación de la industria de la voz inteligente: ¿Ha llegado la creación y comercialización de IA ecológica semiabierta de Microsoft Xiao Bing?
Pero al igual que la conferencia en sí, Xiao Bing también está saliendo inconscientemente de laboratorios e instituciones de investigación y gradualmente está tratando de comercializar. Este es el origen del primer paso de Xiao Bing. Durante las últimas cinco generaciones, Xiao Bing ha pasado de incipiente a crecer, de tener un diagrama de marco bidimensional a una imagen bidimensional, y ahora muestra una imagen holográfica tridimensional, acercándose cada vez más a un ser humano.
La tecnología detrás de esto continúa iterando y el ecosistema comienza a tomar forma. Según Microsoft, esta conferencia es una actualización integral de todas las partes del marco de tecnología emocional de Xiao Bing. Desde la configuración de EQ e IQ al iniciar sesión por primera vez, hasta inteligencia artificial conversacional, modelos generativos y voz full-duplex, Xiao Bing ahora ha entrado en la etapa de creación de IA. En términos de ecología, Microsoft propuso por primera vez la construcción de un ecosistema semiabierto de IA dual, la integración diferenciada de las ventajas de los socios y la creación de habilidades y capacidades exclusivas de Xiao Bing.
“El objetivo final de la inteligencia artificial es la 'colaboración entre humanos y máquinas', utilizando la inteligencia digital para ayudar a los humanos, pero existen diferentes caminos en esta dirección, vicepresidente ejecutivo global de Microsoft y director de Inteligencia Artificial de Microsoft". y Shen Xiangyang de Microsoft Research dijeron: "El equipo de Xiao Bing ha tomado un camino diferente".
Creación de inteligencia artificial
Desde el año pasado, Microsoft Xiao Bing ha realizado muchos intentos de creación. e incluso publicó. Escribió una colección de poemas propios. Ahora, Xiao Bing irá un paso más allá.
En la conferencia de prensa, Shun Xiangyang anunció que Microsoft ha pensado en tres principios para la creación de IA: en primer lugar, su tema debe ser una combinación de IQ y EQ, y en segundo lugar, los productos creados por IA deben ser; Puede convertirse en una obra con derechos de propiedad intelectual independientes; en tercer lugar, el proceso de creación de inteligencia artificial debe corresponder a algún tipo de comportamiento creativo humano, en lugar de una simple sustitución del trabajo humano.
El objetivo de Xiao Bing es convertirse en un robot con una alta inteligencia emocional. "Planeamos operar la creación de inteligencia artificial como una industria emergente". En la conferencia de prensa, Xu, director general de la división de creación de inteligencia artificial de Microsoft, dijo: "Si la creación de IA se considera una industria de contenidos, en lugar de una simple creación literaria, A El 'concept car' por sí solo no es suficiente. Desde el año pasado, hemos comenzado a trabajar en un 'automóvil de producción'". Según los informes, Xiao Bing ha presentado 21 proyectos en los últimos 12 meses. Programas de televisión y 28 programas de radio cubren 41 programas de televisión. Estaciones y estaciones de radio en todo el país, incluidas 9 estaciones de televisión importantes. Hoy en día, Xiao Bing presenta 25 programas de radio todos los días. En Japón y China, Xiao Bing produjo 2.878 horas de contenidos audiovisuales.
Al mismo tiempo, los audiolibros de Xiao Bing han cubierto más del 90% de los robots de educación temprana y el 80% de las plataformas de juegos en línea en China. Además, Xiao Bing, un lector de noticias que coopera con NetEase News Client, tuvo comentarios de lectura de noticias que superaron los 654,38 millones hace dos meses. Xiao Bing también continúa creando contenido en finanzas y otros campos relacionados.
El soporte técnico detrás de esto proviene del marco de tecnología emocional de Xiao Bing. El motor de diálogo central y los sentidos interactivos de la sexta generación de Xiao Bing se han mejorado aún más. Microsoft lanzó un nuevo * modelo sensorial en el Xiao Bing de sexta generación y probó públicamente un nuevo sensor que combina texto, voz full-duplex y visión en tiempo real.
Entre ellos, el * * * modelo sensorial es un motor de diálogo basado en un modelo generativo. Según se informa, el modelo generativo que Xiao Bing completó el año pasado crea sus propias respuestas en lugar de recuperarlas de un corpus de conversaciones existente. El modo de sentimiento * * * de hoy mejora aún más el control de Xiao Bing sobre el contenido, el campo y el ritmo del diálogo, es decir, Xiao Bing puede crear sus propias respuestas para liderar la dirección del diálogo.
Los tres nuevos sentidos de esta beta abierta, el motor de diálogo, la voz full-duplex y la visión en tiempo real, combinados con el modelo sensorial * * *, permiten a Xiao Bing ordenar a los usuarios que completen tareas humanas a través de interacción continua y en tiempo real de visión y detección de rostros, y llevar a cabo un diálogo de dominio abierto en el proceso.
Además, Microsoft también lanzó la cuarta versión de las canciones AI en modo DNN. Según Luan Jian, científico jefe de voz de Xiao Bing, esta versión del modelo puede sintetizar rápidamente canciones de la misma calidad que los cantantes humanos. También le permite a Xiao Bing absorber libremente las habilidades y características de canto de los cantantes humanos, e incluso puede completar nuevas. canciones en nombre de los humanos mientras los imitan.
Sin embargo, aunque Microsoft ha propuesto los principios de la creación de IA y ha realizado actualizaciones técnicas, las acciones de Xiao Bing serán solo el comienzo de la creación real de IA. "Según el Gartner Technology Hype Cycle 2017, los asistentes virtuales tardarán entre 5 y 10 años en generalizarse". Al comentar sobre la creatividad de la IA, el vicepresidente de investigación de Gartner, Cai Huifen, dijo al periodista del 21st Century Business Herald: "Esta aplicación está dirigido principalmente a áreas específicas de dispositivos domésticos, como asistentes personales o control por voz, pero aún necesita incluir la mejora de tecnologías como la construcción de gráficos de conocimiento y la comprensión y generación del lenguaje natural para diferentes campos "
Además de la mejora de las capacidades técnicas, la característica más importante de la sexta generación de Xiao Bing es que ha comenzado a construir su propia ecología: IA dual.
"Antes de Microsoft, la industria ya tenía muchos ecosistemas y modelos de cooperación diferentes. Entre ellos, hay dos modelos más importantes. Uno es el modelo de empoderamiento abierto, que construye un ecosistema proporcionando SDK/API "Peng Shuang, gerente de producto de Xiao Bing, analizó: "El otro tipo es una plataforma cerrada que se centra en sí misma y construye un entorno ecológico abriendo una tienda de aplicaciones de IA en la plataforma".
La doble IA es diferente y más avanzado. Similar a una ecología semiabierta. "En un entorno tan ecológico, por un lado, Microsoft será directamente responsable de la experiencia del producto y controlará los detalles más específicos del producto que están en contacto directo con los usuarios. Por otro lado, no estamos cerrados en nuestra propia plataforma, sino están en contacto externo e incluso se integran directamente en plataformas de terceros ", dijo Peng Shuang.
La razón de esta elección es que los otros dos tipos de ecología tienen cada uno sus propios problemas. Entre ellos, el modo cerrado restringe en gran medida el libre flujo de datos y viola la esencia de la IA. Debido a que no se pueden obtener los datos básicos necesarios para la iteración, es difícil iterar rápidamente y aprovechar la actualización.
En el modelo de empoderamiento abierto, no importa quién esté empoderado o quién esté empoderado, es una relación relativamente flexible "Es decir, nadie es realmente responsable de la experiencia del producto final". La experiencia real de los altavoces inteligentes actualmente de moda es generalmente inferior a la esperada, precisamente debido a los problemas causados por la falta de cooperación.
Al mismo tiempo, debido a que API/SKD en el ecosistema habilitante abierto enfatiza la versatilidad, también limita en cierta medida la puntualidad de las aplicaciones de última y mejor tecnología. no puede ser Debe ser el mejor.
Durante el proceso de cooperación, Xiao Bing también está explorando su propio modelo de ganancias. Actualmente, Xiao Bing ha lanzado cuatro áreas de negocio, incluidas finanzas, cultura pop, medios y publicaciones. "Discutimos varios modelos de ganancias de IA y finalmente descubrimos que se dividen en dos categorías. Una es usar la tecnología de IA para reemplazar el trabajo humano de baja y alta concurrencia a un costo menor, como la producción de contenido", dijo Li Di a 21st Century. Reportero del Business Herald. "El segundo es la colaboración entre la IA y los humanos para lograr compartir mejorando la tasa de conversión de la colaboración".