Informe de investigación de altavoces inteligentes | Explicación detallada de la función de interacción de voz
Los altavoces inteligentes se han convertido en el hardware de consumo de más rápido crecimiento en el mundo. Desde el lanzamiento del Home Pod de Apple en junio de 2017, una o dos empresas de tecnología han lanzado nuevos parlantes inteligentes o parlantes inteligentes de segunda y tercera generación cada mes a partir de la segunda mitad del año. Hasta ahora, los gigantes tecnológicos nacionales BAT y Xiaomi, los fabricantes establecidos de electrodomésticos Lenovo y Suning, las empresas de tecnología de voz iFlytek y Spirits, y las nuevas empresas de tecnología de hardware Mobvoi y Ruoqi han ingresado al mercado a través de la autoinvestigación o la cooperación.
La explosión de los altavoces inteligentes es inseparable del apoyo a la tecnología de voz. Hay dos tipos de fabricantes que dominan la tecnología de voz. Uno son los gigantes de Internet, como Amazon, Google, BAT, Apple y Microsoft, y el otro son los fabricantes especializados en tecnología de interacción de voz, como iFlytek y Spirits. Los fabricantes de tecnología de voz permiten a los fabricantes tradicionales de altavoces inteligentes y a los proveedores de contenidos y servicios de Internet adquirir usuarios y datos y construir un ecosistema de plataforma a través de la investigación y el desarrollo independientes de productos de software y hardware o resultados tecnológicos.
1. Amzon Alexander
Información básica: Amzon Alexa es el asistente virtual inteligente y la plataforma abierta de Amazon. La investigación y el desarrollo comenzaron en 2010 y 11 se lanzó simultáneamente con Echo en 2014. Alexa tiene la capacidad de utilizar la tecnología de voz para implementar diferentes aplicaciones funcionales mediante la ejecución de programas independientes llamados "habilidades" (similar a ejecutar una aplicación en el sistema operativo de un teléfono móvil), admitiendo reproducción de música, compras por voz, control inteligente del hogar y funciones inteligentes. Control del hogar. Comunicación y otras funciones. Debido a su ventaja de ser el primero en actuar y a una gran cantidad de productos comerciales, Alexa ha superado con creces a otros fabricantes de tecnología en términos de implementación de productos y nivel de inteligencia (estadísticas de CNET en CES2017).
Apertura: Alexa 2065438 En junio de 2005, Amazon abrió Alexa a desarrolladores externos y lanzó dos kits de desarrollo, Alexa Skills Kit (ASK) y Alexa Voice Service (AVS), lo que permite a los desarrolladores desarrollar más fácilmente. Alexa “skills” también cuenta con un fondo de capital riesgo creado por Alexa para apoyar a startups en el campo de la interacción de voz, y el Premio Alexa, un concurso de desarrollo para estudiantes universitarios. Desde más de 29 habilidades cuando se lanzó en 2014 hasta casi 40.000 habilidades en la actualidad, Alexa tiene una enorme cantidad de habilidades que superan con creces las de otros fabricantes de tecnología debido a su política activa de apertura y herramientas de desarrollo continuamente optimizadas.
Ámbito de aplicación: hasta el momento, Amazon Alexa se ha lanzado en 38 países de todo el mundo (aún no se ha lanzado en China), y abarca 6 idiomas: inglés, alemán, francés, italiano, español y japonés. (El chino aún no es compatible). Además de su propia serie echo de productos de altavoces, Alexa también potencia productos de altavoces como Sonos, Lenovo y Harman Kardon, televisores inteligentes como amzon fire TV, tabletas y teléfonos inteligentes como amzon fire, Huawei mate9, HTC, etc. Asus, HP, Lenovo, etc. Computadoras portátiles y PC, productos para el hogar inteligentes como refrigeradores, luces e interruptores inteligentes, dispositivos portátiles como auriculares y relojes inteligentes, así como Ford y BMW.
2. Asistente de Google
Información básica: El asistente de Google es el asistente virtual de Google, que fue lanzado oficialmente en la Conferencia de Desarrolladores de Google en mayo de 2016.
Admite interacción de voz y está instalado en los teléfonos inteligentes y altavoces inteligentes de Google.
Apertura: en febrero de 2016, Google lanzó la plataforma para desarrolladores Actions en Google. En abril de 2017, lanzó un SDK (kit de desarrollo de software) para que desarrolladores externos desarrollaran aplicaciones de asistente de Google, ampliando aún más el soporte. para automóviles inteligentes y otros dispositivos domésticos inteligentes. El Asistente de Google admite entrada de voz y respuestas visuales, y puede reconocer objetos y recopilar información visual a través de la cámara del dispositivo.
Ámbito de aplicación: Google Assistant actualmente admite ocho idiomas, incluidos inglés, japonés, francés, alemán y español. Se espera que admita más de 30 idiomas para finales de 2018, abarcando 95 teléfonos Android (el chino no es compatible por el momento). Además de sus propios parlantes de la serie doméstica de Google y teléfonos inteligentes de la serie Pixel, el asistente de Google también habilita teléfonos inteligentes como Sony y Nokia, televisores inteligentes, decodificadores inteligentes y productos de parlantes inteligentes como Panasonic, LG y Sonos, computadoras como Lenovo y Aviva y Volvo, etc. Productos para automóviles inteligentes.
3. Microsoft Cortana
Información básica: Cortana es el asistente inteligente virtual de Microsoft. Fue lanzado oficialmente en junio de 2015 y se utiliza gradualmente en teléfonos móviles equipados con sistema operativo Windows y Android/. sistema ios. Cortana tiene una función de interacción por voz y utiliza la información del motor de búsqueda de Bing para responder preguntas. Puede llamar a aplicaciones, consultar el clima, recomendar restaurantes y atracciones y controlar hogares inteligentes.
Apertura: en la Build Developer Conference de 2017, Microsoft se retiró de la plataforma de desarrollo de habilidades de Cortana, lo que permitió a desarrolladores externos desarrollar habilidades para Cortana.
Ámbito de aplicación: a partir de ahora, Cortana admite casi 10 idiomas, incluidos chino (simple/complejo), inglés, alemán, francés y japonés. Cortana se ha integrado en muchos productos de Microsoft, como el navegador Edge, Windows 10, sistemas para automóviles, Skype (el servicio de mensajería instantánea de Microsoft) y permite a Microsoft trabajar con el altavoz inteligente Invoke de Harman Kardon.
4. Apple siri
Información básica: Siri (interfaz de interpretación y reconocimiento de voz) es el asistente virtual de Apple. Siri se fundó en 2007. Al principio, Siri era sólo una aplicación en la plataforma iOS. Después de que Apple adquirió Siri en abril de 2010 y lo volvió a desarrollar, Siri se convirtió en un software integrado en los dispositivos Apple. Se relanzó en 2011 y solo se podía ejecutar en iOS y macOS. Siri admite la interacción de voz y puede completar muchos servicios, como búsqueda de datos, consulta del tiempo y configuración del despertador.
Apertura: la interfaz de Siri se abrió en la Conferencia de desarrolladores de Apple en junio de 2016 y se agregó Sirikit a la plataforma de desarrollo de IOS para ayudar a los desarrolladores a llamar a Siri para mostrar el contenido de la aplicación. Siri actualmente no cuenta con una plataforma de desarrollo de habilidades independiente.
Ámbito de aplicación: hasta el momento, Siri admite más de 20 idiomas, incluidos chino (simplificado y tradicional), inglés, francés, alemán e italiano, lo que potencia toda la gama de productos de Apple, como iPhone, iPad, iPod, Apple Watch, Mac, etc.
1. iFlytek
Información básica: iFlytek, fundada en 1999, es el mayor fabricante de tecnología de voz inteligente de China. Tiene investigación y acumulación a largo plazo en el campo de la tecnología del habla inteligente y logros líderes a nivel internacional en muchas tecnologías, como la síntesis, el reconocimiento y la evaluación del habla china. Tiene estrechos vínculos con funcionarios chinos y se le puede llamar el “Equipo Nacional de la Industria del Sonido de China”. La cuota de mercado de iFlytek en el mercado de tecnología de voz de China supera el 70%, y su cuota de mercado en productos de síntesis de voz también supera el 70%.
Apertura: la plataforma abierta de iFlytek es la primera plataforma abierta de iFlytek del mundo que proporciona capacidades de interacción de voz inteligente en Internet móvil.
Basado en la plataforma abierta iFlytek, método de entrada iFlytek, asistente de voz Linxi, educación de IA, servicio al cliente de IA, medicina de IA (registros médicos electrónicos de voz, sistema de diagnóstico asistido por imágenes médicas, asistente inteligente, etc.), traductor pequeño, automóvil inteligente Feiyu Productos como el sistema de micrófono iFlytek Morph en sistemas y escenarios domésticos se utilizan ampliamente en inteligencia artificial.
Ámbito de aplicación: iFlytek admite 34 idiomas, incluidos dialectos de toda China. En la actualidad, ha potenciado televisores inteligentes nacionales de renombre como Changhong, Hisense y Konka, dispositivos portátiles como GlassX y ZWatch, y automóviles inteligentes nacionales y extranjeros como Audi, BMW, Mercedes-Benz, GM, Ford, SAIC. , GAC, Changan, Geely, Great Wall y Chery Altavoces inteligentes (altavoces JD.COM Dingdong), robots de chat (Xiaoyu at Home). Los productos para el hogar inteligente, como cortinas y aires acondicionados, brindan servicios de interacción de voz inteligente para más de 60.000 aplicaciones como Didi Taxi, Amap y QQ Reading, que cubren todos los aspectos de la vida, como comunicación por chat, herramientas, videos, noticias y navegación.
2. Baidu dueros Xiaodu
Información básica: DuerOS es el sistema de inteligencia artificial conversacional de Baidu, que se lanzó oficialmente en la Conferencia de Desarrolladores de IA de Baidu en julio de 2017. DuerOS tiene más de 200 capacidades en 10 categorías, que incluyen entretenimiento de audio y video, consulta de información, servicios de vida y condiciones de viaje. Los usuarios pueden realizar control de comandos, consulta de información, aplicación de conocimientos, navegación de direcciones, chat diario, recordatorio inteligente y varios servicios de vida O2O en diferentes escenarios. También admite el acceso a capacidades de desarrolladores externos.
Apertura: la plataforma abierta DuerOS incluye una plataforma abierta para dispositivos inteligentes y una plataforma abierta de habilidades, que son adecuadas para diferentes tipos de fabricantes y desarrolladores de hardware, respectivamente. Para facilitar los "empezamientos", Baidu lanzó la suite DuerOS para individuos, fabricantes de productos y fabricantes especiales, integrando soluciones de terceros, incluidas Yinzhi Technology, Simcere Internet, Intel y Rockchip, y lanzó la aplicación Skill Store "Xiaodujia". ".
Ámbito de aplicación: DuerOS admite mandarín, inglés, cantonés, sichuan y otros idiomas. , y ha potenciado parlantes, televisores, hielo y otros pequeños electrodomésticos y productos para el hogar inteligentes, teléfonos inteligentes, relojes y otros dispositivos portátiles, máquinas para automóviles, espejos retrovisores inteligentes y otros productos para vehículos inteligentes, con una capacidad acumulada de 50 millones de unidades y un vida activa diaria de más de 6,5438 millones, du eros 6,543,806.
3. Compañero de clase de Xiao Ai Open Platform
Situación básica: Xiao Ai Open Platform (anteriormente Water Drop Platform) abrió sus capacidades de voz y SDK al mundo exterior en 2065438 de mayo de 2007. . Basado en el ecosistema de hardware y los datos masivos de Xiaomi, proporciona las tecnologías de inteligencia artificial líderes en el mundo, como el reconocimiento de voz y la PNL, y brinda a los desarrolladores servicios integrales de inteligencia artificial.
Ámbito de aplicación: las capacidades de plataforma abierta de Xiaoai se han integrado en productos de software y hardware de Xiaomi, como Xiaomi TV, altavoces Xiaomi AI, Xiaomi Jinfu 'Mi Xiaobei', potenciando 8500 dispositivos conectados a IoT en la cadena ecológica de Xiaomi. Los usuarios activos diarios del asistente virtual Xiao Ai también alcanzaron los 100.000.
4. Plataforma de desarrollo de voz AliGenie Tmall Genie
Información básica: la plataforma abierta AliGenie se lanzó en la Conferencia de Yunqi el 17 y 12 de junio de 2007. Iniciado por el Laboratorio de Inteligencia Artificial de Alibaba, está dirigido a empresas/instituciones/emprendedores/desarrolladores y comparte la tecnología acumulada de Alibaba en el campo de la inteligencia artificial en forma de API o SDK. Actualmente cuenta con una plataforma online que cubre entretenimiento audiovisual, noticias e información, y compras y comida para llevar.
Ámbito de aplicación: la plataforma de desarrollo AliGenie incluye principalmente tres partes: Genie Skills Market, Hardware Open Platform y Industry Solutions, que potencian completamente escenarios de servicios como hogares inteligentes, fabricación, comercio minorista y hoteles. y aviación.
5. Tencent Cloud Xiao Wei
Información básica: el sistema de servicio inteligente y la plataforma abierta de servicio inteligente de Tencent Cloud ayudan a los fabricantes de hardware inteligente a implementar la interacción de voz entre humanos y computadoras y las capacidades de servicios de audio y video. Desde 2012, el equipo de WeChat AI ha aplicado entrada de voz, reconocimiento de voz, tecnología de análisis semántico y otras funciones a WeChat.
Tencent Cloud Xiaowei utiliza la tecnología de voz de WeChat como capacidad subyacente, por lo que se llama "Xiaowei" y se lanzó oficialmente en la Cumbre "Cloud Future" de Tencent en junio de 2017.
Ámbito de aplicación: Tencent Cloud Xiaowei incluye una plataforma abierta de hardware, una plataforma abierta de habilidades, una plataforma de robot de servicio (servicio al cliente inteligente), combinada con la cadena de relaciones sociales de Tencent, que cubre familias, automóviles, deportes, hoteles y niños. acompañamiento educativo, etc. Múltiples escenas.
6.Plataforma abierta Spirit DUI
Información básica: Spirits se estableció en Cambridge, Reino Unido en 2007. Sus fundadores eran todos de Cambridge. En 2008 regresó a China y se instaló en Suzhou. Es una de las pocas empresas en China que cuenta con tecnología de diálogo entre personas y computadoras, y una de las pocas empresas en el mundo que tiene derechos de propiedad independientes e integra tecnología de voz en chino e inglés. 2065438 En septiembre de 2007, Spirits lanzó oficialmente la plataforma abierta DUI (Dialogue User Interface), que toma el diálogo basado en tareas como núcleo y tiene las funciones de chatear y responder preguntas para crear una interacción humanizada. Como plataforma abierta para el diálogo inteligente de enlace completo, DUI abre funciones de diálogo basadas en la tecnología de lenguaje de voz inteligente de Spirits y proporciona servicios de desarrollo como personalización de GUI, gestión de versiones e implementación de nube privada.
DUI tiene cuatro sistemas principales: Qingnang (servicio y soporte de RD), Tianji (big data), Wei Zi (ricos recursos de terceros) y Linglong (soluciones de terminal y entorno). La plataforma DUI tiene acceso a una gran cantidad de contenido de terceros y ha incorporado la tienda de habilidades lingüísticas y de voz más profesional de China. Tiene visualización de datos en profundidad, personalización personalizada y operación de umbral cero. Los desarrolladores pueden lograr un alto grado de personalización de todo el enlace a través de DUI y casi todos los módulos se pueden personalizar.
Ámbito de aplicación: la plataforma ha cubierto múltiples escenarios de aplicación, como automóviles, muebles para el hogar, robots, máquinas de historias y asistentes móviles. Proporciona soluciones para automóviles inteligentes, hogares inteligentes y robots inteligentes, potenciando productos inteligentes de vanguardia como Tmall Genie X1, el altavoz Xiaomi AI Xiao Ai, los altavoces inteligentes Lenovo y el espejo retrovisor inteligente Xiaomi Die de 70 pasos.
1. Teléfono móvil
Mobvoi es una empresa china de inteligencia artificial invertida por Google. Fue fundada por Li Zhifei, un científico chino de Silicon Valley, que regresó a China en 2012. Ha desarrollado de forma independiente tecnologías centrales como reconocimiento de voz, análisis semántico, búsqueda vertical, ADAS basado en visión y robot SLAM. Los productos de software y hardware representativos incluyen el reloj inteligente Ticwatch, el espejo retrovisor inteligente para automóvil Ticmirror, el altavoz inteligente Tichome, la aplicación de asistente de voz Mobvoi y Ticeye, un sistema avanzado de asistencia a la conducción.
2. Orion Starry Sky
Orion Starry Sky tiene un conjunto completo de tecnología de voz de campo lejano y el sistema de interacción de voz de campo lejano de enlace completo desarrollado de forma independiente "Orion Voice OS". " potencia los parlantes "Xiaoya" "del Himalaya, productos para el hogar inteligente como Midea, Haier, Bolian, Haier Youjia, Oribo y otros productos para el hogar inteligente. Los altavoces Xiaomi AI y Xiaomi TV también utilizan la tecnología TTS (síntesis de voz) y la tecnología ASR (reconocimiento de voz) de Orion Star. Orion Star viene con su propio altavoz, el altavoz Baoxiao AI, que está conectado al pago WeChat y al pago UnionPay e integra la tecnología blockchain.
En 2017, Orion Star también ganó el primer lugar en la categoría restringida (solo usando datos proporcionados por la competencia) del Microsoft Million Celebrity Recognition Competition, que es reconocida como la Copa Mundial de Reconocimiento Facial. 2065438 El 21 de marzo de 2008, Orion Star lanzó oficialmente su matriz de productos robóticos en el campo de la inteligencia artificial, que cubre múltiples escenarios como recepción, ventas y compañía infantil. Al mismo tiempo, se lanzó la plataforma robótica Orion OS de Orion, que integra sistemas multichip de desarrollo propio, algoritmos de visión de cámara, conjuntos de micrófonos, Orion TTS, plataformas de navegación en interiores y manipuladores de siete ejes para formar una cadena tecnológica robótica completa. Orion OS ha establecido asociaciones estratégicas con Microsoft, Sogou, Qualcomm, Nvidia y Smartisan.
3. Rokid
Rokid se fundó en julio de 2014 y está afiliada a Hangzhou Banling Technology Co., Ltd. Tiene su sede en Hangzhou, China, y centros de investigación y desarrollo en Beijing y Beijing. San Francisco, está comprometido con la investigación en el campo de la robótica, centrándose en tecnologías centrales como la captación remota de sonido direccional/reconocimiento semántico del habla, reconocimiento de rostros/gestos, sistemas de sonido y proyección. Actualmente, Rokid tiene productos como los parlantes inteligentes PEBBLE moonstone, las gafas AR Rokid Glass y el robot inteligente ALIEN. El robot doméstico inteligente Rokid ganó el Premio a la Innovación del Salón Internacional de Electrónica de Consumo CES durante dos años consecutivos en 2016 y 2017.
4. Cerebro profundo inteligente de entropía reunida
Deep Brain se estableció en Shanghai en 2012 y está comprometida con la investigación y el desarrollo de productos de inteligencia artificial. El equipo central está compuesto por talentos de investigación técnica de famosas universidades nacionales y extranjeras. Proporciona capacidades de diálogo humano-máquina en profundidad para más de 100 fabricantes y ha alcanzado una cooperación profunda con Samsung, Huawei, Lenovo y ZTE. En 2014, DeepBrain lanzó el primer altavoz inteligente del país, el Xiaozhi Super Speaker, medio año antes del lanzamiento de Echo. Su plataforma de habilidades semánticas ha atraído a miles de desarrolladores y ha desarrollado más de 1000 habilidades semánticas inteligentes para el hogar.
5. Voz de Sogou
Sogou fue fundada por Sohu el 3 de agosto de 2004, con el nombre de dominio Sogou.com, con el propósito de mejorar las capacidades de búsqueda de Sohu. En septiembre de 2013, Tencent inyectó capital en Sogou, inyectando sus servicios de búsqueda y negocios de métodos de entrada en Sogou. En noviembre de 2017, Sogou cotizó en la Bolsa de Valores de Nueva York. Tencent posee actualmente 45,37 acciones de Sogou. El ratio de participación de Sohu en Sogou es 39,21. La investigación sobre la tecnología de voz de Sogou comenzó en 2012 y se lanzó oficialmente en la plataforma abierta Sogou Voice Cloud en junio de 2013. Conecta todos los productos Sogou, incluidos los métodos de entrada y mapas, e inicia Sogou Voice Assistant. Al igual que Siri, la experiencia interactiva proporcionada por Sogou Voice Assistant en teléfonos móviles no puede hacer que los usuarios confíen lo suficiente en él y la tasa de utilización del producto no es alta. En agosto de 2016, Sogou lanzó el motor de interacción de voz "Yin Zhi". En febrero de 2017, cooperó con NavInfo y Gefei para lanzar la solución de software y hardware G8ⅱ de redes inteligentes para automóviles Gefei, que proporcionó capacidades de reconocimiento de voz ASR para Xiaomi TV 4A lanzado en marzo de 2018 y para el fabricante de tabletas de conferencias Vision.
El volumen de ventas y la cuota de mercado son de gran importancia para los productos de altavoces inteligentes. Dado que la tecnología de voz inteligente acaba de lanzarse, depende en gran medida de los datos del usuario. Cuanto más se utiliza, más inteligente se vuelve.
Según la estimación del autor, a partir del primer trimestre de 2018, la cuota de mercado global de los altavoces inteligentes es la siguiente. Amazon ocupa el 71% del mercado con su ventaja de ser el primero en actuar y sus productos ricos, mientras que Google ocupa el 12% del mercado con su completa matriz de productos y base de usuarios baja, media y alta. Tmall y Xiaomi ocupan 6 y 4 cuotas de mercado respectivamente en virtud de su sistema de comercio electrónico, ecología de hogar inteligente y estrategia de productos populares de bajo precio. JD.COM estuvo involucrado anteriormente en altavoces inteligentes. El homepod de Apple se lanzó oficialmente el 9 de febrero de este año. Tiene un precio elevado y todavía representa 1, mientras que otras marcas representan 3.
Como pionero en la categoría de altavoces inteligentes, Amazon continúa optimizando las nuevas capacidades de los productos de altavoces y continúa innovando. A partir de la escena y la forma, se han lanzado uno tras otro el pequeño y económico echo dot, el echo show con parlantes de pantalla y el echo spot con parlantes de despertador. No solo hay artículos promocionales de moda, sino también defensa de categoría de alta gama. Tiene una amplia matriz de productos de gama alta, media y baja, con ventas acumuladas de cada modelo que superan los 30 millones de unidades. Actualmente es el único fabricante de altavoces inteligentes con ventas superiores a los 10 millones, liderando el mercado mundial de altavoces inteligentes.
Linglong Technology, cofundada por JD.COM e iFlytek, lanzó el altavoz Ding Dong. Como fabricante anterior de altavoces inteligentes en China, JD.COM comenzó a vender una serie de productos nuevos en mayo de 2015. La línea general de productos es similar a la de Amazon, que continúa explorando más formas y escenarios, continúa brindando funciones más personalizadas y utiliza parlantes educativos para niños para ingresar al mercado de la educación temprana.
Con la fuerte entrada de Xiaomi, Alibaba y Baidu, JD.COM también lanzó el altavoz de pantalla de alta gama Dingdong PALY y el económico Dingdong mini2 para apoderarse del mercado interno.
En mayo de 2016, cuando Amazon casi monopolizaba el mercado de los altavoces inteligentes, Google entró en el mercado y lanzó Google Home. Con su diseño elegante, preguntas y respuestas inteligentes basadas en el motor de búsqueda de Google y la diferencia de precio, una vez ocupó el lugar. Mercado Más de 20 mercados. Y en 2017, el Google home mini de bajo precio y el Google home max de alto precio se lanzaron en octubre, y continuaron admitiendo más habilidades y escenarios nuevos: acceso a más dispositivos domésticos inteligentes, soporte para 5 millones de recetas para ocupar la cocina, y soporte para compras por voz.
Como constructor ecológico de hogares inteligentes líder en China, los productos de Xiaomi incluyen auriculares, fuentes de alimentación móviles, pulseras, enchufes, monitores de presión arterial, purificadores de aire, purificadores de agua, cámaras de acción, scooters de equilibrio, baterías y camas. Dispositivos domésticos inteligentes como faros y ollas arroceras. Xiaomi comenzó a desarrollar el asistente virtual Xiao Ai a finales de 2016 y lanzó oficialmente el altavoz inteligente Xiao Ai en septiembre de 2017. Además de los sólidos antecedentes ecológicos de Xiaomi Home, Xiao Ai también ha recibido gran atención debido a su ingenioso personal. En 2018, Xiaomi lanzó la versión Q-cute del Classmate Mini de Xiao Ai para unirse a la competencia nacional de impulso de precios bajos.
Alibaba concede gran importancia a la investigación y el desarrollo de nuevas tecnologías. En julio de 2017, se lanzó Tmall Elf x1. Al mismo tiempo, se dio a conocer el Laboratorio de Inteligencia Artificial de Alibaba, responsable de la investigación y el desarrollo de los productos de IA de consumo de Alibaba. En junio de 2017, la Conferencia Yunqi anunció oficialmente el establecimiento de la Academia DAMO para reclutar expertos en diversos campos técnicos clave para realizar investigaciones sobre ciencia básica, chips de inteligencia artificial, innovación tecnológica disruptiva, etc. El 18 de marzo, se lanzaron Tmall Elf M1 Cookies y Fire Eye Stand, y Tmall Elf Cube Sugar se lanzó en junio. Continuamos explorando más formas de altavoces y tecnologías de inteligencia artificial de salida sofisticadas, incluido el reconocimiento de imágenes, el reconocimiento facial, la detección de objetos y la retroalimentación emocional. . Al mismo tiempo, mejora la rentabilidad del producto y se mantiene en el campo de batalla de los altavoces de bajo precio. Basándose en la poderosa red de comercio electrónico de Alibaba, Tmall Genie se ha convertido en la marca de altavoces inteligentes más vendida en China.
En febrero de 2017, Baidu adquirió por completo Raven Technology. El 16 de octubre de 438, lanzó el altavoz inteligente Raven, que tiene una apariencia novedosa, colores intensos y un panel táctil de matriz de puntos desmontable. Con un precio de 1.699, compite con altavoces de alta gama como Sonos, Bose y Harman Kardon. A principios de 2018, DOSS, un fabricante de audio de larga trayectoria, lanzó los altavoces inteligentes DOSS. En marzo y junio, se lanzó el primer altavoz de vídeo inteligente del país a un precio reducido de 599 yuanes para el hogar y 89 yuanes para el interior, y se vendió en JD.COM y Tmall. Con su rendimiento de costo súper alto, todavía tiene un lugar en la guerra de precios de los parlantes nacionales.
Además de los parlantes inteligentes convencionales con ventas visibles, existen muchos productos de parlantes inteligentes en el país y en el extranjero. Por ejemplo, Invoke lanzado conjuntamente por Microsoft y Harman Kardon está equipado con Microsoft Cortana, Clova lanzado conjuntamente por Line y Qualcomm, así como una serie de altavoces inteligentes de equipos empresariales pequeños y medianos nacionales, Tichome de Mobvoi, altavoces Xiaoya de Himalaya, etc. A medida que el mercado de los altavoces inteligentes madure gradualmente, varios altavoces encontrarán su propio lugar o se quedarán en silencio.
Además de proporcionar la función de consumo de recursos de contenido principales, los parlantes inteligentes también profundizan en escenarios domésticos, abren plataformas, atraen a desarrolladores externos y brindan cada vez más habilidades. Amazon Echo, la industria líder de altavoces inteligentes, ya tiene más de 3w de habilidades. Desde la perspectiva del gradiente de crecimiento de habilidades, comenzó a explotar en 2016 y sigue aumentando con el aumento de las ventas de Echo. Con más de 30.000 capacidades, Amazon es más un sistema operativo de voz que sus seguidores.
Al igual que las aplicaciones del sistema operativo de los teléfonos inteligentes, entre las habilidades masivas del sistema operativo de voz, solo unas pocas han recibido realmente atención, mientras que una gran cantidad de habilidades se han convertido en habilidades zombies que a nadie le importan. Por lo tanto, mientras otras marcas de parlantes inteligentes cubran funciones básicas y de alta frecuencia y brinden más recursos, control del hogar y funciones creativas, no tienen que preocuparse por la aterradora cuenta de habilidades de Amazon.
Las funciones de los productos de altavoces inteligentes son similares y se dividen principalmente en tres direcciones principales: habilidades de contenido, habilidades de herramientas y entretenimiento interactivo; la tendencia de la función central de las funciones orientadas a escenarios y grupos principales es; emergiendo poco a poco.
Las funciones a las que los usuarios prestan gran atención incluyen música, películas, asistentes personales, hogares inteligentes, juegos y entretenimiento, seguidas de contenido educativo, diversión, noticias, noticias y funciones financieras;
Las habilidades con herramientas tienen poca reputación entre los usuarios, pero son insustituibles; las habilidades de entretenimiento interactivo son altamente reemplazables, y las características con buena reputación y experiencia tienen un número par de evaluaciones, centrándose en la disponibilidad de alta calidad; recursos.
Extraído de datos de reseñas de usuarios en plataformas de comercio electrónico como eBay, Walmart, JD.COM y Tmall.
Resumen de la experiencia del usuario:
1) La tasa de penetración general de los productos de altavoces inteligentes es muy alta y la aceptación del usuario es alta. La matriz de evaluación es 70 ~ 80 de 5 estrellas;
2) No hay mucha diferencia en la percepción de los usuarios sobre el rendimiento básico de la voz, como la activación, el reconocimiento y el análisis de los productos de los altavoces ( posiblemente debido al número insuficiente de marcas de altavoces propiedad de particulares) 1. El contraste no es sensible a la calidad del sonido, la riqueza de los recursos de contenido y la "inteligencia (inteligencia y diversión)").
3) La satisfacción y el cariño de los ponentes por parte de personas mayores y niños son factores importantes en la toma de decisiones de consumo.
4) Los usuarios extranjeros tienen mayores requisitos de calidad de sonido y tienen distinciones más claras en los escenarios de uso de los altavoces. Suelen equipar varios productos de altavoces para diferentes escenarios residenciales y no tienen muchos requisitos sobre si deben traer sus propias baterías. Los usuarios domésticos no tienen requisitos suficientes en cuanto a calidad del sonido y nivel de reconocimiento, y esperan traer sus propias baterías para facilitar la movilidad.
5) Los usuarios esperan que las palabras de activación se puedan personalizar, que los recursos de contenido sean más ricos y que los recursos y el contenido estén conectados entre sí.
1) Ventas de altavoces: Los envíos globales de altavoces inteligentes en 2017 fueron de 3200 W, de los cuales Amazon y Google se repartieron el mercado en una proporción de aproximadamente 9:1. Las ventas de altavoces de Amazon han superado los 20 millones y su circulación y número de dispositivos activos están muy por delante del mundo. A finales de abril de 2018, las ventas de los fabricantes nacionales estaban lideradas por Tmall y Xiaomi, con pedidos de 2 millones, mientras que nuevas empresas como Baidu y Tencent estaban todas por debajo de 100.000. Los grandes fabricantes con circuitos cerrados ecológicos y plataformas tecnológicas tienen "costos". "tendencia de distribución efectiva", ocupando el mercado de usuarios rápidos a precios bajos. Según un pronóstico conservador de Conax Analyst, las ventas mundiales de altavoces aumentarán a 5.630 unidades en 2065-2008. Las ventas en Estados Unidos, el principal campo de batalla, alcanzarán las 3.840 unidades, y las ventas en China, el segundo mercado más grande, alcanzarán las 4,4. millones de unidades.
2) Cobertura de funciones: las funciones de los productos de altavoces inteligentes son obviamente homogéneas y se dividen principalmente en tres direcciones principales: habilidades de contenido, habilidades de herramientas y entretenimiento interactivo con circuitos cerrados y tecnología ecológicos; las plataformas utilizan la voz La plataforma de tecnología de inteligencia artificial con tecnología como núcleo está integrada en un sistema operativo estilo Android / ios, lo que atrae a más fabricantes de hardware inteligentes y desarrolladores independientes para que se instalen en vista del hecho de que no hay una brecha obvia en; A nivel técnico, la transferibilidad de los desarrolladores de habilidades, la tecnología y las habilidades no es un factor clave para ganar.
3) Comentarios de los usuarios: la aceptación general en el mercado de los productos de altavoces inteligentes es alta, con una matriz de evaluación de 70 a 805 estrellas la percepción de los usuarios sobre el rendimiento básico de la interacción de voz no es muy diferente, como por ejemplo; tasa de éxito al despertar, reconocimiento y análisis, etc., pero es más sensible a dimensiones como la calidad del sonido, la riqueza de los recursos de contenido, la inteligencia y el interés del hablante. Al mismo tiempo, las expectativas de los usuarios siguen aumentando y plantean requisitos cada vez más personalizados para los productos de altavoces.