Los usuarios ahora pueden hablar con el asistente de IA desde el navegador. Quiénes tienen acceso y cuáles son los detalles de la función.
La función en ChatGPT se lanza en primera instancia para los suscriptores.
Desde su lanzamiento a fines de 2022, ChatGPT se ha consolidado como el paradigma de la Inteligencia Artificial Generativa. Y para mantener ese dominio, OpenAI, la organización que desarrolla el chatbot, lanza cambios y mejoras en forma periódica. Esta semana, el grupo estadounidense sigue esa tradición y anuncia la llegada del modo de voz en la versión web, es decir, aquella que corre en navegadores.
El director de productos de la empresa, Kevin Weil, fue el encargado de realizar el anuncio en la red social X, e incluyó un video que muestra detalles de la función.
ChatGPT lanza el modo de voz en los navegadores web
¿El modo de voz en ChatGPT ya estaba disponible en otras versiones? En septiembre, el grupo que dirige Sam Altman había lanzado esta función en móviles, tanto en iOS y Android.
¿Qué implica este paso anunciado por OpenAI? Los usuarios que usan ChatGPT desde el navegador (Chrome, Edge, Safari, Firefox, etcétera) ahora pueden interactuar con el chatbot a través de comandos verbales.
¿Cuál es la ventaja del modo voz en ChatGPT? Las interacciones en voz alta permiten, generalmente, una mayor naturalidad y fluidez en los sistemas conversacionales.
¿Cómo se usa esta función para hablar con la IA? Hay que seleccionar el ícono de voz que aparece en la sección inferior derecha de la ventana de mensajes. También se pedirá permiso para que el navegador acceda al micrófono de la computadora.
¿Quiénes acceden a esta novedad en el chatbot? En el primer despliegue, el cambio se lanza para los usuarios que pagan una suscripción. Según TechCrunch, el modo de voz en ChatGPT empieza a estar disponible, en tanto, para los clientes a los planes Plus, Enterprise, Teams y Edu. La buena noticia es que, de acuerdo a Weil, llegará a todos los usuarios (es decir, a los que no pagan) en las próximas semanas.
Modo de voz en ChatGPT: más detalles de la función
Tanto en los dispositivos móviles como ahora en los navegadores, esta opción del chatbot es parte de las mejoras que llegaron con el modelo de lenguaje GPT-4o. Tal como contamos en TN Tecno en ocasión de aquel lanzamiento, esa tecnología no solo comprende el habla humana, sino que además interpreta señales no verbales, por ejemplo la velocidad de un discurso o pedido, e incluso las emociones de los usuarios.
También promete naturalidad en las interacciones, por caso al permitir interrupciones, tal como ocurre en las conversaciones entre humanos.
Los usuarios de esta función en ChatGPT pueden elegir entre nueve voces diferentes, cada una con su propio tono e incluso carácter. Eso sí: en la lista no aparece la voz que se parecía (demasiado) a la de Scarlett Johansson en la película Her, tras el divulgado pleito entre la actriz y OpenAI.