OpenAI lanza actualizaciones para la inferencia en tiempo real en audio, visión y texto
Según Cointelegraph, OpenAI realizó cuatro actualizaciones a sus modelos en octubre para ayudar a sus modelos de IA a llevar a cabo mejor las conversaciones y mejorar el reconocimiento de imágenes. La primera gran actualización es una API en tiempo real que permite a los desarrolladores crear aplicaciones de voz generadas por IA utilizando un solo aviso, lo que permite conversaciones naturales similares a los patrones de habla avanzados de ChatGPT. Anteriormente, los desarrolladores tenían que "unir" múltiples modelos para crear estas experiencias. La entrada de audio generalmente necesita ser completamente cargada y procesada antes de recibir una respuesta, lo que significa que las aplicaciones en tiempo real, como las conversaciones de voz a voz, tienen alta latencia. Con las capacidades de transmisión de la API en tiempo real, los desarrolladores ahora pueden realizar interacciones instantáneas y naturales, al igual que un asistente de voz. Ejecutándose en GPT-4, que se lanzará en mayo de 2024, la API permite inferencia en tiempo real a través de audio, visión y texto. Otra actualización incluye herramientas de ajuste fino para desarrolladores que les permiten mejorar las respuestas de IA generadas a partir de entradas de imagen y texto. El ajustador fino basado en imágenes permite a la IA comprender mejor las imágenes, lo que lleva a una búsqueda visual mejorada y detección de objetos. El proceso incluye retroalimentación de humanos que proporcionan ejemplos de buenas y malas respuestas para el entrenamiento. Además de las actualizaciones de voz y visión, OpenAI ha introducido "destilación de modelos" y "almacenamiento en caché de señales", que permiten a los modelos más pequeños aprender de los más grandes y reducir los costos y el tiempo de desarrollo al reutilizar texto procesado. OpenAI espera que los ingresos aumenten a $11.6 mil millones el próximo año, frente a los $3.7 mil millones proyectados para 2024, según Reuters.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
NYSE presenta petición a la SEC para convertir Grayscale Litecoin Trust en un ETF al contado
En tendencia
MásPrecios de las criptos
Más![Bitcoin](https://img.bgstatic.com/multiLang/coinPriceLogo/bitcoin.png)
![Ethereum](https://img.bgstatic.com/multiLang/coinPriceLogo/ethereum.png)
![Tether USDt](https://img.bgstatic.com/multiLang/coinPriceLogo/0208496be4e524857e33ae425e12d4751710262904978.png)
![XRP](https://img.bgstatic.com/multiLang/coinPriceLogo/ripple.png)
![Solana](https://img.bgstatic.com/multiLang/coinPriceLogo/solana.png)
![BNB](https://img.bgstatic.com/multiLang/coinPriceLogo/binance.png)
![USDC](https://img.bgstatic.com/multiLang/coinPriceLogo/usdc.png)
![Dogecoin](https://img.bgstatic.com/multiLang/coinPriceLogo/dogecoin.png)
![Cardano](https://img.bgstatic.com/multiLang/coinPriceLogo/cardano.png)
![TRON](https://img.bgstatic.com/multiLang/coinPriceLogo/tron.png)