Se han escrito ríos de tinta sobre el nuevo chatgpt y lo que mejora chatgpt 4 a su versión anterior. Y encontré un ejemplo en linkedin que lo explicaba a la perfección.
Chatgpt es:
- miles de veces más rápido
- cien veces más exacto (dado el mayor número de parámetros)
- capaz de entender directamente "imágenes" (idioma Kosmos-1).
El ChatGPT actual solo puede leer texto, por lo que su actualización hará posible que pueda manejar texto + imágenes + audio. Algunos ejemplos son los siguientes:
a) Enviar una imagen de árboles, pájaros volando, un cielo azul. El modelo de imagen arroja el texto: "árboles, pájaros volando, cielo azul, día soleado".
b) Enviar un clip de audio de personas hablando y corriendo, perros Ladrando. El modelo de audio arroja el texto: "Personas hablando, pasos corriendo, perros ladrando".
c) Con los dos outputs combinados, se pregunta a sí mismo "Veo árboles, pájaros volando, cielo azul, día soleado. Oigo personas hablando, pasos corriendo y perros ladrando. ¿Dónde estoy?" Y responde "Estoy en un parque".
¿Queda claro, no?
Más listo, más rápido y maneja distintos tipos de lenguajes (imágenes, audio y vídeo).
A nivel de lo que nos aplica, ideas para negocios.
Imaginar que sóis el chef de un restaurant. Y hoy, algún proveedor ha fallado y la cocina tiene que espabilarse con lo que tiene. Con una foto de los alimentos disponibles, chatgpt4 puede darnos una lista de sugerencias de recetas para ofrecer a los clientes de nuestro negocio.
O si tienes una tienda ecommerce, podrías habilitar una función en la que el usuario en lugar de búsqueda por texto o audio, pueda subir una imagen con la foto del objeto que está buscando para comprar. Y vía chatgpt, vería los productos disponibles en ese ecommerce.
Esto cada vez se pone más interesante, ¿verdad?