¿Es efectivamente la herramienta digital "más flexible", "más capaz" y "más grande" jamás creda, como describe Google?
¿Es momento de que Open-AI se ponga a temblar por temor a ser destronado en los modelos de lenguaje? ¿Alphabet Inc está preparado para competir al nivel del famoso ChatGPT?
No hay respuestas concretas, pero por lo pronto podemos afirmar que Google lanzó su modelo de lenguaje multimodal más avanzado y fue denominado como Gemini, que promete ser una locura, algo jamás visto hasta el momento.
Gemini está disponible en tres versiones, una muy básica para celulares, Gemini Nano; otra más avanzada, Gemini Pro, y que sería equivalente al ChatGPT en su versión gratuita; y finalmente Gemini Ultra, que es la versión más compleja y avanzada y que llegará en 2024.
Gemini Nano en los celulares de la compañía Pixel 8 y Gemini Pro está funciona en Bard, la alternativa de google a ChatGPT. Eso sí, el último modelo sólo aparece en inglés y a quienes se encuentran físicamente en Estados Unidos; por lo que no hay más remedio que imitar ambas premisas si quieres acceder desde otros países.
¿Qué pasa con la versión Ultra? Para demostrar las capacidades Google mostró varios vídeos destacando sus ventajas multimodales (la capacidad de entender una combinación de texto, lenguaje hablado o imágenes y video).
Según los videos publicados por la propia plataforma, la herramienta es capaz de nutrirse de todos los contenidos que tiene la compañía: vídeos de youtube, imágenes, texto... para dar una respuesta lo más certera posible y, además, en cualquiera de estos formatos.
De esta manera, si una persona le muestra una foto o video de un ovillo de lana y le pregunta qué se podría hacer con ella, el chat le devolverá una imagen con la potencial creación y los pasos a realizar.
Pero como afirma el dicho popular 'cuando la limosna es grande hasta el santo desconfía' y resulta que los sorprendentes videos son meramente ilustrativos, dijo Google en un comunicado ante las numerosas críticas recibidas.
Aunque hay que leer la letra chica porque la descripción en el canal de Youtube incluye una breve línea que indica: "con fines de esta demostración, se ha reducido la latencia y se han acortado los resultados de Gemini para mayor brevedad". Sin embargo, esta nota no se incluye en el video utilizado durante la presentación.
¿Qué pasará con esta plataforma? ¿Llegará a ser tan brillante como promete? Hagan sus apuestas porque en el 2024 tendremos la respuesta.
