Google ha vuelto a revolucionar el panorama de la inteligencia artificial con una serie de actualizaciones significativas en su ecosistema Gemini. Estas innovaciones no son meros ajustes, sino la introducción de herramientas que prometen transformar la productividad, la navegación web y la creación de contenido. Desde agentes autónomos que orquestan flujos de trabajo complejos hasta un navegador que opera de forma independiente y un cuaderno inteligente que integra fuentes de información de manera fluida, la compañía está redefiniendo los límites de lo que la IA puede lograr.
Agentes Gemini: Automatización Inteligente para Empresas
Uno de los pilares de esta renovación es el nuevo constructor de agentes de Google, una plataforma segura que facilita la creación, implementación y gestión de asistentes de IA. Estos agentes están diseñados para tareas empresariales reales, ofreciendo soluciones a medida para diversas necesidades:
-
Deep Research
Reduce drásticamente el tiempo de investigación, pasando de semanas a horas.
Data Insights
Transforma hojas de cálculo en información práctica y actionable.
*
Notebook LM Enterprise
Acelera el intercambio de conocimientos dentro de los equipos de trabajo.
*
Gemini Code Assist
Brinda soporte avanzado a desarrolladores en sus proyectos de codificación.
Además de los agentes preconfigurados por Google, las empresas pueden diseñar sus propios asistentes personalizados, definiendo objetivos, instrucciones y concediendo acceso a datos y herramientas específicas. Esto permite automatizar tareas repetibles y complejas, desde la preparación de briefings para reuniones de clientes hasta la gestión de campañas de marketing.
Un ejemplo ilustrativo de su capacidad es la planificación de una campaña de Halloween. El agente puede:
1. Realizar una investigación de mercado para identificar tendencias.
2. Detectar problemas como la falta de stock y generar pedidos de reposición.
3. Coordinar la comunicación, redactando correos y agendando reuniones.
4. Generar contenido creativo, como imágenes y videos para redes sociales, siguiendo las directrices de marca.
El valor de estos agentes reside en su capacidad para orquestar múltiples subagentes especializados (investigación, stock, comunicación, contenido) y ejecutar acciones directas en herramientas reales, todo bajo un control estricto de permisos y con un registro detallado de cada acción. La suscripción a estos servicios está disponible en los planes Gemini Business y Gemini Enterprise, con costos de $21 y $30 por asiento, respectivamente.
Notebook LM: Tu Cuaderno Inteligente al Alcance de la Mano
Notebook LM ha recibido una actualización significativa que mejora la captura y procesamiento de información. Ahora, con un simple toque desde el teléfono móvil, es posible guardar contenido de cualquier página web, PDF o video de YouTube directamente en un cuaderno de Notebook LM.
-
Integración Perfecta
Ya no es necesario copiar y pegar enlaces; la función de compartir en iOS y Android permite añadir fuentes al instante.
Funcionalidades Avanzadas
Una vez dentro del cuaderno, los usuarios pueden hacer preguntas, generar resúmenes, preguntas frecuentes, briefings, índices o mapas mentales, e incluso crear tarjetas didácticas o resúmenes de audio/video.
*
Compartido Público
La posibilidad de compartir cuadernos públicamente mediante un enlace facilita la distribución de dossiers a clientes o equipos, permitiendo interactuar con las fuentes sin editar el material original.
*
Comprensión Mejorada
Notebook LM ahora es capaz de entender imágenes y gráficos dentro de los PDFs, no solo el texto.
Es importante destacar que la aplicación móvil ofrece menos funciones que la versión web y que las fuentes guardadas son copias estáticas, excepto los archivos de Drive, que sí pueden sincronizarse. Por el momento, Notebook LM es gratuito, lo que lo convierte en una herramienta potente para la gestión del conocimiento.
Gemini 2.5 Computer Use: La IA que Navega por Ti
El modo Computer Use de Gemini 2.5 representa un salto cualitativo en la interacción entre la IA y las interfaces reales. Este agente es capaz de realizar acciones como hacer clic, escribir, arrastrar y rellenar formularios en la web, imitando el comportamiento humano con una precisión y velocidad impresionantes.
En pruebas comparativas con modelos como Anthropic Claude 4 y 4.5, y el Computer Use de OpenAI, Gemini 2.5 ha demostrado un rendimiento superior o igual en la mayoría de las métricas, alcanzando hasta un 88% de éxito en tareas web. Esto no solo se traduce en mayor velocidad, sino también en una interpretación más precisa de la interfaz y una menor tasa de errores.
El funcionamiento se basa en un bucle de agente: recibe una instrucción, toma capturas de pantalla, decide el siguiente paso, lo ejecuta y el entorno devuelve una nueva captura para que continúe hasta completar la tarea. Si una acción es sensible, solicita confirmación al usuario.
Un caso práctico es el ejemplo del «PETSPA», donde el agente recibe la instrucción de buscar mascotas en California y añadirlas al CRM del spa. Gemini 2.5 navega de forma autónoma por la web del spa, rellena los campos del formulario, selecciona fechas y especies, y programa una cita de seguimiento, mostrando en tiempo real el razonamiento detrás de cada acción.
Los usuarios pueden probar esta tecnología en arena.browserbase.com
, donde es posible comparar el rendimiento de Gemini 2.5 con otros modelos en tiempo real, sin necesidad de código ni cuentas empresariales. Esto abre un mundo de posibilidades para la automatización de tareas web y la interacción con entornos digitales.
Canvas Renovado de Gemini: Creación Web Inteligente
El Canvas de Gemini, aunque con algunas semanas en funcionamiento, sigue siendo una herramienta impresionante para la creación de páginas web. Ahora, permite editar la página por partes, enfocándose en bloques específicos y añadiendo funciones de inteligencia artificial directamente en el diseño.
-
Personalización Dinámica
Es posible insertar funcionalidades de IA que personalizan el mensaje de la página según el perfil del visitante o generan contenido a medida en tiempo real.
Edición por Bloques
Los usuarios pueden seleccionar secciones específicas de una landing page y solicitar cambios o integrar funciones de IA sin afectar el resto del proyecto.
*
Ejemplo Práctico
Una landing page para un minicurso gratuito puede incluir un selector que cambie dinámicamente el titular, subtítulo y call to action según si el visitante es un youtuber, una agencia, un solopreneur o un equipo.
*
Generación de Contenido Instantánea
Se puede añadir una sección inteligente donde el usuario introduce su nicho o tema principal, y la IA genera un plan de acción inicial con módulos adaptados, ideas de contenido y un plan semanal.
El Canvas transformado de Gemini va más allá de ser un simple editor, convirtiéndose en una plataforma donde la IA se integra funcionalmente en la propia página, ofreciendo personalización y generación de contenido instantánea. Estas innovaciones de Google ofrecen atajos de productividad que ya están disponibles para ser explorados y aprovechados en diversos contextos, desde el marketing digital hasta la gestión empresarial.