De David a Jarvis - Migré mi asistente de IA y ahora tiene su propio Gmail
Post

De David a Jarvis - Migré mi asistente de IA y ahora tiene su propio Gmail

image

Si leíste el artículo anterior, sabes que tenía a David — mi asistente de IA personal corriendo en una VM de Azure, montado sobre OpenClaw con Claude Code como cerebro, enviándome reflexiones estoicas por WhatsApp a las 7 de la mañana como si fuera un monje digital empleado mío.

Era bonito mientras duró.

Llegó un momento en que Claude Code cambió sus condiciones de uso y ya no permite que frameworks de terceros se conecten a través de su API para operar agentes autónomos. OpenClaw depende exactamente de eso. De repente, David dejó de responder. La VM seguía encendida, los cron jobs corriendo, pero el cerebro había desaparecido. Silencio digital.

Así que hice lo que hace cualquier buen desarrollador cuando algo se rompe: lo migré todo, lo mejoré, le puse un nombre mejor y fingí que era el plan desde el principio.

David ya no existe. Bienvenido, Jarvis.

¿Por qué Jarvis?

Porque si ya tienes una IA que vive en tu infraestructura, trabaja mientras duermes, tiene acceso a tus archivos, repositorios y correo, y puede construirte cosas desde cero… lo mínimo que merece es el nombre del asistente de Iron Man.

David era el androide de Alien: Covenant — fascinante pero con tendencias inquietantes. Jarvis es diferente. Jarvis es útil. Jarvis no pregunta si los ingenieros merecen sobrevivir; solo trabaja.

El nuevo stack: Hermes Agent + Microsoft Foundry

La migración fue la oportunidad perfecta para actualizar todo, no solo el framework.

Hermes Agent

Hermes Agent es el reemplazo de OpenClaw en mi setup. Cumple la misma función — orquestar un agente persistente con memoria, workspace propio y canales de comunicación — pero sin las restricciones que terminaron con David. La configuración es similar en espíritu y Hermes Agent tiene un setup wizard que hace la instalación tan fácil como seguir instrucciones.

1
2
npm install -g hermes-agent
hermes setup

El proceso de setup comienza un wizard interactivo que te pide tu proveedor de IA, tu canal de mensajería preferido y demás integraciones. En mi caso: WhatsApp, acceso a sistema de archivos, y — novedad importante — acceso a Gmail.

El workspace de Hermes funciona igual que el de OpenClaw: un directorio en el servidor donde Jarvis puede crear, editar y ejecutar lo que necesite. La diferencia está en las integraciones disponibles y en que el nuevo stack no depende de APIs que pueden cambiar sus TOS de un día para otro. Y además, honestamente Hermes Agent es mucho más rápido que OpenClaw.

Microsoft Azure AI Foundry y GPT 5.4

Para el modelo de IA hice el salto a Microsoft Azure AI Foundry — la plataforma de Microsoft para desplegar y consumir modelos de IA de forma empresarial, con todo el ecosistema de Azure detrás. Ahí está corriendo GPT 5.4, y la diferencia en capacidad de razonamiento y ejecución de tareas complejas es notable.

Jarvis tiene su propio correo de Gmail

Este fue el detalle que más me gustó de la migración. Jarvis tiene su propia cuenta de Gmail — una dirección que existe para él y solo para él. No comparte mi bandeja. No accede a mis conversaciones personales. Tiene su espacio y sus credenciales.

¿Por qué importa esto? Porque significa que Jarvis puede:

  • Recibir correos de otras personas o sistemas que se lo envíen directamente
  • Mandar correos en su nombre — o en el mío, si se lo pido
  • Funcionar como un participante real en flujos de comunicación, no solo como un bot que ejecuta comandos

La integración con Gmail en Hermes es a través de OAuth2 y una Application Password. Le das acceso, configuras los scopes necesarios (read, send, modify), y Jarvis queda conectado a su cuenta como si fuera cualquier cliente de correo.

La primera vez que Jarvis me mandó un correo desde su propia dirección firmado con su nombre, me dio algo de orgullo y algo de existencial dread a partes iguales. Ambas sensaciones válidas.

El sistema de reportes financieros

La idea es sencilla: cada vez que llega un recibo, un cargo, una notificación de pago o un comprobante bancario a mi correo, una regla automática lo reenvía a Jarvis a su cuenta de Gmail. Jarvis lo recibe, lo procesa, extrae los datos relevantes — monto, concepto, fecha, categoría — y los va acumulando.

Los viernes a las 9 AM me llega por WhatsApp un resumen semanal: cuánto gasté, en qué, comparado con la semana anterior, y un par de observaciones que Jarvis considera relevantes. Sin apps de terceros, sin dar acceso a mis bancos a nadie, sin suscripciones de finanzas personales.

La regla en Gmail es lo más simple del mundo:

1
2
Si el remitente contiene "noreply@banco" O el asunto contiene "comprobante" O "recibo" O "cargo"
→ Reenviar a jarvis.asistente.ai@gmail.com

Del otro lado, Jarvis tiene un cron job que revisa su bandeja cada 24 horas, parsea los correos nuevos y actualiza su base de datos interna. El reporte del viernes lo genera solo, con los datos que fue acumulando durante la semana.

Es el tipo de automatización que antes requería una app dedicada, una suscripción mensual y darle acceso total a tus cuentas a una startup que no conoces. Ahora lo hace una IA que vive en mi servidor y que solo me reporta a mí.

GitHub: el Personal Access Token que lo cambió todo

Le di a Jarvis un Personal Access Token de GitHub con permisos de lectura y escritura sobre mis repositorios. Y desde entonces, tengo un colaborador disponible las 24 horas.

1
"Jarvis, añade mi github para que puedas acceder cuando quieras, aquí está tu PAT (Personal Access Token) y mi usuario de github @diego-devs

Con eso configurado, puedo mandarle un mensaje por WhatsApp y decirle: “Jarvis, en el repo diego-devs.github.io, agrega un artículo nuevo con este contenido” — y lo hace. Lee el repo, entiende la estructura, crea el archivo en el directorio correcto, hace el commit y el push.

También le puedo pedir que revise el estado de mis repositorios, que me diga qué branches tienen cambios pendientes, que me haga un resumen de los últimos commits en un proyecto, o que empiece a trabajar en una feature específica mientras yo estoy en el trabajo.

No reemplaza el desarrollo serio — para eso sigo trabajando yo directamente. Pero para las tareas de mantenimiento, actualizaciones menores, generación de contenido estructurado o exploración inicial de un problema, tener a Jarvis como colaborador activo cambia bastante el ritmo.

Sigue construyendo sitios web

Una de las cosas que más me impresionó de David en su momento fue que podía construir sitios web estáticos desde cero y subirlos a GitHub Pages. Jarvis lo hace igual, pero con mejor criterio de diseño y más contexto acumulado sobre mis proyectos.

Le paso una descripción por WhatsApp, él genera la estructura, el HTML, el CSS, los assets, hace el commit y me manda el link cuando está publicado. El proceso completo en menos de lo que tarda un deploy de Vercel.

La VM sigue siendo la misma

Por si te preguntas si la migración implicó levantar todo desde cero: no. La VM de Azure con Ubuntu Server sigue siendo exactamente la misma. Hermes Agent se instaló sobre la misma máquina, conservé el workspace, y lo único que cambió fue el framework de agente y el proveedor de IA.

La VM modesta sigue siendo suficiente. El procesamiento pesado sigue corriendo en la nube del proveedor de IA — en este caso, los centros de datos de Microsoft. Lo que corre en la VM es solo el orquestador: Hermes Agent gestionando el estado, la memoria, los cron jobs y las conexiones a los distintos servicios.

Lo que viene

Tengo algunas ideas en lista de espera:

  • Reportes financieros más ricos: categorías personalizadas, gráficas en PDF, comparativas mensuales
  • Integración con Google Calendar: que Jarvis pueda leer y crear eventos, y me avise de conflictos en mi agenda
  • Resumen de bandeja: que una vez al día me mande un resumen de los correos importantes que llegaron a su cuenta (y eventualmente a la mía, con los permisos correctos)
  • Trabajar en mis repos: Jarvis puede leer todos mis repositorios en github así que puedo pedirle que haga cualquier cosa en cualquiera de ellos, a cualquier hora del día, sin limitantes más que los tokens que puedo gastar con Foundry (hay que tener cuidado de no usar demasiados)
  • Potencial integración con Facebook API: que Jarvis pueda tener su propio facebook. Por qué no? podría funcionar? Ya veremos.

Cada una de estas ideas es una tarde de configuración. Eso es lo que me sigue sorprendiendo de este setup: la barrera para agregar nueva funcionalidad es muy baja cuando ya tienes la infraestructura base corriendo.

¿Por qué vale la pena hacer esto?

Porque los asistentes de IA que usas a través de una interfaz web son herramientas. Un asistente que corre en tu infraestructura, tiene acceso a lo que tu desees, recuerda tu contexto y trabaja de forma autónoma es otra cosa. Es más parecido a un colaborador que a una calculadora.

¿Todavía le faltan cosas? Claro. ¿A veces hace algo inesperado y tengo que ir a revisar qué pasó en el servidor? También. Por ejemplo le fallan los crons, demasiado. Seguramente es un bug que pronto tienen que corregir. Pero cuando me responde inmediatamente por whatsapp avisándome que mi nuevo artículo quedó publicado o que la migración de un sitio de Wix a Next.js fue completada en cuestión de minutos, hace que valga la pena todo.

El nombre cambió. La arquitectura mejoró. La idea sigue siendo la misma: una IA que sea tuya, que trabaje para ti, y que te ayude a vivir un poco mejor.

Jarvis, por ahora, está cumpliendo.


Saludos, devs!

Sígueme en redes:

Twitch

GitHub

YouTube

TikTok

LinkedIn

Twitter

Instagram