Hermes Agent: cómo montar tu propio agente de IA personal en un VPS
Hace unos meses, cuando empezó toda la fiebre de los agentes de IA, casi todos hablaban de OpenClaw como el primer asistente autónomo serio. El problema es que OpenClaw es complicado de instalar, trae bastantes errores y la experiencia de configuración no es la mejor. Por eso ganó tanta tracción Hermes Agent, un competidor directo creado por Nous Research: es open source igual que OpenClaw, pero mucho más fácil de instalar, con comandos más simples y avanzando muy rápido.
En este artículo te dejo el paso a paso completo y todos los comandos listos para copiar y pegar del video, donde instalamos Hermes en un VPS desde cero, lo conectamos con Telegram y lo dejamos corriendo 24/7 como tu asistente personal.
Si prefieres probarlo primero en tu propia máquina (Windows incluido) antes de montar un servidor, tienes el video introductorio en mi canal. Aquí vamos directo al enfoque "de producción": un agente que vive en la nube y al que le hablas desde donde sea.
¿Qué es un agente de IA (y qué no es Hermes)?
De forma resumida, un agente de IA es la suma de un modelo inteligente + la ejecución de herramientas. Esas herramientas pueden ser comandos de consola, programas adicionales, acceso a internet, etc.
Hay muchos proyectos en este espacio, pero no todos pertenecen a la misma categoría:
- OpenCode, Codex, Claude Code → su objetivo principal es escribir código. Son competidores entre sí enfocados en programación.
- OpenClaw y Hermes → son asistentes personales. Pueden escribir código, sí, pero su foco real es hacer cosas por ti: responder un correo, investigar durante horas, conectarse a una plataforma y analizar datos, y luego avisarte por Telegram o WhatsApp.
Punto importante: si tu objetivo es desarrollar aplicaciones de forma seria, Hermes puede hacerlo, pero te recomiendo herramientas más enfocadas en código como OpenCode o Codex. Hermes brilla como asistente, no tanto como editor de código (más adelante explico por qué).
Hermes no trae modelo: tú le pones el cerebro
Al ser open source, Hermes no viene con ningún modelo inteligente incluido. Tú le conectas el tuyo. Opciones:
- Suscripción de ChatGPT (te da acceso a Codex)
- API de Claude, Grok o Gemini
- OpenRouter (un conjunto de modelos en un solo lugar)
- Modelos chinos como Kimi o MiniMax
- Nous Portal (la propia empresa detrás de Hermes), que al momento de grabar ofrecía acceso gratuito a Qwen — puede que ya no esté disponible cuando leas esto
Esta es justamente la ventaja del open source: no estás atado a ningún modelo.
Estándares modernos: skills y MCP
Hermes soporta los estándares actuales de agentes:
- Skills: configuraciones/conocimiento que se cargan solo cuando hacen falta. Puedes crearlos tú o dejar que Hermes los cree por ti al darle tareas grandes. Puedes tener miles instalados sin saturar el contexto.
- MCP: la forma de conectar el modelo con proveedores externos (requiere más pasos, no lo cubro en este video).
- CLIs / herramientas de consola: como el servidor permite instalar programas, puedes añadir el CLI de Stripe, de PayPal, herramientas para testear con navegador, etc.
¿Por qué un VPS y no tu laptop?
Para que un agente reciba mensajes por Telegram/WhatsApp en cualquier momento, tiene que estar en una máquina encendida el 100% del tiempo. Tu laptop personal no lo está: la apagas y se cae el agente.
Por eso el enfoque correcto es instalarlo en un VPS (Virtual Private Server). Tu laptop pasa a ser solo un cliente: abres la consola, el dashboard web o Telegram, pero Hermes vive en el servidor, con todo un entorno Linux que puede manipular (crear webs, levantar Docker, instalar bases de datos, e incluso cambiar su propia configuración).
Para el video usé Hostinger porque es popular y muchos ya lo conocen, pero puedes usar cualquier proveedor de VPS.
💡 Recomendación de plan: el KVM 2 (12 vCPU, 8 GB RAM) es más que suficiente para una instalación web + agente de IA. Al pagar puedes usar el cupón FAZT para un 10% de descuento. Enlace en la descripción del video.
Requisitos
- Un VPS con Linux (la mayoría lo son).
- Acceso root por SSH con contraseña.
- Una suscripción o API de algún modelo de IA.
- Una cuenta de Telegram (opcional pero recomendado para la mensajería).
Paso 1 — Conectarte al VPS
Si no recuerdas la contraseña root, en Hostinger puedes regenerarla desde el panel del VPS (usa símbolos y números).
# Conéctate por SSH (igual en Windows, macOS y Linux)
ssh root@TU_IP_DEL_SERVIDOR
Escribe yes, luego la contraseña. Ya dentro, actualiza el sistema:
sudo apt update && sudo apt upgrade -y
Paso 2 — Crear un usuario sin root
Los agentes de IA (y muchos programas) no permiten ejecutarse cómodamente como root. Creamos un usuario propio y le damos privilegios sudo.
# Crea el usuario (cambia "fazt" por el tuyo)
adduser fazt
# Dale privilegios de administrador
usermod -aG sudo fazt
# Verifica que esté en el grupo sudo
groups fazt
Sal de la sesión (Ctrl + D) y vuelve a entrar con el usuario nuevo:
ssh fazt@TU_IP_DEL_SERVIDOR
Paso 3 — Instalar Hermes
Los comandos de instalación son los mismos para Linux, macOS y WSL (y por eso sirven en el VPS). Cópialos de la documentación oficial:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Lo genial del instalador es que analiza el servidor y descarga lo que falte: una versión específica de Python, Git, Node, ripgrep (búsquedas rápidas de archivos), ffmpeg (para mensajes de voz), etc. Te pedirá la contraseña del usuario y confirmar algunas instalaciones (responde y).
Paso 4 — Quick Setup (conectar el modelo)
Al terminar, el instalador te ofrece dos modos. Elige Quick Setup (recomendado), que es mucho más práctico — siempre puedes reconfigurar después.
Proveedor de IA: aparecen GitHub Copilot, OpenAI Codex, DeepSeek, Google AI, Nous Portal, etc. Si lo ves en las primeras semanas y quieres gratis, prueba Nous Portal. En mi caso elegí OpenAI Codex:
- Te da una URL y un código. Ábrela, autentícate con tu cuenta de ChatGPT, pega el código y autoriza.
- Esto te habilita los modelos más nuevos (en mi caso GPT-5.5).
Backend de ejecución: Hermes puede correr en Docker, Daytona, Vercel Sandbox, etc. Como ya estás en un VPS dedicado a la IA, elige
keep current/ local (ejecutar Hermes en esta misma máquina).Gateway working directory: el gateway es el puente entre las apps de mensajería (Telegram, WhatsApp, web, consola) y el agente. Acepta el directorio por defecto con Enter.
Soporte sudo: responde
ypara que Hermes guarde la contraseña y pueda instalar programas sin estar preguntando a cada rato.
Recarga el shell con el comando que te indica y verifica:
# Recarga el entorno (ejemplo; usa el que te muestre Hermes)
source ~/.bashrc
hermes --version
Paso 5 — Configurar Telegram
Para conectar Telegram necesitas dos cosas: el token de un bot y tu user ID.
1) Crear el bot — busca en Telegram a @BotFather (el oficial, con check), pulsa Start y usa:
/newbot
Dale un nombre (ej. My Hermes Faztbot). Te devolverá un token — cópialo.
2) Obtener tu user ID — busca a @userinfobot, pulsa Start y copia el ID que te muestra.
3) Configurar el gateway:
hermes gateway setup
Selecciona Telegram (barra espaciadora), pega el token, luego pega tu user ID (deja solo tu usuario autorizado, no lo dejes abierto), y márcalo como canal home.
Paso 6 — Dejar el gateway corriendo 24/7 (system service)
Para que el agente escuche siempre, instálalo como system service (arranca con el servidor). Esto requiere privilegios root, así que Hermes te dará dos comandos para ejecutar como root.
# Cambia a root
su - root
# Si Hermes no existe para root, reinstálalo (mismo comando de antes)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Durante esa reinstalación elige Full Setup y salta todas las configuraciones (puedes pulsar Ctrl + C o ir dando "mantener configuración actual"): solo necesitas el binario para registrar el servicio. Luego ejecuta los dos comandos que te dio Hermes para instalar el servicio. Al terminar, vuelve a tu usuario normal:
exit # o: su - fazt
Finalmente, arranca el gateway:
hermes gateway
Ahora abre tu bot en Telegram, pulsa Start y empieza a chatear. Ojo: la primera respuesta suele tardar un poco mientras carga.
Comandos esenciales de Hermes
hermes # Abrir el chat (interfaz de consola)
hermes dashboard # Abrir la interfaz web
hermes setup # Reconfigurar (añadir más modelos, etc.)
hermes setup gateway # Reconfigurar el gateway
hermes doctor # Diagnosticar configuración y herramientas
hermes auth # Gestionar credenciales (añadir/quitar proveedores)
Dentro del chat, los comandos van con /:
/new # Nueva sesión
/reset # Reiniciar la sesión
/clear # Limpiar la pantalla
/skills # Ver skills disponibles
/resume # Retomar una sesión anterior (por ID)
/model # Cambiar de modelo de forma interactiva
/profile # Ver o cambiar el perfil activo
/commands # Ver todos los comandos disponibles
Dashboard web desde el VPS
Como estás en un servidor (no en localhost), tienes que permitir conexiones externas. Hermes no lo hace por defecto salvo que se lo pidas con --insecure:
hermes dashboard --host 0.0.0.0 --insecure
Luego entra en http://TU_IP:PUERTO (Hermes te indica el puerto en pantalla; en el video fue el 9119).
Más abajo te explico cómo dejar el dashboard accesible de forma segura y permanente con Tailscale.
Tareas programadas (cron jobs)
Hermes puede ejecutar tareas en horarios fijos usando los cron jobs nativos de Linux, pero configurados por él. Puedes hacerlo con comando o conversando.
# Por comando
/cron add 30m "Recuérdame verificar los logs de proyectos, solo escríbeme un mensaje"
# Conversando (carga un skill para entender que quieres un cron)
Cada mañana a las 9 AM verifica Hacker News y envíame un resumen de las noticias de IA
Gestionar tus tareas:
/cron list # Listar tareas
/cron remove <ID> # Eliminar una tarea por ID
/cron pause <ID> # Pausar
/cron resume <ID> # Reanudar
Tipo de entrega (delivery): por defecto responde al canal donde lo pediste (local). Puedes pedirle que cambie el destino a all (todos los canales conectados: Telegram, WhatsApp, etc.) o a uno específico, simplemente conversando: "cambia el delivery de ese cron a all".
Perfiles (personalizar cómo responde)
Los perfiles te permiten fijar skills por defecto y definir cómo se comporta el agente. Desde el dashboard → Profiles → Create, puedes escribir su personalidad en español:
"Eres un agente técnico, responde puntualmente sin explicar cosas básicas."
Guárdalo y úsalo desde consola:
hermes profile list # Listar perfiles
hermes profile use tecnico # Activar el perfil "tecnico"
Con el perfil técnico, si preguntas "¿qué es GraphQL?" obtienes una respuesta concisa y al grano en lugar de un texto largo y verboso.
Vista Kanban (múltiples agentes en paralelo)
Una de las novedades de Hermes: lanzar varios agentes de forma visual desde un tablero estilo Kanban.
hermes kanban init
hermes dashboard --host 0.0.0.0 --insecure
Refresca la web y verás una pestaña Kanban. Cada columna tiene un propósito:
- Triage: ideas sueltas sin asignar.
- To Do: tareas que esperan una dependencia o asignación.
- Ready / Dispatch: al darle Dispatch, lanza un worker (agente) por tarea.
- In Progress: el agente trabajando; puedes abrir la tarjeta y ver los logs en vivo.
Puedes asignar cada tarea a un perfil (ej. "tecnico"). Nota práctica: el dashboard web a veces no tiene acceso sudo, así que tareas que requieren instalar paquetes pueden quedar bloqueadas — esas las resuelves mejor desde la terminal, que sí tiene permisos. Recuerda también que el VPS tiene RAM limitada: a más agentes y programas en paralelo, más RAM necesitas.
Skills y plugins
Desde el dashboard (pestaña Skills) puedes activar más capacidades:
- Skills por defecto: búsqueda, ejecución de programas, memoria (guarda información conforme conversas), generación de imágenes, etc. Puedes dejarlos todos activos: no cargan todos a la vez, sino solo cuando se necesitan.
- Plugins: parecidos a los skills, pero requieren instalar herramientas de consola adicionales (ej. Google Meet). Algunos aparecen como "no dashboard tab" porque no necesitan abrirse desde la web.
Añadir más modelos y cambiar de uno a otro
Puedes tener varios proveedores y alternar entre ellos:
hermes setup # Añade, por ejemplo, MiniMax pegando tu API key y eligiendo versión (M2.7)
Durante el setup te pregunta si quieres una credencial de fallback (otra API por si la primera falla) — opcional. Para cambiar de modelo sobre la marcha, dentro del chat:
/model # Abre el selector interactivo (ej. cambiar a MiniMax M2.7)
Gestionar credenciales (re-autenticar o quitar un proveedor):
hermes auth # Lista tus credenciales y te deja añadir/eliminar por ID
Modo objetivo: /goal
Muchos agentes ya tienen este patrón (OpenClaw, Codex…), inspirado en la técnica del "loop de Ralph": le das una tarea y el agente itera en bucle una y otra vez hasta considerarla terminada, en lugar de entregarte el primer intento. Es un consumo enorme de tokens, pero permite construir aplicaciones completas.
/goal Crea una web de seguimiento de finanzas personales. Usa SQLite como base de datos,
una API en Go, un frontend en Vite con React, autenticación básica de usuarios y ejecuta
los tests para que todo funcione.
En el ejemplo del video, esto cargó el skill de TDD (Test-Driven Development): primero escribió los tests, fallaron por no existir el código, y luego escribió el código hasta que pasaran. Terminó en ~17 minutos con backend (:8080) y frontend (:5173) por separado.
Configurar el número de iteraciones
El máximo de iteraciones vive en el archivo de configuración (por defecto 20, que es un buen estándar):
cat ~/.hermes/config.yml # Ver toda la configuración
hermes config edit # Editar (busca la sección "goals")
Solo súbelo (30, 40, 50…) si sabes que una tarea grande necesita más vueltas y tu suscripción lo soporta.
Instalar CLIs adicionales (ejemplo: GitHub CLI)
Hermes puede usar herramientas de consola que instales en el servidor. Para que cree repos en GitHub, primero instala gh y autentícate. Sigue las instrucciones oficiales para Linux:
# (Sigue el bloque de comandos de la web oficial de GitHub CLI)
sudo apt update
sudo apt install gh -y
gh --version
gh auth login # Elige GitHub.com → HTTPS → login con browser
Pega el código que te da la terminal en el navegador, autoriza, y espera unos segundos (no responde al instante). Una vez autenticado el servidor, dentro del chat puedes pedirle:
/resume <ID>
Guarda este proyecto en un repo privado de GitHub usando gh CLI
Hermes cargará el skill de gestión de repos, verificará la autenticación y subirá el proyecto. Lo interesante es que para casi cualquier tarea, Hermes carga primero un skill — ese es su sello de diseño.
⚠️ Nota honesta sobre escribir código: muchos agentes-asistente (Hermes incluido) no están optimizados para programar. Por dentro intentan parchear archivos con scripts de Python, lo que es incómodo en proyectos grandes y difícil de depurar. Por eso herramientas como OpenClaw usan por debajo un agente especializado en código. Para desarrollo serio, combina Hermes con un editor conectado por SSH o usa una herramienta enfocada en código.
Voz: dictarle tareas
Hermes entiende audios, pero necesita el paquete Faster Whisper. Si te falta, instálalo y configura el TTS:
hermes setup tts # Elige una opción sin configuración (ej. la integrada)
Después puedes mandarle un audio por Telegram tipo "crea un dashboard con el mismo tema del login relacionado con el index.html" y lo procesará.
Dejar el dashboard accesible de forma permanente y segura
El dashboard solo corre en localhost del servidor. Para accederlo desde cualquier dispositivo sin exponerlo a todo internet, combinamos PM2 (mantener el proceso vivo) + Tailscale (VPN privada gratuita).
PM2 — mantener el proceso corriendo
# Node ya viene instalado; verifícalo
node --version
# Instala PM2
npm i -g pm2
# Arranca el dashboard SOLO en localhost (más seguro que 0.0.0.0)
pm2 start "hermes dashboard --host 127.0.0.1" --name hermes-dashboard
# Haz que PM2 (y tus apps) arranquen solos al reiniciar el servidor
pm2 startup
pm2 save
Tailscale — VPN privada para acceder desde fuera
Tailscale es una VPN gratuita: solo los dispositivos autenticados en tu red privada pueden comunicarse. Instálala desde la web oficial:
# Comando de instalación que te da la web oficial de Tailscale
curl -fsSL https://tailscale.com/install.sh | sh
# Levanta Tailscale y autentícate (abre la URL que te muestra)
sudo tailscale up
# Ver dispositivos conectados y la IP del servidor
tailscale status
Ahora, para exponer el puerto del dashboard dentro de la VPN con HTTPS:
# Cambia 9119 por el puerto que use tu dashboard
sudo tailscale serve --bg https / 9119
Instala la app de Tailscale en tu Windows, móvil, etc., y accede a la IP privada del servidor. Como el dashboard se ejecuta vía PM2, aunque cierres la sesión SSH sigue corriendo, y solo es visible para tus dispositivos en la VPN.
En la práctica, el dashboard sirve sobre todo para ver el historial y las analíticas. Para el día a día, lo más cómodo es comunicarte directamente por Telegram. Exportar el dashboard es opcional.
Cierre
Con esto tienes un agente de IA personal viviendo en tu propio servidor: le hablas por Telegram desde donde sea, le programas tareas recurrentes, le conectas el modelo que prefieras, le instalas las herramientas que necesites y lo dejas iterando en tareas largas mientras tú haces otra cosa. Hermes destaca por su instalación sencilla, sus comandos claros y su diseño basado en skills que se cargan bajo demanda.
¿Tienes una idea de qué te gustaría automatizar con Hermes? Déjamela en los comentarios del video. Y si quieres ir más allá, en fazt.dev puedes reservar asesorías personalizadas sobre este o cualquier otro tema.