Hermes Agent: el agente de IA open source con memoria que vive en tu servidor
Hermes Agent se ha vuelto uno de los agentes de IA open source más comentados del momento. Desarrollado por Nous Research, propone una idea simple pero poderosa: tener un agente personal que escuche tareas todo el tiempo desde un servidor, aprenda con cada conversación y esté disponible desde cualquier plataforma de mensajería.
Si has escuchado de OpenCode o agentes similares, la propuesta te sonará familiar. La diferencia es que Hermes es notablemente más sencillo de instalar y trae prácticamente todo configurado por defecto. En este artículo voy a mostrarte qué es, cómo se instala, cómo se conecta a Telegram y por qué tantos desarrolladores están hablando de él.
¿Qué es Hermes y por qué destaca?
Hermes es un agente autónomo escrito en Python que puede correr en tu laptop, en un VPS, en una Raspberry Pi o incluso en infraestructura serverless. La característica que más lo distingue del resto es algo que llaman learning loop: el agente va aprendiendo y guardando información a medida que conversas con él. Esto se traduce en una memoria que se va expandiendo entre sesiones, en lugar de degradarse con el contexto como ocurre con otros agentes.
Otras características importantes:
- Mensajería multiplataforma: soporta Telegram, Discord, Slack, WhatsApp, Signal, Matrix, Email, SMS y otras más, todas desde un único gateway.
- Múltiples backends de ejecución: local, Docker, SSH, Daytona, Singularity y Modal. Estos dos últimos permiten persistencia serverless, es decir, el entorno hiberna cuando no lo usas y casi no genera costo.
- Skills incorporadas: viene con docenas de habilidades preinstaladas (búsqueda web, gestión de repos de GitHub, generación de GIFs, voz, visión, etc.).
- Soporte de MCP: puedes conectarlo a cualquier servidor MCP para extender sus capacidades.
- Soporte de Android vía Termux: sí, también lo puedes correr en un dispositivo Android.
Instalación rápida desde WSL (o Linux/macOS)
La instalación es directa. Solo copias el comando oficial desde la documentación, lo pegas en tu terminal y le das Y cuando te pida instalar dependencias como ripgrep, fd-find o ffmpeg (estas se usan para búsquedas rápidas y para procesar audio).
Una vez termina, lo siguiente es ejecutar:
source ~/.bashrc
# o source ~/.zshrc según tu shell
Esto recarga la configuración para que el comando hermes esté disponible. Es un paso que la propia documentación menciona y que evita el típico error de command not found.
Para verificar que todo quedó bien instalado:
hermes --version
Configuración inicial: quick setup
Al iniciar por primera vez tienes dos opciones: Quick Setup o configuración completa. Para probarlo rápido, el quick setup es más que suficiente.
Te va a pedir un proveedor de IA, ya que Hermes no es un modelo, sino un agente que necesita un LLM detrás. Soporta:
- OpenAI (incluyendo el endpoint de Codex)
- Anthropic
- Nous Portal
- OpenRouter
- Ollama (modelos locales)
- Cualquier endpoint compatible
En mi caso usé OpenAI Codex. El flujo es bastante limpio: te muestra un código en la terminal, abres el enlace, lo pegas y listo, queda autenticado. Después escoges el modelo (por ejemplo, GPT-5).
Conectar Hermes a Telegram
Aquí es donde Hermes empieza a brillar. El siguiente paso del setup te ofrece configurar plataformas de mensajería. Selecciona Telegram con la barra espaciadora y dale enter.
Crear el bot en Telegram
- Busca al usuario
@BotFatheren Telegram (es el bot oficial). - Envía
/newboty sigue el flujo: nombre del bot y username (debe ser único, así que prueba varios). - Copia el token que te da y pégalo en la terminal de Hermes.
Nota: cuando pegues el token en la terminal no lo verás visualmente. Es el comportamiento normal por seguridad.
Restringir acceso (recomendado)
A continuación te pedirá un User ID autorizado. Esto es importante: cada usuario de Telegram tiene un ID único, y si lo configuras solamente esa cuenta podrá comunicarse con tu bot. Si lo dejas vacío, cualquiera que conozca el bot podrá hablarle.
Service mode
Hermes te ofrece dos modos de servicio:
- User Service: usa comandos sin
sudoy se ejecuta solo mientras tu sesión esté activa. Ideal para entornos de desarrollo o pruebas locales. - System Service: requiere permisos de administrador y se mantiene corriendo siempre, incluso después de reinicios. Esto es lo que querrás en un VPS de producción.
Para una prueba en WSL, User Service es lo más práctico.
Emparejar tu chat
Una vez todo configurado, escribe /start en el chat con tu bot. Te aparecerá un mensaje pidiéndote ejecutar un comando del estilo:
hermes pair <código>
Lo copias en tu terminal y listo, tu sesión queda emparejada. Después solo te pedirá fijar el chat actual como canal principal con set home.
Comandos básicos
Dentro de la terminal de Hermes (o desde Telegram) puedes usar comandos slash. Algunos de los más útiles:
| Comando | Descripción |
|---|---|
/ |
Lista todos los comandos disponibles |
/skills |
Gestiona los skills (list, search, install) |
/yolo |
Modo permisivo, equivalente al --dangerously-skip-permissions de Claude Code |
/usage |
Muestra el uso de tokens y contexto disponible |
/new |
Reinicia la sesión actual desde cero |
/personality <nombre> |
Cambia la personalidad del agente |
El comando /personality es especialmente curioso: viene con varias personalidades precargadas (helpful-concise, technical, friendly-explanatory, formal, creative, etc.) que son básicamente prompts de sistema que cambian el tono de las respuestas. Si quieres volver al estado base, usas /personality default.
Funcionalidades que ya vienen incluidas
Una de las razones por las que Hermes destaca es que mucho ya viene preinstalado. No tienes que configurar módulos aparte para funciones básicas:
Búsqueda web
Solo le pides "busca en internet opciones de X" y lo hace. No es ultrarrápido, pero la respuesta final está bien estructurada con recomendaciones y referencias. En OpenCode, por ejemplo, no traes esta herramienta por defecto.
Modo voz (speech-to-text)
Puedes enviar audios desde Telegram y Hermes los transcribe automáticamente para procesarlos. La función ya está configurada después del quick install, no requiere configuración adicional. Tarda unos segundos en responder, pero funciona y es completamente gratis (usa procesamiento local).
Reconocimiento de imágenes
Sube una imagen al chat de Telegram y pregúntale algo. El modelo la interpreta directamente. Probé con una captura temática de Minecraft y la describió perfectamente. De nuevo, sin configuración extra.
El sistema de Skills
Los skills son básicamente instrucciones en Markdown que enseñan a la IA a hacer cosas más específicas. Son texto al final del día, pero potentes: pueden invocar herramientas externas, conectar con APIs o establecer flujos de trabajo concretos.
Para listar los que ya tienes:
/skills list
Verás una tabla con todos los skills preinstalados: GitHub, generación de GIFs, integración con Obsidian, AirTable, Ollama, y muchos más.
Ejemplo práctico: clonar y ejecutar un repo
Le pedí a Hermes:
"¿Puedes clonar un repositorio de GitHub? Usa esta URL:
"
El skill github-repo-management se cargó automáticamente, descargó el repo y, cuando le dije "ejecuta el proyecto", lo levantó en localhost:5000 sin que yo tocara nada. La gracia, claro, es que esto mismo se puede hacer en una máquina remota a la que ni siquiera tendrías que entrar por SSH.
Instalar skills nuevos
Hay un Skills Hub comunitario en agentskills.io compatible con un estándar abierto. Los skills disponibles cubren áreas como:
- Diseño y UI
- Code review y testing
- Gaming (administración de servidores Minecraft, integración con Godot, Unity, Unreal)
- Ingeniería (generación de circuitos, AS, etc.)
- Productividad (Spotify, Obsidian, etc.)
Para instalar uno solo copias el comando que te da la página, por ejemplo:
hermes skill install <nombre-del-skill>
Y queda disponible para invocarlo directamente con /<nombre-del-skill> o pidiéndoselo al agente en lenguaje natural.
Messaging Gateway: la arquitectura
La forma en que Telegram se comunica con tu instancia de Hermes es a través de lo que llaman el Messaging Gateway. Este componente:
- Mantiene una sesión guardada por cada chat.
- Persiste el historial de conversaciones dentro del servidor donde corre Hermes.
- Permite escuchar varias plataformas a la vez (puedes tener Telegram + Discord + Slack funcionando simultáneamente).
Comandos útiles del gateway:
hermes gateway setup # configurar nuevas plataformas
hermes gateway status # verificar si está corriendo
hermes gateway stop # detener la escucha
Recomendación personal: aunque Hermes soporta WhatsApp, no lo recomendaría. WhatsApp se vincula con tu información de contactos personales, mientras que en Telegram puedes eliminar chats limpiamente y mantener todo más aislado.
¿Para quién tiene sentido usar Hermes?
Hermes está pensado para correr siempre activo en un servidor. Si lo instalas solamente en tu laptop, en la práctica no aprovechas su mayor ventaja: tener un asistente personal disponible 24/7 al que puedas escribirle desde el celular sin importar dónde estés.
Casos de uso donde tiene mucho sentido:
- Asistente personal en un VPS barato (puedes correrlo desde unos pocos dólares al mes).
- Automatizaciones programadas con cron que entregan resultados a Telegram o email.
- Operaciones de servidor desde el celular sin tener que abrir SSH.
- Ejecutar tareas largas en background mientras haces otra cosa.
Si lo único que quieres es un agente para programar en tu IDE, probablemente Claude Code, OpenCode o Codex te van a dar mejor experiencia. Pero si lo que buscas es un agente que viva fuera de tu máquina y sea accesible desde cualquier plataforma, Hermes es de las opciones más completas y fáciles de poner en marcha hoy.
Conclusión
Hermes Agent resuelve un problema real: tener un agente de IA potente, persistente y multiplataforma sin tener que armar la infraestructura desde cero. Su quick setup deja todo funcional en minutos, las skills cubren una sorprendente variedad de tareas comunes y el messaging gateway elimina la fricción de hablarle desde donde sea.
En un próximo artículo voy a mostrar cómo instalarlo en un VPS remoto y configurar MCPs, que es donde realmente se le saca el jugo y se justifica usar Hermes en lugar de un agente local. Si tienes preguntas o algo específico que te gustaría ver, déjalo en los comentarios.
Recursos útiles:
- Documentación oficial: hermes-agent.nousresearch.com/docs
- Repositorio GitHub: NousResearch/hermes-agent
- Skills Hub: agentskills.io
- Nous Research: nousresearch.com