Només 5 línies
La petita conversa quotidiana

🦞 DeltaClaw: la meva alternativa a OpenClaw

Aquest matí m'he quedat amb les ganes de provar OpenClaw, però hi ha quelcom que m'inquieta d'aquest programa: principalment el seu model de seguretat i el fet que sigui difícil controlar l'ús que fa de l'API. Quan llegia el que fa la gent amb OpenClaw, he vist que és quelcom que puc fer jo mateix amb les eines que tinc i, sobretot, amb molt més control.

Així doncs, fa una estona m'he posat a treballar amb Gemini CLI. He creat un bot de Delta Chat (un altre), anomenat DeltaClaw, que connecta el meu mòbil amb el Gemini CLI a través de Delta Chat. A la pràctica, em permet tenir el meu propi assistent de programació a la butxaca: puc fer tot el que es permet amb Gemini CLI (o Claude Code o similar, però de moment només està ben implementat Gemini).

A l'ordinador que fa de servidor hi tinc un directori ~/projectes. El meu bot té una comanda per triar la carpeta del projecte que vull o per crear-ne una de nova. Llavors, cada missatge que envio al bot es passa com a prompt a gemini, aquest l'executa i em retorna el resultat via Delta Chat. Així de simple. La gràcia és que Gemini gestiona sessions; per tant, em connecto a la darrera sessió activa d'aquell projecte i mantinc l'historial de la conversa. D'aquesta manera no he de pensar ni en la persistència del context, ni en el pre-RAG, ni en res d'això. Gemini CLI se n'encarrega. A part de seguir a la darrera sessió activa, també en puc crear una de nova. Em falta poder connectar-me a qualsevol sessió passada. Ja ho faré.

D'aquesta manera puc crear projectes, demanar a Gemini que editi codi o que executi comandes de terminal directament des del xat de manera totalment segura (xifrat). DeltaClaw també inclou un sistema de permisos dinàmic per controlar quanta autonomia té l'IA a cada moment:

  • 🟢 Mode lectura: per a planificació.

  • 🔵 Mode escriptura: per a modificacions.

  • 🟠 Mode execució: el famós yolo (you only live once).

L'execució sense sandbox és una mica arriscada, però amb el temps que fa que utilitzo Gemini mai he tingut problemes greus. Crec que té prou bones barreres de seguretat, tot i que el risc sempre hi és. La idea és utilitzar el mode yolo el mínim possible i només quan tot el pla estigui dissenyat. La llàstima és que no tinc encara el mode d'aprovar cada comanda una a una. Per solucionar-ho hauria de posar tot el sistema dins d'una imatge Docker o similar, que només tingui accés a ~/projectes. Ja ho faré.

L'important és que així ja puc picar codi en remot! 🚀📱 El límit és la imaginació. Amb aquest sistema puc fer tot el que (crec que) fa OpenClaw. Bàsicament, he fet una interfície de xat per a Gemini CLI, així aprofito tota la feina que han fet els enginyers de Google: skills, MCPs...

Ara, si un dia anant en tren vull fer un filtre antispam bayesià per al meu correu personal, ho puc fer. Si vull ensenyar al meu altre bot, el Dr. Talai, que aprengui a llegir els meus calendaris, ho puc fer. Si vull comprovar com van les simulacions, fer canvis i llançar-ne de noves, ho puc fer. La veritat és que és genial.

No tardaré a publicar-ne el codi.

Comentaris

Comenta mitjançant Delta Chat