Pilote ton VRAI browser web avec Chrome CDP

Pilote ton VRAI browser web avec Chrome CDP

La problématique

J'ai perdu plusieurs heures à butter sur le pilotage de Playwright. C'est devenu rare d'être bloqué sur un point technique à l'heure de l'IA.

Je voulais que Claude accède au DOM de la page feed de Twitter pour identifier des patterns HTLM et tester en temps reel des modifications.

Simple dans l'esprit.

Playwright MCP

Ca va assez vite devenir un enfer. D'un point de vue technique Playwright repart d'un browser frais et isolé (en mode automation) à chaque exécution.

Donc je dois me re-logger sur Twitter, qui evidemment détecte que le browser est en mode test/automation et bloque.

La solution (tardive)

J'étais à court d'idées et surtout à bout de patience quand je vois un post twitter indiquant que Chrome vient de sortir sa version 146, et de là une solution qui pouvait tout simplifier : chrome-cdp.

On la vu, la plupart des outils d'automatisation browser lancent un navigateur isolé et vide à chaque fois. Pas chrome-cdp il se connecte directement à ton Chrome en cours d'exécution : tes onglets ouverts, tes sessions connectées, ton état de page actuel. Rien à réinstaller, rien à reconfigurer.

CDP, c'est l'interface native qui permet de piloter Chrome depuis ses couches basses.

CDP protocol

Le skill chrome-cdp s'en sert ensuite pour passer des commandes simples à un agent. Ce qui au passage est beaucoup moins couteux en contexte que d'utiliser un MCP.

chrome-cdp maintient un daemon persistant par onglet : le modal ne s'affiche qu'une seule fois, et il gère fiablement 100+ onglets là où les outils basés sur Puppeteer timeout régulièrement.

Installation en 4 étapes

1) Mettre à jour Chrome en version 146

Chrome 146

2) Activer le remote debugging

chrome://inspect/#remote-debugging

Active le toggle. C'est tout.

Activer le remote debugging dans Crhome

3) Récupérer le skill et l'installer

npx skills add https://github.com/pasky/chrome-cdp-skill --skill chrome-cdp
skills.sh

4) Enjoy 🎉

Ton agent peut maintenant lister tes onglets, prendre des screenshots, lire le DOM, cliquer, taper du texte, évaluer du JavaScript — le tout dans ton vrai Chrome, sans quitter ton workflow.

Claude is happy

Sources

Suivre l'auteur

Cédric TOURNIER

Cédric TOURNIER

Recevez un email quand cet auteur publie un nouveau post.

Chargement...

Commentaires (0)

> Aucun commentaire pour l'instant.