
Le MCP data.gouv.fr est un connecteur officiel publié par data.gouv qui permet à Claude, ChatGPT, Le Chat, Gemini CLI et une douzaine d'autres clients IA de chercher, explorer et analyser les datasets publics français en langage naturel. Ouvert en expérimentation le 25 février 2026, il fonctionne avec un endpoint public sans authentification (https://mcp.data.gouv.fr/mcp) et expose des outils strictement read-only sur les jeux de données et les API référencées sur la plateforme.
Quand on a testé ce connecteur la semaine dernière, le constat est revenu plusieurs fois : c'est gratuit, c'est officiel, et personne n'en parle. La plupart des dirigeants pensent encore qu'interroger des données publiques demande un développeur, une API et une semaine de mise en place. Le MCP data.gouv.fr change ça en cinq minutes.
Restons lucides. La promesse n'est pas "Claude a accès à toutes les données de France sans limite". La promesse réelle : Claude interroge les datasets publiés sur data.gouv.fr comme un humain qui irait fouiller le site, en quelques secondes au lieu de quelques heures. Outil de qualification, d'audit marché, de due diligence — pas robot d'extraction massive. Ce cadrage guide le reste de l'article.

MCP signifie Model Context Protocol — un standard ouvert publié par Anthropic en novembre 2024 qui définit comment un assistant IA (client) parle à une source de données ou un outil métier (serveur). Au lieu que chaque éditeur d'IA invente sa propre manière de se brancher sur Notion, Slack ou un dataset public, tout le monde s'accorde sur le même langage. Un connecteur écrit une fois fonctionne avec tous les clients qui parlent MCP.
Quand tu connectes le MCP data.gouv.fr à Claude, tu lui donnes une nouvelle capacité : interroger l'open data français. Chercher un dataset par mot-clé, lire ses métadonnées, parcourir ses fichiers, exécuter des requêtes tabulaires sur un CSV, remonter les statistiques d'usage mensuelles. En conversation naturelle, sans une ligne de code.
L'élément qui compte n'est pas la technique, c'est la signature. Le repo datagouv/datagouv-mcp est publié par l'équipe officielle data.gouv.fr, hébergé sur son compte GitHub, et le serveur de production tourne sur l'infrastructure data.gouv. L'article du 25 février 2026 sur le blog data.gouv confirme la démarche — expérimentation menée par l'État, pas initiative privée qui se réclamerait abusivement de data.gouv.
Plusieurs MCP non-officiels circulent depuis l'automne 2025, et data.gouv prend le soin de pointer le risque dans son article. Si tu mets en place ce connecteur dans un contexte professionnel, vérifie que tu pointes bien sur mcp.data.gouv.fr/mcp et que le repo source est bien github.com/datagouv/datagouv-mcp.
La fenêtre d'usage des données publiques bascule du développeur vers le décideur. Tant que data.gouv était consultable via une interface web ou une API à coder, l'audience restait limitée aux profils techniques. Avec le MCP, n'importe quel dirigeant qui a Claude installé peut interroger l'open data français comme il interrogerait un collaborateur. C'est une démocratisation d'accès.
L'article officiel parle d'une "logique d'exploration et d'apprentissage continu". L'ambition affichée à plus long terme est d'élargir vers l'édition et la publication. Pour l'instant, on reste au stade lecture seule.
Côté Cypher, on suit l'évolution de près parce qu'elle modifie le coût d'entrée de plusieurs cas d'usage qu'on construit pour nos clients. Un audit marché en immobilier commercial ou une analyse de pipeline en BTP qui répond à des appels d'offres commençait jusqu'ici par "il faut que je trouve la donnée". Aujourd'hui, dans un nombre croissant de cas, la donnée est déjà publiée sur data.gouv — le MCP la rend lisible en une question.
C'est ce que la vidéo montre, en deux minutes chrono. Trois étapes, zéro ligne de code à écrire toi-même — c'est Claude qui fait le travail à ta place.
Va sur claude.ai/download et installe l'application sur ton ordinateur (macOS, Windows ou Linux). C'est gratuit. Lance-la, connecte-toi avec ton compte Anthropic.
Dans l'application Claude, repère la section Code (c'est Claude Code, l'environnement intégré qui sait exécuter des commandes et configurer des outils sur ton poste). Ouvre une nouvelle session.
Dans la session Code, copie-colle exactement ce message à Claude :
"Installe ce repo MCP : https://github.com/datagouv/datagouv-mcp"
Claude lit le README officiel, exécute la commande de configuration à ta place, et te confirme quand c'est branché. Au prochain démarrage de session, tu peux lui demander n'importe quoi sur les données data.gouv.fr — il va chercher tout seul.
Si tu utilises Claude Desktop, ChatGPT, Le Chat de Mistral, Cursor, Gemini CLI ou un autre client, le principe est le même mais la syntaxe change. Le README officiel sur github.com/datagouv/datagouv-mcp liste la configuration exacte pour quinze clients différents — data.gouv tient cette liste à jour, mieux que je ne le ferais ici. Pour la majorité des cas pros, l'application Claude reste la voie la plus rapide.
Exemple tiré de la vidéo. Tu prépares une offre de services pour les restaurateurs du XVIIIe arrondissement de Paris. Avant de prospecter, tu veux connaître la densité d'établissements, leur typologie, et si le secteur est en croissance.
Sans MCP : tu vas sur data.gouv, tu cherches "restaurants", tu télécharges trois CSV, tu galères deux heures dans Excel. Avec le MCP connecté à Claude, tu écris :
"Cherche-moi les datasets data.gouv sur les restaurants à Paris. Je veux comprendre la densité du XVIIIe, l'évolution du nombre d'établissements, et la répartition par type de cuisine."
Claude appelle search_datasets avec les bons mots-clés, te ramène les jeux pertinents, lit les métadonnées et propose un plan. Tu valides, il déclenche query_resource_data sur le bon fichier, et te sort une synthèse en quelques secondes. C'est ce que tu vois dans la vidéo.
L'usage à recommander pour ce genre d'exercice tient en trois mots : audit, qualification, décision. Tu te sers du MCP pour comprendre un marché avant d'y entrer, pas pour récupérer des contacts à démarcher en série.
Au-delà du cas restaurateurs, des exemples d'audit pertinents qu'on voit passer :
Pour chacun, un diagnostic IA cadré chez Cypher te dira si le MCP suffit ou s'il faut le compléter avec d'autres sources. En général le MCP couvre 60 à 80 % du besoin.
C'est là que les promesses délirantes circulent sur LinkedIn et désinforment. Soyons nets.
Le serveur expose dix outils read-only documentés dans le repo officiel :
| Outil | À quoi ça sert |
|---|---|
| `search_datasets` | Trouver un dataset par mots-clés (jusqu'à 100 résultats par page) |
| `get_dataset_info` | Lire toutes les métadonnées d'un dataset précis |
| `list_dataset_resources` | Lister les fichiers contenus dans un dataset (CSV, XLS, etc.) |
| `get_resource_info` | Détails d'un fichier précis et disponibilité de l'API tabulaire |
| `query_resource_data` | Lire des lignes d'un CSV ou XLS (max 200 lignes par appel) |
| `search_organizations` | Chercher les organismes publiant des données |
| `search_dataservices` | Chercher des API référencées sur data.gouv |
| `get_dataservice_info` | Métadonnées complètes d'une API |
| `get_dataservice_openapi_spec` | Spécification OpenAPI d'une API référencée |
| `get_metrics` | Statistiques mensuelles de visites et téléchargements |
C'est précis et c'est utile. Tu peux explorer la plateforme au rythme d'une conversation, naviguer entre les datasets et leurs ressources, lire des extraits, et bâtir une analyse en un seul flux de pensée.
Le serveur ne fait pas d'écriture. Tu ne peux pas publier un dataset, modifier une métadonnée, supprimer une ressource. Limitation volontaire, mentionnée explicitement par data.gouv — l'extension vers l'édition viendra plus tard.
Le MCP ne contourne pas non plus les protections RGPD ou les autorisations restreintes de certains datasets. Donnée publique sur data.gouv, accessible via le MCP. Donnée en accès restreint, pas davantage accessible.
Et il ne donne pas accès aux bases ouvertes par d'autres administrations (Sirene en consultation directe, API Adresse, API Geo) sauf quand elles sont référencées comme dataservices sur data.gouv. Pour interroger la base Sirene des onze millions d'entreprises françaises, il existe d'autres voies (API Recherche d'entreprises, API Sirene de l'INSEE) — complémentaires, mais hors de ce connecteur.
Trois limites à connaître avant de te lancer.
La fiabilité n'est pas binaire. L'article officiel le rappelle : un modèle de langage peut produire des réponses incomplètes ou erronées, même quand il appelle correctement un outil MCP. Le MCP réduit le risque d'hallucination parce que Claude lit des données réelles, mais l'interprétation reste à ta charge. Croise toujours une réponse importante avec la fiche dataset sur data.gouv.fr.
Le périmètre évolue. Le repo affiche v0.2.24 et 25 releases depuis la mise en ligne. C'est sain, mais une intégration câblée en dur peut casser. Pour un usage industrialisé, mieux vaut piloter via une session Claude qui s'adapte que via du code rigide. Un accompagnement intégration agents IA chez Cypher sécurise ce genre de connexion en production.
L'éthique d'usage. Une donnée publique reste de la donnée. Certains datasets contiennent des informations nominatives, des indicateurs sociaux par territoire, des informations sur des établissements scolaires ou de santé. Tu peux les analyser pour comprendre, tu n'as pas le droit de les recroiser pour profiler des individus dans une intention commerciale agressive. Le MCP ne change pas le droit, il accélère la lecture.
L'arrivée d'un MCP officiel signé d'une administration française est un signal. D'autres acteurs publics vont probablement suivre — INSEE, Banque de France, BPI, collectivités. L'IA conversationnelle bascule lentement du modèle "outil de productivité" vers "interface d'accès au monde". Voir aussi notre article sur la fuite des prompts système Claude, qui parle de la même bascule sous un autre angle.
Oui, totalement. Code sous licence MIT, serveur public hébergé par data.gouv.fr, sans clé d'API ni authentification. Tu paies seulement ton abonnement Claude, ChatGPT ou autre client si tu en as un. Le connecteur lui-même n'ajoute aucun coût.
Non. La configuration la plus simple — Claude Code avec une seule commande — prend trente secondes et ne demande aucune compétence en code. Pour Claude Desktop, l'édition du fichier JSON peut intimider, mais Claude Code peut faire le travail à ta place si tu lui colles le lien du repo. Si tu bloques, ton service informatique fait ça en deux minutes.
Côté MCP, non — le serveur tourne sur l'infrastructure data.gouv. En revanche, les requêtes que tu envoies à Claude (ou ChatGPT, Le Chat) sortent vers les serveurs de l'éditeur du modèle. Si tu as des contraintes RGPD strictes, choisis un client qui héberge ses modèles en Europe — Le Chat de Mistral ou une instance privée. Le connecteur data.gouv reste compatible avec tous.
Non, ce n'est pas le bon outil. Les outils sont read-only avec une pagination limitée (200 lignes max par appel), et l'esprit de la plateforme open data est de soutenir l'analyse, pas l'extraction industrielle. Pour de la prospection à l'échelle, il existe des bases SIREN dédiées et des outils commerciaux spécialisés. Le MCP data.gouv sert à comprendre un marché, pas à scraper des contacts.
La source. Le serveur officiel est publié par l'équipe data.gouv.fr, repo sur le compte GitHub datagouv, serveur de production sur mcp.data.gouv.fr. Plusieurs MCP non-officiels circulent et data.gouv le mentionne explicitement dans son article du 25 février 2026. Vérifie toujours que tu pointes sur les URLs officielles dans un contexte professionnel.
Pour de l'exploration ponctuelle, c'est largement suffisant. Pour une décision d'investissement, une étude de marché qui engage un budget, ou une intégration industrielle, l'analyse demande un cadrage humain. Le rôle du MCP est d'accélérer la recherche, pas de remplacer le jugement métier. C'est ce qu'on calibre dans un diagnostic IA chez Cypher — décider où le MCP s'inscrit dans ton dispositif.
Le MCP data.gouv.fr fait partie de ces outils dont l'impact se mesure davantage par la friction qu'ils enlèvent que par la fonctionnalité qu'ils ajoutent. La donnée publique française était déjà là, riche, accessible. Cinq minutes de configuration suffisent maintenant pour qu'un dirigeant lise data.gouv comme il lit un mail.
Le bon cadre tient en trois mots : audit, qualification, due diligence. Pas de prospection sauvage, pas de scraping industriel, pas de raccourci marketing. Un outil officiel, dans son périmètre prévu, sur des données publiques. Suffisant pour faire la différence sur la majorité des décisions business d'une PME ou d'une ETI.
Pour cadrer un audit marché avec ce genre d'outil avant d'engager un budget commercial — c'est ce qu'on fait dans nos diagnostics découverte. Réserver un call de 30 min, on identifie si le MCP suffit pour ton besoin ou s'il faut le compléter.
Envie d'aller plus loin ?
15 minutes pour identifier le premier cas d'usage IA rentable dans votre entreprise.
Découvrez aussi nos cas clients (résultats chiffrés par secteur) ou qui est derrière Cypher IA.
Sur le même sujet

Comment tester ChatGPT, Claude, Gemini, Veo 3 et les meilleurs modèles d'images gratuitement en 2026. Trois sites concrets, sans abonnement, sans carte bancaire.

Copie le skill Claude complet pour faire débattre 5 agents IA, relire leurs réponses anonymement et obtenir un verdict clair sur tes décisions importantes.

Graphify prépare une carte de tes documents business pour que Claude réponde à tes questions sans tout relire à chaque fois. Jusqu'à 70× moins de consommation.