Tuto IAOutils IA

MCP data.gouv.fr et Claude : connecter l'open data français en 5 min

2 mai 2026 · 10 min de lecture

Partagerin𝕏
Une carte de France en relief discret posée sur un bureau crème, traversée par un fin trait coral qui relie un tampon administratif officiel à un terminal de chat sobre

MCP data.gouv.fr et Claude : connecter l'open data français en 5 min

Le MCP data.gouv.fr est un connecteur officiel publié par data.gouv qui permet à Claude, ChatGPT, Le Chat, Gemini CLI et une douzaine d'autres clients IA de chercher, explorer et analyser les datasets publics français en langage naturel. Ouvert en expérimentation le 25 février 2026, il fonctionne avec un endpoint public sans authentification (https://mcp.data.gouv.fr/mcp) et expose des outils strictement read-only sur les jeux de données et les API référencées sur la plateforme.

Sommaire

Quand on a testé ce connecteur la semaine dernière, le constat est revenu plusieurs fois : c'est gratuit, c'est officiel, et personne n'en parle. La plupart des dirigeants pensent encore qu'interroger des données publiques demande un développeur, une API et une semaine de mise en place. Le MCP data.gouv.fr change ça en cinq minutes.

Restons lucides. La promesse n'est pas "Claude a accès à toutes les données de France sans limite". La promesse réelle : Claude interroge les datasets publiés sur data.gouv.fr comme un humain qui irait fouiller le site, en quelques secondes au lieu de quelques heures. Outil de qualification, d'audit marché, de due diligence — pas robot d'extraction massive. Ce cadrage guide le reste de l'article.

Démo : Claude connecté au MCP data.gouv.fr — recherche conversationnelle d'un dataset public en quelques secondes
Aperçu : Claude interroge data.gouv.fr en langage naturel via le MCP officiel

Le MCP data.gouv.fr, c'est quoi exactement

MCP signifie Model Context Protocol — un standard ouvert publié par Anthropic en novembre 2024 qui définit comment un assistant IA (client) parle à une source de données ou un outil métier (serveur). Au lieu que chaque éditeur d'IA invente sa propre manière de se brancher sur Notion, Slack ou un dataset public, tout le monde s'accorde sur le même langage. Un connecteur écrit une fois fonctionne avec tous les clients qui parlent MCP.

Quand tu connectes le MCP data.gouv.fr à Claude, tu lui donnes une nouvelle capacité : interroger l'open data français. Chercher un dataset par mot-clé, lire ses métadonnées, parcourir ses fichiers, exécuter des requêtes tabulaires sur un CSV, remonter les statistiques d'usage mensuelles. En conversation naturelle, sans une ligne de code.

Le fait notable : c'est officiel

L'élément qui compte n'est pas la technique, c'est la signature. Le repo datagouv/datagouv-mcp est publié par l'équipe officielle data.gouv.fr, hébergé sur son compte GitHub, et le serveur de production tourne sur l'infrastructure data.gouv. L'article du 25 février 2026 sur le blog data.gouv confirme la démarche — expérimentation menée par l'État, pas initiative privée qui se réclamerait abusivement de data.gouv.

Plusieurs MCP non-officiels circulent depuis l'automne 2025, et data.gouv prend le soin de pointer le risque dans son article. Si tu mets en place ce connecteur dans un contexte professionnel, vérifie que tu pointes bien sur mcp.data.gouv.fr/mcp et que le repo source est bien github.com/datagouv/datagouv-mcp.

Pourquoi l'État ouvre un connecteur IA officiel

La fenêtre d'usage des données publiques bascule du développeur vers le décideur. Tant que data.gouv était consultable via une interface web ou une API à coder, l'audience restait limitée aux profils techniques. Avec le MCP, n'importe quel dirigeant qui a Claude installé peut interroger l'open data français comme il interrogerait un collaborateur. C'est une démocratisation d'accès.

L'article officiel parle d'une "logique d'exploration et d'apprentissage continu". L'ambition affichée à plus long terme est d'élargir vers l'édition et la publication. Pour l'instant, on reste au stade lecture seule.

Côté Cypher, on suit l'évolution de près parce qu'elle modifie le coût d'entrée de plusieurs cas d'usage qu'on construit pour nos clients. Un audit marché en immobilier commercial ou une analyse de pipeline en BTP qui répond à des appels d'offres commençait jusqu'ici par "il faut que je trouve la donnée". Aujourd'hui, dans un nombre croissant de cas, la donnée est déjà publiée sur data.gouv — le MCP la rend lisible en une question.

Comment connecter Claude au MCP data.gouv en 3 étapes

C'est ce que la vidéo montre, en deux minutes chrono. Trois étapes, zéro ligne de code à écrire toi-même — c'est Claude qui fait le travail à ta place.

Étape 1 — Télécharge l'application Claude

Va sur claude.ai/download et installe l'application sur ton ordinateur (macOS, Windows ou Linux). C'est gratuit. Lance-la, connecte-toi avec ton compte Anthropic.

Étape 2 — Clique sur "Code"

Dans l'application Claude, repère la section Code (c'est Claude Code, l'environnement intégré qui sait exécuter des commandes et configurer des outils sur ton poste). Ouvre une nouvelle session.

Étape 3 — Colle ce prompt

Dans la session Code, copie-colle exactement ce message à Claude :

"Installe ce repo MCP : https://github.com/datagouv/datagouv-mcp"

Claude lit le README officiel, exécute la commande de configuration à ta place, et te confirme quand c'est branché. Au prochain démarrage de session, tu peux lui demander n'importe quoi sur les données data.gouv.fr — il va chercher tout seul.

Et pour les autres clients IA ?

Si tu utilises Claude Desktop, ChatGPT, Le Chat de Mistral, Cursor, Gemini CLI ou un autre client, le principe est le même mais la syntaxe change. Le README officiel sur github.com/datagouv/datagouv-mcp liste la configuration exacte pour quinze clients différents — data.gouv tient cette liste à jour, mieux que je ne le ferais ici. Pour la majorité des cas pros, l'application Claude reste la voie la plus rapide.

Cas concret : qualifier un marché local avant d'attaquer

Exemple tiré de la vidéo. Tu prépares une offre de services pour les restaurateurs du XVIIIe arrondissement de Paris. Avant de prospecter, tu veux connaître la densité d'établissements, leur typologie, et si le secteur est en croissance.

Sans MCP : tu vas sur data.gouv, tu cherches "restaurants", tu télécharges trois CSV, tu galères deux heures dans Excel. Avec le MCP connecté à Claude, tu écris :

"Cherche-moi les datasets data.gouv sur les restaurants à Paris. Je veux comprendre la densité du XVIIIe, l'évolution du nombre d'établissements, et la répartition par type de cuisine."

Claude appelle search_datasets avec les bons mots-clés, te ramène les jeux pertinents, lit les métadonnées et propose un plan. Tu valides, il déclenche query_resource_data sur le bon fichier, et te sort une synthèse en quelques secondes. C'est ce que tu vois dans la vidéo.

L'usage à recommander pour ce genre d'exercice tient en trois mots : audit, qualification, décision. Tu te sers du MCP pour comprendre un marché avant d'y entrer, pas pour récupérer des contacts à démarcher en série.

Les autres usages qui marchent bien

Au-delà du cas restaurateurs, des exemples d'audit pertinents qu'on voit passer :

  • Concurrence locale sur un secteur réglementé (artisanat, BTP, transport) avant d'ouvrir une agence
  • Santé financière d'une commune avant de répondre à un appel d'offres public
  • Cartographier les acteurs publics et associatifs d'un territoire avant un partenariat
  • Calibrer une étude de prix en lisant les indices INSEE par filière
  • Vérifier la conformité d'un fournisseur en croisant SIREN et sanctions publiques

Pour chacun, un diagnostic IA cadré chez Cypher te dira si le MCP suffit ou s'il faut le compléter avec d'autres sources. En général le MCP couvre 60 à 80 % du besoin.

Ce que tu peux faire — et ce que tu ne peux pas

C'est là que les promesses délirantes circulent sur LinkedIn et désinforment. Soyons nets.

Ce que le MCP data.gouv fait

Le serveur expose dix outils read-only documentés dans le repo officiel :

OutilÀ quoi ça sert
`search_datasets`Trouver un dataset par mots-clés (jusqu'à 100 résultats par page)
`get_dataset_info`Lire toutes les métadonnées d'un dataset précis
`list_dataset_resources`Lister les fichiers contenus dans un dataset (CSV, XLS, etc.)
`get_resource_info`Détails d'un fichier précis et disponibilité de l'API tabulaire
`query_resource_data`Lire des lignes d'un CSV ou XLS (max 200 lignes par appel)
`search_organizations`Chercher les organismes publiant des données
`search_dataservices`Chercher des API référencées sur data.gouv
`get_dataservice_info`Métadonnées complètes d'une API
`get_dataservice_openapi_spec`Spécification OpenAPI d'une API référencée
`get_metrics`Statistiques mensuelles de visites et téléchargements

C'est précis et c'est utile. Tu peux explorer la plateforme au rythme d'une conversation, naviguer entre les datasets et leurs ressources, lire des extraits, et bâtir une analyse en un seul flux de pensée.

Ce que le MCP ne fait pas

Le serveur ne fait pas d'écriture. Tu ne peux pas publier un dataset, modifier une métadonnée, supprimer une ressource. Limitation volontaire, mentionnée explicitement par data.gouv — l'extension vers l'édition viendra plus tard.

Le MCP ne contourne pas non plus les protections RGPD ou les autorisations restreintes de certains datasets. Donnée publique sur data.gouv, accessible via le MCP. Donnée en accès restreint, pas davantage accessible.

Et il ne donne pas accès aux bases ouvertes par d'autres administrations (Sirene en consultation directe, API Adresse, API Geo) sauf quand elles sont référencées comme dataservices sur data.gouv. Pour interroger la base Sirene des onze millions d'entreprises françaises, il existe d'autres voies (API Recherche d'entreprises, API Sirene de l'INSEE) — complémentaires, mais hors de ce connecteur.

Limites et le bon cadre d'usage

Trois limites à connaître avant de te lancer.

La fiabilité n'est pas binaire. L'article officiel le rappelle : un modèle de langage peut produire des réponses incomplètes ou erronées, même quand il appelle correctement un outil MCP. Le MCP réduit le risque d'hallucination parce que Claude lit des données réelles, mais l'interprétation reste à ta charge. Croise toujours une réponse importante avec la fiche dataset sur data.gouv.fr.

Le périmètre évolue. Le repo affiche v0.2.24 et 25 releases depuis la mise en ligne. C'est sain, mais une intégration câblée en dur peut casser. Pour un usage industrialisé, mieux vaut piloter via une session Claude qui s'adapte que via du code rigide. Un accompagnement intégration agents IA chez Cypher sécurise ce genre de connexion en production.

L'éthique d'usage. Une donnée publique reste de la donnée. Certains datasets contiennent des informations nominatives, des indicateurs sociaux par territoire, des informations sur des établissements scolaires ou de santé. Tu peux les analyser pour comprendre, tu n'as pas le droit de les recroiser pour profiler des individus dans une intention commerciale agressive. Le MCP ne change pas le droit, il accélère la lecture.

Et après le MCP data.gouv ?

L'arrivée d'un MCP officiel signé d'une administration française est un signal. D'autres acteurs publics vont probablement suivre — INSEE, Banque de France, BPI, collectivités. L'IA conversationnelle bascule lentement du modèle "outil de productivité" vers "interface d'accès au monde". Voir aussi notre article sur la fuite des prompts système Claude, qui parle de la même bascule sous un autre angle.

Questions fréquentes

Le MCP data.gouv est-il vraiment gratuit ?

Oui, totalement. Code sous licence MIT, serveur public hébergé par data.gouv.fr, sans clé d'API ni authentification. Tu paies seulement ton abonnement Claude, ChatGPT ou autre client si tu en as un. Le connecteur lui-même n'ajoute aucun coût.

Faut-il être développeur pour l'installer ?

Non. La configuration la plus simple — Claude Code avec une seule commande — prend trente secondes et ne demande aucune compétence en code. Pour Claude Desktop, l'édition du fichier JSON peut intimider, mais Claude Code peut faire le travail à ta place si tu lui colles le lien du repo. Si tu bloques, ton service informatique fait ça en deux minutes.

Mes données sortent-elles de France quand j'utilise le MCP data.gouv ?

Côté MCP, non — le serveur tourne sur l'infrastructure data.gouv. En revanche, les requêtes que tu envoies à Claude (ou ChatGPT, Le Chat) sortent vers les serveurs de l'éditeur du modèle. Si tu as des contraintes RGPD strictes, choisis un client qui héberge ses modèles en Europe — Le Chat de Mistral ou une instance privée. Le connecteur data.gouv reste compatible avec tous.

Puis-je utiliser le MCP pour faire de la prospection commerciale massive ?

Non, ce n'est pas le bon outil. Les outils sont read-only avec une pagination limitée (200 lignes max par appel), et l'esprit de la plateforme open data est de soutenir l'analyse, pas l'extraction industrielle. Pour de la prospection à l'échelle, il existe des bases SIREN dédiées et des outils commerciaux spécialisés. Le MCP data.gouv sert à comprendre un marché, pas à scraper des contacts.

Quelle est la différence entre le MCP officiel et les autres ?

La source. Le serveur officiel est publié par l'équipe data.gouv.fr, repo sur le compte GitHub datagouv, serveur de production sur mcp.data.gouv.fr. Plusieurs MCP non-officiels circulent et data.gouv le mentionne explicitement dans son article du 25 février 2026. Vérifie toujours que tu pointes sur les URLs officielles dans un contexte professionnel.

Le MCP remplace-t-il un audit IA chez un prestataire ?

Pour de l'exploration ponctuelle, c'est largement suffisant. Pour une décision d'investissement, une étude de marché qui engage un budget, ou une intégration industrielle, l'analyse demande un cadrage humain. Le rôle du MCP est d'accélérer la recherche, pas de remplacer le jugement métier. C'est ce qu'on calibre dans un diagnostic IA chez Cypher — décider où le MCP s'inscrit dans ton dispositif.

Conclusion

Le MCP data.gouv.fr fait partie de ces outils dont l'impact se mesure davantage par la friction qu'ils enlèvent que par la fonctionnalité qu'ils ajoutent. La donnée publique française était déjà là, riche, accessible. Cinq minutes de configuration suffisent maintenant pour qu'un dirigeant lise data.gouv comme il lit un mail.

Le bon cadre tient en trois mots : audit, qualification, due diligence. Pas de prospection sauvage, pas de scraping industriel, pas de raccourci marketing. Un outil officiel, dans son périmètre prévu, sur des données publiques. Suffisant pour faire la différence sur la majorité des décisions business d'une PME ou d'une ETI.

Pour cadrer un audit marché avec ce genre d'outil avant d'engager un budget commercial — c'est ce qu'on fait dans nos diagnostics découverte. Réserver un call de 30 min, on identifie si le MCP suffit pour ton besoin ou s'il faut le compléter.

Envie d'aller plus loin ?

On vous aide à passer à l'action.

15 minutes pour identifier le premier cas d'usage IA rentable dans votre entreprise.

Découvrez aussi nos cas clients (résultats chiffrés par secteur) ou qui est derrière Cypher IA.