Analyse de l'existant

Inventaire exhaustif des donnees brutes disponibles dans entrants/, issues des ZIP de la Direction du Budget. Cette page documente le contenu de chaque livraison, les formats trouves, et les ecarts entre annees.

Vue d'ensemble

Dossier Type document Annee budgetaire PDF HTML XLS nomenclature XLS credits XLS emplois
entrants/2023/PLRG/ PLRG 2023 2023 209 694 MiS_PGM_ACT_SSA.xls Credits_Destination_Nature_YC_RetD.xls _emplois.xls
entrants/2024/PLF/ + PLRG/ PLF 2024 + PLRG 2024 2024 217 + 229 665 MiS_PGM_ACT_SSA.xls (x2) PLF2024-credits.xls + Credits_...RetD.xls PLF2024-emplois.xls + _emplois.xls
entrants/2025/PLF/ PLF 2025 2025 229 0 MiS_PGM_ACT_SSA.xls Credits_Destination_Nature_YC_RetD.xls emplois.xls
entrants/2026/PLF/ PLF 2026 2026 224 0 MiS_PGM_ACT_SSA.xls Credits_Destination_Nature_YC_RetD.xls emplois.xls

S'ajoutent les sources open data deja presentes dans entrants/plf open data/ : CSV pour PLF 2014 a 2025, LFI 2019 a 2023, et PLR 2018.

Organisation des dossiers

Les documents sont ranges par annee budgetaire, puis par exercice (PLF ou PLRG), puis par type de budget :

entrants/{annee}/
  PLF/                  Documents du Projet de Loi de Finances
    BA/ BG/ CAS/ CCF/ CCO/ COM/
      MSN/{code}/       Documents par mission
      PGM/{code}/       Documents par programme
  PLRG/                 Documents du Projet de Loi de Resultats de Gestion
    BA/ BG/ CAS/ CCF/ CCO/ COM/
      MSN/{code}/       Documents par mission
      PGM/{code}/       Documents par programme
  donnees pour dataviz... PLF {annee}/
    MiS_PGM_ACT_SSA.xls, Credits_*.xls, emplois.xls
  donnees pour dataviz... PLRG {annee}/
    MiS_PGM_ACT_SSA.xls, Credits_*.xls, _emplois.xls

Detail par annee

PLRG 2023 entrants/2023/PLRG/

Documents budgetaires (PLR_2023.zip — 313 Mo)

1 129 fichiers : 209 PDF 694 HTML

Les PDF sont les bleus budgetaires complets (RAP). Les HTML sont les memes documents decomposes en sections parsables :

Suffixe HTMLContenuNombre
_CREDITSTableaux de credits par action/titre (AE/CP, LFI N-1, execution)166
_JPEJustification au Premier Euro — detail fin des depenses173
_STRATPresentation strategique du programme166
_PERFObjectifs et indicateurs de performance136
_OPEOperateurs rattaches au programme53

Convention de nommage des fichiers : FR_2023_PLR_{type_budget}_PGM_{code}.pdf

Donnees dataviz (donnees pour dataviz et nomenclature PLRG 2023.zip)

  • MiS_PGM_ACT_SSA.xls — Nomenclature complete (2 593 lignes, 8 colonnes)
  • Credits_Destination_Nature_YC_RetD.xls — Credits executes (3 424 lignes, colonnes AE EXEC / CP EXEC)
  • _emplois.xls — ETPT par programme (166 programmes)

PLF 2024 + PLRG 2024 entrants/2024/PLF/ + entrants/2024/PLRG/

Documents budgetaires PLF (PLF_2024.zip — 210 Mo)

1 114 fichiers : 217 PDF 665 HTML

Suffixe HTMLNombre
_CREDITS157
_JPE165
_STRAT157
_PERF134
_OPE52

Convention de nommage PLF : FR_2024_PLF_{type_budget}_PGM_{code}.pdf

Documents budgetaires PLRG (PLRG_2024.zip — 236 Mo)

229 PDF 0 HTML — RAP (resultats de gestion). Convention : FR_2024_PLR_{type_budget}_PGM_{code}.pdf

Donnees dataviz PLF

  • MiS_PGM_ACT_SSA.xls — Nomenclature PLF (2 642 lignes)
  • PLF2024-credits.xls — Credits PLF (2 374 lignes, colonnes ae / cp)
  • PLF2024-emplois.xls — ETPT PLF

Donnees dataviz PLRG

  • MiS_PGM_ACT_SSA.xls — Nomenclature PLRG (2 643 lignes)
  • Credits_Destination_Nature_YC_RetD.xls — Credits executes (3 560 lignes, colonnes AE EXEC / CP EXEC)
  • _emplois.xls — ETPT executes

Ecart constate : nommage du fichier credits PLF

Le fichier credits PLF est nomme PLF2024-credits.xls au lieu de Credits_Destination_Nature_YC_RetD.xls (nom utilise pour toutes les autres annees). Le schema des colonnes differe aussi entre PLF (ae/cp, sous-action) et PLRG (AE EXEC/CP EXEC, sous_action).

PLF 2025 entrants/2025/PLF/

Documents budgetaires (PLF_2025.zip — 131 Mo)

472 fichiers : 229 PDF 0 HTML

Ecart majeur : pas de HTML

Contrairement au PLR 2023 et PLF 2024, ce ZIP ne contient aucun fichier HTML. Seuls les PDF compiles sont fournis. Le contenu (credits, JPE, performance, operateurs) est le meme mais uniquement dans les PDF.

Convention de nommage :

  • Missions : PAP2025_{type_budget}_{nom_mission}_{code}.pdf
  • Programmes : FR_2025_PLF_{mission}_PGM_{code}.pdf

Donnees dataviz (donnees pour dataviz nomenclature PLF 2025.zip)

  • MiS_PGM_ACT_SSA.xls — Nomenclature (2 664 lignes)
  • Credits_Destination_Nature_YC_RetD.xls — Credits (2 404 lignes, colonnes ae / cp)
  • emplois.xls — ETPT

PLF 2026 entrants/2026/PLF/

Documents budgetaires (PLF_2026.zip — 132 Mo)

462 fichiers : 224 PDF 0 HTML

Convention identique au PLF 2025 : PAP2026_... pour les missions, FR_2026_PLF_... pour les programmes.

Donnees dataviz (donnees pour dataviz nomenclature PLF 2026.zip)

  • MiS_PGM_ACT_SSA.xls — Nomenclature (2 642 lignes)
  • Credits_Destination_Nature_YC_RetD.xls — Credits (2 333 lignes, colonnes ae / cp)
  • emplois.xls — ETPT

Ecarts et variantes constates

1. Presence des HTML structurés

SourceHTMLCommentaire
PLR 2023694HTML complets (CREDITS, JPE, STRAT, PERF, OPE)
PLF 2024665HTML complets (idem)
PLF 20250PDF uniquement — rupture de format
PLRG 20240PDF uniquement
PLF 20260PDF uniquement

Les HTML sont la version machine-readable des PDF (meme contenu, meme dossier programme). Ils permettent le parsing direct des tableaux de credits. A partir du PLF 2025, seuls les PDF compiles sont livres.

2. Variantes des colonnes dans les XLS credits

Format PLF (PLF 2024, 2025, 2026)
exercice, loi, typeBudget, ministere,
mission, programme, action,
sous-action,     ← tiret
categorie, titre,
ae, cp           ← minuscules
Format PLR (PLRG 2023, PLRG 2024)
exercice, loi, typeBudget, ministere,
mission, programme, action,
sous_action,     ← underscore
categorie, titre,
AE EXEC, CP EXEC ← majuscules

Le schema de base est identique (12 colonnes, meme granularite action × categorie). Seuls les noms de colonnes pour les montants et les sous-actions different. Deux schemas YAML distincts gerent ces variantes (credits_xls_plf.yaml et credits_xls_plr.yaml).

3. Nommage des fichiers

ElementVariante constatee
Credits PLF 2024PLF2024-credits.xls au lieu de Credits_Destination_Nature_YC_RetD.xls
Emplois PLR_emplois.xls (prefixe underscore) vs emplois.xls (sans)
Emplois PLF 2024PLF2024-emplois.xls (nom specifique)
Dossier datavizVariations dans le nom : "donnees pour dataviz et nomenclature" vs "donnees pour dataviz nomenclature" (avec ou sans "et")

4. Nomenclature XLS : parfaitement stable

Aucun ecart

Les 5 fichiers MiS_PGM_ACT_SSA.xls ont exactement les memes 8 colonnes (Type ligne, Type Budget, code, Mission, Ministere, Libelle, Libelle abrege, commentFP) et le meme format de codes (PGM-NN pour les actions, PGM-NN-NN pour les sous-actions). Identique au CSV PLF_2022_Nomenclature.csv deja integre.

5. Volume de donnees par source

SourceLignes creditsProgrammesMissionsTotal AETotal CP
PLRG 2023 (exec)3 42416645811,6 Md€813,5 Md€
PLF 20242 37416946816,4 Md€812,1 Md€
PLF 20252 40416746847,6 Md€823,0 Md€
PLRG 2024 (exec)3 56016445798,8 Md€808,5 Md€
PLF 20262 33316245842,8 Md€818,5 Md€

Les fichiers PLR ont ~50% de lignes en plus que les PLF (plus de detail dans l'execution).

Couverture des sources de donnees

Comparaison entre ce qui est disponible dans les HTML/PDF, les XLS dataviz, et les CSV open data :

DonneeHTML (2023-2024)XLS dataviz (toutes)CSV open dataPDF (toutes)
Credits AE/CP par action/titreouiouioui (variable)oui
Nomenclature mission/pgm/actionouiouioui (variable)oui
JPE (detail fin des depenses)ouioui
Performance / indicateursouipartiellementoui
Operateursouioui
Emplois / ETPTouipartiellementoui

Pour la pipeline actuelle (credits + nomenclature), les XLS dataviz couvrent toutes les annees de maniere homogene. Les CSV open data sont un complement utile avec des colonnes supplementaires (libelles, FdC/AdP). Le detail JPE et les operateurs ne sont accessibles que via les HTML (2023-2024) ou les PDF.