Analyse de l'existant
Inventaire exhaustif des donnees brutes disponibles dans entrants/, issues des ZIP de la Direction du Budget. Cette page documente le contenu de chaque livraison, les formats trouves, et les ecarts entre annees.
Vue d'ensemble
| Dossier | Type document | Annee budgetaire | HTML | XLS nomenclature | XLS credits | XLS emplois | |
|---|---|---|---|---|---|---|---|
entrants/2023/PLRG/ |
PLRG 2023 | 2023 | 209 | 694 | MiS_PGM_ACT_SSA.xls | Credits_Destination_Nature_YC_RetD.xls | _emplois.xls |
entrants/2024/PLF/ + PLRG/ |
PLF 2024 + PLRG 2024 | 2024 | 217 + 229 | 665 | MiS_PGM_ACT_SSA.xls (x2) | PLF2024-credits.xls + Credits_...RetD.xls | PLF2024-emplois.xls + _emplois.xls |
entrants/2025/PLF/ |
PLF 2025 | 2025 | 229 | 0 | MiS_PGM_ACT_SSA.xls | Credits_Destination_Nature_YC_RetD.xls | emplois.xls |
entrants/2026/PLF/ |
PLF 2026 | 2026 | 224 | 0 | MiS_PGM_ACT_SSA.xls | Credits_Destination_Nature_YC_RetD.xls | emplois.xls |
S'ajoutent les sources open data deja presentes dans entrants/plf open data/ : CSV pour PLF 2014 a 2025, LFI 2019 a 2023, et PLR 2018.
Organisation des dossiers
Les documents sont ranges par annee budgetaire, puis par exercice (PLF ou PLRG), puis par type de budget :
entrants/{annee}/
PLF/ Documents du Projet de Loi de Finances
BA/ BG/ CAS/ CCF/ CCO/ COM/
MSN/{code}/ Documents par mission
PGM/{code}/ Documents par programme
PLRG/ Documents du Projet de Loi de Resultats de Gestion
BA/ BG/ CAS/ CCF/ CCO/ COM/
MSN/{code}/ Documents par mission
PGM/{code}/ Documents par programme
donnees pour dataviz... PLF {annee}/
MiS_PGM_ACT_SSA.xls, Credits_*.xls, emplois.xls
donnees pour dataviz... PLRG {annee}/
MiS_PGM_ACT_SSA.xls, Credits_*.xls, _emplois.xls
Detail par annee
PLRG 2023 entrants/2023/PLRG/
Documents budgetaires (PLR_2023.zip — 313 Mo)
1 129 fichiers : 209 PDF 694 HTML
Les PDF sont les bleus budgetaires complets (RAP). Les HTML sont les memes documents decomposes en sections parsables :
| Suffixe HTML | Contenu | Nombre |
|---|---|---|
_CREDITS | Tableaux de credits par action/titre (AE/CP, LFI N-1, execution) | 166 |
_JPE | Justification au Premier Euro — detail fin des depenses | 173 |
_STRAT | Presentation strategique du programme | 166 |
_PERF | Objectifs et indicateurs de performance | 136 |
_OPE | Operateurs rattaches au programme | 53 |
Convention de nommage des fichiers : FR_2023_PLR_{type_budget}_PGM_{code}.pdf
Donnees dataviz (donnees pour dataviz et nomenclature PLRG 2023.zip)
MiS_PGM_ACT_SSA.xls— Nomenclature complete (2 593 lignes, 8 colonnes)Credits_Destination_Nature_YC_RetD.xls— Credits executes (3 424 lignes, colonnesAE EXEC/CP EXEC)_emplois.xls— ETPT par programme (166 programmes)
PLF 2024 + PLRG 2024 entrants/2024/PLF/ + entrants/2024/PLRG/
Documents budgetaires PLF (PLF_2024.zip — 210 Mo)
1 114 fichiers : 217 PDF 665 HTML
| Suffixe HTML | Nombre |
|---|---|
_CREDITS | 157 |
_JPE | 165 |
_STRAT | 157 |
_PERF | 134 |
_OPE | 52 |
Convention de nommage PLF : FR_2024_PLF_{type_budget}_PGM_{code}.pdf
Documents budgetaires PLRG (PLRG_2024.zip — 236 Mo)
229 PDF 0 HTML — RAP (resultats de gestion). Convention : FR_2024_PLR_{type_budget}_PGM_{code}.pdf
Donnees dataviz PLF
MiS_PGM_ACT_SSA.xls— Nomenclature PLF (2 642 lignes)PLF2024-credits.xls— Credits PLF (2 374 lignes, colonnesae/cp)PLF2024-emplois.xls— ETPT PLF
Donnees dataviz PLRG
MiS_PGM_ACT_SSA.xls— Nomenclature PLRG (2 643 lignes)Credits_Destination_Nature_YC_RetD.xls— Credits executes (3 560 lignes, colonnesAE EXEC/CP EXEC)_emplois.xls— ETPT executes
Ecart constate : nommage du fichier credits PLF
Le fichier credits PLF est nomme PLF2024-credits.xls au lieu de Credits_Destination_Nature_YC_RetD.xls (nom utilise pour toutes les autres annees). Le schema des colonnes differe aussi entre PLF (ae/cp, sous-action) et PLRG (AE EXEC/CP EXEC, sous_action).
PLF 2025 entrants/2025/PLF/
Documents budgetaires (PLF_2025.zip — 131 Mo)
472 fichiers : 229 PDF 0 HTML
Ecart majeur : pas de HTML
Contrairement au PLR 2023 et PLF 2024, ce ZIP ne contient aucun fichier HTML. Seuls les PDF compiles sont fournis. Le contenu (credits, JPE, performance, operateurs) est le meme mais uniquement dans les PDF.
Convention de nommage :
- Missions :
PAP2025_{type_budget}_{nom_mission}_{code}.pdf - Programmes :
FR_2025_PLF_{mission}_PGM_{code}.pdf
Donnees dataviz (donnees pour dataviz nomenclature PLF 2025.zip)
MiS_PGM_ACT_SSA.xls— Nomenclature (2 664 lignes)Credits_Destination_Nature_YC_RetD.xls— Credits (2 404 lignes, colonnesae/cp)emplois.xls— ETPT
PLF 2026 entrants/2026/PLF/
Documents budgetaires (PLF_2026.zip — 132 Mo)
462 fichiers : 224 PDF 0 HTML
Convention identique au PLF 2025 : PAP2026_... pour les missions, FR_2026_PLF_... pour les programmes.
Donnees dataviz (donnees pour dataviz nomenclature PLF 2026.zip)
MiS_PGM_ACT_SSA.xls— Nomenclature (2 642 lignes)Credits_Destination_Nature_YC_RetD.xls— Credits (2 333 lignes, colonnesae/cp)emplois.xls— ETPT
Ecarts et variantes constates
1. Presence des HTML structurés
| Source | HTML | Commentaire |
|---|---|---|
| PLR 2023 | 694 | HTML complets (CREDITS, JPE, STRAT, PERF, OPE) |
| PLF 2024 | 665 | HTML complets (idem) |
| PLF 2025 | 0 | PDF uniquement — rupture de format |
| PLRG 2024 | 0 | PDF uniquement |
| PLF 2026 | 0 | PDF uniquement |
Les HTML sont la version machine-readable des PDF (meme contenu, meme dossier programme). Ils permettent le parsing direct des tableaux de credits. A partir du PLF 2025, seuls les PDF compiles sont livres.
2. Variantes des colonnes dans les XLS credits
Format PLF (PLF 2024, 2025, 2026)
exercice, loi, typeBudget, ministere, mission, programme, action, sous-action, ← tiret categorie, titre, ae, cp ← minuscules
Format PLR (PLRG 2023, PLRG 2024)
exercice, loi, typeBudget, ministere, mission, programme, action, sous_action, ← underscore categorie, titre, AE EXEC, CP EXEC ← majuscules
Le schema de base est identique (12 colonnes, meme granularite action × categorie). Seuls les noms de colonnes pour les montants et les sous-actions different. Deux schemas YAML distincts gerent ces variantes (credits_xls_plf.yaml et credits_xls_plr.yaml).
3. Nommage des fichiers
| Element | Variante constatee |
|---|---|
| Credits PLF 2024 | PLF2024-credits.xls au lieu de Credits_Destination_Nature_YC_RetD.xls |
| Emplois PLR | _emplois.xls (prefixe underscore) vs emplois.xls (sans) |
| Emplois PLF 2024 | PLF2024-emplois.xls (nom specifique) |
| Dossier dataviz | Variations dans le nom : "donnees pour dataviz et nomenclature" vs "donnees pour dataviz nomenclature" (avec ou sans "et") |
4. Nomenclature XLS : parfaitement stable
Aucun ecart
Les 5 fichiers MiS_PGM_ACT_SSA.xls ont exactement les memes 8 colonnes (Type ligne, Type Budget, code, Mission, Ministere, Libelle, Libelle abrege, commentFP) et le meme format de codes (PGM-NN pour les actions, PGM-NN-NN pour les sous-actions). Identique au CSV PLF_2022_Nomenclature.csv deja integre.
5. Volume de donnees par source
| Source | Lignes credits | Programmes | Missions | Total AE | Total CP |
|---|---|---|---|---|---|
| PLRG 2023 (exec) | 3 424 | 166 | 45 | 811,6 Md€ | 813,5 Md€ |
| PLF 2024 | 2 374 | 169 | 46 | 816,4 Md€ | 812,1 Md€ |
| PLF 2025 | 2 404 | 167 | 46 | 847,6 Md€ | 823,0 Md€ |
| PLRG 2024 (exec) | 3 560 | 164 | 45 | 798,8 Md€ | 808,5 Md€ |
| PLF 2026 | 2 333 | 162 | 45 | 842,8 Md€ | 818,5 Md€ |
Les fichiers PLR ont ~50% de lignes en plus que les PLF (plus de detail dans l'execution).
Couverture des sources de donnees
Comparaison entre ce qui est disponible dans les HTML/PDF, les XLS dataviz, et les CSV open data :
| Donnee | HTML (2023-2024) | XLS dataviz (toutes) | CSV open data | PDF (toutes) |
|---|---|---|---|---|
| Credits AE/CP par action/titre | oui | oui | oui (variable) | oui |
| Nomenclature mission/pgm/action | oui | oui | oui (variable) | oui |
| JPE (detail fin des depenses) | oui | — | — | oui |
| Performance / indicateurs | oui | — | partiellement | oui |
| Operateurs | oui | — | — | oui |
| Emplois / ETPT | — | oui | partiellement | oui |
Pour la pipeline actuelle (credits + nomenclature), les XLS dataviz couvrent toutes les annees de maniere homogene. Les CSV open data sont un complement utile avec des colonnes supplementaires (libelles, FdC/AdP). Le detail JPE et les operateurs ne sont accessibles que via les HTML (2023-2024) ou les PDF.