Beoordelingsmethode NMBS-treincontract geschorst: verband tussen kwalitatieve labels en punten is onbegrijpelijk
De Raad van State schorst de aanwijzing van CAF als preferentiële inschrijver voor het AM30-raamakkoord van de NMBS (tot 4,66 miljard euro voor elektrische treinstellen), omdat de beoordelingsmethode voor het criterium 'technische waarde' niet toeliet te begrijpen hoe de generieke kwalitatieve labels en de vastgestelde meer- en minwaarden zich vertaalden in de toegekende puntenscores.
Wat gebeurde er?
De NMBS lanceerde in december 2022 een onderhandelingsprocedure met voorafgaande oproep tot mededinging (artikel 120 wet overheidsopdrachten) voor een raamakkoord voor de aankoop van elektrische treinstellen (EMU's) en batterijtreinstellen (BEMU's) — het AM30-programma, geraamd op minimaal 1,85 miljard euro en maximaal 4,66 miljard euro voor een vloot van maximaal 170.000 zitplaatsen. De aanbesteding werd op 23 december 2022 nationaal en op 28 december 2022 Europees bekendgemaakt. Op 3 februari 2023 dienden vier kandidaten een aanvraag tot deelneming in: Alstom, CAF, het Groupement Siemens (Siemens Mobility GmbH en Siemens Mobility NV) en Stadler. Alle vier werden op 13 april 2023 geselecteerd, maar Stadler liet op 16 mei 2023 weten geen offerte in te dienen. De drie overblijvende inschrijvers doorliepen een uitgebreid traject van vier offerterondes met meerdere regularisaties: eerste offertes op 24 november 2023 (drie regularisatieronden), tweede offertes op 10 juli 2024, derde offertes op 25 november 2024, en vierde offertes op 13 januari 2025. De gunningsleidraad voorzag in de mogelijkheid om na evaluatie van de finale offertes ofwel het raamakkoord rechtstreeks te gunnen, ofwel een preferentiële inschrijver aan te wijzen waarmee contractonderhandelingen zouden worden gevoerd (fase 5), terwijl de andere inschrijvers in een wachtsectie werden geplaatst. Het bestek bevatte zes gunningscriteria, waaronder 'Technische waarde' (gewicht 36 op 100 punten). De gunningsleidraad beschreef de beoordelingsmethode als een globale evaluatie op basis van meer- en minwaarden in verschillende gradaties ('belangrijke meerwaarde', 'meerwaarde', 'beperkte meerwaarde', en hun tegenhangers), die werden vertaald in generieke kwalitatieve labels ('de bonne qualité', 'plus que suffisante', 'suboptimale', 'suffisante', 'faible'). Op basis daarvan werd een globale puntenscore toegekend. Na evaluatie van de vierde offertes wees de raad van bestuur van de NMBS op 28 februari 2025 CAF aan als preferentiële inschrijver, met de scores 18/36 voor CAF, 17/36 voor Alstom en 17,25/36 voor het Groupement Siemens. Alstom en Siemens werden in de wachtsectie geplaatst. Beiden vochten op 14 maart 2025 de beslissing aan. CAF kwam vrijwillig tussenbeide ter ondersteuning van de beslissing, het Groupement Siemens ter ondersteuning van Alstoms vordering — al werd het tussenkomstverzoek van Siemens gedeeltelijk buiten beschouwing gelaten omdat het in wezen nieuwe middelen aanvoerde uit hun eigen parallelle zaak, in strijd met artikel 21bis. De Raad onderzocht het vierde middel van Alstom over de beoordelingsmethode en oordeelde dat het middel ernstig was, om vier redenen. Ten eerste: de betekenis en draagwijdte van de generieke labels waren nergens gedefinieerd, zodat hun invloed op de score niet te achterhalen viel. Ten tweede: de verhouding tussen labels en punten was onbegrijpelijk — het Groupement Siemens kreeg vijf keer de beoordeling 'faible' maar scoorde hoger (17,25/36) dan Alstom dat slechts drie keer 'faible' kreeg (17/36). Ten derde: het was onmogelijk na te gaan of een 'zeer goede of zeer slechte prestatie' op een element de globale beoordeling daadwerkelijk had beïnvloed, zoals de gunningsleidraad aankondigde. Ten vierde: als de beoordeling zich concentreerde op de onderscheidende elementen, was het onverklaarbaar dat zelfs de hoogste score slechts de helft van het maximale gewicht bedroeg (18/36). Noch de NMBS, noch CAF konden concreet uitleggen hoe de punten effectief waren toegekend — CAF beweerde dat de methode 'assurément' begrijpelijk was, maar onthield zich ervan concreet uiteen te zetten hoe de punten waren berekend. De Raad beval de schorsing.
Waarom doet dit ertoe?
Dit arrest raakt aan de kern van de beoordelingsmethode bij grote en complexe overheidsopdrachten. Een globale evaluatie op basis van kwalitatieve labels is op zich toegestaan — de aanbestedende overheid heeft een ruime beoordelingsvrijheid bij de keuze van haar evaluatiemethode. Maar de methode moet transparant en begrijpelijk zijn. Als de overheid werkt met gradaties van meer- en minwaarden en generieke labels, moet het verband tussen die labels en de uiteindelijke puntenscores controleerbaar zijn — zowel voor de inschrijvers als voor de rechter. Dat is hier niet het geval: de labels hadden geen gedefinieerde waarde, en de punten die eruit volgden waren niet verklaarbaar. Het arrest heeft ook een aanzienlijk economisch en politiek belang, gegeven de omvang van het AM30-contract.
De les
Een globale beoordelingsmethode met kwalitatieve labels is toegestaan, maar de methode moet controleerbaar blijven. Als je werkt met gradaties van meer- en minwaarden en generieke kwalificaties, definieer dan de betekenis van die labels en maak het verband met de puntenscores traceerbaar. Onverklaarbare scoreresultaten — zoals een hogere score ondanks meer negatieve beoordelingen — zijn een sterk middel bij de Raad van State. En als tussenkomende partij: als de aanbestedende overheid de methode niet concreet kan uitleggen en jij het ook niet kunt, staat de schorsing voor de deur.
Stel jezelf de vraag
Kan ik uit de kwalitatieve beoordelingen in het gunningsverslag begrijpen hoe de aanbestedende overheid tot de toegekende puntenscores is gekomen — of is het verband tussen de labels en de cijfers ondoorzichtig?
Over deze databank
De Raad van State is het hoogste administratieve rechtscollege in België. Bij geschillen over overheidsopdrachten — van de gunning van een contract tot de uitsluiting van een inschrijver — is het de Raad van State die in laatste instantie oordeelt. De arresten in deze databank zijn door TenderWolf samengevat in begrijpelijke taal, met concrete lessen voor inschrijvers en aanbestedende overheden. Bekijk alle arresten →