Quote stuffing
†mortInonder une place d'ordres et d'annulations instantanées pour congestionner le flux de données et ralentir les concurrents : un déni de service sur le carnet. Manipulatoire sous le MAR et les règles américaines ; couvert pour la détection.
Voir en mouvement
À remarquer (détection seulement). Montez l'intensité et le débit de messages explose tandis que les exécutions restent plates, si bien que le ratio ordres/transactions dépasse de loin celui d'un desk honnête et la latence du flux que tout le monde subit grimpe. Cette congestion est le but recherché – et c'est la signature de surveillance que les régulateurs signalent. Montré pour que vous le reconnaissiez, jamais pour le pratiquer.
Qu'est-ce que le quote stuffing, et pourquoi est-il illégal ?
Le quote stuffing consiste à entrer et retirer rapidement un très grand nombre d'ordres pour surcharger délibérément le flux et le moteur d'appariement, de sorte que les concurrents traitant ce flux prennent du retard. Les ordres ne sont pas destinés à trader ; leur but est de congestionner l'infrastructure, fabriquant un bref avantage de latence pour le stuffeur sur tous ceux contraints de traiter le bruit. C'est, en effet, une attaque par déni de service contre la plomberie du marché.
Le mécanisme est simple. Chaque ordre, modification et annulation est un message que la place doit traiter et diffuser, et que tout autre participant doit analyser. Si un participant émet des dizaines de milliers de messages par seconde sans aucun but économique, le flux et les analyseurs des rivaux congestionnent, et leur vue du marché prend du retard. Le stuffeur, qui sait que la rafale est du bruit, agit sur l'état réel tandis que les concurrents digèrent encore le déluge. Le trait déterminant (ce qui le sépare d'un teneur de marché légitimement occupé) est que le volume de messages ne sert aucune fonction économique : un taux d'exécution quasi nul, aucun but d'inventaire, et un timing qui coïncide avec les propres trades du stuffeur.
Dans l'UE et au Royaume-Uni il est explicitement nommé : l'article 12(2)(c) du MAR cite le « quote stuffing » comme exemple de manipulation qui perturbe le fonctionnement de la place ou rend plus difficile pour d'autres l'identification des ordres véritables. C'est dans le règlement lui-même, pas seulement inféré. Aux États-Unis, les dispositions sur les pratiques perturbatrices du CEA (§4c(a)(5), amendé par le Dodd-Frank) atteignent une conduite montrant un mépris intentionnel ou inconsidéré de l'exécution ordonnée, et la SEC/FINRA poursuivent une conduite analogue sur valeurs mobilières sous les règles anti-manipulation générales. Les règlements de places interdisent indépendamment toute conduite qui dégrade les performances du système, donc le stuffing peut être une violation de règle avant d'être une violation statutaire. Voir les régimes d'abus de marché.
Comment est-il détecté ?
Le quote stuffing est invisible dans le registre des transactions et incomparable dans le registre des messages, donc la détection tourne sur la télémétrie de taux de messages que la place capture déjà à la microseconde. La surveillance suit les messages-par-seconde de chaque participant, son ratio ordres-sur-transactions, la durée de vie de ses ordres, et la corrélation entre ses rafales et la latence de flux pour tous les autres.
Quatre indices de télémétrie se combinent. Une anomalie de taux de messages : un pic d'ajouts plus annulations par unité de temps bien au-dessus des bases de référence du participant et de ses pairs. Un ratio ordres-sur-transactions qui explose : des milliers de messages par exécution, au-delà de tout besoin véritable de cotation ou de couverture. Une minuscule durée de vie d'annulation : des ordres annulés en quelques microsecondes, ne reposant jamais assez longtemps pour plausiblement trader. Et une corrélation de latence : la rafale coïncide avec une hausse mesurable de la latence de diffusion pour les pairs (l'effet même que la conduite existe pour produire) et est calée autour des propres trades véritables du stuffeur. Le journal horodaté complet rend la rafale reconstructible, et des modèles de machine learning entraînés sur les distributions normales de taux de messages signalent l'anomalie automatiquement.
Comment les places et les régulateurs l'écartent-ils par les prix ?
La défense structurelle ne repose pas sur la preuve d'intention au cas par cas ; elle fait que le volume de messages coûte quelque chose, si bien que le stuffing devient non économique et auto-limitant. Quatre contrôles font le travail. Les throttles de messages plafonnent les messages-par-seconde de chaque participant ; l'excès est rejeté ou mis en file, supprimant le mécanisme de congestion. Les limites de ratio ordres-sur-transactions (mandatées par le MiFID II RTS 9, qui exige des places qu'elles fixent un OTR maximal par instrument) freinent ou pénalisent un participant dont les messages dépassent largement ses transactions. Les frais basés sur les messages facturent par message (ou par annulation au-dessus d'un ratio), internalisant le coût que la rafale impose au système. Et les temps de repos minimaux ou ralentisseurs (speed bumps) exigent qu'un ordre repose un intervalle minimal, supprimant le motif tirer-et-annuler dont dépend le stuffing.
Là où la conduite est néanmoins prouvée, les régulateurs la poursuivent sous l'article 12 du MAR ou le CEA, et les places la sanctionnent sous leurs règlements. La combinaison (détection par télémétrie plus tarification structurelle) est pourquoi le quote stuffing est désormais substantiellement atténué relativement à l'ère du début des années 2010 où il fut d'abord identifié. Voir les régimes d'abus de marché pour l'interdiction et la façon dont les contrôles d'OTR s'insèrent dans les obligations de surveillance propres d'une firme.
Un teneur de marché occupé fait-il du quote stuffing ?
Non, et la distinction est tout l'enjeu des contrôles. Un véritable teneur de marché envoie lui aussi d'énormes volumes de messages, re-cotant constamment à mesure que le prix bouge. La différence est le but et l'effet économiques : les messages du teneur maintiennent des cotations réelles, exécutables et à deux sens qui produisent des exécutions ; ceux du stuffeur ne servent qu'à congestionner, avec des exécutions quasi nulles et un effet de latence délibéré sur les autres. Les limites d'OTR sont calibrées précisément pour permettre le premier et attraper le second.
C'est pourquoi une stratégie à forts messages doit être conçue avec les limites d'OTR et la grille de frais par message à l'esprit, non pour les contourner, mais parce que la cotation légitime doit rester dans l'enveloppe que la place définit pour l'activité véritable, et parce qu'une boucle de re-cotation mal réglée peut ressembler à du stuffing sur la télémétrie. Le volume du teneur s'accompagne d'exécutions et d'un but d'inventaire ; celui du stuffeur de ni l'un ni l'autre. Les métriques ci-dessus sont conçues pour lire exactement cette différence.
Exemple travaillé
Une reconstruction de télémétrie synthétique, à la date de 2026 : comment on l'attrape, pas comment on le fait. La base de référence normale d'un participant sur un instrument est ~50 messages/seconde avec un ratio ordres-sur-transactions autour de 20:1, occupé mais économique. Dans une fenêtre de 200 ms il émet ~12 000 messages d'ajout/annulation, un taux équivalent proche de 60 000/seconde, avec zéro exécution dans cette fenêtre. La latence de diffusion de la place vers les autres participants monte de façon mesurable sur la rafale, et le propre ordre véritable du participant trade immédiatement après, dans le retard.
Lisez les indices. Le taux de messages tourne à ~1 200× la propre base du participant pour la fenêtre, une anomalie criante contre son historique. Le ratio ordres-sur-transactions en fenêtre est indéfini : 12 000 messages, zéro transaction. La durée de vie d'annulation a une vie médiane d'ordre de ~30 µs, bien sous toute intention d'exécution plausible. Et la corrélation de latence montre la latence de flux pour les pairs piquant exactement sur la rafale, puis se rétablissant : l'effet que la conduite existe pour produire. Sous une limite d'OTR du MiFID II (RTS 9) et des frais par message, cette rafale serait freinée ou rendue directement coûteuse, la défense structurelle qui mord avant qu'un dossier ne soit même construit.
La leçon : le quote stuffing est invisible dans le registre des transactions et incomparable dans le registre des messages, ce qui est pourquoi la télémétrie de taux de messages, pas la bande, est là où on l'attrape et où les contrôles mordent. Les chiffres sont synthétiques et illustratifs ; les bases, seuils et plafonds d'OTR réels sont calibrés par instrument et par place. Voir manipulation de marché pour la conduite environnante.