Algorithmes d'exécution

Exploiter le calendrier

∞structurel

Revu le 4 juin 2026. En 2026 : un trait permanent du marché, pas un avantage qui s'érode.

Un calendrier prévisible est une cible : si les autres devinent votre courbe VWAP, ils tradent devant. Randomiser et adapter le calendrier est le contre-jeu.

L'idée

Métronome vs gigue : la prévisibilité est la fuite schéma annotéDG-GAMING

Ce que montre ce schéma. Un calendrier qui trade la même taille aux mêmes heures est un métronome : dès qu'un détecteur le repère, un prédateur achète juste avant chaque tranche et vend dans l'impact qu'elle crée, si bien que le coût réalisé dérive au-dessus du modèle (ici de 15 à 19 bps). Varier la taille des ordres enfants, introduire de la gigue dans le timing et répartir sur plusieurs places au même débit moyen effondre le taux de réussite du prédateur et ramène le coût près du modèle (~16 bps). Les quelque 3 bps récupérés sont la valeur de l'imprévisibilité – surtout de la fuite évitée, pas de l'impact réduit.

Comment un calendrier est-il détecté ?

Un gros ordre parent travaillé selon une règle fixe laisse une empreinte : des tailles d'enfants régulières, une cadence régulière, une pression unilatérale constante à des moments prévisibles. D'autres traders, de plus en plus dotés de reconnaisseurs de motifs par ML, repèrent cette empreinte sur la bande publique et infèrent « un gros acheteur travaille un calendrier ici », puis se positionnent pour profiter des tranches qu'ils peuvent désormais anticiper.

La prévisibilité est le signal. Un TWAP parfaitement régulier qui achète 10 000 actions à la minute, chaque minute, est presque un métronome, trivial à détecter. Un VWAP naïf qui retrace toujours le même U historique est presque aussi facile. C'est la régularité qui fuit, pas un ordre isolé. Les outils du détecteur sont les mêmes signaux de microstructure que le reste de l'atlas enseigne, joués à l'envers : un déséquilibre du flux d'ordres persistant d'un côté, un regroupement régulier dans les motifs d'arrivée en temps irrégulier, et un prix qui revient entre les tranches. En 2026 ce sont des classifieurs appris, entraînés à reconnaître « ceci ressemble à un calendrier institutionnel ».

Cette page est de reconnaissance seulement. Nous décrivons comment la prévisibilité est détectée pour qu'un exécutant puisse s'en défendre, pas un mode d'emploi opérationnel pour le prédateur. La conduite prédatrice qui bascule dans l'illégalité, comme l'amorçage de momentum, est traitée sous le cadrage juridique du sujet manipulation de marché.

Que fait le prédateur une fois qu'il vous a détecté ?

Il anticipe la tranche suivante. S'il sait qu'un gros acheteur lèvera l'offre dans environ 30 secondes, il achète maintenant, laisse la tranche de l'acheteur pousser le prix à la hausse, et vend dedans, captant le mouvement que le calendrier lui-même crée. Il ne prédit pas le marché ; il vous prédit, ce qui est bien plus facile, et cela retourne votre propre impact contre vous.

Devancer le calendrier (au sens prédateur, pas au sens illégal du courtier qui devance ses clients) signifie trader devant un enfant anticipé et profiter de l'impact que cet enfant causera. L'exécutant paie à la fois son impact normal et la marge extraite par le prédateur. Et cela compose : chaque tranche anticipée qui dégrade le prix élève le coût de la tranche suivante, si bien qu'un calendrier détecté se dégrade, et le slippage réalisé dérive bien au-dessus de ce que le modèle d'impact prédit.

Le coût réalisé d'un calendrier détecté est l'impact modélisé plus un terme de fuite : la marge par tranche que le prédateur extrait, sommée sur chaque enfant anticipé.

\text{cost}_{\text{realised}} = \underbrace{\text{cost}_{\text{model}}}_{\text{impact}} \;+\; \underbrace{\sum_{k} \ell_k}_{\text{leakage}}

L'écart entre coût modélisé et coût réalisé est souvent la fuite elle-même. La perte de l'exécutant est le P&L du prédateur, la même pièce de sélection adverse qu'ailleurs dans l'atlas : le teneur de marché craint le flux informé ; l'exécutant craint d'être reconnu comme grand et prévisible. Voir sélection adverse.

La défense : la randomisation

Cassez le motif. Au lieu de tranches égales sur l'horloge, variez les tailles d'enfants, variez la cadence (introduisez du jitter dans les intervalles), et variez la place et le mélange passif/agressif. Un calendrier randomisé avec la même participation moyenne est bien plus difficile à détecter, si bien que le prédateur ne peut pas anticiper de façon fiable la tranche suivante, au prix d'un peu plus de variance autour de l'indice de référence.

Tirez la taille de chaque enfant et l'intervalle inter-arrivées d'une distribution autour de la cible plutôt que de les fixer : le calendrier moyen suit toujours le VWAP/POV, mais aucune tranche n'est prévisible.

n_k \sim \mathcal{U}\!\big(\bar{n}(1-\delta),\, \bar{n}(1+\delta)\big), \qquad \Delta t_k \sim \bar{\tau} \pm \text{jitter}

Une petite dose délibérée de « bruit » achète du camouflage. Randomisez aussi la place et le côté : variez la place que chaque enfant frappe (routage intelligent d'ordres) et mélangez postage passif et prises agressives, pour que l'empreinte ne soit pas unilatérale et métronomique. L'arbitrage : la randomisation augmente l'erreur de suivi face à l'indice de référence (vous ne collez plus parfaitement au VWAP) en échange d'une fuite d'information moindre. Le coût net réalisé s'améliore en général, car la fuite que vous supprimez coûte plus que la variance que vous ajoutez, mais c'est un équilibre, raison pour laquelle l'anti-gaming se règle, il n'est pas maximal.

La défense : l'exécution adaptative / dynamique

Au-delà de la randomisation, un algorithme adaptatif répond au marché en temps réel, accélérant quand la liquidité est bon marché et abondante, ralentissant ou s'arrêtant quand il détecte qu'on l'exploite ou que l'impact s'envole. Là où un calendrier statique s'engage à l'avance, un calendrier adaptatif redécide chaque enfant à partir de l'état courant, ce qui le rend à la fois moins prévisible et plus efficace.

Le POV est l'adaptation la plus simple (une règle de rétroaction sur le volume, voir VWAP, TWAP & POV), et les algos adaptatifs plus complets lisent aussi l'impact à court horizon, le spread, et les signes qu'ils sont détectés. Les calendriers d'implementation shortfall / Almgren–Chriss s'adaptent à la volatilité, chargeant tôt quand le prix est volatil et ralentissant dans le calme, ce qui est à la fois optimal et moins prévisible qu'une courbe fixe.

La frontière de 2026 est la politique apprise : l'exécution posée comme un problème d'apprentissage par renforcement, une politique qui mappe l'état vivant du carnet d'ordres vers l'enfant suivant, entraînée à minimiser le coût y compris le terme de fuite. C'est la pointe de ce que l'IA change pour l'exécution ; voir ce que l'IA change pour le HFT.

La course aux armements

Détection et défense escaladent ensemble. À mesure que les prédateurs déploient de meilleurs détecteurs par ML, les exécutants déploient de meilleures politiques de randomisation et d'adaptation ; à mesure que les exécutants se cachent mieux, les détecteurs deviennent plus intelligents. Aucun camp ne gagne définitivement. L'avantage est d'être d'un cran moins prévisible que la génération courante de détecteurs, raison pour laquelle l'anti-gaming est un effort d'ingénierie continu, pas un problème résolu.

C'est structurel, pas une mode passagère : chaque fois qu'un gros ordre lent doit transiger contre des contreparties rapides et attentives, le jeu du chat et de la souris existe. Il existait avant le ML et s'intensifie avec lui. Il relie aussi tout l'atlas : les mêmes signaux de microstructure (déséquilibre du flux d'ordres, VPIN, microprice) sont des outils de détection pour le prédateur et des diagnostics de défense pour l'exécutant.

Le verdict honnête de 2026 : il n'existe pas d'« algorithme anti-gaming » statique que vous livrez une fois. Les desks qui exécutent le mieux entretiennent leurs politiques de randomisation et d'adaptation comme les équipes de sécurité entretiennent leurs défenses : en continu, contre un adversaire qui s'adapte.

Exemple travaillé

Chiffres synthétiques illustratifs à jour en 2026, pas un conseil. Dispositif : un TWAP naïf achète 12 000 actions par heure sous forme de 200 actions chaque minute, à la minute, pour une journée entière. Le modèle d'impact prédit environ 15 pb de coût total.

Détecté. Le classifieur d'un prédateur signale les achats métronomiques de 200 actions après environ 20 minutes. Il commence à lever environ 150 actions environ 10 secondes avant chaque tranche attendue et à vendre dans l'impact de la tranche. Sur la journée cela extrait, disons, environ 4 pb de l'ordre.

Un calendrier statique détecté paie son impact modélisé plus un terme de fuite pure ; ici 15 pb modélisés plus 4 pb extraits donnent 19 pb réalisés, les 4 pb d'écart que le modèle n'a jamais vus.

\text{cost}_{\text{realised}} \approx 15\,\text{bps} + 4\,\text{bps} = 19\,\text{bps}

Randomisé. Même taux moyen, mais chaque enfant tiré uniformément de 100 à 300 actions à des intervalles avec un jitter de ±40 secondes, dispersé sur deux places, avec environ 30 % posté passivement. Le taux de réussite du classifieur à anticiper les tranches s'effondre ; la fuite extraite tombe à environ 1 pb. L'erreur de suivi face à l'indice de référence monte légèrement (le calendrier est plus grumeleux), mais le coût réalisé tombe à environ 16 pb, de nouveau proche du modèle. Les quelque 3 pb récupérés sont la valeur de l'imprévisibilité : l'essentiel de l'avantage de slippage d'un algo bien construit sur un naïf est de la fuite évitée, pas de l'impact réduit. La fuite réelle dépend de la taille de l'ordre rapportée à l'ADV, de la liquidité du nom, et de l'attention des contreparties.

Où cela s'inscrit

↑ Vers le haut · brique de Algorithmes d'exécution ↔ En travers · se combine avec VWAP, TWAP & POV ↔ En travers · se combine avec Alignement de cotation ↔ En travers · se combine avec Déséquilibre du flux d'ordres → Application · rapporte sur Actions & futures ⤓ Construire / Acheter · outil nécessaire Jeux de données et outils