Stratégies de trading·other

Arbitrage de latence

banalisé
Revu le 4 juin 2026. En 2026 : largement connu et implémenté ; l'avantage est dans l'exécution, pas dans l'idée.

Cueillez une cotation périmée sur une place lente avant qu'elle ne se mette à jour pour rejoindre une place rapide. Comme trait structurel, cela arrive chaque jour ; comme opportunité ouverte sur les actions matures, c'est une course aux armements banalisée où le gagnant rafle tout.

Voir en mouvement

La course à la latenceappuyez sur courirIX-LATENCY
Votre avantage de vitesse30%
Probabilité de gain64%
Dernière course
vous (chemin rapide)concurrent (chemin lent)cotation périmée
Votre avantage de latence30%

À remarquer. L'arbitrage de latence n'est pas de l'astuce ; c'est arriver le premier sur la même transaction évidente. Ramenez votre avantage vers zéro et c'est un pile ou face ; sur les actions matures le gagnant possède déjà le chemin le plus rapide, c'est pourquoi c'est une course aux armements banalisée, pas une opportunité ouverte.

Qu'est-ce que l'arbitrage de latence, exactement ?

L'arbitrage de latence n'est pas un modèle de pricing ; c'est un avantage de timing. Deux marchés (ou deux flux du même marché) portent la même information, mais l'un l'apprend en premier. Pendant la brève fenêtre avant que le plus lent ne rattrape, ses cotations sont périmées, valorisées sur de l'information ancienne. Quiconque atteint cette cotation périmée en premier trade contre un prix déjà erroné, en sa faveur.

L'intuition d'abord : imaginez un titre coté 100,00 à la fois sur la Place A et la Place B. Un acheteur lève l'offre sur A et le juste prix bondit à 100,02. Pendant quelques microsecondes, B affiche encore 100,00 au bid / 100,01 à l'offre. Un trader rapide achète l'offre de B à 100,01 et est maintenant long à un prix que le reste du marché a déjà quitté. L'« arbitrage », c'est que la perte est celle d'un autre : le teneur de marché lent sur B qui n'avait pas encore retiré sa cotation.

Vous gagnez la cotation périmée chaque fois que votre instant d'arrivée sur la place en retard bat le moment où son propriétaire l'annule ou la recote : tout le jeu en une comparaison d'instants.
tarrival(B)  <  tupdate(B)t_{\text{arrival}}(B) \;\lt\; t_{\text{update}}(B)

Le même instrument se trade sur de nombreuses places, donc un mouvement sur l'une devrait se propager aux autres ; jusqu'à ce qu'il le fasse, les cotations au repos des retardataires sont cueillables. Cette fenêtre de propagation est la « fenêtre de cotation périmée », et c'est ce que modélise la course ci-dessus.

Les trois formes classiques

L'arbitrage de latence apparaît sous trois formes reconnaissables. Chacune est la même course, courue sur un écart différent.

1. SIP vs flux direct (le classique des actions américaines). Sous la Reg NMS, la bande consolidée (le SIP, ou Securities Information Processor) agrège les meilleures cotations de chaque place, mais elle est plus lente que les flux directs que vous pouvez acheter à chaque bourse et colocaliser. Un trader lisant les flux directs voit le NBBO bouger avant que le SIP ne le publie. Les ordres et même une partie de la logique de « cotation protégée » référencent le SIP plus lent, si bien que pendant quelques centaines de microsecondes l'image officielle est en retard sur la réelle. Cet écart, mesuré à des centaines de microsecondes historiquement, comprimé mais pas éliminé par les améliorations du SIP, fut le moteur d'une large part de l'activité d'arbitrage de latence américaine.

2. Cueillette de cotation périmée inter-places. Le même instrument se trade sur de nombreuses places (fragmentation des marchés). Un mouvement sur la place la plus active devrait se propager aux autres ; jusqu'à ce qu'il le fasse, les cotations au repos des retardataires sont cueillables. C'est la forme inter-places la plus pure, et celle que modélise la course interactive.

3. La course géographique / micro-ondes. L'information voyage à la vitesse de la lumière, et la lumière est plus lente dans le verre que dans l'air. La fameuse liaison Chicago–New York (les futures valorisent le marché au comptant et vice versa) a transformé un chemin par fibre d'environ 13 ms en un chemin par micro-ondes d'environ 8 ms ; la firme dotée du médium le plus rapide entre les deux marchés gagnait la course inter-marchés. C'est l'arbitrage de latence réduit à sa limite physique : le même trade, décidé par qui a acheté le meilleur fil.

Les trois sont aujourd'hui disputés par un petit ensemble de firmes à l'infrastructure sur mesure. L'idée est gratuite ; le chemin coûte des millions et est exclusif par conception.

D'où vient réellement l'avantage, et où il s'en va

Le profit par gain est la variation de prix sur la fenêtre de cotation périmée ; le profit attendu est le taux de gain fois l'avantage moyen par gain fois la fréquence d'opportunité, moins le coût fixe d'infrastructure. Le trait brutal est que la course est « le gagnant rafle tout » : être deuxième d'une microseconde signifie généralement zéro, pas la moitié.

C'est pourquoi l'économie est impitoyable (l'économie d'un desk HFT). Comme le trader le plus rapide gagne presque chaque exécution disputée, le prix se concentre. Dépenser pour être rapide n'est rationnel que si cela vous rend le plus rapide sur un chemin donné ; arriver deuxième ne vous achète rien. L'activité s'effondre donc vers une poignée de firmes par course, chacune ayant englouti un gros coût fixe (tours micro-ondes, fibre à cœur creux, FPGA tick-to-trade, espace de rack premium) pour posséder un chemin. L'opportunité marginale est concurrencée à la baisse jusqu'à ce que l'avantage net égale le coût d'être le plus rapide. C'est la signature de manuel d'un avantage banalisé : réel, mécanique, et presque entièrement capté par les acteurs en place.

Sur une fenêtre de cotation périmée de longueur τ\tau le juste prix bouge à une échelle diffusive, mais les mouvements exploitables sont les sauts : un ordre exécutable ou une transaction d'actualité. Le P&L attendu est la chance que vous arriviez premier, fois le saut moyen capté, fois le taux de sauts.
E[P&L]=Pr(arrive first)×ΔSjump×νjumps,ΔSστE[\text{P\&L}] = \Pr(\text{arrive first}) \times \overline{\Delta S}_{\text{jump}} \times \nu_{\text{jumps}}, \qquad \Delta S \sim \sigma\sqrt{\tau}
Voir la dérivation optionnel

Décomposez la fenêtre de cotation périmée. Sur une fenêtre de longueur τ\tau le juste prix a un mouvement diffusif d'ordre στ\sigma\sqrt{\tau} en amplitude attendue, mais une diffusion symétrique n'est pas directement exploitable contre une cotation à deux côtés. L'argent est dans les sauts : un décalage discret ΔSjump\Delta S_{\text{jump}} d'un ordre exécutable ou d'une transaction d'actualité qui bouge le prix avant que le retardataire ne recote.

Par événement disputé, votre avantage est le saut capté contre la cotation périmée, moins le demi-spread que vous franchissez pour le prendre ; vous ne le réalisez que si vous arrivez avant la mise à jour de la cotation.

edgewinΔSjump12spread,Pr(win)=Pr ⁣(tyou<min(trivals,tupdate))\text{edge}_{\text{win}} \approx \Delta S_{\text{jump}} - \tfrac12\,\text{spread}, \qquad \Pr(\text{win}) = \Pr\!\big(t_{\text{you}} \lt \min(t_{\text{rivals}},\, t_{\text{update}})\big)

Agréger sur un taux de sauts ν\nu donne le P&L attendu, dont vous soustrayez le coût fixe d'infrastructure. Réduisez τ\tau (places plus rapides, mieux connectées) et la fenêtre, et l'avantage, s'évanouissent.

E[P&L]=νPr(win)(ΔSjump12spread)    CfixedE[\text{P\&L}] = \nu \cdot \Pr(\text{win}) \cdot \big(\overline{\Delta S}_{\text{jump}} - \tfrac12\,\text{spread}\big) \; - \; C_{\text{fixed}}

L'arbitrage de latence est-il encore rentable en 2026 ?

Sur les marchés transparents matures, surtout non pour un nouveau venu : l'avantage s'est banalisé en une course d'infrastructure que quelques acteurs en place ont déjà gagnée, et les écarts SIP/flux qui alimentaient le classique des actions ont été réduits par les améliorations des places. Il n'est pas mort ; il est possédé. Là où il reste vivant pour un petit opérateur rapide, c'est à la frontière, où la plomberie est jeune.

Crypto inter-bourses. Des dizaines de places (CEX et DEX), 24h/24, pas de bande consolidée, des moteurs d'appariement hétérogènes et souvent lents, et des API en retard. Les prix divergent réellement entre bourses sur des fenêtres mesurables ; les mêmes maths se transplantent directement (tenue de marché en crypto), mais la course aux armements aussi, et sur les plus grosses paires la colocation et la latence côté bourse dominent désormais. L'avantage vit sur la longue traîne des places et des paires, et dans les moments de dislocation.

Places nouvellement lancées. Une nouvelle place d'actions ou de dérivés démarre avec une connectivité mince et des flux immatures ; l'écart avec les places établies est large avant que les firmes rapides ne se câblent. La fenêtre est les premiers mois de la place.

Dislocations de flux et d'horloge. Microbursts, pertes de paquets, congestion de passerelle et erreurs de synchronisation d'horloge élargissent brièvement la fenêtre de cotation périmée même sur des places rapides. Les exploiter de façon fiable est elle-même une capacité d'infrastructure spécialiste, toujours banalisée, juste à un palier plus élevé.

Ce que l'IA change : très peu sur le chemin critique. L'arbitrage de latence est un problème de physique et d'ingénierie, pas un problème de prédiction ; il n'y a pas de place pour qu'un modèle « réfléchisse » à l'intérieur d'une course sub-microseconde (voir machine learning dans le HFT sur l'arbitrage latence-vs-complexité). Le ML aide hors du chemin critique (choisir quelles courses engager, dimensionner, et prédire quand les dislocations sont probables) mais il ne rend pas rapide un chemin lent. Le goulet d'étranglement est le fil, et le fil s'achète, il ne s'apprend pas. Pour la vue d'honnêteté inter-stratégies, voir le HFT est-il encore rentable en 2026 ?

Oui. L'arbitrage de latence est légal : il exploite la vitesse et l'infrastructure, pas la tromperie. Il se distingue de la manipulation (manipulation de marché), qui implique de faux signaux comme le spoofing. Le débat autour de lui porte sur l'équité et la structure de marché (speed bumps, le SIP, la conception de la bande consolidée) pas sur la légalité. Il est lourdement étudié par les régulateurs mais pas interdit. Qui paie au final quand une cotation périmée est cueillie est le fournisseur de liquidité lent, raison pour laquelle la structure d'incitation maker-taker interagit si étroitement avec cette course.

Exemple travaillé

Une cueillette inter-places concrète, avec une arithmétique vérifiable (synthétique et illustratif, à la date de 2026). Un instrument se trade sur la Place A (rapide, active) et la Place B (un retardataire plus lent), taille de tick 0,01. Un achat exécutable lève l'offre de A et le juste mid bondit de 100,00 à 100,02, un saut de 2 ticks. La Place B affiche encore 100,00 / 100,01 pendant une fenêtre de cotation périmée de τ=250μs\tau = 250\,\mu\text{s}, le délai de propagation A→B.

Vous lisez le flux direct de A et tirez un achat sur l'offre de B à 100,01. Votre tick-to-trade est de 8 µs sur FPGA ; celui de votre concurrent est de 15 µs. Vous avez tous deux démarré la course quand A a imprimé, donc vous arrivez à environ 8 µs dans une fenêtre de 250 µs et le concurrent à environ 15 µs. Vous gagnez l'exécution ; le concurrent arrive deuxième et n'obtient rien.

Vous êtes maintenant long à 100,01 contre une juste valeur de 100,02 : un tick, environ 1 pb d'avantage brut sur ce lot, avant le coût éventuel de revenir à plat.
edgewin=100.02100.01=0.01=1 tick1 bp\text{edge}_{\text{win}} = 100.02 - 100.01 = 0.01 = 1\ \text{tick} \approx 1\ \text{bp}

L'économie vit dans fréquence fois taux de gain. Si de tels sauts surviennent environ 5 000 fois par séance et que vous gagnez 80 % des disputés à environ 0,6 tick net capté après coûts de sortie, le brut est réel, mais il doit couvrir le coût fixe du FPGA, des flux directs, de la colocation premium et de la connectivité qui ont rendu vos 8 µs possibles.

P&L brut avant coût fixe : événements fois taux de gain fois ticks nets. Ce coût fixe est exactement ce qui concentre l'activité entre quelques mains.
5000×0.80×0.6 ticks=2400 ticks/session    Cfixed5000 \times 0.80 \times 0.6\ \text{ticks} = 2400\ \text{ticks/session} \; - \; C_{\text{fixed}}

La leçon qu'enseignent les chiffres : l'avantage par transaction est minuscule et la technologie pour le capter est coûteuse et exclusive, raison pour laquelle c'est un utilitaire possédé par les acteurs en place, pas une idée qu'un nouveau venu peut simplement implémenter. Les chiffres sont synthétiques ; c'est la logique de timing qui se généralise.

Où cela s'inscrit

Questions fréquentes

L'arbitrage de latence est-il encore vivant en 2026 ?
Comme trait structurel, oui ; comme opportunité ouverte, surtout non. Cueillir des cotations périmées entre places arrive encore chaque jour, mais sur les marchés transparents matures c'est un utilitaire où le gagnant rafle tout, détenu par une poignée de firmes à liaisons micro-ondes et FPGA ; le nouvel entrant marginal ne peut pas gagner la course. Là où cela reste disputable, c'est sur des places plus jeunes et fragmentées (crypto entre plateformes) aux planchers de latence plus lâches.