Stratégies de trading·stat-arb

Arbitrage statistique

≈banalisé

Revu le 4 juin 2026. En 2026 : largement connu et implémenté ; l'avantage est dans l'exécution, pas dans l'idée.

Trader un portefeuille d'instruments corrélés en pariant que des relations statistiques temporaires reviennent. L'avantage est le comportement moyen de nombreuses petites positions diversifiées, pas une prévision isolée.

L'idée

L'arbre généalogique du stat arb, enraciné dans un seul spread schéma annotéDG-STATARB

Ce que montre ce schéma. L'arbitrage statistique est un seul mécanisme sous cinq habits. Chaque branche construit un spread (une combinaison linéaire de prix conçue pour être stationnaire) et trade ses écarts à une moyenne ajustée ; elles ne diffèrent que par ce qui impose le retour, à quelle vitesse il survient et à quel point le trade est encombré. L'encart est l'image canonique : deux noms liés s'écartent, le spread franchit une bande d'entrée, et vous tenez jusqu'à son retour à la moyenne.

Qu'est-ce que l'arbitrage statistique, précisément ?

L'arbitrage statistique est une famille de stratégies qui profitent du mauvais alignement relatif d'instruments apparentés plutôt que de la direction d'un seul d'entre eux. Vous construisez un portefeuille dont la valeur est un spread à retour à la moyenne, vous entrez quand le spread se trouve statistiquement loin de sa moyenne, et vous sortez quand il revient. L'« arbitrage » est statistique, pas sans risque : le spread peut diverger avant de converger.

L'intuition d'abord. Deux actifs économiquement liés (Coca-Cola et Pepsi, un ETF et son panier, un future et son indice cash) devraient bouger ensemble. Quand ils s'écartent sans raison fondamentale, l'écart est un spread qui tend à se refermer. Le stat arb achète le retardataire, vend le meneur, et attend que l'écart se referme. Votre profit est la fermeture du spread, que le marché dans son ensemble monte ou baisse.

La propriété déterminante est la neutralité au marché : les jambes longue et courte sont dimensionnées pour que le portefeuille ait peu d'exposition nette au facteur commun : le marché, le secteur, l'indice. Vous ne pariez pas sur la direction ; vous pariez sur la convergence. Et « arbitrage » est un mot vague ici. Un vrai arbitrage est sans risque et autofinancé ; l'arbitrage statistique n'est ni l'un ni l'autre. C'est un pari qu'une relation estimée historiquement tiendra assez longtemps pour que le spread revienne avant que votre stop ou votre capital ne s'épuise. L'avantage est statistique (valeur attendue positive sur de nombreux paris indépendants) pas une garantie sur un seul.

Une position de stat arb est un spread : long la jambe bon marché, court la jambe chère, mise à l'échelle par un ratio de couverture pour que la combinaison soit neutre au marché. Vous profitez quand le spread revient à sa moyenne, pas sur la direction de l'une ou l'autre jambe.

S_t = P_{A,t} - \beta\,P_{B,t}, \qquad z_t = \frac{S_t - \mu_S}{\sigma_S}

D'où vient le retour à la moyenne ?

Le retour vient d'un lien économique ou mécanique qui attache les instruments ensemble : substituts, une relation indice-et-constituants, un mécanisme de création/rachat, ou un décalage temporel dans la propagation de l'information. Quand le lien est réel, les écarts sont du bruit temporaire ; quand il est fallacieux, le « spread » est un pile ou face. Tout le savoir-faire est de distinguer les deux.

Le lien économique est les substituts, la même chaîne d'approvisionnement, le même facteur : deux compagnies aériennes, deux mineurs d'or, deux réseaux de paiement. Le moteur partagé fait que la divergence idiosyncratique tend à revenir. C'est le trade de paires classique. Le lien mécanique est une identité contractuelle ou structurelle : un ETF doit se trader près de sa valeur liquidative car les participants autorisés peuvent créer et racheter ; un future doit se trader près du spot-plus-portage à cause de l'arbitrage cash-and-carry ; un indice doit égaler ses constituants pondérés. Ces liens sont imposés par les arbitragistes, donc les écarts sont plus petits et plus rapides, mais reviennent plus fiablement à la moyenne. C'est l'arbitrage d'indice et l'arbitrage d'ETF.

Le lien de microstructure est le rebond bid-ask et la pression transitoire du flux d'ordres : à de très courts horizons, le dépassement causé par un gros ordre taker revient à mesure que la liquidité se reconstitue. C'est le retour à la moyenne intraday, une autre bête : mécanique et minuscule, pas économique. Le danger partout est la relation fallacieuse : deux séries qui ont corrélé historiquement par coïncidence, sans lien pour imposer le retour. La corrélation ne suffit pas ; il vous faut la cointégration (un spread stationnaire) et même cela peut casser quand le régime change. La distinction corrélation contre cointégration est développée en entier sur trading de paires.

Qu'y a-t-il dans la famille ? La carte des variantes de stat arb

L'arbitrage statistique couvre les paires et paniers (valeur relative entre deux ou plusieurs noms), l'arbitrage d'indice et d'ETF (l'instrument contre ses constituants), et le retour à la moyenne intraday ou de microstructure (renversement à très court horizon). Tous partagent le même cœur (construire un spread à retour à la moyenne, trader ses écarts) mais ils diffèrent par l'horizon, par ce qui impose le retour, et par leur degré d'encombrement.

Le trading de paires trade le spread entre deux noms cointégrés, imposé par le lien économique, sur des minutes à des jours : banalisé sur les actions liquides, avec de l'alpha survivant en crypto, sur les petites capitalisations et à des horizons plus rapides. Le panier / multi-noms trade un portefeuille long-short contre un facteur, imposé par la structure factorielle statistique ; c'est l'espace encombré de style WorldQuant / Two-Sigma, où l'avantage est dans le modèle de résidu. L'arbitrage d'indice trade un future d'indice contre son panier cash, imposé par le no-arbitrage cash-and-carry sur des secondes à des minutes : mécanique, à faible marge et bridé par la latence. L'arbitrage d'ETF trade le prix d'un ETF contre sa VL, imposé par la création/rachat via les participants autorisés : structurel et serré sur les ETF liquides, plus large sur les illiquides ou à levier. Le retour à la moyenne intraday trade le prix à court horizon contre une juste valeur locale, imposé par la microstructure : alpha de niche, mécanique, minuscule et sensible aux coûts.

L'image unificatrice est que chacun d'eux construit un spread (une combinaison linéaire de prix conçue pour être stationnaire) et trade ses écarts à une moyenne ajustée. Plus le lien est rapide et mécanique (arbitrage d'indice et d'ETF), plus le retour est serré et fiable, mais plus la marge est basse et plus cela devient un jeu de latence, pas un jeu de modélisation. Plus le lien est lent et économique (paires et paniers), plus le spread est riche mais plus le risque qu'il ne revienne jamais est élevé. Les maths du spread (cointégration, z-score, demi-vie) sont développées en entier sur trading de paires et réutilisées dans toute la famille.

Le cycle de vie d'une stratégie de stat arb, et pourquoi elle se dégrade

Une stratégie de stat arb a un arc prévisible : découverte (un spread qui revient), profitabilité (vous le tradez avant les autres), encombrement (les autres le trouvent, les écarts se réduisent et les retours s'accélèrent), et mort (le spread est arbitré dès l'entrée, donc il ne reste rien à capter après coûts). La dégradation est structurelle : publier ou mettre à l'échelle un avantage l'accélère.

Découverte. Vous trouvez un spread avec une tendance statistiquement significative à revenir : une demi-vie assez courte pour trader, des écarts assez grands pour couvrir les coûts. Attention : la plupart des « découvertes » sont des artefacts de backtest (survie, look-ahead, ou tests multiples sur des milliers de paires). Un test d'Engle–Granger qui passe sur l'une de 5 000 paires à $p\lt 0.05$ est attendu par chance. Profitabilité. Tant que peu le tradent, les écarts sont grands et les retours assez lents pour capter. Vous gagnez le spread moins les coûts, et les coûts sont toute l'histoire : l'écart brut doit couvrir le spread, plus les frais et l'impact de marché sur les deux jambes, deux fois (entrée et sortie).

Encombrement. À mesure que le capital s'entasse (voir capacité & érosion de l'alpha), les écarts sont arbitrés plus vite et restent plus petits. Le même dollar d'avantage brut arrive maintenant sur une distance de retour moindre, et après coûts, le net se rétrécit vers zéro. C'est pourquoi le trade de paires actions classique, public depuis des décennies, est mort sur les noms liquides. La rupture de régime est l'autre façon dont un stat arb meurt : pas une dégradation graduelle mais une rupture structurelle, où la relation cointégrante cesse de tenir (une fusion, un choc sectoriel, un changement de constituant). Le spread qui revenait toujours diverge maintenant et continue de diverger. C'est ainsi que les books de stat arb explosent : le « quant quake » d'août 2007, quand les books actions-neutres encombrés se sont tous déleviérés sur les mêmes noms en même temps, est le cas canonique.

Le P&L de valeur relative est à skew négatif : de nombreux petits gains quand les spreads reviennent, l'occasionnelle grosse perte quand l'un casse. Un book diversifié de spreads ne vous protège pas quand la même foule les détient tous et déboucle d'un coup.

\text{net edge per trade} \;\approx\; \underbrace{|\Delta S|}_{\text{gross reversion}} \;-\; \underbrace{c_{\text{legs}\times\text{in/out}}}_{\text{fixed cost floor}}

Le verdict honnête : le stat arb n'est pas un avantage statique que vous possédez ; c'est une recherche renouvelable de spreads, menée contre la dégradation et le risque toujours présent d'une rupture. L'avantage durable est la machine de recherche-et-exécution, pas une paire isolée. La valeur relative comme mécanisme est permanente (voir queues épaisses pour pourquoi la queue de perte compte) ; l'avantage de tout spread spécifique se dégrade.

L'arbitrage statistique est-il encore profitable en 2026 ?

En partie. Le trade de paires classique et lent sur les grandes capitalisations actions liquides est concurrencé à mort : les spreads sont arbitrés en millisecondes et net de coûts il ne reste rien. L'avantage survit là où le terrain est plus mince ou plus lent : horizons plus rapides, petites capitalisations, ETF et paniers, relations inter-places et crypto, et à modéliser la dynamique des spreads mieux que le consensus.

Mort / banalisé : le trade de paires de manuel à deux actions sur des noms du S&P 500 à horizon quotidien : public depuis les années 1990, arbitré dès l'entrée. Vivant, pour qui est équipé : valeur relative intraday avec de bonnes données et de faibles coûts ; arbitrage d'ETF et de paniers où les frictions de création/rachat laissent de la marge ; paires crypto et relations inter-plateformes, où les places sont ouvertes et le terrain plus jeune ; et portefeuilles de résidus modélisés statistiquement où votre modèle de facteurs et votre exécution battent la foule. Ce que l'IA change : le machine learning aide à sélectionner et modéliser les spreads (quelles paires cointègrent hors échantillon, comment la dynamique se déplace avec le régime), mais il ne conjure pas le retour là où le lien économique est absent, et il intensifie l'encombrement en mettant les mêmes outils dans toutes les mains. Voir machine learning dans le HFT et ce que l'IA change.

Pour la réponse au niveau de la marque à « le HFT est-il encore profitable ? », voir le HFT est-il encore rentable en 2026, qui place le stat arb face aux autres segments.

Exemple travaillé

Un trade de stat arb schématique sur une paire cointégrée, à jour en 2026, synthétique et illustratif. Prenez deux noms $A$ et $B$ avec un ratio de couverture ajusté $\beta = 0.8$ issu d'une régression cointégrante (voir trading de paires). Le spread est $S = P_A - 0.8\,P_B$ . Sur la fenêtre d'ajustement le spread a une moyenne $\mu = 0$ et un écart-type $\sigma = 0.40$ , donc le z-score est $z = (S - \mu)/\sigma$ .

Entrée. Le spread s'élargit à $S = +0.80$ , donc $z = +2.0$ , deux écarts-types cher. Vous vendez une unité d'A et achetez 0,8 unité de B (court le spread), pariant qu'il revient vers zéro. Sortie. Le spread revient à $S = 0$ ( $z = 0$ ) ; vous débouclez. P&L brut $\approx 0.80$ par unité de spread (la distance parcourue par le spread) et neutre au marché tout du long.

Vous avez franchi le spread et payé frais et impact sur deux jambes, deux fois (entrée et sortie), à peu près quatre franchissements de spread. À 0,10 par franchissement le coût est 0,40, donc le net est 0,40. Divisez par deux l'écart brut, à une entrée z = 1,0, et le trade est non profitable.

\text{net} = \underbrace{0.80}_{\text{gross}} - \underbrace{4 \times 0.10}_{\text{cost}} = 0.40, \qquad \text{at } z=1.0:\; 0.40 - 0.40 = 0.00

C'est exactement pourquoi l'avantage meurt à mesure que l'encombrement réduit les écarts : le brut doit couvrir un plancher de coût fixe. Demi-vie. Si la demi-vie d'Ornstein–Uhlenbeck du spread est de 3 jours, un écart $z = 2.0$ est censé se réduire de moitié à $z = 1.0$ en 3 jours, ce qui est votre période de détention et votre rotation de capital. Une demi-vie de semaines signifie une rotation lente et une exposition à une rupture de régime ; une demi-vie de minutes signifie une stratégie intraday rapide et sensible aux coûts. Le widget vivant IX-COINT sur trading de paires vous laisse fixer $\beta$ , $\sigma$ et les bandes z et observer le P&L. Les vrais spreads, coûts et demi-vies doivent être mesurés par instrument et datés ; ces chiffres sont synthétiques, pédagogiques seulement, et pas un conseil en investissement.

Où cela s'inscrit

↑ Vers le haut · brique de Stratégies de trading ↔ En travers · se combine avec Trading événementiel directionnel ↔ En travers · se combine avec Tenue de marché → Application · rapporte sur Tenue de marché en crypto → Application · rapporte sur Actions & futures ⤓ Construire / Acheter · outil nécessaire Jeux de données et outils

Questions fréquentes

Qu'est-ce que l'arbitrage statistique ?

L'arbitrage statistique est une approche neutre au marché qui trade un portefeuille d'instruments corrélés en pariant que des relations statistiques temporaires (un spread, un résidu, une exposition à un facteur) reviennent à leur norme historique. Il parie sur le comportement moyen de nombreuses petites positions diversifiées plutôt que sur une prévision isolée. Les rendements viennent de transactions fréquentes à faible avantage dont la statistique tient sur un grand échantillon.