Données haute fréquence

Queues épaisses

structurel
Revu le 4 juin 2026. En 2026 : un trait permanent du marché, pas un avantage qui s'érode.

Les rendements haute fréquence ne sont pas normaux. Les queues sont bien plus lourdes qu'une gaussienne ne le prédit, si bien que l'événement à six sigma arrive chaque mois, pas une fois par millénaire. Prétendez le contraire et votre modèle de risque vous ment.

Voir en mouvement

Rendements empiriques vs normaletirez les queuesIX-FATTAILS
Poids des queueslourdes
Événements en queue337
vs normalebien plus
pointillés = normale · rouge = les queues
Lourdeur des queues (↓ = plus épaisses)3

À remarquer. L'histogramme empirique a bien plus de masse dans les queues rouges que la courbe normale en pointillés ne l'autorise. Sous une gaussienne, une journée à six sigma est un événement millénaire ; dans les vrais rendements haute fréquence, il arrive couramment. Les modèles de risque bâtis sur la normalité sous-estiment le danger.

Les rendements financiers sont-ils distribués normalement ?

Non. C'est l'un des faits les plus robustes de toute la finance, montré pour la première fois par Mandelbrot (1963) et Fama (1965) et démenti par aucun régime depuis. Les distributions de rendements sont leptokurtiques : un pic plus haut et plus étroit et des queues bien plus épaisses qu'une gaussienne de même variance. Les mouvements extrêmes (krachs, trous, événements éclair) arrivent des ordres de grandeur plus souvent que la normalité ne le prédit, et l'écart empire à mesure que vous échantillonnez plus vite.

Commencez par l'intuition, car les maths ne font que la confirmer. Une courbe en cloche dit que les mouvements énormes n'arrivent essentiellement jamais ; les marchés ne sont pas d'accord et livrent des journées « impossibles » à intervalles réguliers. La gaussienne n'est pas légèrement fausse dans les queues. Elle est fausse par des ordres de grandeur, et les queues sont exactement là où vivent l'argent et la ruine. Un modèle juste dans le corps et catastrophiquement optimiste dans la queue est pire que pas de modèle, car il vous tend une fausse confiance précisément là où vous ne pouvez pas vous le permettre.

Les rendements empiriques partagent un ensemble de faits stylisés universels (Cont 2001) à travers les actifs, les places et les décennies : queues lourdes / excès de kurtosis ; regroupement de volatilité (les grands mouvements suivent les grands mouvements) ; gaussianité d'agrégation (les rendements paraissent plus normaux à plus long horizon) ; la quasi-absence d'autocorrélation linéaire dans les rendements aux côtés d'une forte autocorrélation dans leurs valeurs absolues et au carré ; l'effet de levier (la volatilité monte davantage après les baisses) ; et l'asymétrie gain/perte. Cette page traite frontalement les trois premiers.

Ce que « épaisse » signifie précisément : la queue décroît comme une loi de puissance plutôt que comme l'exponentielle qui s'évanouit rapidement de la gaussienne, donc elle retient dramatiquement plus de masse loin du centre. Empiriquement, l'indice de queue α\alpha tourne autour de 3 à 5 pour de nombreux actifs liquides, la « loi cubique inverse » (Gopikrishnan et al. 1999).
P(r>x)    xα(power law)vs.P(r>x)    ex2/2(Gaussian)P(|r| \gt x) \;\sim\; x^{-\alpha} \quad\text{(power law)} \qquad \text{vs.} \qquad P(|r| \gt x) \;\sim\; e^{-x^2/2} \quad\text{(Gaussian)}

Qu'est-ce que la kurtosis, et pourquoi importe-t-elle ?

La kurtosis mesure la lourdeur des queues : le quatrième moment standardisé, E[(rμ)4]/σ4E[(r-\mu)^4]/\sigma^4. Une distribution normale a une kurtosis de 3, donc l'excès de kurtosis (kurtosis moins 3) est nul pour une gaussienne et positif pour des rendements à queues épaisses, souvent dans les chiffres simples ou doubles élevés à haute fréquence. Un excès de kurtosis positif est l'empreinte digitale en un seul nombre des queues épaisses.

L'intuition est dans l'exposant. La kurtosis est mue par la quatrième puissance de l'écart, donc elle est dominée par les rares grands mouvements et remarque à peine les ordinaires. Une kurtosis élevée, c'est la distribution qui dit « l'essentiel de ma variance vient d'une poignée d'observations énormes », ce qui est exactement le profil de danger des rendements financiers, où quelques journées de crise portent le risque que les mois calmes cachent.

Excès de kurtosis : combien de la variance vit dans les mouvements extrêmes. La gaussienne est à 0 ; les rendements actions quotidiens siègent à quelques unités ; les rendements au tick ou à la minute sont souvent dans les dizaines, et une poignée de journées de crise peut soulever énormément le chiffre de l'échantillon entier.
κ  =  E ⁣[(rμ)4]σ4    3\kappa \;=\; \frac{E\!\left[(r-\mu)^4\right]}{\sigma^4} \;-\; 3

Rapportez le nombre, mais ne vous fiez pas à sa précision. Parce que la kurtosis pondère si fortement les plus grandes observations, l'estimation d'échantillon est dominée par (et follement sensible à) les quelques plus grands mouvements ; elle est bruitée et converge lentement. Cette fragilité est elle-même un indice que les queues sont lourdes : sous une vraie loi de puissance avec α4\alpha \le 4, la kurtosis théorique est infinie, donc la valeur d'échantillon ne fait que croître à mesure que vous collectez plus de données plutôt que de se stabiliser. Quand un moment refuse de converger, la bonne réponse n'est pas un plus gros échantillon mais un meilleur outil : préférez l'indice de queue α\alpha à une seule estimation de kurtosis.

Pourquoi le graphique QQ révèle-t-il les queues épaisses ?

Un graphique QQ (quantile–quantile) trace les quantiles empiriques de vos données contre les quantiles théoriques d'une normale. Si les données étaient gaussiennes, les points se trouveraient sur une ligne droite. Les queues épaisses font décoller les points de la ligne aux deux extrémités : les observations extrêmes sont bien plus grandes que la normale ne le prédit. C'est le diagnostic visuel le plus clair de la non-normalité, et l'image signature de cette page.

Pourquoi le milieu se comporte-t-il et les extrémités trahissent-elles ? Le centre d'une distribution de rendements est à peu près en cloche, donc les points centraux siègent docilement sur la ligne. Ce sont les queues qui trahissent la gaussienne : les points empiriques les plus extrêmes sont bien plus extrêmes que les quantiles normaux correspondants, si bien que la courbe se courbe nettement vers le haut à droite et vers le bas à gauche. Un histogramme ne peut pas le montrer aussi bien (ses cases de queue sont presque vides et difficiles à lire), tandis que le graphique QQ place les observations de queue directement sur les axes, où l'écart est impossible à manquer.

Le graphique QQ vous dit aussi vers quoi tendre la main. Superposez une référence Student-t à faibles degrés de liberté (ν35\nu \approx 3\text{–}5) et elle épouse les queues empiriques exactement là où la normale échoue : un modèle à queues épaisses traitable et pratique que le diagnostic vous donne envie d'utiliser. L'image fait double emploi : elle condamne la gaussienne et nomme son remplaçant.

Qu'est-ce que la gaussianité d'agrégation ?

La gaussianité d'agrégation est le fait stylisé que les rendements paraissent plus normaux à plus long horizon. Les rendements au tick et à la minute sont violemment à queues épaisses ; les rendements quotidiens moins ; les rendements mensuels sont proches du gaussien. Sommer de nombreux rendements à court horizon tire la distribution vers la normalité (un effet de limite centrale), mais le fait lentement, et jamais complètement tant que la volatilité se regroupe.

Le théorème central limite dit que les sommes de nombreux chocs indépendants tendent vers le gaussien. Un rendement mensuel est une somme de nombreux rendements à court horizon, donc il paraît plus normal. Mais la convergence est lente et incomplète, parce que les rendements à court horizon ne sont emphatiquement pas indépendants : le regroupement de volatilité et les chocs individuels épais ralentissent tous deux la marche vers la normalité. Le TCL est une affirmation vraie sur la limite ; les marchés vivent simplement loin d'elle.

Pour le HFT, cela porte une conséquence tranchante et fâcheuse. C'est précisément le régime haute fréquence, où opère le HFT, qui est le plus non normal. Plus vous tradez vite, plus vos queues sont épaisses et plus une hypothèse gaussienne devient dangereuse. Vous ne pouvez pas balayer le problème avec « c'est normal aux horizons qui me concernent », parce que votre horizon est là où c'est pire. Regardez cela tourner en sens inverse sur l'explorateur ci-dessus : faites glisser du quotidien au tick et les queues du QQ se courbent plus fort tandis que la kurtosis grimpe.

Pourquoi le regroupement de volatilité et les queues épaisses vont-ils ensemble ?

Les rendements eux-mêmes sont presque non corrélés, mais leurs amplitudes sont fortement autocorrélées : le calme suit le calme, la turbulence suit la turbulence. Ce regroupement de volatilité est la moitié de la raison des queues épaisses : une gaussienne à σ\sigma fixe ne peut pas reproduire l'alternance des régimes calmes et violents, mais un mélange de normales à variance variable dans le temps le peut, et ce mélange est à queues épaisses.

Voici le mécanisme. Tirez des rendements d'une normale dont la variance change elle-même dans le temps (basse certains jours, haute d'autres) et la distribution inconditionnelle, mettant tous les jours en commun, est un mélange de courbes en cloche de largeurs différentes. Ce mélange a un pic plus net et des queues plus épaisses qu'une seule courbe en cloche. Donc la volatilité variable dans le temps fabrique des queues épaisses inconditionnelles même si chaque jour individuel était conditionnellement gaussien. Les queues épaisses ne tiennent pas qu'à la taille des chocs ; elles tiennent en partie à l'échelle changeante qui les produit.

C'est exactement ce que modélise GARCH (Bollerslev 1986) : la variance conditionnelle d'aujourd'hui dépend des rendements au carré récents, donc la volatilité se regroupe et la distribution inconditionnelle ressort leptokurtique. L'effet de levier (la volatilité montant davantage après les baisses) est capturé par des variantes asymétriques (EGARCH, GJR-GARCH).
σt2  =  ω  +  αrt12  +  βσt12\sigma_t^2 \;=\; \omega \;+\; \alpha\,r_{t-1}^2 \;+\; \beta\,\sigma_{t-1}^2

Il y a deux sources de queues épaisses, pas une, et les confondre mal-spécifie le modèle de risque. Une partie de la lourdeur des queues est conditionnelle (regroupement de volatilité, modélisé par GARCH) ; une partie est résiduelle, des queues épaisses qui restent dans les innovations même après dé-volatilisation, ce qui est pourquoi les praticiens ajustent GARCH avec des innovations Student-t plutôt que gaussiennes. Les deux comptent. Ce fait stylisé se relie aussi directement au temps irrégulier : l'activité se regroupe dans le temps tout comme la volatilité se regroupe en taille, la même structure « les rafales engendrent les rafales » vue de deux façons.

Pourquoi les modèles de risque gaussiens explosent-ils ?

Un modèle de risque gaussien (la value-at-risk sous normalité, ou toute règle « N-sigma ») assigne une probabilité négligeable aux grands mouvements. Parce que les vraies queues sont lourdes en loi de puissance, ces mouvements « impossibles » arrivent bien plus souvent, si bien que le modèle sous-estime à la fois la probabilité et la taille des pertes par des ordres de grandeur. Les événements qui ruinent les desks sont exactement ceux qu'une gaussienne écarte.

Imaginez une VaR gaussienne qui dit « vous ne perdrez plus de XX qu'un jour sur cent. » Si la vraie queue est en loi de puissance, vous franchissez XX plusieurs fois plus souvent, et quand vous franchissez, vous franchissez de bien plus : la queue en loi de puissance n'a pas de coupure fine, donc la perte au-delà du seuil est elle-même lourde. Le modèle est faux dans deux directions à la fois, et les deux directions sont fatales : il sous-compte les franchissements et les sous-dimensionne.

La gaussienne sous-compte les extrêmes par des facteurs de milliers. Un mouvement quotidien de 5σ-5\sigma a une probabilité gaussienne d'environ un jour sur 3,5 millions, une fois en environ 14 000 ans de trading. Les marchés livrent plusieurs journées 5σ\ge 5\sigma (échelle gaussienne) par décennie.
P(r<5σ)    2.9×107    13,500,000P(r \lt -5\sigma) \;\approx\; 2.9 \times 10^{-7} \;\approx\; \tfrac{1}{3{,}500{,}000}

Octobre 1987 fut un événement d'environ 20σ-20\sigma sous la volatilité gaussienne alors prévalente, un nombre si absurde qu'il prouve que le modèle était faux, pas le marché. Quoi utiliser à la place : modéliser les queues explicitement. Innovations Student-t ou à erreur généralisée ; théorie des valeurs extrêmes (la distribution de Pareto généralisée pour les pics au-dessus d'un seuil) pour la queue elle-même ; perte attendue (CVaR), qui intègre la queue, plutôt que la VaR, qui ne pointe que vers son bord ; et la simulation historique ou historique filtrée plutôt qu'une gaussienne paramétrique. La posture honnête est de dimensionner les positions pour la queue que vous ne pouvez pas voir, pas le corps que vous pouvez.

C'est le moteur sous les thèmes risque et performance. Un ratio de Sharpe ou une VaR calculés sous normalité flattent une stratégie à queues épaisses jusqu'à ce que la queue arrive, ce qui est pourquoi la même non-normalité réapparaît dans les ratios ajustés du risque (le Sharpe utilise un écart-type qui sous-pondère les extrêmes) et dans la mesure du risque HFT (dimensionner pour la queue).

Exemple travaillé

Une comparaison de distributions de rendements que vous pouvez reproduire dans l'explorateur ci-dessus, en 2026. Générez un chemin de tick avec germe (un mid brownien plus une composante de saut à faible intensité) puis agrégez le même chemin en rendements au tick, à 1 seconde, à 1 minute et quotidiens. Parce que les sauts sont cuits dedans par construction, la vraie distribution est connue et sauvagement épaisse à haute fréquence ; les chiffres ci-dessous sont illustratifs et synthétiques, destinés à rendre le mécanisme lisible plutôt qu'à être cités comme des faits sur un marché quelconque.

L'excès de kurtosis tombe à mesure que vous agrégez, la gaussianité d'agrégation en action :

Kurtosis par horizon : violemment épaisse au tick, s'amincissant régulièrement à mesure que le chemin est agrégé en rendements plus longs, mais toujours bien au-dessus du zéro gaussien même au quotidien.
κtick18,κ1s9,κ1min4,κdaily1\kappa_{\text{tick}} \approx 18, \quad \kappa_{\text{1s}} \approx 9, \quad \kappa_{\text{1min}} \approx 4, \quad \kappa_{\text{daily}} \approx 1

Maintenant le titre. Ajustez une normale aux rendements au tick. Elle assigne à un rendement au tick de 5σ-5\sigma une probabilité d'environ 2.9×1072.9 \times 10^{-7}, un sur environ 3,5 millions de ticks. La fréquence empirique des rendements au tick d'amplitude 5σ\ge 5\sigma dans l'échantillon est, disons, un sur environ 12 000 :

La queue empirique est environ 300 fois plus lourde que la gaussienne ajustée ne le permet, et une Student-t avec environ 3,5 degrés de liberté épouse les queues du tick sur le graphique QQ là où la normale les sous-habille par des ordres de grandeur.
Pempirical(r5σ)PGaussian(r5σ)    1/12,0001/3,500,000    300\frac{P_{\text{empirical}}(|r| \ge 5\sigma)}{P_{\text{Gaussian}}(|r| \ge 5\sigma)} \;\approx\; \frac{1/12{,}000}{1/3{,}500{,}000} \;\approx\; 300

La leçon est directe : une règle de VaR ou de dimensionnement de position bâtie sur la normale ajustée serait franchie des centaines de fois plus souvent que son niveau de confiance affiché, et les franchissements seraient plus grands qu'elle ne peut même les représenter. Re-vérifiez les indices de queue et la kurtosis contre des séries de rendements réelles avant de vous y fier ; les indices de queue et la kurtosis empiriques sont spécifiques à l'actif, à la place et à la période, et ces chiffres synthétiques n'existent que pour rendre le mécanisme lisible. L'explorateur vous laisse changer la fréquence d'échantillonnage, les degrés de liberté de la superposition en t et l'intensité des sauts, et regarder la kurtosis et les probabilités de queue répondre.

Où cela s'inscrit