PIN / VPIN
◆encore alphaLa probabilité de trading informé (Easley–O'Hara) et sa cousine en buckets de volume, le VPIN : la jauge qui dit au teneur de marché quand le flux est devenu toxique, et qu'il faut élargir ou se retirer.
Voir en mouvement
À remarquer. Rendez le flux unilatéral et le VPIN franchit la ligne pointillée, la jauge qu'un teneur de marché surveille pour décider quand élargir ses cotations ou les retirer entièrement. Un flux toxique, c'est du flux informé qui arrive d'un coup.
Qu'est-ce que le PIN, la probabilité de trading informé ?
Le PIN est l'estimation d'Easley–O'Hara de la probabilité qu'une transaction donnée vienne d'un trader informé. Il modélise le flux d'ordres quotidien comme un mélange d'achats et de ventes non informés plus, lors des « jours d'information », une rafale unilatérale de transactions informées, puis infère des comptes d'achats/ventes à quel point le flux a été toxique. Un PIN plus élevé signifie plus de sélection adverse.
L'intuition : un jour normal, achats et ventes arrivent à des rythmes de fond à peu près équilibrés de la part de traders non informés. Un jour où quelqu'un sait quelque chose, une rafale d'ordres informés unilatéraux s'ajoute par-dessus : beaucoup d'achats sur bonne nouvelle, beaucoup de ventes sur mauvaise. Le PIN travaille à rebours à partir du déséquilibre des comptes de transactions du jour pour estimer la fréquence de tels événements d'information et la taille de la rafale informée.
C'est le frère structurel de la sélection adverse : la fraction informée qui fixe le spread de Glosten–Milgrom est le PIN. Là où le modèle GM l'utilise pour tarifer une transaction, le PIN l'estime empiriquement sur une fenêtre de transactions, donnant à un teneur de marché un nombre pour dire à quel point le flux d'un nom a été toxique.
La faiblesse est pratique : le PIN classique est estimé par maximum de vraisemblance sur une séquence de jours de trading, donc il est lent (un nombre à fréquence quotidienne) et numériquement délicat, car la vraisemblance est mal conditionnée pour les actions actives. Il vous dit qu'une action a été toxique ces dernières semaines ; il ne peut pas vous avertir que les dix prochaines minutes deviennent toxiques. Cet écart de latence est exactement ce que le VPIN a été conçu pour combler.
▸ Voir le modèle PIN optionnel
Dans le modèle d'Easley, Kiefer, O'Hara & Paperman (EKOP/PIN), chaque jour un événement d'information survient avec probabilité ; étant donné un événement, la nouvelle est mauvaise avec probabilité et bonne avec . Les achats et ventes non informés arrivent comme des processus de Poisson de rythme chacun.
Les jours d'événement, les traders informés ajoutent des arrivées de Poisson au rythme du côté correct. Le compte d'achats et le compte de ventes du jour suivent alors un mélange de Poissons sur les trois états (pas d'événement, bonne nouvelle, mauvaise nouvelle) :
Les paramètres sont ajustés par MLE sur de nombreux jours. Le nombre de toxicité est alors le rythme informé sur le rythme total :
L'instabilité de l'estimateur pour les noms à forte activité (la vraisemblance devient plate et mal conditionnée) est ce qui a motivé la reformulation cadencée au volume ci-dessous.
Qu'est-ce que le VPIN, et pourquoi une horloge-volume ?
Le VPIN (Easley, López de Prado & O'Hara 2012) est un proxy de toxicité haute fréquence. Il groupe les transactions en buckets de volume égal, classe le volume de chaque bucket en parts achat et vente, et moyenne le déséquilibre absolu sur une fenêtre glissante de buckets. L'horloge-volume le fait réagir plus vite exactement quand le trading est intense, ce qui est le moment où la toxicité compte. La glose en une ligne : découpez la bande en lots égaux de volume, demandez à quel point chaque lot était asymétrique, et moyennez l'asymétrie.
Chacun des buckets détient le même volume , scindé en parts achat et vente par classification de volume en bloc : la fraction du volume d'un bucket étiquetée comme achats est la CDF normale de la variation de prix du bucket mise à l'échelle de la volatilité, plutôt que de signer chaque transaction individuellement.
Pourquoi une horloge-volume plutôt qu'une horloge-temps. L'information et la toxicité arrivent avec le volume, pas avec le calendrier. Dans une minute chargée, une action peut trader autant qu'en une heure calme ; une horloge-temps les échantillonne pareil, étalant la période chargée et toxique. L'horloge-volume du VPIN remplit les buckets plus vite quand c'est chargé, si bien qu'elle prend plus de lectures, plus fines, exactement pendant les épisodes à fort volume où la sélection adverse s'envole. C'est le même principe « trader en temps-événement, pas en temps-calendrier » que les modèles temps irrégulier / ACD.
Classification en bloc, pas signage transaction par transaction. Plutôt que d'appliquer la règle du tick / Lee–Ready à chaque transaction, le VPIN scinde le volume de chaque bucket de façon probabiliste à partir de sa variation de prix. C'est plus rapide et plus robuste à une erreur de classification individuelle, mais c'est aussi une approximation dont le comportement fait partie de pourquoi les résultats du VPIN sont contestés ci-dessous. Le VPIN se met à jour à chaque bucket, en intraday, ce qui est toute sa raison d'exister face au PIN : un teneur de marché peut en principe regarder le VPIN grimper et élargir ou retirer ses cotations avant qu'un épisode toxique ne se résolve contre lui.
Le VPIN et le Flash Crash de 2010
L'affirmation phare du VPIN est qu'il a grimpé à des niveaux extrêmes dans l'heure avant le Flash Crash du 6 mai 2010 (quand les indices actions américains ont chuté d'environ 9 % et se sont rétablis en quelques minutes), signalant le flux toxique et unilatéral qui a précédé l'effondrement de liquidité. L'épisode est l'étude de cas signature du VPIN et la raison pour laquelle il attire l'attention comme indicateur d'alerte précoce de toxicité.
Le mécanisme que proposent les auteurs : quand le flux devient sévèrement unilatéral et toxique, les teneurs de marché font face à une sélection adverse croissante, élargissent puis se retirent, la profondeur s'évapore, et une boucle de rétroaction de liquidité retirée et de prix en baisse peut déclencher une dislocation. Le VPIN, en mesurant exactement cette unilatéralité sur une horloge-volume, prétend capter l'accumulation avant la cassure de prix, ce que le préréglage « injecter un événement toxique » de l'interactif reproduit : la courbe VPIN grimpe tandis que le panneau de prix en dessous est encore calme, puis la cassure suit.
Le Flash Crash lui-même est bien documenté : le rapport conjoint CFTC–SEC (2010) attribue le déclencheur à un grand programme de vente automatisé exécuté sans égard au prix dans une liquidité qui s'amincit. La contribution du VPIN est l'affirmation plus étroite que la toxicité du flux était mesurablement élevée auparavant. Cela rejoint la sélection adverse et le problème de survie du teneur : un événement flash est une sélection adverse à l'échelle du marché entier, où le flux de tous devient toxique en même temps, les teneurs se retirent, et le carnet s'effondre. Que le VPIN prédise cela de façon fiable, plutôt que de simplement le décrire à mesure qu'il se produit, est exactement le nœud de la section suivante.
Le VPIN est-il vraiment prédictif ? La réponse honnête
C'est authentiquement disputé. Easley, López de Prado & O'Hara présentent le VPIN comme prédisant les dislocations dues à la toxicité ; des travaux ultérieurs, notamment Andersen & Bondarenko (2014), soutiennent que le résultat prédictif est largement mécanique, dépendant des choix de bucketing et de classification en bloc, et faible hors échantillon. La position honnête en 2026 : le VPIN est un descripteur raisonnable de toxicité, pas un oracle d'alerte précoce prouvé.
Les critiques, dites équitablement. Premièrement, les artefacts mécaniques : le niveau du VPIN est sensible à la taille de bucket , à la longueur de fenêtre et au lissage de classification en bloc, et une grande partie de son comportement apparemment « prédictif » peut être un artefact de ces choix et de la volatilité (le VPIN et la volatilité réalisée sont mécaniquement liés) plutôt qu'une information indépendante sur la toxicité future. Deuxièmement, en échantillon contre hors échantillon : certaines des preuves les plus fortes que « le VPIN prédit les crashs » sont en échantillon sur un petit nombre d'événements, et hors échantillon l'avantage prédictif est bien plus faible ou absent, une mise en garde familière du backtesting sur les petits comptes d'événements et les paramètres choisis a posteriori. Troisièmement, description contre prédiction : même là où le VPIN monte avant une dislocation, il peut co-bouger avec la toxicité plutôt que la prévoir avec un délai d'avance utilisable. Le temps que le VPIN soit extrême, un teneur peut déjà être en difficulté.
La défense, dite aussi équitablement : le VPIN est bon marché, léger en modèle, et directionnellement sensé. Une mesure d'asymétrie cadencée au volume devrait être élevée dans les régimes toxiques, et comme un intrant parmi plusieurs il ajoute de l'information. Peu de praticiens tradent le VPIN seul ; beaucoup incluent une feature de toxicité dans cet esprit.
L'enseignement de 2026, honnête et non vendu : utilisez le VPIN comme une jauge parmi d'autres, validez-le hors échantillon sur vos propres données et votre place, et ne traitez jamais un VPIN qui monte comme une garantie. C'est la posture de la marque : nommer le résultat, citer la critique, ne pas survendre l'avantage. Pour la posture d'honnêteté plus large voir le HFT est-il encore rentable.
Exemple travaillé
Prenez une lecture de VPIN synthétique sur une séance calme-puis-toxique, en 2026. Reproduisez-la dans l'interactif ci-dessus. La taille de bucket de volume est lots et la fenêtre glissante est buckets, chaque bucket scindé en volume achat/vente par classification en bloc à partir de sa variation de prix.
Dans le régime calme les buckets sont à peu près équilibrés : un bucket typique est 5 300 achat / 4 700 vente, donc son asymétrie est . Moyenné sur 50 buckets de ce genre, le VPIN se situe près d'un 0,06 bas et bénin.
Maintenant appuyez sur « injecter un événement toxique » : le flux informé devient unilatéral et les buckets passent à environ 8 500 achat / 1 500 vente, une asymétrie de 0,70. À mesure que ces buckets toxiques entrent dans la fenêtre glissante, le VPIN grimpe de 0,06 vers 0,50 et au-delà, bien au-delà du seuil, tandis que le panneau de prix en dessous est encore à peu près plat. Ce n'est qu'après que le VPIN est élevé que le prix synthétique se disloque, à mesure que les teneurs du modèle élargissent et se retirent. Le délai entre le franchissement du seuil par le VPIN et la cassure de prix est l'affirmation d'alerte précoce.
L'expérience d'honnêteté. Réduisez de moitié la taille de bucket à et allongez la fenêtre à . La même bande sous-jacente produit maintenant un niveau de VPIN différent et un délai d'avance apparent différent : preuve visible que la lecture du VPIN est dépendante des paramètres, exactement la critique d'Andersen–Bondarenko. L'épisode toxique est réel dans les données ; le nombre que vous en lisez est un choix de modélisation.
Les chiffres ici sont synthétiques et arrondis ; les niveaux de VPIN, les seuils et tout délai d'avance sont entièrement sensibles à la taille de bucket, à la longueur de fenêtre et aux choix de classification, et doivent être validés hors échantillon par instrument et datés. Le concept de toxicité est robuste ; l'avantage prédictif du VPIN est non tranché, et cette page le dit délibérément. Pour le signal de prix à court horizon avec lequel le VPIN est souvent confondu, voir le déséquilibre du flux d'ordres : l'OFI prédit le prochain mouvement sur une horloge-temps, tandis que le VPIN jauge la toxicité du flux sur une horloge-volume. Ce sont deux questions différentes.