Données thème

Données haute fréquence

structurel

La microstructure telle qu'elle est enregistrée : le flux transactions/cotations/carnet, son volume, et les bizarreries statistiques qui cassent les hypothèses que des données plus lentes vous laissent faire.

Ce que contient ce thème

6 pages, chacune menant aux idées qu'elle contient.

Comment les données sont enregistrées01
Transactions, cotations et mises à jour du carnet, chacune horodatée d'un numéro de séquence et d'une heure d'horloge. Bien gérer les horodatages et l'ordonnancement, c'est la différence entre un vrai backtest et une fiction.
structurel
Volume de données et ingénierie02
Des téraoctets par jour et par marché. Les données haute fréquence sont énormes, irrégulièrement échelonnées dans le temps et impitoyables face au stockage naïf : l'ingénierie est la moitié de la bataille.
structurel
Rebond bid-ask03
La dent de scie artificielle des prix de transaction, causée par les transactions alternant entre toucher le bid et lever l'ask, sans changement de juste valeur. Roll (1984) en déduit le spread effectif à partir de cette seule covariance sérielle.
structurel IX-BOUNCE
Queues épaisses04
Les rendements haute fréquence ne sont pas normaux. Les queues sont bien plus lourdes qu'une gaussienne ne le prédit, si bien que l'événement à six sigma arrive chaque mois, pas une fois par millénaire. Prétendez le contraire et votre modèle de risque vous ment.
structurel IX-FATTAILS
Temps irrégulier et processus ponctuels05
Les transactions arrivent en rafales groupées, pas à l'horloge. Le modèle ACD d'Engle–Russell (1998) traite les durées entre événements comme l'objet d'étude, des maths qu'un mathématicien reconnaîtra immédiatement.
structurel IX-DURATION
Inférence du sens des transactions06
La plupart des flux n'indiquent pas qui était l'agresseur, alors vous l'inférez. La règle du tick signe par le changement de prix ; Lee–Ready (1991) compare la transaction au mid en vigueur. Les deux sont imparfaites, et la précision chute sur les marchés rapides.
structurel IX-TICKRULE

Où cela s'inscrit

Les questions auxquelles ce thème répond

Où trouver des données de carnet d'ordres pour s'exercer ?
Les plateformes crypto publient des données de carnet L2/L3 complètes via des API WebSocket publiques gratuites, les données haute fréquence réelles les plus accessibles en 2026. Les places de marchés de prédiction (ex. Polymarket) exposent aussi leurs carnets. Les données tick/profondeur actions sont accessibles mais coûteuses. Pour apprendre, capturez un flux crypto vous-même ; pour un backtesting sérieux il faut un jeu L2/L3 propre et daté précisément, le genre de ressource sur notre liste d'attente jeux de données.