L'era del Ferro

Dal divano alla finish line

Potenzialità dell’analisi multivariata per lo sport di endurance

Lascia un commento

Una metodologia dell’allenamento nello sport di endurance che si ponga l’obiettivo del miglioramento prestativo richiede necessariamente due passaggi:

  1. lo studio degli aspetti fisiologici (metabolici, neuromuscolari/biomeccanici) per la definizione di protocolli su cui la comunità scientifica sia in accordo
  2. l’applicazione all’individuo “sul campo” di tali raccomandazioni generali, e la conseguente osservazione sul tipo di risposta specifica per innescare un processo virtuoso di verifica e aggiustamento del principio dose-risposta

La rapida progressione tecnologica che rende sempre più semplice e economico misurare il comportamento degli atleti nel mondo reale (outdoor) ha fatto assumere via via più rilevanza alla performance analysis nel supporto alle decisioni del tecnico, tanto che un approccio matematico nella elaborazione dei protocolli di allenamento e delle strategie di gara (race pace) è addirittura ritenuto in certi contesti più utile di uno basato unicamente sulla misurazione di parametri fisiologici, come concluso nella review “Critical Power: Implications for Determination of VO2max and Exercise Tolerance“, pubblicata nel 2010 sulla rivista Medicine and Science in Sports and Exercise 42(10):1876-90 · February 2010.

“The measurement of changes in the P-t relationship after a training intervention is likely to be functionally more valuable than the measurement of discrete physiological constructs such as, for example, VO2max, GET/LT, or “anaerobic power”.

In sintesi dunque, come sintetizza Andrew Coggan “the best predictor of performance is performance itself” anche se probabilmente una posizione più neutra, che integri la modellizzazione matematica con la verifica dei parametri fisiologici è consigliabile quando si ha la responsabilità dei risultati di un atleta.

Inoltre, è vero che il livello funzionale dell’atleta è riassumibile in una relazione potenza-tempo, ma è anche vero che la potenza è l’espressione meccanica del costo metabolico ed è quindi condizionata non solo da aspetti puramente metabolici (immaginiamoli come il “motore”) ma anche neuromuscolari e biomeccanici (“telaio, sospensioni, gomme” per mantenere la metafora automobilistica), tecniche (pensiamo alle diverse componenti di una bicicletta, dai rapporti, alle pedivelle, ai profili ruota, per non parlare della posizione in sella, o le scarpe per quanto riguarda la corsa) e ambientali (temperatura, umidità, pressione con) con impatto sulla fisiologia (ad esempio al variare della core temperature) e sull’effetto “estrinseco” della fisiologia (ad esempio minore o maggiore velocità al variare della resistenza all’avanzamento a pari costo metabolico).

Insomma, usare indicatori sintetici sembra essere una ragionevole opportunità di tipo pratico per riuscire a manipolare le variabili in entrata (su sui abbiamo più o meno controllo) in modo da valutare l’impatto della loro variazione sul risultato: andare più veloci o andare più lontano.

Il nodo cruciale è riuscire a generare informazione utile dalla mole di dati a disposizione. Il dato infatti non è informazione di per sé, perché è sempre accompagnato da un livello più o meno elevato di rumore e bias, da cui l’importanza del pre-trattamento. Nasce dunque da questa presa d’atto il tentativo di prendere a prestito dalla chemiometria, la disciplina della chimica che usa modelli matematici per valutare e predire proprietà chimiche, fisiche, biologiche, il metodo e le tecniche di analisi multivariata (Data Analysis and Chemometrics, Paolo Oliveri, Michele Forina, 2012), da applicare al mondo dell’endurance.

DALL’OSSERVAZIONE UNIVARIATA ALLA SCELTA SU BASE MULTIVARIATA

Il nocciolo della statistica multivariata è la semplificazione, cioè la capacità di estrarre informazioni utili da sistemi complessi, sfruttando per la descrizione dei fenomeni ciò che normalmente è un limite, ovvero la variabilità dei dati. Maggiore la variabilità tanto maggiore è la possibilità di riconoscere strutture (cluster); più definite le strutture tanto più grande il grado di informazione. Riuscire a riconoscere cluster comporta alcuni vantaggi tra cui quello di costruire modelli predittivi.

Le due aree di applicazione nel triathlon – e nello sport di endurance in generale – possono essere

  • Experimental design (utilizzando allenamenti ad hoc)
  • Pattern recognition (utilizzando dati storici)

Grazie ad esse è possibile generare un modello di prestazione totalmente individuale, progettare stimoli personalizzati ai fini dell’allenamento, definire soluzioni tecniche ottimali, valutare la race strategy. Sono attività che richiedono di essere integrate nel sistema del tecnico, non possono essere impiegate fruttuosamente se vivono a sé stanti.

D’altra parte l’essere umano prende la maggior parte delle proprie decisioni pensando in modo multivariato – cioè tenendo in considerazione una moltiplicità di fattori e il modo in cui “pesano” sugli effetti anche interagendo tra loro – e molte delle dinamiche ben note ai triatleti sono di questo tipo, a partire dalla classica ottimizzazione di cadenza e ampiezza (o lunghezza dei rapporti), o di peso\potenza, efficienza aerodinamica e comfort nella ricerca della velocità. Quello che cambia è l’arricchimento dato dalla formalizzazione matematica a supporto dell’intuito e dell’esperienza, in definitiva un nuovo strumento da aggiungere alla cassetta degli attrezzi del coach, a cui continuare a applicare l’etichetta “arte dell’allenamento”.

Pattern recognition: il modello della corsa

Nel caso della corsa è conveniente usare i dati raccolti “in continuo” sia outdoor che indoor, un compito cui si presta il sensore Stryd Power Meter. Qui la validazione indipendente per la parte Power e VO2max e qui la validazione indipendente per la cinematica ; in un precedente articolo su era del ferro la descrizione delle metriche utilizzate di seguito. Consiglio caldamente a chi vuole comprendere il tema Running with Power di leggere da cima a fondo tutti gli articoli di Steve Palladino, raccolti nella article library del Palladino Power Project su Facebook.

Principal Component Analysis

Per capire come funziona un atleta (complessivamente e nelle diverse situazioni specifiche) sfruttando serie storiche è possibile ricorrere alla Principal Component Analys. La PCA è una tecnica statistica che usa una trasformazione ortogonale per convertire un set di osservazioni di variabili potenzialmente correlate in un set di variabili linearmente non correlate chiamate componenti principali. Ogni componente principale è una combinazione lineare standardizzata delle variabili originali che permette una interpretazione olistica di un fenomeno multivariato.

Cioè in sostanza le variabili vengono “pesate” e compattate nella direzione della massima variabilità (Componente Principale 1) e della ortogonalità per spiegare la massima varianza residuale (Componente Principale 2 e eventuali iterazioni) . Questo permette di semplificare l’analisi per due ragioni: innanzitutto sfruttando la ridondanza si possono eliminare le variabili che covariano (in caso di solida correlazione) e in secondo luogo emergono gli effetti combinati, altrimenti impossibili da comprendere.

Dal punto di vista operativo è fondamentale che i campioni analizzati siano abbastanza numerosi e abbiano un sufficiente livello di variabilità, che permetta di far emergere strutture, ovvero informazione. Un data set inadeguato porta inevitabilmente a risultati che non permettono una comprensione globale del fenomeno. Ci sono i dati ma non c’è informazione, come si vede nel grafico 1 dove non si riconoscono strutture. Un ulteriore ambito di sviluppo è il riconoscimento dei pattern attraverso metodi di apprendimento automatico.

Grafico 1

Loading plot: costruire un modello della corsa

Con un buona campionatura si riesce costruire un modello che spiega il funzionamento dell’atleta. Nel caso della corsa vedremo come i risultati della PCA sono perfettamente coerenti con quelli dei modelli fisiologici.

Il loading plot infatti permette di comprendere l’importanza di ogni variabile nella generazione delle componenti principali e le correlazioni tra loro. Variabili posizionate nello stesso quadrante correlano positivamente, variabili posizionate in quadranti opposti correlano negativamente, variabili posizionate ortogonalmente (sempre passando per il centro) non sono correlate.

Grafico 2

Per l’atleta preso in considerazione, si riconosce la componente principale 1 (evidenziata in fucsia nel grafico sopra) come il “costo della corsa”. Sulla componente principale 2 (in arancio) troviamo la velocità.

Si può subito apprezzare come l’ampiezza (SL) sia molto correlata (inversamente) alla running economy (Econ) e al costo energetico (Ecor, perfettamente sovrapposto al precedente) mentre il costo non è quasi per nulla correlato alla cadenza (SR), che invece è coinvolta con l’ampiezza nella generazione di velocità. Questo ha delle implicazioni importanti per un runner\triatleta, che vedremo nella parte dedicata all’experimental design con l’obiettivo di migliorare la Running Effectiveness. La potenza è correlata inversamente alle variabili che descrivono lo spostamento verticale (Vertical Oscillation, Form Power Ratio e Form Power in valore assoluto) ma la correlazione inversa tra potenza totale e potenza verticale è “un po’ meno” che proporzionale, ovvero per generare velocità non si può fare a meno di una quota di costo assoluto speso verticalmente. La PCA descrive in modo coerente il modello di Bosco per cui a velocità maggiori corrisponde minore oscillazione verticale.

Grafico 3a

Allo stesso modo balza subito all’occhio la correlazione inversa tra velocità e tempo di contatto al suolo (GCT) e come all’aumentare della componente orizzontale della potenza l’oscillazione verticale si muova in modo inversamente proporzionale

Questa descrizione puramente matematica (che richiede pochi secondi per essere costruita) è quindi coerente con descrizioni consolidate del modello cinematico della corsa, come quello celebre del prof Bosco.

Grafico 3b

o più ampiamente metabolico-meccanico cinematico (Hookgamer, Taboga and Kram; Peer J 2014; 2:e482 ben spiegato in “A Conceptualized Understanding of Running Power Components” da Steve Palladino )

breakdown of running power costs.jpg
Grafico 4

Vale la pena di notare come la stiffness muscolare (LSS) sia direttamente correlata al costo e inversamente alla velocità (più alta la stiffness meno efficiente la corsa) ma come il suo contributo alla variabiità di PC1 e PC2 sia molto ridotto. Dato che i campioni non includono durate tali da far emergere forte affaticamento questo suggerisce di verificare se invece la stiffness ha una maggiore importanza nelle prestazioni di lunghissima durata.

Score Plot: le relazioni tra variabili in un colpo d’occhio

Lo score plot permette di visualizzare il contributo dei campioni alla variabilità, nel nuovo spazio definito dalle componenti, mettendo in rilievo tendenze e raggruppamenti. Sulla base della posizione dei campioni nel grafico è possibile mettere in evidenza quali di essi contribuiscano in proporzione maggiore alle variabili localizzate nella regione corrispettiva del loading plot.

Nel grafico 5 i campioni sono plottati evidenziando l’incremento della running economy e, correttamente, i campioni rappresentativi degli sprint in salita si addensano al livello più alto di Econ/Ecor (alta potenza, alto tempo di contatto al suolo…ma bassa velocità). L’economia dei campioni in basso a sinistra migliora (il valore diminuisce) mano a mano che si riduce la potenza e risale in modo contenuto seppure a fronte dell’aumentare della velocità.

Grafico 5

Nel grafico 6 lo score plot è raffigurato individuando i campioni a velocità crescente e infatti sono riconoscibili i campioni riconducibili a allenamenti di mechanical speed. La riga 68 è un outlier e lo score plot offre lo spunto per controllarlo più in dettaglio.

Grafico 6

E’ anche più semplice confrontare due variabili per cui supponiamo ci sia interazione, mettendole contemporaneamente in relazione con le componenti principali, come nel grafico 7.

Grafico 7

Qui si nota come al crescere della velocità cresca progressivamente la cadenza mentre la variazione dell’ampiezza è minore, a indicare come l’atleta produca movimento quasi a ampiezza fissa. Altra indicazione interessante per il tecnico.

Per un approfondito esame della running economy dalla prospettiva integrata tra l’utilizzo dei substrati energetici da parte dei muscoli e gli aspetti antropometrici, cinetici, cinematici e ambientali (ad esempio tipo di superficie) rimando alla review di Fletcher e Macintosh “Running Economy from a Muscle Energetics Perspective“, Front. Physiol., 22 June 2017, segnalando in particolare i paragrafi relativi alla tendon stiffness e alla conclusione per cui there may be an “optimal tendon compliance” with respect to minimizing muscle shortening, che ancora una volta sembra incoraggiare all’osservazione delle variabili in modo multivariato.

Porsi le domande giuste

L’utilità della PCA è tanto maggiore quanto più si mette a fuoco “cosa si vuole osservare”. Taggando i campioni in modo appropriato, infatti, è possibile far emergere le discriminanti dei fenomeni\comportamenti.

Un primo semplice modo di far emergere informazioni creando strutture è per esempio quella di taggare ogni riga del data set con l’intensità di riferimento nella corsa, in questo caso grosso modo rispettivamente la Z2, tutta l’area della potenza aerobica estensiva, e poi da Z4 in su. Nel caso di esempio è possibile confrontare il rapporto tra velocità e costo in rapporto alle intensità metaboliche.

Grafico 7

Una importante applicazione della classificazione via PCA è quella della conoscenza dei mezzi tecnici, nell’ultimo esempio una suddivisione delle acquisizioni in base al tipo di scarpa utilizzato (nel grafico 8 evidentemente la campionatura è in progress dato lo squilibrio nella numerosità). E’ abbastanza intuitivo capire la potenzialità di una chiara distinzione nel rapporto tra velocità e costo nella scelta dei materiali. Ancora più alta se pensiamo che si possono aggiungere giudizi soggettivi (ad esempio relativi al comfort), e più lo sport è tecnicamente complesso maggiore è il vantaggio, in termini di supporto alla scelta più vantaggiosa, di poter sintetizzare il fenomeno in poche variabili con grande capacità descrittiva.

Grafico 8

Uno strumento potente

La PCA applicata alla corsa ha potuto costruire un modello che, a fronte dell’opportuna raccolta, selezione e trattamento dei dati, 1) si è rivelato coerente con quelli validati dai fisiologi, 2) ha permesso di riconoscere la distribuzione delle variabili mettendone in risalto i trend e 3) ci ha semplificato la vita consentendoci di ridurre il numero di variabili da considerare.

Inoltre l’approccio multivariato apre la porte alla possibilità di selezionare le variabili predittrici, modellare la relazione e calcolare la variabile di risposta. Ad esempio può essere usata per migliorare l’economia della corsa, manipolando ampiezza e cadenza.

Nota: i calcoli e i plot sono stati eseguiti con il software CAT, Chemometric Agile Tool (R-based), gratuitamente distribuito dal Gruppo divisionale di Chemiometria (Divisione di Chimica Analitica della Società Chimica Italiana).

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...