APPUNTI DI INFERENZA STATISTICA BAYESIANA

 

Fabrizio CIPOLLINI e Federico Mattia STEFANINI

Firenze, 1995

 

INTRODUZIONE

 

Nello studio di un fenomeno (un sistema o un processo) che coinvolge aspetti di incertezza ci si propone di descrivere la realtà oggetto di studio in modo che ogni possibile fonte di informazione sia contemplata nella sua rappresentazione astratta, detta modello.  Operando in questo modo si tenta di giungere alla massima conoscenza del fenomeno, conoscenza che può essere eventualmente sfruttata anche in senso applicato, attraverso la scelta delle azioni da intraprendere in un determinato contesto.

Benché la necessità di impiegare strumenti matematici per il raggiungimento dello scopo sia pressoché universalmente riconosciuta, in virtù dell'imprescindibile esigenza di formalizzare, il percorso da seguire per giungere al modello matematico non è univocamente definito.  Basti pensare come i medesimi concetti di incertezza, informazione, probabilità siano temi attuali di confronto metodologico.

Perché i risultati del processo di inferenza siano applicativamente rilevanti, è prioritaria l'esistenza di uno stretto legame tra sistema reale e modello, quale esso sia.  Inoltre non è giustificabile nessun formalismo matematico, per quanto potenzialmente efficace, qualora non ne sia esplicitabile il contenuto semantico. 

 

Prima di affrontare i metodi ed i significati relativi ad una possibile scelta metodologica, detta inferenza Bayesiana, è necessario richiamare alcuni concetti di base particolarmente importanti in tale contesto. Seguirà l'esposizione delle principali procedure Bayesiane.

 

Probabilità ed informazione nell'approccio Bayesiano.

Il modello statistico, come astrazione del fenomeno in studio, consiste nella descrizione degli esiti sperimentali o di osservazione che sono possibili, in unione al meccanismo probabilistico che li genera.  Pertanto, un buon modello non si comporta differentemente dalla situazione reale per quanto riguarda i risultati, indipendentemente dal fatto che ne sia una "spiegazione vera".  E' necessario, allora, esplicitare quali significati può assumere il termine probabilità, nel contesto Bayesiano.

 

Il concetto di probabilità è imprescindibilmente legato alle inclinazioni specifiche del singolo autore e del singolo statistico applicato.  In ambito Bayesiano sono di particolare rilievo le impostazioni frequentista e soggettivista.

 

Nella concezione soggettivista, la probabilità esprime il grado di fiducia individuale circa le possibilità di accadimento di diverse eventualità.  Benché non sia sempre semplice esprimere numericamente tale grado di fiducia, negli sviluppi di seguito considerati è necessario che lo sia.

Questo fatto costituisce anche uno stimolo psicologico all'asserzione ottimale circa situazioni che coinvolgono incertezza, quasi che la richiesta di esprimere la fiducia in termini numerici sia in grado di "mettere a fuoco" il sistema di credenze interiori al massimo livello.  Si ottiene pertanto una concezione che dipende strettamente dall'esperienza (intesa nel senso più ampio) accumulata dall'individuo.  Inoltre la presenza di un collegamento tra utilità ed espressione soggettiva è implicitamente affermato, non potendo in generale l'individuo slegarsi con facilità dal proprio livello pragmatico.  Epistemicamente l'irrazionalità dell'individuo è ritenuta effetto dell'ignoranza metodologica costitutiva circa il modo con cui processare l'informazione relativa all'incertezza, ma qualora opportunamente erudito, l'individuo divenuto allora razionale dovrebbe attenersi a:

1) ordinare i possibili esiti su una scala compresa tra l'evento impossibile e quello inevitabile;

2) attenersi alla consistenza di giudizio in modo da non contraddirsi;

3) attenersi ad un principio di coerenza, in particolare non accettare scommesse per le quali è sicuro di perdere.

 

Quest'ultimo punto si relaziona alla pratica di numerizzazione delle probabilità, ottenuta mediante la formulazione di scommesse da parte dell'individuo.  L'idea sottostante è che due individui che abbiano avuto le stesse esperienze precedenti tenderanno a formulare lo stesso tipo di scommessa, giungendo a valori di probabilità quasi uguali per gli esiti possibili.  Tuttavia la teoria ha funzione normativa, non impositiva.  Le affermazioni probabilistiche sono di tipo condizionale e riguardano eventi isolati, dato che non sussiste l'idea di ripetibilità.

 

Nella concezione frequentista, l'oggettività della formulazione riveste un ruolo prioritario: i motivi personali non devono inficiare i valori di probabilità, proprio perché non oggettivi.  La dimostrazione sperimentale diviene pertanto prioritaria e causa la restrizione dei tipi di problema affrontabili.  In tal senso la ripetibilità dell'esperimento, od osservazione, in condizioni analoghe deve essere possibile perché il significato frequentista sia valido.  Come tale, l'affermazione probabilistica è condizionale alla situazione sperimentale di riferimento, benché la condizionalità non sia formalmente espressa.  Nonostante nel fenomeno in studio sia presente variabilità casuale riguardante il singolo esito, a lungo termine in prove ripetute, emerge una regolarità espressa come rapporto tra il numero di esiti di un dato tipo e il numero di prove totali effettuate. Si accetta come fatto empirico che tale limite esista, così come empiricamente si accetta l'addittività di eventi mutuamente esclusivi.

 

In conclusione, l'evento dell'approccio frequentista è una delle potenziali osservazioni del collettivo definito come ripetibile, mentre per l'approccio soggettivista è una particolare realizzazione esplicitamente caratterizzata, da cui deriva l'idea di probabilità condizionale.

 

Scelto l'approccio probabilistico appropriato per il fenomeno in studio, il modello statistico Bayesiano può essere formulato, ma l'identificazione del modello, ovvero la determinazione dei suoi parametri, può essere ottenuta solo in base all'informazione rilevante disponibile. Quest'ultima può essere suddivisa in informazione sperimentale e preconoscenza.

Il primo tipo di informazione risulta a seguito dell'esperimento-osservazione di dati campionari, pertanto l'informazione sperimentale è oggettiva essendo basata sulla misura di variabili di interesse.  Nell'approccio Bayesiano non è richiesto che esista un collettivo di riferimento in base al quale ripetere l'esperimento in condizioni analoghe. 

La preconoscenza consiste nella disponibilità di informazione a priori rispetto ai dati osservati nel campione.  Questa disponibilità dipende dalle esperienze precedenti, o più in generale dalla presenza di cognizioni tecnico-scientifiche pertinenti.  Quando l'informazione disponibile a priori è "sfumata", allora si richiede il completamento dell'informazione stessa, principalmente su base soggettiva ma legata spesso a motivazioni matematico-formali, perché l'informazione sia utilizzabile formalmente.  Un caso tipico di preconoscenza è costituito da considerazioni chimico-fisiche esterne al sistema in studio ma rilevanti per esso. 

L'eventuale informazione disponibile riguardo le conseguenze relative alle azioni intraprese in base ai risultati delle procedure inferenziali non vengono incluse nell'approccio Bayesiano puro.

 

 

L'INFERENZA BAYESIANA

 

Procedure di inferenza Bayesiana.

Nell'inferenza Bayesiana i due tipi di informazione menzionati, a priori e campionaria, sono quantificate attraverso due distribuzioni (di densità) di probabilità, dette rispettivamente priori e verosimiglianza.  Si noti che i parametri del modello, in quanto dotati di distribuzione, sono considerati variabili casuali.

Nelle procedure Bayesiane l'informazione espressa dalla priori è modificata dall'informazione contenuta nel campione osservato impiegando il teorema di Bayes.  L'inferenza prende la forma di distribuzione del parametro condizionata ai dati osservati, detta posteriori del parametro.  Le affermazioni probabilistiche sono quindi condizionali.

 

Il ruolo del teorema di Bayes è fondamentale, poiché tutta l'inferenza Bayesiana si fonda su di esso: date una partizione finita di eventi {Hi} di W, ed un generico evento A, note le probabilità di tipo P[Hi] ed P[A |Hi], segue la probabilità condizionale (od inversa):

 

Nella trattazione successiva si adotta la simbologia seguente: x sono i dati del campione, X la variabile casuale rispettiva definita sullo spazio campionario X , pq(x) è la distribuzione di X che appartiene alla famiglia P={pq(x); q Î W} indiciata dal parametro (uni-multidimensionale) q appartenente a W spazio dei parametri, p(q) la priori del parametro. Quando x sia fissato, pq(x) rappresenta la funzione di verosimiglianza, una funzione che quantifica come cambia la probabilità (densità) del realizzarsi di x al variare di q.

 

La priori rappresenta la traduzione "matematica" dell'informazione extra-campionaria rilevante e disponibile.  Quest'ultima può consistere di informazioni tecniche, di opinioni, del feed-back del processo, ed a volte include un super-esperimento di riferimento.  Non esclude necessariamente l'adozione dell'approccio frequentista, pur essendo naturale una spiegazione di tipo soggettivista.  Qualora siano disponibili i risultati di esperimenti precedenti si usano i metodi Bayesiani empirici (si veda di seguito) per la costruzione della priori.

 

Dopo aver definito la priori ed avendo il campione disponibile si può ottenere la distribuzione a posteriori, la quale aggiorna l'informazione sul parametro contenuta nella priori attraverso l'informazione distributiva contenuta nel campione:

 

Si noti che questa espressione è in generale indipendente dallo schema di campionamento, dato che tutte le informazioni campionare sono contenute nella verosimiglianza, che come tale assurge a concetto centrale nell'inferenza Bayesiana.

La posteriori fornisce una espressione completa dell'inferenza sul parametro.  Tuttavia spesso non è richiesta l'intera informazione distributiva, ma una o più misure riassuntive.

 

Stima puntuale Bayesiana.

Nella stima puntuale Bayesiana, un valore puntuale della distribuzione a posteriori del parametro è scelto quale stima dell'incognita q.  E' pratica frequente scegliere la moda della posteriori p(q|x) come stima puntuale del parametro incognito, dato che può essere interpretata come il più probabile (credibile) valore di q nella situazione corrente.  Qualora siano disponibili (ed utilizzate) ulteriori informazioni  riguardanti le conseguenze di una scelta errata di q, può essere conveniente impiegare la media della distribuzione a posteriori.

 

Regioni di confidenza Bayesiane.

In questa procedura si desidera ottenere una informazione riassuntiva circa p(q|x) costituita da una regione Sa(x) contenuta in W, con la proprietà probabilistica:

con (1-a) livello di confidenza Bayesiano della regione di confidenza Bayesiana.  Si noti la generalità della definizione, la quale peraltro lascia ampia libertà riguardo l'individuazione concreta della regione, ad esempio tramite tail-area se la distribuzione è simmetrica. In generale servono ulteriori specifiche per restringere la classe delle possibili scelte.

Un criterio ragionevole, fondato sul significato probabilistico della distribuzione a posteriori, prevede che nella regione non ci siano punti con probabilità inferiore a quella relativa ai punti non inclusi in essa.

 

Test delle ipotesi Bayesiano.

In virtù della diretta interpretabilità della distribuzione a posteriori, il test delle ipotesi in ambito Bayesiano ha forma semplice.  Ovvero, fissata l'ipotesi nulla H: q Î w Ì W in alternativa all'ipotesi H': q Î W - w, si valuta la probabilità

e si rifiuta l'ipotesi nulla se tale valore di probabilità risulta piccolo, ovvero più piccolo del fissato livello critico a.  A seguito di questa definizione, il test risulta simmetrico poiché non predilige nessuna delle due ipotesi formulate.

 

Nel caso in cui l'ipotesi nulla sia semplice e l'ipotesi alternativa sia composta, o viceversa, si pongono alcuni problemi interpretativi.

Supponiamo che il parametro abbia natura continua (è il caso comune) e che si voglia sottoporre a verifica H: q = q0 in alternativa a H': q ¹ q0.  In tal caso accade che, a meno di ipotesi particolari sulla priori, la posteriori non concentra massa distributiva in punti singoli del proprio dominio, quindi P[H |x]=0 contro P[H' | x]=1-P[H |x]=1.

Chiaramente tale problema non si pone se entrambi le ipotesi sono complesse e di stessa dimensionalità, e non sussiste neppure se si confrontano ipotesi H ed H' entrambi semplici poichè in questo caso il test può basarsi sul confronto delle due densità p(q0|x) e p(q1|x) in forma di odds. 

Sono state formulate due possibili soluzioni:

1) Lindley propone di ottenere la regione di confidenza Bayesiana del parametro al 100(1 - a)%, accettando l'ipotesi nulla se nella regione è compreso il valore q0, altrimenti rifiutando H.

2) Jeffreys osserva come in alcune circostanze un valore q0 rivesta particolare importanza applicativa, ad esempio come valore del controllo in un esperimento, rispetto ai rimanenti possibili valori q Î W - q0.  In tal caso la priori viene scomposta in due parti: una probabilità discreta P[q0] su q0 e una densità a priori continua p(q) per q ¹ q0.  Attraverso i dati campionari x si calcolano le posteriori P[q0 | x] e p(q |x) per q ¹ q0.  L'ipotesi nulla H è accettata o rifiutata in base al valore degli odds in proprio favore:

Previsioni Bayesiane.

In molti casi di interesse sperimentale, l'attenzione è volta a prevedere la distribuzione di probabilità di dati futuri sulla base delle conoscenze campionarie x e delle loro implicazioni inferenziali su q (Aitchison and Dunsmore, 1975).  Indicati i dati futuri come y, la predizione ha forma di probabilità condizionale P[y | x]:

la quale fornisce un'espressione inferenziale completa riguardo y.  Quando desiderato si può procedere poi a misure riassuntive di informazione, in modi analoghi a quanto esposto in precedenza riguardo la posteriori del parametro.

 

 

FORMULAZIONE DELLA PRIORI

 

Vi sono due difficoltà relative all'approccio Bayesiano in confronto a quello classico.  La prima relativa alla natura della probabilità a priori, la seconda riguardante la specificazione numerica della stessa. Riguardo al primo aspetto, si rimanda alla parte conclusiva sulle critiche all'approccio Bayesiano.  Per ciò che concerne il secondo aspetto, distinguiamo tre casi principali: ignoranza a priori, conoscenza a priori vaga, conoscenza a priori sostanziale.

Si rammenta che i concetti seguenti sono da riferirsi strettamente all'importanza relativa dei due tipi di informazione considerati: a priori e campionaria.

 

Ignoranza a priori.

In questo caso non si dispone di nessuna informazione a priori tangibile (oggettiva o soggettiva), e tuttavia, dato che l'approccio Bayesiano richiede una priori, l'ignoranza su q deve essere espressa mediante formulazione quantitativa.  Le priori formate in condizioni di ignoranza totale sono dette non informative.

A questo proposito, Jeffreys propone di utilizzare il principio di ragione insufficiente, il quale prevede che, entro un insieme discreto di alternative in condizioni di ignoranza, non c'è ragione di assegnare a qualcuna di queste una probabilità diversa. 

Tuttavia, alcune problematiche sorgono quando si vuole estendere questo principio al caso continuo.  Ad esempio, si possono ottenere distribuzioni improprie, per le quali cioè esiste almeno un intervallo (a,b) tale che  P[a < q < b] > 1.

Per evitare anomalie dovute alla natura impropria delle distribuzioni e per soddisfare certe condizioni di invarianza, più autori hanno proposto di assegnare priori non informative di natura diversa a seconda dello spazio parametrico:

1) se W =(-¥,¥) allora p(q) µ 1 (priori uniforme); Jeffreys supporta la scelta sostenendo che se siamo ignoranti per q lo siamo anche per ogni sua funzione lineare;

2) se W =(0,¥) allora p(q) µ 1/q; la scelta è motivata da Jeffreys notando che f=log(q) Î (-¥,¥) e trattando f come nel caso (1);

3) se W =(0,1) allora p(q) può essere scelto in differenti modi secondo le proposte di diversi autori: p(q) = I(0,1)(q) (Bayes); p(q) µ q-1 (1-q)-1 (Haldane) che risulta ottimale riguardo le proprietà di invarianza;  p(q) µ q-1/2 (1-q)-1/2 (Jeffreys) che rispetto alla precedente ha meno peso negli estremi; p(q) µ Is(q)1/2 (Jeffreys) proposta opinabile dal punto di vista Bayesiano in quanto effettua una media sullo spazio campionario X; infine, Jeffreys sostiene che in molti problemi è più naturale assegnare probabilità discrete a specifici q e uniforme altrove (si veda la proposta dello stesso Jeffreys riguardo al test delle ipotesi). 

 

Conoscenza a priori vaga.

E' il caso che si verifica quando è irragionevole, per la quantità di informazione posseduta, costruire una priori non informativa e, tuttavia, l'informazione contenuta nei dati campionari "sovrasta" l'informazione a priori; ovvero, similmente al caso delle priori non informative, la posteriori è essenzialmente la verosimiglianza normalizzata.  Questa eventualità possiede un'utilità pratica: il conflitto sul modo di esprimere la priori per un particolare fenomeno diviene scarsamente rilevante, dato che l'informazione a priori sarà sottopesata dai dati campionari se questi sono sufficientemente numerosi (principio della misura precisa).    

 

Conoscenza a priori sostanziale e problematiche collegate.

Si ha quando l'informazione a priori è abbastanza forte da far sì che la posteriori sia piuttosto diversa dalla verosimiglianza.

 

In tale circostanza si pone il problema della scelta o della stima della priori data la pesante rilevanza della stessa sull'inferenza.  Una risposta parziale a questo problema è fornita dai metodi di Bayes empirici oppure dall'uso delle meta-priori.

Nel primo caso, l'informazione consiste in un campione di dati limitato tratto da una situazione ritenuta simile a quella corrente, ma di dimensione insufficiente per costruire una distribuzione di frequenza di stime accurate dei precedenti valori di q.  La metodologia è applicabile quando non c'è difficoltà concettuale a postulare l'esistenza di una priori suscettibile di interpretazione frequentista, e si sostanzia nell'uso di metodi classici per trovare una stima della priori basata su un campione di dati anch'esso a priori.

Nel secondo caso, si dispone di un campione dei precedenti valori veri di q in situazioni ritenute simili all'attuale.  La procedura può essere scomposta in due fasi.  Nella prima si impiegano metodi Bayesiani per ricavare una posteriori per il parametro condizionata al campione dei q.  Nella seconda fase, si usa il risultato precedente quale priori per risolvere il problema inferenziale di interesse prioritario.

 

Un altra problematica rilevante è costituita dalla possibilità di impiegare priori con proprietà matematiche buone, quali le coniugate.  Il loro impiego consente di risolvere, almeno in certi casi, due questioni urgenti, quali la derivazione matematica della posteriori e la discriminazione entro la posteriori tra il contributo informativo portato dai dati campionari e quello offerto dalla priori.

Una priori p(q) appartenente alla famiglia di distribuzioni Q={pa(q); a Î A} è detta coniugata se la posteriori p(q|x) appartiene ancora alla famiglia Q. In tal caso se a0 rappresenta l'informazione a priori su q, il campione x lo trasforma in un nuovo a1 che sintetizza l'informazione a posteriori su q.  In questo contesto, allora, il processo di inferenza Bayesiano è funzione di A in se stesso.

I vantaggi principali di questa scelta sono: (1) la possibilità di interpretare a in termini di proprietà dei dati campionari, illustrata dalla scomposizione di a1 in a1=a0+ (a1-a0), dove a0 è il contributo della priori ed a1-a0 è la variazione indotta dall'informazione campionaria; (2) l'ottenimento di una maggiore semplicità computazionale, dovuta al fatto che priori e posteriori hanno la stessa forma funzionale a meno del parametro a.  

Le coniugate, tuttavia, esistono in pochi casi benché assai rilevanti applicativamente.  E' infatti necessario che: (a) esista una statistica singolarmente sufficiente per q, (b) la priori appartenga alla stessa famiglia di distribuzioni a cui appartiene la distribuzione campionaria della statistica sufficiente; (c) a possa essere espresso in termini di valore della statistica sufficiente e della dimensione campionaria.  Si noti l'importanza del concetto di sufficienza anche in contesto Bayesiano. 

Priori coniugate possono essere derivate per distribuzioni campionarie appartenenti alla famiglia esponenziale, benchè possano esistere coniugate anche per altre distribuzioni (ad esempio per l'uniforme in (0,q)) (sull'argomento si veda DeGroot, 1970).

 

 

ARGOMENTAZIONI A FAVORE DELL'APPROCCIO BAYESIANO

 

L'approccio Bayesiano, relativamente a quello classico, consente di fare inferenza direttamente sul parametro, con notevoli vantaggi anche dal punto di vista interpretativo.  Si noti, infatti, che la posteriori p(q|x), espressione completa dell'inferenza su q, probabilizza direttamente il parametro.  Da ciò consegue che anche le misure inferenziali sintetiche derivate beneficiano dell'immediatezza interpretativa citata.  Le regioni di confidenza definiscono la probabilità che q appartenga ad un certo sottoinsieme dello spazio W, mentre nell'approccio classico occorre riferirsi a regioni casuali che contengono il valore vero di q.  

Ancora, nel test delle ipotesi, l'approccio Bayesiano consente di assegnare probabilità direttamente alle ipotesi formulate, mentre nell'approccio classico si può solo effettuare una valutazione di conformità del campione osservato rispetto all'ipotesi di lavoro.  Ne consegue che l'asimmetria costitutiva del test delle ipotesi classico svanisce a favore di una struttura inferenziale che non richiede di privilegiare nessuna delle due ipotesi formulate.

Questo fatto rende il test delle ipotesi Bayesiano particolarmente interessante nei casi in cui lo stato di preconoscenza non sia sufficiente per motivare un atteggiamento conservativo nei riguardi della ipotesi nulla, come avviene nell'approccio frequentista.

 

Strettamente legato a quanto appena esposto è il seguente aspetto: tutte le inferenze Bayesiane sono condizionate al campione x.  Ne consegue la disponibilità di una misura interna di accuratezza che è legata solo alla corrente situazione campionaria.  Differentemente dall'approccio classico, in cui la misura di precisione delle inferenze può essere solo iniziale (prima dell'osservazione campionaria), l'approccio Bayesiano consente di valutare la precisione finale (dopo l'osservazione del campione).  Essa è importante perchè quantifica l'accuratezza della stima effettuata in relazione al campione effettivamente disponibile.

 

L'approccio Bayesiano al test d'ipotesi può essere criticato nei casi di tipo H: q = q0 in alternativa all'ipotesi H': q ¹ q0, poichè il parametro è ritenuto usualmente una variabile casuale continua.  Un approccio minimale è offerto dagli autori Lindley e Jeffreys.  V'è, tuttavia, anche da considerare che la risoluzione degli strumenti di misura è finita, e ciò causa la partizione in classi di equivalenza di X, ognuna grande quanto la risoluzione d dello strumento impiegato.  Ne deriva una trasformazione dell'ipotesi di lavoro H: q Î(q0-0.5 d , q0 + 0.5 d) = w, dove d è la risoluzione menzionata.

 

L'approccio classico e quello Bayesiano si incentrano su due principi totalmente diversi. Quello classico è costituito dal principio di campionamento ripetuto, per il quale è prioritario il disegno campionario. Di contro, quello Bayesiano, include il principio di verosimiglianza, dove la densità congiunta del campione riveste ruolo fondamentale.  A favore della scelta operata dai Bayesiani, si rammenti che la verosimiglianza risulta necessariamente "fedele" a quanto osservato, principio non garantibile dai classici, per i quali è prioritario il modello di campionamento rispetto a quanto effettivamente avvenuto (cfr. Piccinato, 1992).

 

Anche la modellizzazione dei fenomeni temporali risulta in principio differente, essendo  l'inferenza condizionale in ambito Bayesiano del tutto naturale.  Infatti è ineccepibile considerare la quantità P[y|x], con x le osservazioni passate ed y quelle future.  Viceversa in ambito classicista non c'è la possibilità diretta di legare il passato al futuro, se non indirettamente attraverso la stima di q che si considera valida per il tempo futuro in cui si registrerà y.

 

Il confronto dell'efficacia di disegni sperimentali in ambito di modelli non lineari può beneficiare della metodica Bayesiana.  Essa elimina la dipendenza dal parametro mediante integrazione, mentre tale eliminazione non è sempre possibile nelle espressioni relative all'approccio classico.  Pertanto la bontà relativa di due disegni può dipendere dal valore incognito del parametro da stimare, essendo così possibile ottenere una valutazione assoluta di preferenza tra i due disegni confrontati.

 

E' rimarchevole la possibilità di scegliere opportunamente la priori e il criterio di ottenimento dell'intervallo Bayesiano in modo che le espressioni di stima per intervallo secondo l'approccio frequentista e quelle ottenibili in termini Bayesiani siano uguali. Benché questo fatto non costituisca un'argomentazione di validazione incrociata dei due approcci, illustra un punto di contatto formale tra le due scuole di pensiero.

 

Qualora l'informazione a priori non sia disponibile, l'approccio Bayesiano è ancora impiegabile e può essere motivato in virtù della centralità della nozione di coerenza. Esso cerca di formalizzare precisamente ciò che è richiesto all'individuo razionale perché reagisca ragionevolmente e consistentemente a prospettive differenti, realizzabili in situazioni di incertezza.  In tal caso si formalizza l'ignoranza a priori (prior ignorance).

 

Nelle procedure di inferenza Bayesiana opera il principio della misura precisa. In molte circostanze i dati sperimentali sono così importanti in termini di contributo informativo, che la scelta della priori diventa largamente irrilevante. La concentrazione della verosimiglianza su W, infatti, fornisce una posteriori che è proporzionale alla verosimiglianza.  La disponibilità di campioni di dimensione elevata consente una inferenza robusta rispetto alla scelta della priori (stable estimation).

 

Un motivo di ulteriore interesse applicativo dei metodi Bayesiani è offerto dai recenti progressi nelle tecniche di integrazione numerica (calcolo numerico), i quali consentono una più libera scelta della priori rispetto l'uso delle famiglie coniugate, e permettono lo studio di realtà sperimentali più complesse.

 

All'obiezione della sensibilità della metodologia inferenziale Bayesiana riguardo la scelta della priori in casi di preconoscenza debole, la metodologia Bayesiana risponde studiando nei casi specifici la sensitività delle conclusioni al variare della priori entro una certa classe.

 

 

LE CRITICHE ALL'APPROCCIO BAYESIANO

 

Supponiamo che l'informazione a priori sia tanto rilevante da poter specificare senza dubbio alcuno la reale forma della priori.  In tale caso, a nostro avviso poche obiezioni possono essere sollevate sulla liceità dell'uso della strumentazione inferenziale Bayesiana: essa offre un modo efficace ed inopinabile dal punto di vista analitico per sfruttare tutta l'informazione disponibile. Tuttavia, se tale informazione a priori non è così incontrovertibile, allora è lecito domandarsi se l'ammontare di "rumore" introdotto dalla scelta di una priori sia compensato dal guadagno informativo per aver usato tutta l'informazione teoricamente a disposizione.  Ciò conduce a dubitare della generale applicabilità di queste metodiche, fuori dalla circostanza, pressoché ideale, sopra esposta.

Questa critica è mossa da coloro che, volendo introdurre nel processo di inferenza il minor numero possibile di elementi soggettivi, ritengono preferibile non utilizzare in modo formale l'informazione extracampionaria, a meno che questa non sia inoppugnabile.

L'eventuale obiezione circa la possibilità di utilizzare priori non informative, oppure di ricorrere al principio della misura precisa, sembrano assai poco convincenti.  Perché, di fatto, impiegare un approccio inferenziale che vanta fra i maggiori pregi quello di poter considerare l'informazione extracampionaria, quando non se ne dispone, oppure quando si ritiene che sia di scarsa affidabilità?

 

Un altro aspetto da collegare a quanto appena esposto riguarda l'esigenza imprescindibile, a nostro avviso, di assumere un atteggiamento di fondo soggettivista quando si impieghi l'approccio inferenziale Bayesiano, anche nel caso in cui sia possibile costruire una priori suscettibile di interpretazione frequentista.

Questa esigenza è a maggior ragione vera se la priori è interpretata come traduzione probabilistica dell'informazione sui parametri.  Il concetto di informazione, infatti, è tipicamente soggettivo, e come tale è difficile da conciliare con un'ottica strettamente frequentista ed oggettivista, anche qualora tale informazione si presenti con tali connotati.  Dal punto di vista soggettivista, invece, se la priori è data "quasi deterministicamente" non sorgono problemi nell'accettare che un individuo razionale-coerente includa proprio quella come informazione nel modello.  Se invece non si accetta l'interpretazione in chiave informativa della priori, si è costretti ad ammettere l'esistenza di un super-esperimento nel quale viene effettuata l'estrazione di q da una distribuzione con legge p(q), in modo che il valore di q fissato determini la legge probabilistica pq(x) della popolazione attuale.

Il passaggio concettuale è più evidente non appena si consideri la posteriori.  Accettando il punto di vista frequentista il parametro q estratto nel super-esperimento è fissato, ma il risultato inferenziale espresso dalla posteriori tratta il parametro come variabile casuale, non essendo la p(q|x) tutta concentrata sul valore di q.

 

Da un punto di vista decisionale, le eventuali informazioni sulle conseguenze del processo inferenziale non entrano nella procedura di inferenza stessa. A tal riguardo è rilevante osservare come la scelta del livello di confidenza (nelle regioni e nei test) risulti esterna al meccanismo inferenziale Bayesiano, invece che derivare, ad esempio, dalla valutazione delle possibili conseguenze che essa provoca.

 

Si osservi poi che l'unica via per includere l'informazione derivata dal campione, nelle procedure Bayesiane è costituita dall'impiego della funzione di verosimiglianza.  Questo fatto da un punto di vista filosofico non risulta completamente accettabile, specie da un punto di vista frequentista.

 

L'approccio Bayesiano non fornisce un criterio di verifica delle procedure inferenziali, data la mancanza del concetto di spazio dei campioni.  Tutto si basa infatti, una volta scelta la priori, sull'applicazione del Teorema di Bayes per l'ottenimento della posteriori.  Al contrario, i concetti classici di efficienza, consistenza, correttezza, forniscono in modo molto naturale ed intuitivo la struttura concettuale, a priori, necessaria per valutare la bontà dei criteri adottati.

 

Si posso effettuare diversi ordini di considerazioni riguardanti la scelta di statistiche riassuntive della posteriori.

Riguardo la stima puntuale, si osservi che la moda, principale scelta riassuntiva, non è invariante per generiche trasformazioni del parametro, potendo così giungere a conclusioni contrastanti sulla base delle stesse informazioni in virtù, per esempio, della scala di misura adottata. 

L'assunzione talvolta fatta circa l'esistenza di parametrizzazioni naturali, almeno per una certa classe di problemi, non risulta pienamente soddisfacente.

Per quel che riguarda il test delle ipotesi Bayesiano, nel caso in cui una ipotesi sia semplice e l'altra sia composta, le procedure proposte da Lindley e da Jeffreys non sembrano pienamente soddisfacenti da un punto di vista concettuale, suggerendo l'impressione che esse siano mere soluzioni di convenienza matematica.

 

Un ulteriore punto critico è costituito dai criteri impiegati per definire la priori nel caso di ignoranza a priori.  La scelta si basa  prevalentemente su criteri matematico-formali, da cui deriva la sensazione di una forzosa estensione del campo di applicazione Bayesiano ad ambiti non congeniali.  Ed ancora: perché l'ignoranza (come formalizzazione) deve essere diversa in dipendenza dallo spazio parametrico?  Perché, a parità di spazio parametrico, vi sono diverse possibili formalizzazioni dell'ignoranza? 

Si noti che in alcuni problemi multiparametrici si possono orginare paradossi dovuti all'uso di priori improprie.

 

Infine una critica di tipo Bayesiano ad un certo modo di fare inferenza Bayesiana.  Le priori coniugate offrono uno strumento analitico considerevole dal punto di vista della trattabilità matematica e della interpretabilità dei risultati, ma da un punto di vista filosofico ciò significa ben poco.  Lo statistico Bayesiano deve essere libero di formulare la priori sulla base delle informazioni di cui dispone e non secondo regole di convenienza matematica.

 

 

BIBLIOGRAFIA

 

1.      Aitchison J., Dunsmore I.R., 1975, Statistical prediction analysis, Cambridge C.U.P., cap.2.

2.      Barnett V., 1973, Comparative Statistical Inference, Wiley, pp. 325.

3.      Bernardo J.M., Smith A.F.M., 1994, Bayesian Theory, Wiley, pp. 586.

4.      De Groot M.H., 1970, Optimal statistical decisions, McGraw Hill, cap. 9.

5.      Piccinato L., 1992, Critical issues in different inferencial paradigms, Journal of the Italian statistical society, 1:251-274.