APPUNTI DI INFERENZA STATISTICA BAYESIANA
Fabrizio CIPOLLINI e Federico Mattia STEFANINI
Firenze, 1995
INTRODUZIONE
Nello studio di un fenomeno
(un sistema o un processo) che coinvolge aspetti di incertezza ci si propone di
descrivere la realtà oggetto di studio in modo che ogni possibile fonte di
informazione sia contemplata nella sua rappresentazione astratta, detta
modello. Operando in questo modo si
tenta di giungere alla massima conoscenza del fenomeno, conoscenza che può
essere eventualmente sfruttata anche in senso applicato, attraverso la scelta
delle azioni da intraprendere in un determinato contesto.
Benché la necessità di
impiegare strumenti matematici per il raggiungimento dello scopo sia pressoché
universalmente riconosciuta, in virtù dell'imprescindibile esigenza di
formalizzare, il percorso da seguire per giungere al modello matematico non è
univocamente definito. Basti pensare
come i medesimi concetti di incertezza, informazione, probabilità siano temi
attuali di confronto metodologico.
Perché i risultati del
processo di inferenza siano applicativamente rilevanti, è prioritaria
l'esistenza di uno stretto legame tra sistema reale e modello, quale esso
sia. Inoltre non è giustificabile
nessun formalismo matematico, per quanto potenzialmente efficace, qualora non
ne sia esplicitabile il contenuto semantico.
Prima di affrontare i metodi
ed i significati relativi ad una possibile scelta metodologica, detta inferenza
Bayesiana, è necessario richiamare alcuni concetti di base particolarmente
importanti in tale contesto. Seguirà l'esposizione delle principali procedure
Bayesiane.
Probabilità ed
informazione nell'approccio Bayesiano.
Il modello statistico, come
astrazione del fenomeno in studio, consiste nella descrizione degli esiti
sperimentali o di osservazione che sono possibili, in unione al meccanismo
probabilistico che li genera. Pertanto,
un buon modello non si comporta differentemente dalla situazione reale per
quanto riguarda i risultati, indipendentemente dal fatto che ne sia una
"spiegazione vera". E'
necessario, allora, esplicitare quali significati può assumere il termine
probabilità, nel contesto Bayesiano.
Il concetto di probabilità è
imprescindibilmente legato alle inclinazioni specifiche del singolo autore e
del singolo statistico applicato. In
ambito Bayesiano sono di particolare rilievo le impostazioni frequentista
e soggettivista.
Nella concezione soggettivista,
la probabilità esprime il grado di fiducia individuale circa le possibilità di
accadimento di diverse eventualità.
Benché non sia sempre semplice esprimere numericamente tale grado di
fiducia, negli sviluppi di seguito considerati è necessario che lo sia.
Questo fatto costituisce
anche uno stimolo psicologico all'asserzione ottimale circa situazioni che
coinvolgono incertezza, quasi che la richiesta di esprimere la fiducia in
termini numerici sia in grado di "mettere a fuoco" il sistema di
credenze interiori al massimo livello.
Si ottiene pertanto una concezione che dipende strettamente
dall'esperienza (intesa nel senso più ampio) accumulata dall'individuo. Inoltre la presenza di un collegamento tra
utilità ed espressione soggettiva è implicitamente affermato, non potendo in
generale l'individuo slegarsi con facilità dal proprio livello pragmatico. Epistemicamente l'irrazionalità
dell'individuo è ritenuta effetto dell'ignoranza metodologica costitutiva circa
il modo con cui processare l'informazione relativa all'incertezza, ma qualora
opportunamente erudito, l'individuo divenuto allora razionale dovrebbe
attenersi a:
1) ordinare i possibili esiti
su una scala compresa tra l'evento impossibile e quello inevitabile;
2) attenersi alla consistenza
di giudizio in modo da non contraddirsi;
3) attenersi ad un principio
di coerenza, in particolare non accettare scommesse per le quali è sicuro di
perdere.
Quest'ultimo punto si
relaziona alla pratica di numerizzazione delle probabilità, ottenuta mediante
la formulazione di scommesse da parte dell'individuo. L'idea sottostante è che due individui che abbiano avuto le
stesse esperienze precedenti tenderanno a formulare lo stesso tipo di
scommessa, giungendo a valori di probabilità quasi uguali per gli esiti
possibili. Tuttavia la teoria ha
funzione normativa, non impositiva. Le
affermazioni probabilistiche sono di tipo condizionale e riguardano eventi
isolati, dato che non sussiste l'idea di ripetibilità.
Nella concezione frequentista,
l'oggettività della formulazione riveste un ruolo prioritario: i motivi
personali non devono inficiare i valori di probabilità, proprio perché non
oggettivi. La dimostrazione
sperimentale diviene pertanto prioritaria e causa la restrizione dei tipi di
problema affrontabili. In tal senso la
ripetibilità dell'esperimento, od osservazione, in condizioni analoghe deve
essere possibile perché il significato frequentista sia valido. Come tale, l'affermazione probabilistica è
condizionale alla situazione sperimentale di riferimento, benché la
condizionalità non sia formalmente espressa.
Nonostante nel fenomeno in studio sia presente variabilità casuale
riguardante il singolo esito, a lungo termine in prove ripetute, emerge una
regolarità espressa come rapporto tra il numero di esiti di un dato tipo e il
numero di prove totali effettuate. Si accetta come fatto empirico che tale
limite esista, così come empiricamente si accetta l'addittività di eventi
mutuamente esclusivi.
In conclusione, l'evento
dell'approccio frequentista è una delle potenziali osservazioni del collettivo
definito come ripetibile, mentre per l'approccio soggettivista è una
particolare realizzazione esplicitamente caratterizzata, da cui deriva l'idea
di probabilità condizionale.
Scelto l'approccio
probabilistico appropriato per il fenomeno in studio, il modello statistico
Bayesiano può essere formulato, ma l'identificazione del modello, ovvero la
determinazione dei suoi parametri, può essere ottenuta solo in base
all'informazione rilevante disponibile. Quest'ultima può essere suddivisa in
informazione sperimentale e preconoscenza.
Il primo tipo di informazione
risulta a seguito dell'esperimento-osservazione di dati campionari, pertanto
l'informazione sperimentale è oggettiva essendo basata sulla misura di
variabili di interesse. Nell'approccio
Bayesiano non è richiesto che esista un collettivo di riferimento in base al
quale ripetere l'esperimento in condizioni analoghe.
La preconoscenza consiste
nella disponibilità di informazione a priori rispetto ai dati osservati nel
campione. Questa disponibilità dipende
dalle esperienze precedenti, o più in generale dalla presenza di cognizioni
tecnico-scientifiche pertinenti. Quando
l'informazione disponibile a priori è "sfumata", allora si richiede
il completamento dell'informazione stessa, principalmente su base soggettiva ma
legata spesso a motivazioni matematico-formali, perché l'informazione sia
utilizzabile formalmente. Un caso
tipico di preconoscenza è costituito da considerazioni chimico-fisiche esterne
al sistema in studio ma rilevanti per esso.
L'eventuale informazione
disponibile riguardo le conseguenze relative alle azioni intraprese in base ai
risultati delle procedure inferenziali non vengono incluse nell'approccio
Bayesiano puro.
L'INFERENZA BAYESIANA
Procedure di inferenza
Bayesiana.
Nell'inferenza Bayesiana i
due tipi di informazione menzionati, a priori e campionaria, sono quantificate
attraverso due distribuzioni (di densità) di probabilità, dette rispettivamente
priori e verosimiglianza.
Si noti che i parametri del modello, in quanto dotati di distribuzione,
sono considerati variabili casuali.
Nelle procedure Bayesiane
l'informazione espressa dalla priori è modificata dall'informazione contenuta
nel campione osservato impiegando il teorema di Bayes. L'inferenza prende la forma di distribuzione
del parametro condizionata ai dati osservati, detta posteriori del
parametro. Le affermazioni
probabilistiche sono quindi condizionali.
Il ruolo del teorema di Bayes
è fondamentale, poiché tutta l'inferenza Bayesiana si fonda su di esso: date
una partizione finita di eventi {Hi} di W, ed un generico evento A, note le probabilità di tipo
P[Hi] ed P[A |Hi], segue la probabilità condizionale (od inversa):

Nella trattazione successiva
si adotta la simbologia seguente: x sono i dati del campione, X la variabile
casuale rispettiva definita sullo spazio campionario X , pq(x) è la distribuzione di X che appartiene alla
famiglia P={pq(x); q Î W} indiciata dal parametro
(uni-multidimensionale) q appartenente a W spazio dei
parametri, p(q) la priori
del parametro. Quando x sia fissato, pq(x) rappresenta la
funzione di verosimiglianza, una funzione che quantifica come cambia la probabilità
(densità) del realizzarsi di x al variare di q.
La priori rappresenta la
traduzione "matematica" dell'informazione extra-campionaria rilevante
e disponibile. Quest'ultima può
consistere di informazioni tecniche, di opinioni, del feed-back del processo,
ed a volte include un super-esperimento di riferimento. Non esclude necessariamente l'adozione
dell'approccio frequentista, pur essendo naturale una spiegazione di tipo
soggettivista. Qualora siano disponibili
i risultati di esperimenti precedenti si usano i metodi Bayesiani empirici (si
veda di seguito) per la costruzione della priori.
Dopo aver definito la priori
ed avendo il campione disponibile si può ottenere la distribuzione a
posteriori, la quale aggiorna l'informazione sul parametro contenuta nella
priori attraverso l'informazione distributiva contenuta nel campione:

Si noti che questa
espressione è in generale indipendente dallo schema di campionamento, dato che
tutte le informazioni campionare sono contenute nella verosimiglianza, che come
tale assurge a concetto centrale nell'inferenza Bayesiana.
La posteriori fornisce una
espressione completa dell'inferenza sul parametro. Tuttavia spesso non è richiesta l'intera informazione
distributiva, ma una o più misure riassuntive.
Stima puntuale
Bayesiana.
Nella stima puntuale
Bayesiana, un valore puntuale della distribuzione a posteriori del parametro è
scelto quale stima dell'incognita q. E' pratica frequente scegliere la moda della
posteriori p(q|x) come stima puntuale del parametro
incognito, dato che può essere interpretata come il più probabile (credibile) valore
di q nella situazione corrente. Qualora siano disponibili (ed utilizzate) ulteriori
informazioni riguardanti le conseguenze
di una scelta errata di q, può essere conveniente impiegare la media della
distribuzione a posteriori.
Regioni di confidenza
Bayesiane.
In questa procedura si
desidera ottenere una informazione riassuntiva circa p(q|x) costituita da una regione Sa(x)
contenuta in W, con la proprietà probabilistica:
![]()
con (1-a) livello di confidenza Bayesiano della regione di confidenza
Bayesiana. Si noti la generalità della
definizione, la quale peraltro lascia ampia libertà riguardo l'individuazione
concreta della regione, ad esempio tramite tail-area se la distribuzione
è simmetrica. In generale servono ulteriori specifiche per restringere la
classe delle possibili scelte.
Un criterio ragionevole,
fondato sul significato probabilistico della distribuzione a posteriori,
prevede che nella regione non ci siano punti con probabilità inferiore a quella
relativa ai punti non inclusi in essa.
Test delle ipotesi
Bayesiano.
In virtù della diretta
interpretabilità della distribuzione a posteriori, il test delle ipotesi in
ambito Bayesiano ha forma semplice.
Ovvero, fissata l'ipotesi nulla H: q Î w Ì W in alternativa all'ipotesi H': q Î W - w, si valuta la probabilità
![]()
e si rifiuta l'ipotesi nulla
se tale valore di probabilità risulta piccolo, ovvero più piccolo del fissato
livello critico a. A seguito di
questa definizione, il test risulta simmetrico poiché non predilige nessuna
delle due ipotesi formulate.
Nel caso in cui l'ipotesi
nulla sia semplice e l'ipotesi alternativa sia composta, o viceversa, si
pongono alcuni problemi interpretativi.
Supponiamo che il parametro
abbia natura continua (è il caso comune) e che si voglia sottoporre a verifica
H: q = q0 in alternativa a H': q ¹ q0. In tal caso
accade che, a meno di ipotesi particolari sulla priori, la posteriori non
concentra massa distributiva in punti singoli del proprio dominio, quindi P[H
|x]=0 contro P[H' | x]=1-P[H |x]=1.
Chiaramente tale problema non
si pone se entrambi le ipotesi sono complesse e di stessa dimensionalità, e non
sussiste neppure se si confrontano ipotesi H ed H' entrambi semplici poichè in
questo caso il test può basarsi sul confronto delle due densità p(q0|x) e p(q1|x) in
forma di odds.
Sono state formulate due
possibili soluzioni:
1) Lindley propone di
ottenere la regione di confidenza Bayesiana del parametro al 100(1 - a)%, accettando l'ipotesi nulla se nella regione è
compreso il valore q0,
altrimenti rifiutando H.
2) Jeffreys osserva come in
alcune circostanze un valore q0 rivesta particolare importanza applicativa, ad
esempio come valore del controllo in un esperimento, rispetto ai rimanenti
possibili valori q Î W - q0. In tal caso
la priori viene scomposta in due parti: una probabilità discreta P[q0] su q0 e una
densità a priori continua p(q) per q ¹ q0. Attraverso i dati campionari x si calcolano
le posteriori P[q0 | x] e
p(q |x) per q ¹ q0. L'ipotesi nulla H è accettata o rifiutata in
base al valore degli odds in proprio favore:

Previsioni Bayesiane.
In molti casi di interesse sperimentale,
l'attenzione è volta a prevedere la distribuzione di probabilità di dati futuri
sulla base delle conoscenze campionarie x e delle loro implicazioni
inferenziali su q (Aitchison and Dunsmore, 1975). Indicati i dati futuri come y, la predizione
ha forma di probabilità condizionale P[y | x]:

la quale fornisce
un'espressione inferenziale completa riguardo y. Quando desiderato si può procedere poi a misure riassuntive di
informazione, in modi analoghi a quanto esposto in precedenza riguardo la
posteriori del parametro.
FORMULAZIONE DELLA PRIORI
Vi sono due difficoltà
relative all'approccio Bayesiano in confronto a quello classico. La prima relativa alla natura della
probabilità a priori, la seconda riguardante la specificazione numerica della stessa.
Riguardo al primo aspetto, si rimanda alla parte conclusiva sulle critiche
all'approccio Bayesiano. Per ciò che
concerne il secondo aspetto, distinguiamo tre casi principali: ignoranza a
priori, conoscenza a priori vaga, conoscenza a priori sostanziale.
Si rammenta che i concetti
seguenti sono da riferirsi strettamente all'importanza relativa dei due
tipi di informazione considerati: a priori e campionaria.
Ignoranza a priori.
In questo caso non si dispone
di nessuna informazione a priori tangibile (oggettiva o soggettiva), e
tuttavia, dato che l'approccio Bayesiano richiede una priori, l'ignoranza su q deve essere espressa mediante formulazione quantitativa. Le priori formate in condizioni di ignoranza
totale sono dette non informative.
A questo proposito, Jeffreys
propone di utilizzare il principio di ragione insufficiente, il quale
prevede che, entro un insieme discreto di alternative in condizioni di
ignoranza, non c'è ragione di assegnare a qualcuna di queste una probabilità
diversa.
Tuttavia, alcune
problematiche sorgono quando si vuole estendere questo principio al caso
continuo. Ad esempio, si possono
ottenere distribuzioni improprie, per le quali cioè esiste almeno un
intervallo (a,b) tale che P[a < q < b] > 1.
Per evitare anomalie dovute
alla natura impropria delle distribuzioni e per soddisfare certe condizioni di
invarianza, più autori hanno proposto di assegnare priori non informative di
natura diversa a seconda dello spazio parametrico:
1) se W =(-¥,¥) allora p(q) µ 1 (priori uniforme); Jeffreys
supporta la scelta sostenendo che se siamo ignoranti per q lo siamo anche per ogni sua funzione lineare;
2) se W =(0,¥) allora p(q) µ 1/q; la scelta è motivata da
Jeffreys notando che f=log(q) Î (-¥,¥) e trattando f come nel caso (1);
3) se W =(0,1) allora p(q) può essere scelto in
differenti modi secondo le proposte di diversi autori: p(q) = I(0,1)(q) (Bayes); p(q) µ q-1 (1-q)-1 (Haldane) che risulta ottimale riguardo le proprietà
di invarianza; p(q) µ q-1/2 (1-q)-1/2 (Jeffreys) che rispetto alla precedente ha meno peso
negli estremi; p(q) µ Is(q)1/2 (Jeffreys) proposta opinabile dal punto di vista
Bayesiano in quanto effettua una media sullo spazio campionario X; infine,
Jeffreys sostiene che in molti problemi è più naturale assegnare probabilità
discrete a specifici q e uniforme altrove (si veda la proposta dello stesso
Jeffreys riguardo al test delle ipotesi).
Conoscenza a priori
vaga.
E' il caso che si verifica
quando è irragionevole, per la quantità di informazione posseduta, costruire una
priori non informativa e, tuttavia, l'informazione contenuta nei dati
campionari "sovrasta" l'informazione a priori; ovvero, similmente al
caso delle priori non informative, la posteriori è essenzialmente la
verosimiglianza normalizzata. Questa
eventualità possiede un'utilità pratica: il conflitto sul modo di esprimere la
priori per un particolare fenomeno diviene scarsamente rilevante, dato che
l'informazione a priori sarà sottopesata dai dati campionari se questi sono
sufficientemente numerosi (principio della misura precisa).
Conoscenza a priori
sostanziale e problematiche collegate.
Si ha quando l'informazione a
priori è abbastanza forte da far sì che la posteriori sia piuttosto diversa
dalla verosimiglianza.
In tale circostanza si pone
il problema della scelta o della stima della priori data la pesante rilevanza
della stessa sull'inferenza. Una
risposta parziale a questo problema è fornita dai metodi di Bayes empirici
oppure dall'uso delle meta-priori.
Nel primo caso,
l'informazione consiste in un campione di dati limitato tratto da una
situazione ritenuta simile a quella corrente, ma di dimensione insufficiente
per costruire una distribuzione di frequenza di stime accurate dei precedenti
valori di q. La metodologia
è applicabile quando non c'è difficoltà concettuale a postulare l'esistenza di
una priori suscettibile di interpretazione frequentista, e si sostanzia
nell'uso di metodi classici per trovare una stima della priori basata su un
campione di dati anch'esso a priori.
Nel secondo caso, si dispone
di un campione dei precedenti valori veri di q in situazioni
ritenute simili all'attuale. La
procedura può essere scomposta in due fasi.
Nella prima si impiegano metodi Bayesiani per ricavare una posteriori
per il parametro condizionata al campione dei q. Nella seconda fase, si usa il risultato
precedente quale priori per risolvere il problema inferenziale di interesse
prioritario.
Un altra problematica
rilevante è costituita dalla possibilità di impiegare priori con proprietà
matematiche buone, quali le coniugate.
Il loro impiego consente di risolvere, almeno in certi casi, due
questioni urgenti, quali la derivazione matematica della posteriori e la
discriminazione entro la posteriori tra il contributo informativo portato dai
dati campionari e quello offerto dalla priori.
Una priori p(q) appartenente alla famiglia di distribuzioni Q={pa(q); a Î A} è detta
coniugata se la posteriori p(q|x) appartiene ancora alla
famiglia Q. In tal caso se a0
rappresenta l'informazione a priori su q, il campione x lo
trasforma in un nuovo
a1 che sintetizza l'informazione a posteriori su q. In questo contesto, allora,
il processo di inferenza Bayesiano è funzione di A in se stesso.
I vantaggi principali di
questa scelta sono: (1) la possibilità di interpretare a in termini di proprietà dei dati campionari, illustrata dalla
scomposizione di a1 in a1=a0+ (a1-a0), dove a0 è il
contributo della priori ed a1-a0 è la variazione indotta dall'informazione campionaria;
(2) l'ottenimento di una maggiore semplicità computazionale, dovuta al fatto
che priori e posteriori hanno la stessa forma funzionale a meno del parametro a.
Le coniugate, tuttavia,
esistono in pochi casi benché assai rilevanti applicativamente. E' infatti necessario che: (a) esista una
statistica singolarmente sufficiente per q, (b) la priori
appartenga alla stessa famiglia di distribuzioni a cui appartiene la
distribuzione campionaria della statistica sufficiente; (c) a possa essere espresso in termini di valore della statistica
sufficiente e della dimensione campionaria.
Si noti l'importanza del concetto di sufficienza anche in contesto
Bayesiano.
Priori coniugate possono
essere derivate per distribuzioni campionarie appartenenti alla famiglia
esponenziale, benchè possano esistere coniugate anche per altre distribuzioni
(ad esempio per l'uniforme in (0,q)) (sull'argomento
si veda DeGroot, 1970).
ARGOMENTAZIONI A FAVORE
DELL'APPROCCIO BAYESIANO
L'approccio Bayesiano, relativamente
a quello classico, consente di fare inferenza direttamente sul
parametro, con notevoli vantaggi anche dal punto di vista interpretativo. Si noti, infatti, che la posteriori p(q|x), espressione completa dell'inferenza su q, probabilizza direttamente il parametro. Da ciò consegue che anche le misure inferenziali sintetiche
derivate beneficiano dell'immediatezza interpretativa citata. Le regioni di confidenza definiscono la
probabilità che q appartenga ad un certo sottoinsieme dello spazio W, mentre nell'approccio classico occorre riferirsi a regioni casuali
che contengono il valore vero di q.
Ancora, nel test delle
ipotesi, l'approccio Bayesiano consente di assegnare probabilità direttamente
alle ipotesi formulate, mentre nell'approccio classico si può solo effettuare
una valutazione di conformità del campione osservato rispetto all'ipotesi di
lavoro. Ne consegue che l'asimmetria
costitutiva del test delle ipotesi classico svanisce a favore di una struttura
inferenziale che non richiede di privilegiare nessuna delle due ipotesi
formulate.
Questo fatto rende il test
delle ipotesi Bayesiano particolarmente interessante nei casi in cui lo stato
di preconoscenza non sia sufficiente per motivare un atteggiamento conservativo
nei riguardi della ipotesi nulla, come avviene nell'approccio frequentista.
Strettamente legato a quanto
appena esposto è il seguente aspetto: tutte le inferenze Bayesiane sono
condizionate al campione x. Ne consegue
la disponibilità di una misura interna di accuratezza che è legata solo alla
corrente situazione campionaria.
Differentemente dall'approccio classico, in cui la misura di precisione
delle inferenze può essere solo iniziale (prima dell'osservazione campionaria),
l'approccio Bayesiano consente di valutare la precisione finale (dopo
l'osservazione del campione). Essa è
importante perchè quantifica l'accuratezza della stima effettuata in relazione
al campione effettivamente disponibile.
L'approccio Bayesiano al test
d'ipotesi può essere criticato nei casi di tipo H: q = q0 in
alternativa all'ipotesi H': q ¹ q0, poichè il parametro è ritenuto usualmente una
variabile casuale continua. Un
approccio minimale è offerto dagli autori Lindley e Jeffreys. V'è, tuttavia, anche da considerare che la
risoluzione degli strumenti di misura è finita, e ciò causa la partizione in
classi di equivalenza di X, ognuna grande quanto la risoluzione d dello strumento impiegato. Ne
deriva una trasformazione dell'ipotesi di lavoro H: q Î(q0-0.5 d , q0 + 0.5 d) = w, dove d è la risoluzione
menzionata.
L'approccio classico e quello
Bayesiano si incentrano su due principi totalmente diversi. Quello classico è
costituito dal principio di campionamento ripetuto, per il quale è
prioritario il disegno campionario. Di contro, quello Bayesiano, include il principio
di verosimiglianza, dove la densità congiunta del campione riveste ruolo
fondamentale. A favore della scelta
operata dai Bayesiani, si rammenti che la verosimiglianza risulta
necessariamente "fedele" a quanto osservato, principio non garantibile
dai classici, per i quali è prioritario il modello di campionamento rispetto a
quanto effettivamente avvenuto (cfr. Piccinato, 1992).
Anche la modellizzazione dei
fenomeni temporali risulta in principio differente, essendo l'inferenza condizionale in ambito Bayesiano
del tutto naturale. Infatti è
ineccepibile considerare la quantità P[y|x], con x le osservazioni passate ed y
quelle future. Viceversa in ambito classicista
non c'è la possibilità diretta di legare il passato al futuro, se non indirettamente
attraverso la stima di
q che si considera valida per il tempo
futuro in cui si registrerà y.
Il confronto dell'efficacia
di disegni sperimentali in ambito di modelli non lineari può beneficiare della
metodica Bayesiana. Essa elimina la
dipendenza dal parametro mediante integrazione, mentre tale eliminazione non è
sempre possibile nelle espressioni relative all'approccio classico. Pertanto la bontà relativa di due disegni
può dipendere dal valore incognito del parametro da stimare, essendo così possibile
ottenere una valutazione assoluta di preferenza tra i due disegni confrontati.
E' rimarchevole la
possibilità di scegliere opportunamente la priori e il criterio di ottenimento
dell'intervallo Bayesiano in modo che le espressioni di stima per intervallo
secondo l'approccio frequentista e quelle ottenibili in termini Bayesiani siano
uguali. Benché questo fatto non costituisca un'argomentazione di validazione
incrociata dei due approcci, illustra un punto di contatto formale tra le due
scuole di pensiero.
Qualora l'informazione a
priori non sia disponibile, l'approccio Bayesiano è ancora impiegabile e può
essere motivato in virtù della centralità della nozione di coerenza. Esso cerca
di formalizzare precisamente ciò che è richiesto all'individuo razionale perché
reagisca ragionevolmente e consistentemente a prospettive differenti,
realizzabili in situazioni di incertezza.
In tal caso si formalizza l'ignoranza a priori (prior ignorance).
Nelle procedure di inferenza
Bayesiana opera il principio della misura precisa. In molte circostanze
i dati sperimentali sono così importanti in termini di contributo informativo,
che la scelta della priori diventa largamente irrilevante. La concentrazione
della verosimiglianza su W, infatti, fornisce una posteriori che è proporzionale
alla verosimiglianza. La disponibilità
di campioni di dimensione elevata consente una inferenza robusta rispetto alla
scelta della priori (stable estimation).
Un motivo di ulteriore
interesse applicativo dei metodi Bayesiani è offerto dai recenti progressi
nelle tecniche di integrazione numerica (calcolo numerico), i quali consentono
una più libera scelta della priori rispetto l'uso delle famiglie coniugate, e
permettono lo studio di realtà sperimentali più complesse.
All'obiezione della
sensibilità della metodologia inferenziale Bayesiana riguardo la scelta della
priori in casi di preconoscenza debole, la metodologia Bayesiana risponde
studiando nei casi specifici la sensitività delle conclusioni al variare della priori
entro una certa classe.
LE CRITICHE ALL'APPROCCIO
BAYESIANO
Supponiamo che l'informazione
a priori sia tanto rilevante da poter specificare senza dubbio alcuno la reale
forma della priori. In tale caso, a nostro
avviso poche obiezioni possono essere sollevate sulla liceità dell'uso della
strumentazione inferenziale Bayesiana: essa offre un modo efficace ed
inopinabile dal punto di vista analitico per sfruttare tutta l'informazione
disponibile. Tuttavia, se tale informazione a priori non è così
incontrovertibile, allora è lecito domandarsi se l'ammontare di
"rumore" introdotto dalla scelta di una priori sia compensato dal
guadagno informativo per aver usato tutta l'informazione teoricamente a disposizione. Ciò conduce a dubitare della generale
applicabilità di queste metodiche, fuori dalla circostanza, pressoché ideale,
sopra esposta.
Questa critica è mossa da
coloro che, volendo introdurre nel processo di inferenza il minor numero
possibile di elementi soggettivi, ritengono preferibile non utilizzare in modo
formale l'informazione extracampionaria, a meno che questa non sia
inoppugnabile.
L'eventuale obiezione circa
la possibilità di utilizzare priori non informative, oppure di ricorrere al
principio della misura precisa, sembrano assai poco convincenti. Perché, di fatto, impiegare un approccio
inferenziale che vanta fra i maggiori pregi quello di poter considerare
l'informazione extracampionaria, quando non se ne dispone, oppure quando si
ritiene che sia di scarsa affidabilità?
Un altro aspetto da collegare
a quanto appena esposto riguarda l'esigenza imprescindibile, a nostro avviso,
di assumere un atteggiamento di fondo soggettivista quando si impieghi
l'approccio inferenziale Bayesiano, anche nel caso in cui sia possibile
costruire una priori suscettibile di interpretazione frequentista.
Questa esigenza è a maggior
ragione vera se la priori è interpretata come traduzione probabilistica
dell'informazione sui parametri. Il
concetto di informazione, infatti, è tipicamente soggettivo, e come tale è
difficile da conciliare con un'ottica strettamente frequentista ed
oggettivista, anche qualora tale informazione si presenti con tali
connotati. Dal punto di vista soggettivista,
invece, se la priori è data "quasi deterministicamente" non sorgono
problemi nell'accettare che un individuo razionale-coerente includa proprio
quella come informazione nel modello.
Se invece non si accetta l'interpretazione in chiave informativa della
priori, si è costretti ad ammettere l'esistenza di un super-esperimento
nel quale viene effettuata l'estrazione di q da una
distribuzione con legge
p(q), in modo che il valore di q fissato determini la legge probabilistica pq(x)
della popolazione attuale.
Il passaggio concettuale è
più evidente non appena si consideri la posteriori. Accettando il punto di vista frequentista il parametro q estratto nel super-esperimento è fissato, ma il risultato inferenziale
espresso dalla posteriori
tratta il parametro come variabile
casuale, non essendo la p(q|x) tutta concentrata sul valore di q.
Da un punto di vista
decisionale, le eventuali informazioni sulle conseguenze del processo
inferenziale non entrano nella procedura di inferenza stessa. A tal riguardo è
rilevante osservare come la scelta del livello di confidenza (nelle regioni e
nei test) risulti esterna al meccanismo inferenziale Bayesiano, invece che
derivare, ad esempio, dalla valutazione delle possibili conseguenze che essa
provoca.
Si osservi poi che l'unica
via per includere l'informazione derivata dal campione, nelle procedure
Bayesiane è costituita dall'impiego della funzione di verosimiglianza. Questo fatto da un punto di vista filosofico
non risulta completamente accettabile, specie da un punto di vista
frequentista.
L'approccio Bayesiano non
fornisce un criterio di verifica delle procedure inferenziali, data la mancanza
del concetto di spazio dei campioni.
Tutto si basa infatti, una volta scelta la priori, sull'applicazione del
Teorema di Bayes per l'ottenimento della posteriori. Al contrario, i concetti classici di efficienza, consistenza,
correttezza, forniscono in modo molto naturale ed intuitivo la struttura
concettuale, a priori, necessaria per valutare la bontà dei criteri adottati.
Si posso effettuare diversi
ordini di considerazioni riguardanti la scelta di statistiche riassuntive della
posteriori.
Riguardo la stima puntuale,
si osservi che la moda, principale scelta riassuntiva, non è invariante per
generiche trasformazioni del parametro, potendo così giungere a conclusioni
contrastanti sulla base delle stesse informazioni in virtù, per esempio, della
scala di misura adottata.
L'assunzione talvolta fatta
circa l'esistenza di parametrizzazioni naturali, almeno per una certa classe di
problemi, non risulta pienamente soddisfacente.
Per quel che riguarda il test
delle ipotesi Bayesiano, nel caso in cui una ipotesi sia semplice e l'altra sia
composta, le procedure proposte da Lindley e da Jeffreys non sembrano
pienamente soddisfacenti da un punto di vista concettuale, suggerendo
l'impressione che esse siano mere soluzioni di convenienza matematica.
Un ulteriore punto critico è
costituito dai criteri impiegati per definire la priori nel caso di ignoranza a
priori. La scelta si basa prevalentemente su criteri matematico-formali,
da cui deriva la sensazione di una forzosa estensione del campo di applicazione
Bayesiano ad ambiti non congeniali. Ed
ancora: perché l'ignoranza (come formalizzazione) deve essere diversa in
dipendenza dallo spazio parametrico?
Perché, a parità di spazio parametrico, vi sono diverse possibili
formalizzazioni dell'ignoranza?
Si noti che in alcuni
problemi multiparametrici si possono orginare paradossi dovuti all'uso di
priori improprie.
Infine una critica di tipo
Bayesiano ad un certo modo di fare inferenza Bayesiana. Le priori coniugate offrono uno strumento
analitico considerevole dal punto di vista della trattabilità matematica e
della interpretabilità dei risultati, ma da un punto di vista filosofico ciò
significa ben poco. Lo statistico Bayesiano
deve essere libero di formulare la priori sulla base delle informazioni di cui
dispone e non secondo regole di convenienza matematica.
BIBLIOGRAFIA
1. Aitchison J., Dunsmore I.R., 1975, Statistical
prediction analysis, Cambridge C.U.P., cap.2.
2. Barnett V., 1973, Comparative Statistical Inference,
Wiley, pp. 325.
3.
Bernardo J.M., Smith A.F.M., 1994, Bayesian Theory, Wiley, pp. 586.
4.
De Groot M.H., 1970, Optimal statistical decisions, McGraw Hill, cap. 9.
5.
Piccinato L., 1992, Critical issues in different inferencial paradigms,
Journal of the Italian statistical society, 1:251-274.