147 33 5MB
Italian Pages 308 Year 1991
Quando riflette sulla capacità di pensiero delle macchine, la maggior parte delle persone nega che le macchine possano essere creative. Perché? Qual è il magico potere che le persone posseggono e che le macchine sono incapaci di possedere? La progettazione di sistemi intelligenti, dunque, rimanda alla più generale questione della cono scenza dei modi di pensare propri dell'essere umano. Nonostante ciò, questo libro non è affatto un trattato filosofico, ma piuttosto un esercizio di intelligenza artificiale e di scienze cognitive; è un tentativo di esplorazione di uno fra i più complessi problemi della mente umana: la capacità di pensare, comprendere ed essere creativi.
Roger C. Schank è stato professore di Computer Science e di Psicologia presso l'Università di Yale, dove ha diretto il progetto di Intelligenza Artificiale. Attualmente è Direttore dell'lnstitute for Learning Sciences presso la Northwest University of Chicago.
Università
Questo libro riguardd le persone, ma non esclusivamente; riguarda la simulazione de gli esseri umani mentre compiono quello che essi considerano il loro atto più specificamen te umano: essere creativi. In questo senso, è anche un libro sulle macchine e sulla capaci tà delle macchine. La premessa dell'autore è che ". . . i compiti mentali più semplici e quelli più complessi sono interrelati. Anche la comprensione della frase più semplice è un atto creativo, ma se la si considera un processo elementare La moglie di Vance ha mai incon trato la signora Begin ?
Sì , l'occasi one p i ù recente è stata una cena ufficiale i n Israele nel gennaio del 1 980.
La questione è: in che modo CYRUS ha potuto rispondere a questa domanda? Infatti, CYRUS non aveva assolutamente in memoria l 'informazione contenuta nella risposta. Tuttavia è riuscito a rispondere alla domanda, trasformandola in una serie di domande, in questo modo: D 1 : Sua moglie ha m a i i ncontrato Begi n ? D 2 : Dove s i sa reb bero inco ntrati? D 3: I n quali ci rcosta nze si i ncontra no le m og l i dei d i p lomatici? D 4: I n q u a l i ci rcosta nze si i ncontra no i d i p lomatici ? R 4 : D u ra nte l e visite d i stato.
(Alle conferenze i nternaziona l i . ) R 3 : Quando accom pagnano i ma riti i n q uelle visite.
Modelli di spiegazione
208 D 3 a : Quando Va nce a ndò i n Israele? D 3b: Qua ndo Begin a ndò neg l i U SA? R 3a/R 3b:
S i possono ritrova re va rie date i n memoria .
D 3c: Le mog l i l i h a n no accom pagnati i n q u a lche viaggio? R 3c: Si trova u n viaggio nel q u a le questo è successo. D 2 a : I n quale parte del viaggio le mog l i si sono i n contrate? R 2a: D u ra nte u n a cena ufficiale. Dom a n da fi nale riela borata: C'è stata una cena ufficiale il 24 maggio del 1 9 77 durante la visita di Vance e sua moglie in Israele? Risposta ( R 1 ) : Probabilmente il 24 maggio 1 977, a Gerusalemme ad una cena ufficiale in cui erano entrambe presenti.
Il fatto importante è che il processo di trasformazione della domanda è un modo per ottenere, da una domanda a cui non è possibile rispondere, una domanda a cui invece è possibile rispondere. Non è possibile rispondere alla domanda originale perché essa non dà alcun aiuto su dove cercare in memoria i fatti pertinenti. Attraverso una serie di trasformazioni, si modifica la domanda originale in una domanda che riguarda le date delle visite diplomatiche e delle cene ufficiali; il programma sa che sono state usate come categorie in cui archiviare le informazioni. CYRUS sembra intelligente perché può rispondere a domande. Potrebbe sembrare una cosa ovvia, una cosa che la maggior parte dei progra�mi di comprensione potrebbe fare. In effetti è abbastanza facile fare in modo che un programma ritrovi dei fatti in una base di dati e quindi risponda a domande. In realtà, se si può attribuire una qualche intelligenza a CYRUS è perché può porre domande. Come abbiamo visto nel capitolo 6, porre le domande giuste può condurre a risultati importanti. Porre domande è al cuore dell'intelligenza .
IPP rivisitato Come confrontare CYRUS e IPP? In un certo senso, CYRUS è un programma molto più interessante perché conosce meglio quello che sa e può fare domande su ciò che non sa. Il problema di IPP (o peraltro di qualunque programma di comprensione esistente) è che non pone domande in qualsiasi senso profondo del termine. Neanche CYRUS fa molto, ma è capace di porre domande a cui è
Capitolo 7: Comprensione guidata da domande
209
possibile rispondere in sostituzione di domande a cui non è possibile rispondere. Sembra quindi che voglia sapere più cose di quanto faccia IPP. Il problema principale di IPP è che non si è mai sorpreso del fatto che il terrorista iracheno fosse stato ucciso dopo che la polizia francese lo aveva catturato. IPP era capace di produrre una frase che esprimeva la sua "sorpresa", dicendo essenzialmente che non aveva alcuna aspettativa o struttura di cono scenza disponibile per interpretare questa parte dell'evento. Quindi si era verificata una violazione di aspettative. Si ha insuccesso di un'aspettativa quando quello che ci aspettavamo non si verifica o quando succede qualche cosa che non ci aspettavamo. In entrambi i casi, si può alterare il MOP del terrorismo (le strutture di memoria e di imma gazzinamento u sate sia per IPP che per CYRUS sono chiamate MOP) con un simbolo che indica che un terrorista è stato ucciso dai suoi connazionali; in questo modo in futuro, di fronte a un'esperienza simile il programma potrebbe rievocare il primo fatto, permettendogli di conseguenza di modificare il proprio MOP del terrorismo. Essenzialmente, IPP era capace di caratterizzare una circostanza strana in modo da poterla ritrovare in presenza di circostanze simili. Questo è il problema dell'indicizzazione e il traguardo significativo raggiunto con IPP. Di recente ho letto la stessa storia del terrorista di lingua araba a qualcuno che si è ricordato di come gli israeliani cerchino di sparare ai terroristi palestinesi in . situazioni simili nell'ipotesi che, se venissero catturati, per esempio dai fran cesi, i francesi sarebbero troppo teneri con loro (sempre dal punto di vista degli israeliani). Se ci venisse in mente questo fatto potremmo anche stabilire che nel nostro caso non è molto pertinente. Comunque il problema è che, in assenza del tipo di rievocazione citata prima, un lettore non ha una sensazione di insoddisfazione su questa storia. Leggen dola, io ne sono rimasto affascinato; volevo sapere perché avessero sparato al terrorista. Certo sono rimasto sorpreso per la conclusione della notizia, ma questa non è veramente la cosa più interessante. Dopo averla letta mi sono ritrovato a riflettervi e a chiedermi perché si fossero comportati in quel modo. Allora ho cominciato a elaborare delle ipotesi: Forse i francesi i nten devano ri lasciare l ' i racheno. (In q uesto caso opera la rievocazione dei palesti nesi). Forse g l i i racheni temeva no che q uel l ' i nd ivi duo rivelasse qua lcosa che avrebbe potuto dan neggiarl i .
210
Modelli di spiegazione
Forse temevan o che qualche gruppo dissidente lo avrebbe usato come " cause célèbre" .
Qualunque sia la risposta vera, c'è ragione di credere che i servizi iracheni abbiano qualche motivo recondito. Insomma, per questa storia è necessaria qualche spiegazione. Quando in una storia notiamo qualcosa che non potevamo aver previsto, possiamo di certo ipotizzare che l 'evento considerato abbia qualche giusti ficazione o qualche scopo. Non ci limitiamo a ipotizzare che l'insuccesso delle aspettative sia un fatto casuale di cui non preoccuparsi ulteriormente. Facciamo l ' ipotesi, in particolare se il fatto inaspettato implica un piano condotto da altre persone, che ci siano motivi e intenzioni e ci chiediamo quali potrebbero essere. La comprensione. per buona parte. consiste nella nostra capacità di capire un fatto inatteso elaborando un 'ipotesi che renda conto dei motivi e delle modalità dell'accaduto. Con ciò ci si allontana molto da IPP. IPP cercava di render conto degli avvenimenti trovando fatti precedenti simili a quello corrente e confrontandoli. Naturalmente, questo è un metodo utilissimo, e forma la base della memoria dinamica come veniva proposta in Schank ( 1 982). L 'idea è semplicemente qu�sta: il fatto che un'esperienza ce ne faccia venire in mente un'altra ci permette di confrontare le due esperienze, di vedere i punti in comune e di creare aspettative migliori per il futuro. Noi comunque siamo capaci di creare spiegazioni senza avere un preceden te. Possiamo fornire una spiegazione senza una rievocazione iniziale. Come abbiamo già osservato, il ricordo spesso serve da verifica di una spiegazione. Sembra evidente che possiamo fornire spiegazioni proprio guardando ai fatti, utilizzando qualsiasi principio pertinente per quel processo. Un programma che pretenda di capire deve avere, in un certo senso, una salutare curiosità. Deve aver voglia di conoscere. Nel nostro esempio, deve preoccuparsi dei motivi delle persone e dei piani particolari adottati da terroristi, polizia, governi e così via. Deve preoccuparsi di queste cose in qualche senso non artificiale. Ciò di cui stiamo parlando sono le azioni giustificative dei personaggi di cui veniamo a sapere, dopo esserci fatta un 'ipotesi delle loro motivazioni. Avere un senso di comprensione del perché un personaggio in un certo ruolo faccia una certa cosa è un fatto essenziale per la comprensione. In IPP questo senso dei piani relativi ai personaggi che conosceva era piuttosto superficiale, tanto che quando un personaggio agiva in modo diverso dalla norma non era in grado di
Capitolo 7: Comprensione guidata da domande
21 1
porre domande in proposito. Un programma di comprensione dovrebbe avere una serie di domande sempre pronte ali ' uso. Per esempio: Perché questo personaggio si comporta così? Quali sono le sue motivazioni? Quali sono i suoi piani? Qual è la sua in tenzione?
IPP avrebbe dovuto voler sapere perché il terrorista iracheno fosse stato ucciso e, nel chiederselo, avrebbe dovuto cominciare a riflettere, per azzardare qualche ipotesi. Ora, non dovrebbe porsi domande su ogni azione che si presenta nella storia. Non dovrebbe chiedersi perché il terrorista fosse armato, visto che dovrebbe essersi già spiegato cose simili, dopo aver incontrato la prima storia sul terrorismo. In sostanza, ciò che abbiamo detto finora è che quando affermiamo di aver capito qualcosa, intendiamo che siamo stati capaci di trovare una spiegazione già memorizzata (ricevuta in toto da altri o elaborata da noi stessi), oppure che abbiamo elaborato con successo la spiegazione di un evento per il quale non avevamo alcuna precedente esperienza pertinente. Capire qualcosa significa quindi essere capaci di ri-conoscer/a come qual cosa di già conosciuto. È come se dicessimo: "Sl, l'ho già spiegato, e non devo spiegarlo ancora". Capire significa aver già spiegato, ed essere capaci di accedere a quella spiegazione. Nel caso in cui non si sia gia spiegato un evento simile, se c'è qualcosa di nuovo in questo senso, il problema diventa: Q u a l i domande si trova no nella m i a memoria, e in che rap porto sono con la p rofond ità del l a sp iegazione che si rich iede i n q uesto caso?
Di tanto in tanto, chi deve capire cerca spiegazioni complicate, in profondità. Tuttavia, per ottenere spiegazioni "profonde", bisogna aver posto domande profonde. Alla domanda sul perché le guardie abbiano seguito quel compor tamento è possibile rispondere a un livello molto semplice. Ma, se vogliamo migliorare i computer fornendoli di una vera capacità di comprensione, è necessario fare in modo che pongano domande di complessità molto maggiore. Per esempio, potremmo chiederci che cosa dica questo evento sul carattere delle guardie, o sulla natura delle relazioni politiche fra Iraq e Francia. Potremmo farci domande sull'accettabilità crescente del terrorismo nelle am basciate di tutto il mondo, o sui sentimenti e gli atteggiamenti delle persone che sono state tenute in ostaggio. Ognuna di questa domande, una volta posta, ci
2 12
Modelli di spiegazione
induce a elaborare una spiegazione alla cui base si trova la domanda stessa. Una volta posta, cioè, la domanda orienta la risposta. Quando si incontra una dif ficoltà nella comprensione, le domande già presenti nella nostra mente orienteranno il processo della spiegazione . Supponiamo, per esempio, che le guardie irachene che l'hanno ucciso fossero proprio le persone che il terrorista aveva tenuto in ostaggio: in tal caso "punizione" sarebbe una spiegazione ragionevole della loro azione. Così, sembra abbastanza importante domandarsi se le cose non siano andate proprio così, prima di decidere una spiegazione dell 'evento. Problemi relativi a quali possano essere stati i sentimenti degli attori, o che cosa i compagni del terrorista possano aver fatto ai parenti delle guardie, qui sono pertinenti. In altre parole, per capire pienamente dobbiamo richiamare alla mente ciò che conosciamo della vendetta; oppure dobbiamo cercare di immaginare che l 'azione delle guardie possa essere considerata un'azione eroica nella cultura irachena. Forse quando le guardie si comportano così vengono considerate "eroi della rivo luzione". Come abbiamo osservato, per dare spiegazioni interessanti è necessario avere la capacità di porre domande interessanti. Le spiegazioni che elaboriamo per noi stessi dipendono dalle domande che ci poniamo. È la domanda che è centrale, non la risposta. Così, in questo esempio, la domanda per noi è: come si pone la domanda la punizione potrebbe essere stata unfattore determinante? Sfortunatamente sembra che abbiamo un circolo vizioso. Il solo modo di porre una domanda sulla possibilità che la punizione sia stata un fattore determinante consiste nell 'aver già avuto l'idea che la punizione potesse essere una spiega zione possibile. Quale viene prima?
La perti nenza dei mode l l i d i spiegazione I l ciclo che h o i n mente è questo: Domande operative fondamentali Domande di spiegazione Modelli di spiegazione Domande specifiche
Capitolo 7: Comprensione guidata da domande
2 13
Spiegazioni
Le domande operative fondamentali seguono il corso della storia. Fra queste vi sono le domande sul chi è andato dove, su quando ci è arrivato, su che cosa intendeva fare là, e così via. Le domande di spiegazione entrano in gioco allorché le aspettative che generano le normali domande di routine cominciano a non funzionare. Come abbiamo visto, tali domande si collegano ai modelli di spiegazione; gli MS vengono poi trasformati in domande particolari le cui risposte producono le spiegazioni reali. Simuliamo il processo prendendo come esempio la storia del terrorista di lingua araba: le domande operative fondamentali di un programma standard di comprensione del linguaggio potrebbero essere, per esempio: C h i è il terrorista ? Che cosa spera d i ottenere? Quale g ru p po ra ppresenta?
La domanda di spiegazione sarebbe: Perché l e guardie hanno abbandonato le regole del copione della cattu ra ?
A questo punto vengono alla mente gli MS indicizzati con questa domanda (per esempio il modello della punizione). Poi cerchiamo di ri-considerare il fatto in questione per vedere se veramente il vecchio modello di punizione vi si adatta. Questo significa generare una o più domande specifiche: in quali eventi il terrorista avrebbe potuto essere coin volto in precedenza, che tipi erano le guardie, chi le pagava, quali istruzioni avevano, e così via. Tutte queste domande vengono generate nel momento in cui si specifica sempre di più il vecchio modello per applicarlo alla nuova situazione. Se, perché ci sia punizione deve essere stato commesso in precedenza un atto malvagio, dobbiamo chiederci se l 'aver preso degli ostaggi possa essere qualificato come atto malvagio, o se nel passato del terrorista non ci sia qualche azione ancora peggiore. In questo modo si generano moltissime domande, ognuna attraverso la combinazione di una domanda di spiegazione diversa e di un modello di spiegazione innescato da essa, insieme a quella parte del modello che è stata chiamata in questione. Il ruolo delle domande di spiegazione e dei modelli di spiegazione è perciò quello di generare nuove domande. Il compito è fare in modo che il programma,
2 14
Modelli di spiegazione
o la persona, guardi una certa situazione e si chieda se potrebbe essere un esempio di punizione. Poi vengono generate molte domande specifiche quando si accede al modello di spiegazione e lo si tratta come una spiegazione ipotetica che, in seguito, viene messa a confronto con la situazione corrente. Nella misura in cui spiegazione ipotetica e situazione collimano, nascono domande sull'ap propriatezza del confronto; sulla eventuale diversità delle circostanze; o sulla possibilità di trovare qualche altro modello di spiegazione.
Il ciclo d e l l a com p rensione Ritorniamo a IPP per un momento. È chiaro ora che al programma mancava quello che ora possiamo definire ciclo base della comprensione. Per capire veramente, cioè, dobbiamo porre domande sulle cose che leggiamo o sentiamo. Dobbiamo poter prendere fenomeni che sono fuori dal dominio delle nostre esperienze precedenti e trovare rievocazioni di due tipi. Per prima cosa, dobbiamo trovare ricordi che siano in sintonia con l'esperienza c he stiamo elaborando. Quando ciò non è possibile, quando cioè non esiste un ricordo particolare pertinente, indicizzato sotto la spiegazione di un'aspettativa insod disfatta che costruiamo in modo ad hoc, o non possiamo trovare questo ricordo, dobbiamo prendere modelli di spiegazioni standard più neutri (cioè meno particolari) e derivarne un insieme di domande. In un certo senso, il primo tipo di rievocazione è una scorciatoia, un metodo facile di elaborazione di una situazione nuova con l'aiuto di un'esperienza vecchia correlata molto strettamente da confrontare con quella corrente. Quando questa via non è aperta, di solito perché tale ricordo non ci torna alla mente, dobbiamo assumere un ruolo più attivo. Dobbiamo trovare modelli di spiegazio ni correlati a cui far guidare il processo di indagine; in altre parole, dobbiamo cercare di avere delle rievocazioni. L 'essenza della mia ipotesi è che capiamo proprio attraverso la creazione di queste domande; IPP, o un qualunque programma di comprensione, deve operare alla luce di un insieme di domande. La sua forza guida, per così dire, deve essere il desiderio di conoscere le risposte alle domande prodotte durante il processo di comprensione. Questo significa che, se vogliamo leggere un'ar ticolo sul terrorismo, dobbiamo avere delle domande che guidino il processo. Innanzitutto, deve esserci stata qualche ragione per cui abbiamo cominciato a leggere quella storia. Perché si legge una notizia sul giornale? Sembrerebbe una domanda eccen-
Capitolo 7: Comprensione guidata da domande
215
trica ma, se vogliamo che un programma capisca una notizia a un livello più che superficiale, deve avere qualche idea su ciò che vuoi sapere. Quando si legge una notizia come quella sul terrorista di lingua araba, non la si legge per scoprire che cosa sia successo nell'ambasciata irachena a Parigi, bensì per un insieme di ragioni personali che riguardano ciò che ci preoccupa e ciò che ci interessa nel mondo. Altrimenti non c'è alcuna ragione per leggere la notizia. Quando allora arriva una notizia sul terrorismo, dobbiamo esserci già posti delle domande; per esempio: "Perché oggi il terrorismo è cosl diffuso?" o "Cosa sta succedendo a Parigi?" o "Mi chiedo se posso trovare materiale nuovo per una battuta da inserire nel monologo di questa sera", o "Posso arrivare a capire meglio la situazione del mondo cercando di in formarmi sul terrorismo?" o anche "Ho bisogno di sapere sui fatti di sangue, e di conoscerne i particolari in modo da sapere che fare nel caso dovessi restarne coinvolto". Ci sono motivi di ogni genere per leggere le notizie sul giornale. A prima vista, sembrerebbe che qualcuno possa aprire il giornale e leggere gli articoli per ammazzare il tempo, o per divertirsi, o altro. Che cosa succede allora? Ciò che succede effettivamente è che permettiamo alle nostre domande di sfondo di emergere. Ci sono cose che si vuole sempre sapere o di cui si è sempre curiosi; centinaia di cose, forse migliaia. Non dobbiamo pensarci esplicitamente ogni volta che apriamo il giornale. Semplicemente stanno lì in attesa di risposte. In altre parole, non possiamo costruire un programma di comprensione che non abbia alcuna ragione per leggere. Può voler trovare delle informazioni particolari, ma allora non troverà niente altro. Credo che non si possa veramente costruire un lettore di giornali che non abbia alcune domande, a cui cerca di rispondere, che siano a un livello più alto di quella posta dallo specifico articolo che si trova a considerare in un qualunque momento dato. Tale programma non riuscirebbe a rilevare niente di insolito negli articoli letti. Il problema di come affrontare una situazione con un insieme di domande deve guidare qualunque nuovo programma di comprensione. Questo può farvi venire in mente in qualche misura FRUMP (De Jong, 1 979) che, credo, fosse un programma metodologicamente corretto, nel senso che poteva porre domande. Le domande non erano poste in forma di domande, ma come richieste o condizioni. Le richieste, tradotte in linguaggio comune, erano del tipo "Quale grado della scala Richter ha raggiunto il terremoto?" o "Quanti danni ha provocato?" o "Quante persone sono morte?" Le domande di FRUMP erano quindi semplicemente quelle che ho definito domande operativefondamentali .
216
Modelli di spiegazione
Non credo che le persone che leggono le notizie dei terremoti sprechino veramente il loro tempo chiedendosi dell'intensità sulla scala Richter. Potremmo avere una routine "bottom up" che dice: "se supera il 7 ° grado rievocare il terremoto di San Francisco o quello di Città del Messico". Uno dei problemi di FRUMP era che lavorava su notizie noiose. Se cercassimo di far lavorare FRUMP su notizie interessanti, o se volessimo capire notizie sui terremoti in un modo interessante, vorremmo poter iniziare il processo di comprensione con un'ipotesi. La prossima generazione di pro grammi per la lettura di giornali dovrà avere un insieme di domande che guidino il processo della comprensione. Costituirebbero essenzialmente il motivo per cui il programma leggerebbe la notizia. Queste domande dovrebbero essere più profonde di "Quante persone sono morte?" o "Quali sono le notizie più recenti, vorrei riassumerle". Questo atteggiamento va bene per la trasmis sione di informazioni, ma non per assimilarle. C'è una differenza notevole fra la profondità dell'elaborazione richiesta per trasmettere informazione e quella richiesta per assimilare informazione . Un qualunque programma deve avere un insieme di domande che costitui scono il suo punto di partenza. Sarebbero il risultato di esperienze precedenti (magari altri fatti di cronaca) che hanno sollevato quelle domande ma senza riuscire a darvi risposta. In un certo senso allora, l'input per il processo di comprensione è la notizia e un insieme di domande. L'output è un altro insieme di domande. Se l'elaborazione dei testi in linguaggio naturale viene fatta correttamente, deve rispondere ad alcune domande e farne sorgere altre. Questo non è un circolo vizioso, perché presumibilmente le domande che sorgono sono un po' più sofisticate di quelle a cui si è risposto. Ciò di cui abbiamo bisogno per raggiungere la vera comprensione è perciò quella che chiamo comprensione guidata da domande . Le domande possono venire da qualsiasi campo. Per esempio possono aver origine da vecchie notizie, ovvero da vecchi ricordi con parti capite in modo incompleto, su cui ci siamo posti degli interrogativi. Se non riuscissimo a darne una spiegazione certa, l a notizia sul terrorista d i lingua araba diventerebbe u n insieme d i domande che potrà guidare la c omprensione di altre notizie su questo argomento. La rievocazione in realtà è proprio questo . In questo caso la domanda è: "Ci sono altri esempi di questo bizzarro comportamento che mi aiuterebbero a capire meglio questa notizia?" Questo tipo di domanda può rimanere in circolazione per anni passivamente in attesa di una risposta. Domande come questa stareb bero sotto la superficie, in cerca di risposte. Naturalmente, ci sono domande che
Capitolo 7: Comprensione guidata da domande
217
stanno invece in superficie, domande di cui ci preoccupiamo esplicitamente e consapevolmente. Infine, ci sono domande tematiche di fondo a cui si cerca sempre di rispondere, consapevolmente nel senso che si sa di cercarle, ma inconsapevolmente nel senso che non sono costantemente presenti nella nostra mente. È necessario che, in qualunque programma di comprensione si possa sviluppare, sia ben presente la distinzione fra questi tipi di domande e il modo specifico in cui ciascuna di esse si realizza.
Qua lche domanda Se consideriamo IPP nei termini delle domande che era in grado di porre (e a cui perciò avrebbe potuto rispondere) notiamo che IPP funzionava a un livello che potremmo definire livello giornalistico. Poneva domande del tipo chi, che cosa dove e quando. Non è molto sorprendente - dopo tutto leggeva notizie sui giornali. Queste domande di livello giornalistico erano programmate come aspettative (o richieste) e facevano parte di un sistema generale che aveva anche il compito di eseguire l ' analisi del linguaggio. Si può dire senza timore di sbagliare che le persone hanno in mente queste domande di livello giornalistico quando leggono una notizia (dopo tutto, è proprio per questo che i giornalisti cercano di rispondere a quelle domande). Quando si sente una notizia che non presenta tutte le informazioni suddette, è molto probabile che si cerchi di riempire i vuoti attraverso inferenze o domande particolari (nel caso di una situazione interattiva) in modo da sapere chi, che cosa, quando e dove. Da un certo punto di vista, il problema più grave di IPP era che non produceva da sé queste domande, cioè IPP non voleva sapere quel tipo di cose. Erano invece i programmatori che gli dicevano di fare quelle domande. Naturalmente questo vale per tutti i programmi. Tali domande vengono inserite nel programma (sebbene non sempre in forma di domande), prima che il programma cerchi effettivamente di leggere la notizia. Noi informiamo il programma che leggere significa cercare di rispondere a quelle domande. Comunque ciò che non facciamo è dire al programma di cercare ciò che deve sapere. C'è una sottile differenza fra le due cose. Dietro a una domanda c ' è i l bisogno d i sapere, c 'è i l fatto d i meravigliarsi d i qualche cosa, o l 'interesse per qualche aspetto di quella cosa. La tesi è che non possiamo fare in modo che un programma capisca in senso profondo, se non è interessato a ciò che legge. Possiamo dire la stessa cosa delle persone. Non è possibile che una persona capisca veramente ciò che legge, se non dà alcun interesse alla cosa. Un buon
218
Modelli di spiegazione
esempio è una dattilografa che digita ciò che le arriva dal dittafono o da una registrazione. La dattilografa ha bisogno di udire le parole, ma non di capire in un senso profondo. Non ci aspettiamo che la dattilografa capisca ciò che scrive, salvo che le interessi. È persino improbabile che cerchi di capire. Come abbiamo detto, l 'interesse deriva dal possesso di un insieme di domande. Una delle ragioni per cui è improbabile che una dattilografa o un traduttore (altro esempio dello stesso fenomeno) capiscano veramente, deriva dalla loro probabile mancanza di interesse. I traduttori alle Nazioni Unite potrebbero essere interessati ai fatti internazionali, ma è lecito chiedersi, visti gli scopi del loro lavoro, se essi possano persino tentare di capire ciò che traducono. Il loro lavoro è troppo veloce, ed essi hanno troppo da fare per permettere alle loro menti di porre domande su ciò che sentono. Succede quindi che non capiscano ciò che leggono o sentono. Non dico che non possano riferirei qualcosa su quanto è stato detto e che non possano rispondere ad alcune domande, bensl che non sarebbero in grado di porre domande. Chiedere è di importanza capitale. Naturalmente si potrebbe modifi care IPP in modo che possa formulare domande. Il problema è se queste domande sarebbero veramente sentite o no. IPP, cioè, vorrebbe davvero cono scere le risposte? Sembra un po' sciocco, poiché è difficile stabilire i veri sentimenti di una macchina, e si tende a ipotizzare che la risposta standard sarebbe che le macchine non hanno affatto sentimenti. La cosa più ragionevole da chiedere è che le domande si autogenerino. Cioè: le domande c'erano prima di aver visto la notizia o sono venute dopo? Invece di domandare se "Il programma vuole veramente conoscere la risposta" chiediamoci "In che modo il programma potrebbe voler giungere a porre la domanda?" Se gli suggerissimo di porre la domanda, avremmo una simulazione interessante, ma sarebbe in qualche modo diverso dal produrre da sé la domanda. Possiamo dire a un bambino, a uno studente, o a un giornalista, quali domande porre, ma solo quando cominciano a formulare da sé le proprie domande sentiamo di aver realizzato qualcosa. Il programma deve veramente voler sapere; deve produrre le proprie domande. In che modo si può indurre in un programma un genuino desiderio di sapere? Per voler sapere, dobbiamo avere un insieme di obiettivi. Deve esserci qualcosa che guidi il sistema cosicché nella nostra mente ci sia qualche finalità. In un certo senso sto dicendo che in IPP (o in FRUMP o in SAM) era sbagliato il fatto di avere una base di domande (sempre che in base alla nostra ricostru zione avessero proprio delle domande), che erano solo un insieme di domande
Capitolo 7: Comprensione guidata da domande
219
operative fondamentali a cui dovevano rispondere. Tutte le loro domande erano specifiche dei loro domini. Non avevano un insieme di ipotesi che li guidassero. (Naturalmente questa non è una critica di quelle ricerche, ma semplicemente un ampliamento. L' obiettivo dei progettisti di quei programmi era il controllo delle idee fondamentali del primo passo della comprensione automatizzata delle notizie. Quello che voglio dire è che ora è giunto il momento di fare il secondo passo.) Naturalmente, si potrebbe semplicemente dare a IPP un insieme di ipotesi. Si potrebbe cercare di sviluppare una teoria dei terroristi -chi sono, che cosa fanno, perché lo fanno - e potremmo cercare di prevedere in che modo agirà un certo terrorista, o dove si potrebbe presentare il terrorismo. In tal caso, quel programma potrebbe non prestare attenzione ali' articolo che abbiamo considerato - dato che il terrorista è stato ucciso dalle guardie dei servizi iracheni. Potrebbe trovarlo non interessante rispetto a un'ipotesi gene rale sul terrorismo sulla quale si trovasse a lavorare. Invece, forse lo sarebbe. Forse ciò che vogliamo veramente da un sistema guidato da ipotesi è che possa produrre ogni volta tutte le domande che potrebbero essere pertinenti. Un programma potrebbe chiedersi per ogni fatto: "Questo ha interesse per i miei obiettivi? Come posso collegarlo ai miei obiettivi?" Se il nostro scopo fosse seguire i terroristi e fare previsioni sui terroristi, allora, data un'azione in cui fossero coinvolti, il problema sarebbe il grado di collegamento possibile di quell'azione con la teoria generale. Il problema allora è: Quali tipi di domande ci dobbiamo porre? Le domande al livello giornalistico sono veramente le domande di livello più basso. Al secondo livello, si tovano domande ancora piuttosto primitive per il concetto di comprensione, come : Questa azione mi tocca in qualche modo ?
In che modo influenza i miei obiettivi? Come si collega ai miei obiettivi? Gli obiettivi di cui parliamo sono quelli del lettore, così la tesi è semplicemente questa: non si può scrivere un programma di comprensione del linguaggio che sia molto efficace se non ha obiettivi e interessi propri che lo inducano a far domande su ciò che legge. Quindi, il risultato naturale della nostra rivisitazione dell'elaborazione del linguaggio naturale è questo: perché un programma di comprensione del linguaggio sia efficace, deve avere obiettivi propri e deve poter creare e seguire le domande che nascono dall'interazione delle nuove informazioni elaborate con gli obiettivi e la memoria del programma. La forza guida della comprensione deve essere il bisogno di sapere di più .
220
Modelli di spiegazione
Ti pi d i doma nde Formuliamo continuamente domande di ogni tipo. Per insegnare alle macchine a porre queste domande, dobbiamo avere un buona visione del tipo di domande da porre. Poiché le domande dipendono dai propri obiettivi, ne segue che gli obiettivi della spiegazione discussi nel capitolo 3 debbono correlarsi stretta mente alle domande che è necessario porre mentre si capisce un testo. Questi obiettivi generano tipi diversi di domande in base al livello di comprensione che si cerca. Ho diviso le domande, che ritengo significative per un sistema di comprensione analitico e creativo, in quattro ampie classi che riflettono i livelli di comprensione abbinati agli obiettivi delle spiegazioni standard. I livelli della comprensione che prenderò in considerazione sono: centrato su di sé ; fattuale; teorico e creativo. Questa distinzione corrisponde all'idea che si possa desi derare di conoscere solo ciò che ci riguarda direttamente; o di ottenere una conoscenza di base dei fatti del mondo; o di ottenere una comprensione teorica del come e del perché il mondo vada proprio cosi come va; o di raggiungere prospettive nuove sulle cose, con l 'intento di essere creativi. Domande di livello 1: centra te su di sé
Le domande del primo tipo, che chiamo domande di livello l , sono quelle che non c ' è bisogno di insegnare a nessuno (eccetto forse una macchina). Più o meno sono il tipo di domande che programmi come IPP hanno posto, implicitamente o esplicitamente, sin da principio. Altrettanto deve fare un qualsiasi sistema di pianificazione. Queste domande riflettono il tentativo di capire con un orienta mento centrato su di sé. Ricordo che gli obiettivi della spiegazione erano: 1 . Stabilire se l'attore ha qualcosa di coerente in mente quando tutto indica il contrario. 2 . Trovare nella catena credenza-azione il con testo naturale per una data azione. 3 . Trovare nuove regole predittive per il comportamento di un certo individuo. 4. Trovare nuove regole predittive che valgano per un gruppo. 5. Ottenere nuove regole per operare nel mondo copiando quelle di altri che sembrano funzionare. 6. Aggiungere nuovi fa tti alla propria base di da ti.
Capitolo 7: Comprensione guidata da domande
22 1
7 . Trovare verità universali che valgano per una vasta gamma di fenomeni.
Per rendere le cose più semplici possiamo riassumerli come: Coerenza del piano Collocazione contestuale Previsione individuale Previsione di gruppo Nuovi fatti Riproduzione di regole Verità
Quando questi sette obiettivi si combinano con un interesse generale per i problemi centrati su di sé, generano domande che ci si pone in modo naturale e che sono essenziali per la vita. I bambini se le pongono continuamente, ma sempre di meno m an mano che crescono. Anche le macchine dovranno imparare a porle, ma questo è il problema minore nella formulazione delle domande poiché sono le domande più semplici da formulare. Coerenza del piano . Perché fa questo? (C he cosa lo interessa ?) Collocazione con testuale. Q u a l i sono le sue i ntenzioni nei m iei confronti ? Previsione individuale. I n che m odo può ri guardarmi q uesto? Previsione di gruppo. Questo attore è membro d i u na classe di attori che m i tratterà i n q u esto modo? Nuovi fa tti. Che cosa ha fatto esatta m ente? Copia di regole. Posso i m pa ra re a farlo? Verità. Q uesto succederà a ncora nello stesso m odo?
Domande di livello due: fa ttuali
Al secondo livello ci sono le domande fattuali; sono quelle che ci insegnano a porre nel corso normale dell'educazione standard. Non tutti imparano a formu lare queste domande perché non tutti ricevono un'educazione adeguata. Tutta via, l 'educazione fondamentale riguarda nel complesso l'apprendere a formulare queste domande. Impariamo a formularle su un'ampia gamma di fatti diversi. Impariamo come acquisire fatti a un livello basilare (livello giornalistico), e
Modelli di spiegazione
222
quindi usiamo i nostri interessi per l 'acquisizione dei fatti in termini degli obiettivi che abbiamo già. Impariamo inoltre a valutare la coerenza degli argomenti che usano gli altri (argomentazione/retorica), questa volta usando i nostri obiettivi di spiegazione per cercare di stabilire la chiarezza di una linea di ragionamento. In altri termini, raccogliamo fatti e otteniamo comprensione di come i fatti sono connessi : Domande di secondo livello: giornalismo Coerenza del piano
Perché lo ha fatto?
Collocazione contestuale C h i lo ha fatto?
Dove lo ha fatto? Quando lo ha fatto? Che cosa ha fatto? Previsione individuale
Quali sono i fatti passati d i q uesto attore che rendono conto della sua azione?
Previsione di gruppo
Appartiene a u n gruppo che agisce i n questo modo?
Fatti nuovi
Q u a l i tendenze nuove ci sono nel mondo?
Riproduzione di regole
Questo è l ' i nizio d i qua lcosa che succederà an cora ?
Verità
Qual è l ' i ntento generale o l ' i deologi a dietro a q uesta azione?
Domande di secondo livello: argomentazione/retorica Coerenza del piano
Quali prove sostengono q uesto a rgomento?
Collocazione contestuale Quali sono i controesempi per q uesta premessa ? Previsione individuale
Che cosa dovrebbe esser vero perché ne segua questo?
Previsione di gruppo
Quali a ltre generalizzazion i come q uesta esisto no?
Capitolo 7: Comprensione guidata da domande
223
Fatti nuovi
Quali a ltri fatti devono esser veri se la premessa è vera ?
Riproduzione di regole
Quali a rgomenti a naloghi potrebbero esserci?
Verità
C h e cosa ne seg ue i n genera le se tutto ciò che d ice è vero ?
Domande di livello tre: teorie
Le domande di terzo livello sono quelle che raramente si insegna a porre. Sembrerebbe discutibile in questo caso pensare di insegnarle alle macchine. In un certo senso, stiamo chiedendo che le macchine raggiungano un livello di comprensione molto complesso. Non tante persone riescono a raggiungere questo livello di comprensione. Queste domande sono alla base di una mente fondamentalmente analitica. Gli scienziati e gli studenti imparano a porte, ma spesso si concentrano a rispondere ad alcune domande e dimenticano di continuare a formularne altre. Anche le macchine dovranno imparare a formu larle se vorranno essere buoni pensatori. Le domande di terzo livello riguardano la teoria che sta dietro un evento e possono essere abbastanza generali oppure esprimere il punto di vista di un particolare campo di ricerca. Domande di terzo l ivello: comprensione/coerenza Coerenza del piano
Q ual è l ' informazione che m i sfu gge e che rende rebbe coerenti q uesti eventi ? Qual è il piano che veniva segu ito e che, se mi fosse stato noto, avrebbe reso preved i b i le u na certa azione 7 Perché qualcuno dovrebbe fa re qua lcosa i n u n modo q uando u n a ltro modo sem bra m i g l iore? Perché un certo stato pianificato nel mondo è stato pian ificato proprio i n q uel modo?
Collocazione contestuale
Quali a ltri eventi ho in memoria, simili a quello corrente? Come possiamo sta b i l i re il costo e i benefici di u n a azione?
Modelli di spiegazione
224
In che modo q ualcuno che ha asserito un fatto è g i u nto a conoscerlo? Chi dovrebbero aver conosciuto per sapere q ue sto? Quale posizione dovrebbero avere per g i u n gere a conoscere ciò? Dov'erano q u a ndo l ' ha n no scoperto? Quale tipo di a n a l isi debbono aver fatto per poter ca pire q uesto ti po di cose? Previsione individuale
Quale teoria d i q uesto fatto mi servirebbe per a ntici pare corretta mente q u esto risu ltato? Quali risu ltati derivano di sol ito da una certa azione? Cosa possono d i r m i i va ri stati del mondo pia nificato sulle persone che l ' h a n no p i a nificato? Cosa possono dirmi i va ri stati del mondo fisico su l l e regole che governano la n ostra vita ?
Previsione di gruppo
Quali a ltri eventi come q uello corrente m i in du rreb bero a rivedere una i potesi di base?
Fatti nuovi
C he cosa m i fa credere che u n a certa azione ha senso (quando non sem bra)? Quali stati del mondo dovrebbero essersi verifi cati perché un certo fatto ne consegua natu ra l mente?
Riproduzione di regole
Che cosa ca m bierebbe se questo fosse vero? Quali buone strategie si possono cop iare da u n certo evento?
Verità
Quali altre cose del mondo sono come q uesta ?
Domande di livello qua ttro: creatività
Le domande di quarto livello sono quelle su cui si fonda veramente l'essenza della creatività. Possono essere molto fondamentali o molto ottuse. Spesso sono diverse a seconda dei campi di indagine, e qualche volta portano un insieme standard di domande da un'area a un'altra area di ricerca rispetto a cui di solito
Capitolo 7: Comprensione· guidata da domande
225
non si applicano. Se vorranno essere creative, le macchine dovranno imparare a formulare questo tipo di domande: Coerenza del piano
C he pa rte possiamo proiettare una certa azione i n modo che a ppaia qualcosa di diverso da ciò che è? Come possiamo fa re i n modo che q ua lcuno d i a sostegno a qua lcosa c h e a ltri menti n o n potreb be sostenere? Come potrei escog ita re un piano che potrebbe contri b u i re a correggere u n piano erroneo che ho osservato?
Collocazione contestuale Quali a ltre situazioni posso costru ire, che a b biano le proprietà d i quelle sotto esa me, cosic ché io possa sottoli nea re l'assu rdità di quella ori g i nale?
Q u a l i a l tre situazioni posso costru ire, che ab biano le proprietà d i quella i n esa me, cosicché possa sottoli neare la va l i d ità d i q uel la originale? Qua l i a l tre situazioni posso costru ire, che ab biano le p roprietà di quella i n esa me, cosicché io possa trova re le genera l izzazioni che va lgo no per e ntra m be? Cosa succederebbe se giusta pponessi il l uogo contestuale di una cosa e quello di un'a ltra ? Previsione individuale
Quali prove si possono i g norare se si vuole creare una teoria d i cosa q ualcuno fa rà ? I n che modo posso vedere u n a persona che non ca pisco come un esempio d i qualcuno che capi sco?
Previsione di gruppo
Quali categorie di raggruppamento i m p iegate dalla maggior pa rte delle persone si possono considerare inefficaci e da mod ifica re? I n che modo forma re un ra g g ru ppam ento che abbia più potere predittivo del ra ggruppa mento corrente?
226
Fatti nuovi
Modelli di spiegazione
Q ua l i sono le i potesi ca re a ta nte persone e che debbono essere riesa m inate? Come possiamo mettere una doma n d a a cui non è possibile rispondere i n u n a forma i n cui è possi bile rispondere?
Riproduzione di regole
I n che modo certe persone costruiscono regole efficaci per affronta re il mondo? Come e perché a ltre persone evita no q ueste regole? Hanno a ltretta nto successo? Come sap piamo q u a l i regole del mondo copiare e q u a l i riscrivere?
Verità
C i sono delle verità nel mondo? Come si possono d i m ostra re verità defi nitive? Qual è il va l ore di una genera l i zzazione che si assume tem poranea mente?
I n nesch i Se formulassimo ognuna di queste domande ogni volta che osserviamo un fatto, probabilmente non elaboreremmo mai quel fatto. Formulare tutte queste do mande riguardo a un evento o alle nostre inferenze sulle cause e gli effetti di quell'evento, provocherebbe un'esplosione combinatoria. Un problema impor tante è quindi che cosa inneschi una domanda. Che cosa fa sì che una o più di queste domande siano portate alla coscienza? Esattamente, quando dovremmo considerare che cosa? Ci sono tre tipi di inneschi (trigger) di cui parleremo qui. I primi, che classificherò come TRIG-0 sono quelli che non si ha bisogno di imparare in modo complesso. Questi inneschi o sono innati (non è necessario insegnare a un bambino a spaventarsi), o si apprendono molto facilmente nei primi anni di vita. Naturalmente è molto importante determinarne la natura e insegnarli a una macchina se si vuole che capisca le persone e che abbia una vita cosciente propria. Il livello di un innesco non è correlato ai livelli delle domande. Una persona creativa può generare una domanda a livello quattro con un innesco TRIG-0. Gli
Capitolo 7: Comprensione guidata da domande
227
inneschi TRIG-0 innescano le domande semplicemente per eventi di grande immediatezza; si collegano agli insuccessi delle aspettative che nascono dal l' elaborazione di un' azione mentre è sotto osservazione. Al secondo livello ci sono gli inneschi che classificherò TRIG- 1 . Sono quelli che apprendiamo nella prima fase di vita, ma che non tutti apprendono necessariamente. Spesso sono regole empiriche che si insegnano a scuola. Per esempio, un bambino può imparare ad innescare la domanda "mi sono comportato male?". I TRIG- 1 tendono a collegarsi agli eventi elaborati dopo il fattd, e spesso a quelli per cui non c'è stata osservazione diretta. IDentificherò gli inneschi di terzo livello con TRIG-EA (dove EA sta a indicare che debbono Essere Appresi). Se per essere intelligenti è necessario porre costantemente domande, come abbiamo sostenuto, allora gli inneschi che si apprendono sono una parte importante di quel processo. Apprendere a far scattare le domande al momento giusto è alla base dell'apprendimento; sia le persone che le macchine debbono aprrendere come innescare nuove domande. Tuttavia, l 'apprendimento ha luogo nel proprio contesto personale, cosi i TRIG EA tendono a entrare in azione a causa di situazioni insolite percepite come importanti per gli obiettivi di chi deve capire. Per esempio, un ipocondriaco può avere un TRIG-EA che agisce quando riceve complimenti sulla sua salute, e che lo induce a cercare moti vi per cui i buoni indizi sarebbero fuorvianti e a trovare argomenti più convincenti per la sua infermità. Naturalmente, ali 'inizio si ricevono insegnamenti sugli inneschi appropriati. Usarli a.l momento giusto è questione di esperienza. Quindi la compilazione dell' informazione sull 'uso appropriato degli inneschi è la parte significativa dell' apprendimento che deriva dall'esperienza. Per esempio, le domande di primo livello hanno i seguenti inneschi: Domande di primo livello: centrate su di sé Perché questo è importante per me?
TRIG-0:
L'osservazione d i u n evento fisico è u n a g u id a (essenzialm ente i n nato)
TRIG - 1 :
C iò che ci viene detto su u n fatto (sotti ntende che qualcuno ce lo d ica perché pensa che sia i m porta nte per noi)
TRIG-EA: Osservativi (le osservazioni che posson o essere i m portanti posso no n o n sem b rare tal i a pri m a vista)
In altri termini, ogni animale conosce
TRIG-0.
La sua conoscenza deve essere
228
Modelli di spiegazione
raffinata continuamente sulla base dell 'esperienza. Questo significa conoscere la risposta alla domanda particolare generata dalla domanda generale che è stata innescata. Il processo ha l'innesco che produce la domanda generale: Perché questo è importante per me?
quindi la domanda viene trasformata in una domanda specifica, per esempio: Perché questo animale selvaggio che si dirige verso di me è importante per me?
La risposta alla domanda particolare verrebbe presumibilmente codificata in modo tale da includere un'azione che ha funzionato in precedenza nella prevenzione di qualche pericolo che si può ipotizzare sia il risultato potenziale di una azione che si sta svolgendo. Per quanto riguarda TRIG-t , la situazione è un po' più complessa. Quando da bambini ci viene raccontato un evento, è proprio perché quell 'evento ha importanza diretta per noi. Quando cresciamo, le informazione che ci vengono fomite sono importanti solo indirettamente. TRIG-1 fa scattare la domanda: Perché questo è importante per me?
e ci fa quindi decidere se continuare a riflettere sulla domanda finché non si coglie qualche motivo di interesse personale. Per esempio, se il notiziario ci dicesse che i Cardinals battono i Phillies per 5 a 3, ci potremmo chiedere se prestare o meno attenzione alla cosa. Lo faremmo se fossimo tifosi dei Cardinals o dei Phillies. Non lo faremmo se il baseball non ci interessasse, salvo conoscere qualcuno attento a queste cose, o avere qualche ragione particolare (come una visita imminente a un tifoso dei Phillies). Se fossimo tifosi dei Met, per esempio, presteremmo attenzione alle notizie sugli impegni dei Met con questa o quell'altra squadra, e così via. La cosa importante è il tentativo di valutare la pertinenza di ogni dato input che riceviamo in questo modo (cioè passivamente). Attraverso il processo di trasformazione delle domande che abbiamo visto nel caso di CYRUS, cerchiamo di convertire la domanda innescata Perché questo è importante per me?
in una a cui sia possibile rispondere direttamente, come: Il risultato della partita riguarderà una squadra che mi interessa ? Il risultato della partita riguarderà una persona che mi interessa ?
Capitolo 7: Comprensione guidata da domande
229
Generare queste domande è molto significativo. Per farlo, è necessario usare una delle molte regole di trasformazione delle domande (T-D) . Per esempio la regola TD applicabile in questo caso è: T-D 1 :
Per TRIG- 1 che riguardano i risultati di una gara atletica : trasformare la domanda iniziale di TRIG- 1
i n una domanda sulla possi bile relazione con i risu ltati di a ltre gare atletiche oppure
i n u n a doma nda sugli stati affettivi deg l i i ndivi d u i associ ati con le squa dre i n contesa .
Bisogna notare che la regola in questo caso è molto specifica. Ci aspettiamo di trovare regole specifiche perché una volta che abbiamo appreso a che cosa fare attenzione in un certo contesto, possiamo facilmente arrivare al problema. Ciò che intendo è che per un qualunque fatto nuovo trasformiamo domande generali sulla pertinenza personale in domande particolari che abbiamo impa rato a porre in quel tipo di situazione. Ora consideriamo quello che accade quando l 'informazione che attiva TRIG1 viene riferita direttamente a noi. Supponiamo cioè che qualcuno ci dica una cosa su di sé o qualcosa non connesso direttamente a uno di noi. Per esempio: Mia moglie si è svegliata ammalata questa mattina
oppure Gli iraniani hanno bombardato Bagdad
Il problema sarebbe quello di capire l 'importanza di queste osservazioni per noi. Si applicano varie regole di trasformazione: TD 2:
Per TR/G- 1 riguardo alla malattia:
trasforma re I n una domanda sul possi bile contagio della ma lattia . I n una domanda sug l i effetti possibili della ma lattia sul l ' i n d ivid uo, che p rovoca no la sua ma nca nza d i d ispon i b i l ità . I n domande sui possi b i l i effetti delle difficoltà della persona ma lata su a ltri i n d ivi d u i che riteniamo responsabili .
Modelli di spiegazione
230
Questo può sembrare un insieme di domande molto egocentriche, ma non dimenticate che ci stavamo chiedendo proprio "Perché questa cosa è importante per me?" Il problema è generare un insieme di domande a partire dalla domanda originale. Non tutti i tipi di domande che abbiamo discusso sono attivi in ogni momento. Tuttavia, le domande di livello l come questa sono sempre attive. Le trasformazioni della domanda per il bombardamento di Bagdad sono: T-D 3:
Per TRIG- 1 riguardo alla guerra in paesi stranieri
trasforma re I n u na domanda sulla possibile p ropagazione della g uerra ad a ltri paesi . I n una doma nda sui possib i l i effetti della g uerra i n termi n i della produ zione delle merci che usiamo.
Le T-D suddette sono tutte piuttosto tipiche. Abbiamo sviluppato un insieme di modi standard per stabilire l'importanza che hanno per noi certi fatti appartenenti a una varietà di aree particolari di conoscenza. Impariamo cosl a porre certe domande quando quegli eventi si presentano. Naturalmente, queste T-D sono molto simili alle inferenze o alle richieste che potrebbero generare FRUMP o IPP; questo perché sono al livello più semplice di comprensione. La cosa che mi interessava era alzare il livello della comprensione permettendo alla macchina di generare domande che le interessano o che almeno saprebbe porre. In generale queste domande sorgono in due modi diversi. O provengono da TRIG-EA, o provengono da domande di livello più alto (livelli 3 e 4). Per vedere cosa intendo, consideriamo il TRIG-EA per la precedente domanda di primo livello. Anche se la domanda di primo livello "Perché questo è importante per me?" non è davvero una domanda sofisticata, vi può essere una forte componen te di apprendimento legata ad essa. Quando si osserva un evento che non è apertamente minaccioso, se ne può apprendere non poco. I TRIG-EA ci fanno chiedere se un certo evento sia abbastanza insolito da meritare ulteriore studio. In altre parole, per quanto riguarda TRIG-0 e TRIG-1 , sappiamo che per noi esiste un'importanza diretta: il compito è stabilire quale sia. Dobbiamo stabilire da noi quanto siano importanti per noi quegli eventi che non rientrano fra quelli che ci coinvolgono in modo diretto e non mediato o fra quelli sui quali qualcuno ha deciso che dobbiamo essere informati. Per stabilir! o, dobbiamo compilare una complessa base di dati di conoscenze sul mondo che ci permetta di stabilire se un evento è insolito. In effetti è piuttosto difficile decidere che cosa sia insolito. È un fatto insolito che vicino a casa nostra
Capitolo 7: Comprensione guidata da domande
23 1
venga costruito un palazzo nuovo? Potremmo considerarlo abbastanza insolito da voler sapere quali conseguenze potrebbe avere per noi. Il compito di un computer è quello di apprendere, chiedendosi, sui possibili effetti di tutte le azioni che elabora, quali azioni potrebbero influenzare i suoi obiettivi. Ed eccoci tornati ancora una volta agli obiettivi. Non si può stabilire se valga la pena di esaminare completamente un fatto, a meno che non si possegga un insieme di obiettivi in base ai quali lo si voglia fare.
I n neschi che si basa no su obiettivi Consideriamo un esempio di domanda di livello 3 e un esempio di domanda di livello 4. Quali inneschi provocherebbero quelle domande e quali obiettivi che dovrebbero essere presenti per forzare l 'attivazione di quegli inneschi. Come esempi prendiamo: Domanda d i terzo livel lo
Perché qualcuno dovrebbe fa re qualcosa i n u n modo quando sem b ra esserci un m odo m ig l iore? Domanda di quarto livello
In che modo possia m o proietta re u na certa azione perché appaia q u a lcosa di diverso da ciò che è?
Gli inneschi per la domanda di terzo livello sono i seguenti: TRIG-0
aspetta re u n piano a lternativo
TRIG- 1 :
essere i nformati di u n p i a no a lternativo
TRIG-EA: obiettivi : teoria dell'attore, teoria della scelta dei pia n i
Ciò che essenzialmente dicono è che quando un' azione non riesce a inserirsi in un insieme prede terminato di azioni al servizio di un obiettivo noto, scatta TRIO o. Detto in altro modo: qualcuno fa qualcosa orientato al fine che ci aspettavamo, ma non nel modo che ci aspettavamo. TRIG-0 produce la domanda di terzo livello di cui è indice. La domanda può essere poi soggetta ad alcune trasformazioni. La domanda è: Perché qualcuno dovrebbe fare qualcosa in un modo quando sembra esserci un modo migliore?
Modelli di spiegazione
232
Le T-D si possono applicare solo in contesti reali, perciò riconsideriamo il nostro esempio di prima: Gli iraniani hanno bombardato Bagdad.
Il problema è metterei in condizioni di porre una domanda che possa indurci a pensare, in modo creativo, a qualcosa che nasce dalla nuova informazione. In questo esempio, TRIG-0 scatterebbe solo se avessimo qualche aspettativa sul fatto. In altre parole, l'aspettativa riflette l 'interesse, e le domande che proven gono dall'innesco generano ulteriore interesse. Così, perchési innescasse TRIO o, avremmo dovuto in qualche modo aspettarci che gli iraniani non bombardas sero Bagdad. Le T-D dipendono quindi dall'aspettativa insoddisfatta. TD 4: Per TR/G-0 riguardo alle azioni in una guerra, laddove ci si aspettava che tali azioni non venissero in traprese: trasformare I n una domanda su quale n uovo obiettivo possa aver scelto l'attore, per cui sia fu nzionale q uesto piano. I n una domanda su qua l i condizioni sono ca m biate nella guerra . I n una doma nda sui ca mbia menti a l vertice che possono essersi verificati .
In questo caso le trasformazioni producono: Gli iraniani credono ora che Teheran sia completamente difendibile? (Si basa su l l 'assu nzione che l 'aspettativa fa l l ita derivi d a l l ' i potesi che la ra gione per non bomba rda re Bagdad sia evita re u n a escala tion dan nosa per l ' I ra n). Gli iraniani sono disperati perché credono di non poter resistere più a lungo ? Forse l'Aya tollah Khomeini non è più a capo del suo governo ?
L a mia tesi è che nella generazione d i queste domande sta l a risposta all' appren dimento. Queste domande possono essere rifiutate facilmente o indicizzate in modo che possano essere controllate in casi futuri. Sono, in ultima analisi, ipotesi che chi intende capire deve generare in risposta al proprio tentativo di elaborare un nuovo fatto. Perché TRIG-1 sia attivo, è necessario che l'evento in elaborazione sia presentato insieme a una alternativa. Quindi, TRIG-1 è attivo quando vengono
Capitolo 7: Comprensione guidata da domande
233
presi in considerazione due progetti, e quando quello che è stato realizzato è il meno plausibile dei due. T-D5 trasforma perciò Perché qualcuno dovrebbe fare qualcosa in un modo quando sembra esserci un modo migliore?
nelle domande che seguono: L 'attore credeva che il progetto A fosse meglio del progetto 8? Nel progetto 8 ci sono effetti negativi per l'attore? Per qualche motivo l'attore non era in grado di eseguire il progetto 8?
Perché TRIG-EA sia attivo, abbiamo bisogno di confronti di obiettivi simili. La nostra domanda (Perché qualcuno dovrebbe fare qualcosa in un modo quando sembra esserci un modo migliore?) si trasforma in: Quali proprietà dell'attore fanno sì che sia improbabile che lui segua il piano che mi aspetto segua ? (Questa è attiva quando l'attore è contras segnato come interessante per chi elabora). Quali sono le proprietà del piano in questione a cui non avevo pensato? (Questa è attiva quando il progetto è contrassegnato come intrinseca mente interessante). Gli attori che agiscono con un dato obiettivo si comportano in modo diverso con obiettivi particolari? (Questa è attiva quando l'obiettivo è contrassegna to come intrinsecamente interessante).
Il punto è che per chi elabora e ha l'obiettivo di apprendere un maggior numero di fatti su un certo attore, piano, o obiettivo, domande come queste sono attive se l 'interesse si congiunge con una aspettativa fallita su quell' interesse. L'in tenzione è apprendere di più su un soggetto di interesse quando le proprie aspettative sono insoddisfatte.
Al q u a rto l ivel l o Consideriamo ora l'altro esempio nel quadro di una domanda di quarto livello. La frase "Mia moglie si è svegliata ammalata questa mattina" può avere numerose trame subordinate. Qualcuno che sia interessato a capire comincia a riflettere su questi problemi ulteriori nella misura in cui ha ragione di credere in
Modelli di spiegazione
234
qualcuno di essi. Abbiamo i seguenti inneschi: TRIG-0:
effetti negativi dell'azione; la respo nsa b i l ità cade su di noi
TRIG- 1 :
quando u n 'azione c i si presenta i n modo contra rio a q uello che ci sa remmo aspettati
A TRIG-EA: obiettivi, retorica : necessità di convi ncere q ua lcuno su u n
p unto d i vista
TRIG-0 è attivo quando si può in ferire una ragione per cui l' azione in questione causa un danno potenziale per colui che ascolta. Questa è una interpretazione di tipo paranoico, e sarebbe attiva solo se l'elaboratore avesse motivi per essere paranoico. Dovremmo quindi porci la domanda: Come possiamo proiettare una certa azione in modo che sembri diversa da quello che è?
se avessimo motivo di sospettare che l 'evento in questione sia in qualche modo collegato a noi. Il compito che abbiamo di fronte è generare una domanda che ci permetta di dire o fare qualcosa che ribalti la situazione. TD 6:
Per TRIG-0 riguardo a un fatto di cui siamo stati incolpati:
trasformare I n una domanda su come l'evento sia i n rea ltà positivo. In u na doma nda su come fa re a ppa rire che il fatto in q uestione possa non essere successo. In una doma nda su chi altro possa essere i ncol pato.
Come per la maggior parte dei TRIG-0, le domande generate sono note a quasi tutti i bambini. È raro che ci sia bisogno di qualcuno che ce le insegni. Le domande di livello 4, però, presentano qualche forma di creatività anche per TRIG-0,. Le domande effetivamente generate sarebbero, per esempio: Quali saranno gli effetti positivi di questa malattia per il marito? (Natura l mente, q uesta si potrebbe genera re senza attri buzione d i re sponsa b i l ità). Quali ragioni avrebbe la moglie per simulare la malattia ? Chi altro potrebbe essere responsabile di questo fatto? (Questa sa re b be u n a domanda im portante se la ma lattia fosse " ma l a n no del matti no " e q uesta fosse vera mente u n atto d'accusa).
Capitolo 7: Comprensione guidata da domande
235
Ancora una volta, queste sono solo domande iniziali, ma si possono generare facilmente le risposte per contribuire a creare una risposta all'osservazione iniziale, se si fosse scoperto che era appropriato farlo. Attiviamo TRIG-1 quando c'è qualche aspettativa relativa all 'evento discusso, ma se l'aspettativa che è stata disattesa riguarda il modo in cui è stata presentata l 'informazione. In altre parole, se sappiamo che la moglie di chi parla è infelice ed egli ci dice che è ammalata, il problema è il motivo per cui l'informazione è stata presentata in questo modo particolare. T-D l trasforma perciò la doma nda ori g i na le i n :
Perché chi pa rlava h a deciso d i n o n racconta rmi q u e l l o c h e io pensavo m i avrebbe raccontato? Che cosa è successo i n rea ltà (rispetto a qua nto m i era stato detto)? Perché col u i che parla percepisce le conseguenze di un fatto com e p i ù sign ificative d i altre?
Per TRIG-EA, il problema è poter riproporre un dato evento in termini dei propri obiettivi. TRIG-EA verrebbe attivato, se il nostro punto di vista non si accor dasse con una certa asserzione. Gli inneschi che debbono essere appresi dipendono dalla nostra capacità di controllare una certa asserzione per vedere se si accorda con le nostre assunzioni sull'argomento. La T-08 trasforma la domanda: Come possiamo proiettare una certa azione perché appaia qualcosa di diverso da ciò che è?
quando l'evento si presenta in conflitto col proprio punto di vista e si ha l' occasione di dare una risposta. TD 8: Per TRIG-EA : trasforma In u na domanda su come il fatto possa essere presentato com e pa rte d i u n piano per i l rag g i u n g i mento d i fini contra ri a quel l i evidenti . I n una domanda su come fa r a pparire che gli aspetti negativi del l'evento fossero in rea ltà indifferenti o benefici . I n una domanda su l le prove che sostengono le ipotesi fonda menta l i dell'evento, come c h i l ' h a vera m ente progettato, c h i ha agito, e così via .
236
Modelli di spiegazione
Con c l usione Creatività significa porre domande. Se vogliamo che una machina sia creativa, che pensi, in qualche senso significativo del termine, allora deve essere stimolata da ciò che percepisce, cosi da porsi delle domande in proposito. Molto di questo "domandarsi" è gia prescritto. Sappiamo che cosa chiedere a un primo livello fondamentale. Più oltre ci viene insegnato su che cosa porci degli interrogativi. Al di là di questo livello ne esiste un altro nel quale ci poniamo interrogativi su cose veramente nuove. Ma, che siano cose nuove o vecchie, impariamo certi trucchi su come porci interrogativi e a quale livello farlo. La mia tesi è che dobbiamo insegnare anche alle macchine a porsi domande. Per questo dovranno avere idee molto dettagliate su quali interrogativi porsi in domini particolari, e anche un insieme di algoritmi su come fare domande in generale. Inoltre, dovranno avere una personalità di qualche tipo. Si tende cioè a porre domande in modo idiosincratico; in un modo che riflette le proprie esperienze personali e la conoscenza di un certo dominio.
Capitolo 8
Qua lche dom a nda fi nale
Nell'ultimo capitolo siamo partiti dall'idea di osservare di nuovo il processo di comprensione di un articolo di giornale, e abbiamo concluso con un insieme dettagliato di euristiche per la trasformazione di domande a cui non è possibile rispondereindomande acuièpossibilerispondere. Lo scopodi tutte le trasformazioni, naturalmente, era quello di far sì che delle macchine si pongano autonomamente delle domande e vi rispondano. Per comprendere come è possibile che una macchina sappia quali domande prendere in considerazione nel leggere un giornale, vale la pena di vedere come le persone leggono le notizie. Se è vero che, come abbiamo sostenuto, le domande sono cosl importanti per la comprensione, allora dovremmo riuscire a trovare le domande che ci si pone nel corso della comprensio ne. Per discutere su questo punto, prendiamo in esame un articolo un po' insolito apparso sul New York Times domenica 14 aprile 1 985: Sedicenne recl utato dai Libanesi per condurre un'auto-bomba Gerusalemme, 13 Aprile - Un ragazzo l i ba nese di 1 6 a n n i è stato cattu rato d a l le truppe isra e l i a ne a lcune ore prima di sa l i re su u n ' a uto ca rica d i esplosivo e a n d a re poi i n m issione suicida contro i l q uartier generale dell'esercito israeliano i n Liba no, secondo le a utorità israel iane e i l racconto del ra gazzo stesso .
I l ragazzo, Moha m m ed M a h moud B u rro, è stato catturato da soldati israeli a n i d u ra nte un ra i d i n u n vi llaggio del Libano meridionale i l 23 feb b raio scorso. Pa re sia la prima volta che sia stato cattu rato vivo u n terrorista a d destrato per un attentato suicida .
238
Modelli di spiegazione
I nterrogato da g l i israeliani e i ntervistato dal N ew York Ti m es, egli ha raccontato della sua vita, del recluta m ento per la m issione suicida e del le persone per cui lavorava . I l racconto, se veritiero, fornirebbe per la pri ma volta u n a visione dall'i nterno delle motivazioni d i u n terrorista suicida, e della p rogettazione e organ izzazione che sta nno dietro q uesto tipo di operazioni. Benché non sia g i u nta alcuna conferma i n d i pendente del suo racconto, le a utorità m i l ita ri israeliane hanno ded icato g iorni i nteri a i nterroga re B u rro - ca pelli casta no chiaro e ricciol uti , i m berbe e i n tutto simile alle m i g l i a ia di ragazzini sciiti oggi per le strade d i Bei rut ovest . Hanno segreta me nte control lato pa recchi elementi chiave del racconto e in ciascun caso, d icono, h a n no ri levato che il ragazzo ha detto la verità o com unque non avrebbe potuto i nventa re ciò che diceva . " S iamo convi nti " , ha afferm ato una fonte m i l ita re, " che la sua storia sia vera " . Ha a gg i u nto che l ' a n n uncio ufficiale della cattu ra e del racconto del ra gazzo sa rebbe stato dato in Israele domenica matti na. Si pensa che B u rro resterà sotto la custodia israeliana per qualche tem po. Non è chiaro se il racconto d i Bu rro sia ra ppresentativo o meno d i q u a nto accade a coloro che sono stati coi nvolti nell'ondata di attentati con a utobombe suicide in Libano e in a ltre zone del Medioriente neg li u lti m i a n n i . Ma tre aspetti del suo racconto possono avere portata notevole a l fine d i comprendere il fenomeno degli attentati suicidi . Musulmano ma non fanatico
C iò che più col pisce nel racconto di B u rro è che, benché sia M us u l m a no sci ita , provenga da un a m b iente fam i liare non pratica nte. Passava i l tem po li bero non a pregare, ha detto, ma a g u i da re la sua moto e a gioca re a fl i pper. Secondo i l suo racconto egl i non era un fa natico pronto a morire per la ca usa lsla m ica o a ntisionista, ma è stato reclutato per la m issione suicida con altri m ezzi : il ricatto . l gruppi estremisti sci iti i n Libano e i n Iran hanno dato l ' i m p ressione che g li attacc h i suicidi fossero eseg uiti da persone devote a l la relig ione e desiderose di divenire marti ri . B u rro ha aggiunto che pa rte del suo addestra mento per la m i ssione era costitu ita da incontri con due ca pi rel i g iosi, evi dentemente per insti l l a re in l u i lo zelo rel igioso.
Capitolo 8: Qualche domanda finale
239
Non conosce g l i organizzatori
In secondo l uogo B u rro ha affermato di non conoscere la maggior pa rte delle persone che l ' h a n no recl utato o dato istruzioni fino al p u nto i n cui g l i sa rebbe stata portata la macch ina carica di esplosivo. I l suo racconto, se è esatto, sembrerebbe conferma re l ' ipotesi secondo la quale le persone che g u idano le a uto bom ba vengono reclutate con cura da ufficia l i dei servizi seg reti delle milizie l i b a nesi o dei governi mediorienta l i . Sem bra che la progettazione e la prepa razione vengano condotte d a esperti dei servizi seg reti che il conducente non conosce e che l ' a uto venga portata a l conducente solo a l l ' ultimo momento. Terzo, B u rro ha detto che g l i uom i n i che l ' hanno recl utato era no del la m i l izia sciita liba nese Ama i . La cosa pare degna di nota perché Ama i è considerata l 'orga n izzazione sciita li ba nese dom inante e q uella p i ù moderata e, mentre è ben nota la sua opposizione a l l ' occupazione israel i a na del Libano merid io nale, si ritiene generalmente che Amai faccia uso di metodi bellici p i ù convenzionali lascia ndo i cosiddetti metodi d a "fa natici " a l suo acerrim o rivale, i l fi loira n iano Pa rtito di Dio. Il racconto d i B urro potrebbe i n dica re che metod i terroristici che u n tem po parevano relegati a una frangia fa natica possa no conferm a rsi ogg i com e strumento di lotta accettato a nche dai g ruppi più moderati e dai servizi segreti d i stato. Dieci g iorni fa, sotto richiesta del Ti mes, che aveva sa puto tra mite a ltre vie della cattu ra d i B u rro, l 'esercito israeliano ha concesso u n ' i ntervista d i 90 m i n uti, i n u n ufficio d i Tel Aviv, senza alcuna interferenza ma i n presenza di personale m i l itare. L' i ntervista è stata rilasciata a concl usione del l ' i nterro gatorio di B urro da pa rte degli Israeli a n i . Venerdì, l' ufficio m i litare israeliano per l a censu ra ha conseg nato l ' i ntervista per la pubbl icazione, dopo averla letta e aver deciso che nulla a n dava cancellato. Burro era nervoso a l l ' i n izio del l ' i ntervista, i ntera mente condotta i n a ra bo ma, col tem po, si è rilassato e i nfi n e sembrava parlare li bera mente. B u rro, com e lo hanno defin ito le a utorità israelia ne, " non è che un ra gazzi no " . Ecco i l suo racconto.
(Ho omesso il racconto vero e proprio, che è interessante ma esula dai nostri scopi.)
240
Modelli di spiegazione
La l ettu ra dei m i e i studenti Secondo la mia premessa la lettura comporta la generazione di domande. In una occasione ho letto questa storia a una classe di laureati e ho chiesto loro di dar voce ad ogni domanda che venisse loro in mente mentre leggevo. Ci volle più di un' ora per leggere soltanto l ' introduzione alla storia che il ragazzo racconta. Ecco le domande che sono state generate, riportate nel punto in cui sono state poste, per la parte introduttiva dell 'articolo: Gerusalemme, 13 aprile - Un ragazzo libanese di 16 anni è stato catturato dalle truppe israeliane, alcune ore prima di salire su un 'auto carica di esplosivo e andare poi in missione suicida contro il quartiere generale dell'esercito israeliano in Libano, secondo le autorità israeliane e il racconto del ragazzo stesso.
Perché mai u na persona dovreb be suicidarsi se non è depressa ? Perché la n otizia ci pa rla solo d i a utobom be l i b a nesi ? Non ci sono a utobom be isra eliane? Questi ra gazzi ricordano i piloti kam i kaze nella seconda g uerra mondiale. Sono motivati nella stesso modo? Il ragazzo, Mohammed Mahmoud Burro, è stato catturato da soldati
israeliani durante un raid in un villaggio libanese il 23 febbraio scorso.
Perché mai tutti g l i Ara b i pare si chia m i no Moha mmed? Come fa nno gli Israel i a n i a sa pere dove fa re i loro rai d ? C o m e sa ra nno i ragazzi n i l i ba nesi rispetto a q uel l i a m erica n i ? Pare sia la prima volta che sia stato catturato vivo un terrorista addestrato per un attentato suicida.
Perché non era n o stati presi vivi pri m a ? C h e cosa pensa no i genitori d e i loro fig l i c h e vengono addestrati per d iventa re d i na m ita rdi suici d i ? C ' è u n g ru ppo politico c h e orga nizza i ragazzi? Questa storia fa pensare a O l iver Twist. C 'è forse u n Fa g a n l i ba n ese che prepara ra gazzi senza tetto a diventa re d i n a m itard i suici d i ?
Capitolo 8: Qualche domanda finale
24 1
Interroga to dagli Israeliani e intervistato dal New York Times, egli ha raccontato della sua vita, del reclutamento per la missione suicida e delle persone per cui lavorava.
Qua nto severo è stato l ' i nterrogatorio israelia no? Gli israeli a n i gli hanno sug gerito quello che doveva d i re? Perché gli israeliani h a n no permesso che i l Times lo intervistasse ? Il racconto, se veritiero, fornirebbe per la prima volta una visione dall'in terno delle motivazioni di un terrorista suicida, e della progettazione e organizza zione che stanno dietro questo tipo di operazioni.
Perché l'autore d ice " se veritiero " ? Perché a l l ' i m p rowiso i l Ti mes è così i nteressato a i terroristi? Non avrebbero potuto avere q uesta visione d a l l ' interno g ià m olto tempo fa ? I n Israele g l i psicologi non stud iano le motivazioni dei terroristi? Di certo devono avere u na visione più profonda di q uella che potremmo avere noi dall'anal isi di u n solo caso. C'è molto terrorismo a nche in Irlanda del Nord, ma là non si sente m a i parl a re d i adolescenti fanatici i n m i ssion i suicide. Perché? Il ragazzi no pensava che sa reb be morto? Benché non sia giunta alcuna conferma indipendente del suo racconto, le autorità militari israeliane hanno dedicato giorni interi a interrogare Burro - capelli castano chiaro e riccioluti, imberbe e in tutto simile alle migliaia di ragazzini sciiti oggi per le strade di Beirut ovest.
Perché a q uesto p u nto i l Ti mes ci dà una descrizione fisica ? Come sono i ra gazzi n i sciiti? Hanno segretamente con trolla to parecchi elementi chiave del racconto e in ciascuno, dicono, hanno rilevato che il ragazzo ha detto la verità o comunque non avrebbe potuto inven tare ciò che diceva.
Come si controlla un racconto "segreta mente " ? C he cosa h a n no control lato? "Siamo convinti", ha affermato una fonte militare "che la sua storia sia vera ". Ha aggiunto che l'annuncio ufficiale della cattura e del racconto del ragazzo sarebbe stato dato in Israele domenica mattina.
242
Modelli di spiegazione
Qual è l ' i m portanza d i "sapere " che la storia è vera ? La sta m pa israel iana sa di q uesta storia? Il com a ndo mil itare israel iano vuole farsi propaganda con questo fatto? Si pensa che Burro resterà sotto la custodia israeliana per qualche tempo.
Che conda nna g l i hanno i nflitto? Lo sca m biera nno con q ualcun a ltro? Perché il Ti mes ha dato così poco peso a questo aspetto? G l i israeli a n i lo processeranno come se fosse un a d ulto? l l i ba nesi lo considera no lega l mente responsabile? Non è chiaro se il racconto di Burro sia rappresentativo o meno di quanto accade a coloro che sono sta ti coinvolti nell'ondata di attentati con autobombe suicide in Libano e in altre zone del Medioriente negli ultimi anni. Ma tre aspetti del suo racconto possono avere portata notevole al fine di comprendere il fenomeno degli atten tati suicidi.
Quali sono le tre cose? Ciò che colpisce nel racconto di Burro è che benché sia Musulmano sciita egli provenga da un ambiente familiare non praticante.
Perché secondo i l Ti m es è interessa nte i l fatto che i l suo a m biente fa m i l ia re non sia pratica nte? Presume che i l fa natismo sia solo rel i g ioso? Perché il Times presume che un a m biente fa m i li a re non p ratica nte eviti i l fa natismo rel i g ioso? I n India molti fa natici rel i g iosi provengono da u n a m biente secolare. Passava il tempo libero non a pregare, ha detto, ma a guidare la sua moto e a giocare a flipper.
Non è forse vero che a nche i Weathermen provenivano da buone fa m i g l ie? Il fl i p per porta al terrorismo? Secondo il suo racconto egli non era un fanatico pronto a morire per la causa islamica o antisionista, ma è stato reclutato per la missione suicida con altri mezzi: il ricatto.
t p i ù facile ricatta re ragazzi ni? Chi li ricattava ?
Capitolo 8: Qualche do17Janda finale
243
Che cosa può fa re u n ragazzino così che l o si possa ricatta re? l gruppi estremisti sciiti in Libano e in Iran hanno dato l'impressione che gli attacchi suicidi fossero eseguiti da persone devote alla religione e desiderose di divenire martiri. Burro ha aggiunto che parte del suo addestramento per la missione era costituita da incontri con due capi religiosi, evidentemen te per instillare in lui lo zelo religioso. Qua nto durava no g l i i ncontri con i leader rel ig iosi ? A q uesto pu nto i l ragazzo ha acq u isito la g i usta qua ntità di zelo rel i g i oso? Perché ci sembra i m porta nte sapere com 'era motivato? Perché ai ricattatori i m porta che i terroristi dinam ita rd i sem b ri no persone rel i g i ose? Se i loro addestratori sono dawero dei fa natici della rel i g ione, perché non va n no loro a guidare le a uto bomba? Perché i tortu ratori ch iedono ca m biam enti prima d i g iustizia re i prigion ieri? Chi cercano d i inga nnare quei ricattatori ? In secondo luogo Burro ha a ffermato di non conoscere la maggior parte delle persone che l'hanno reclutato o gli hanno dato istruzioni fino al pun to in cui gli sarebbe stata portata la macchina carica di esplosivo.
Se i ricattatori non lo conosceva no, come hanno potuto attirarlo? Il suo racconto, se è esatto, sembrerebbe confermare l'ipotesi secondo la
quale le persone che guidano le auto bomba vengono reclutate con cura da ufficiali dei servizi segreti delle milizie libanesi o dei governi mediorientali.
Anche g l i a ltri conducenti di a uto bomba vengono ricattati? Chi ha ava nzato l ' ipotesi di cui si parla? Come fa una m i l izia a cerca re vitti me? Perché hanno scelto questo ragazzi no? Quali " govern i mediorienta l i " ? Sembra che la progettazione e la preparazione vengano condotte da esperti dei servizi segreti che il conducente non conosce e che l'auto venga porta ta al conducente suicida solo all'ultimo momento.
Dove prendono l'a uto?
244
Modelli di spiegazione
C h e cos'è che fa d i u n ' a uto u n a buona a uto bom b a ? Terzo, Burro h a detto che gli uomini che l'hanno reclutato erano della milizia sciita libanese Ama/.
Viene da pensare a i " d raga m i ne u ma n i " uti lizzati i n I ra n . Ai m usu l m a n i non i m porta n u lla dei giova n i ? Perché n o n c i sono terroristi cristi a n i ? l cristian i danno u n va lore diverso a l l a vita d e i g iova n i ? La cosa pare degna di nota perché Ama/ è considerata l'organizzazione sciita libanese più moderata e quella dominante e, mentre è ben nota la sua opposizione all'occupazione israeliana del Libano meridionale, si ritiene generalmente che Amai faccia uso di metodi bellici più convenzionali lasciando i cosiddetti metodi da "fanatici" al suo acerrimo rivale, il filoiraniano Partito di Dio.
Com'è che Amai si è fatta una reputazione " convenzionale " ? Amai riesce a controllare l e sue tru ppe? La g uerra convenzionale è " pi ù p u l ita " deg l i attentati d i n a m itardi s u icid i ? Perché u n ' a uto bom ba è considerata una buona tattica ? C he cosa fa d i così terribile i l Pa rtito d i D io? Il racconto di Burro potrebbe indicare che metodi terroristici che un tempo parevano relega ti a una frangia fanatica possano confermarsi oggi come strumen to di guerra accettato anche dai gruppi più moderati e dai servizi segreti di stato.
Con quale velocità ca m bi a no le tendenze terroristiche? Sono tendenze paragonabili a l la moda nell'abbiglia mento? C h i è il manda nte d i q uesti ca m bi a menti, e perché? Perché non awelenano le riserve d'acq u a ? Che cos' ha n no di speciale le a uto bom ba? C he cosa significa che u no strumento d i g uerra è fa natico? Dieci giorni fa, sotto richiesta del Times, che aveva saputo tramite altre vie della cattura di Burro, l'esercito israeliano ha concesso un 'intervista di 90 min uti, in un ufficio di Te/ Aviv, senza alcuna interferenza ma in presenza di personale militare. L 'in tervista è stata rilasciata a conclusione dell'in terro-
Capitolo 8: Qualche domanda finale
245
gatorio di Burro da parte degli israeliani. Venerdì, l'ufficio militare israeliano per la censura ha consegnato l'intevista per la pubblicazione, dopo averla letta e aver deciso che nulla andava cancellato.
Come ha fatto i l Ti mes a sa pere della cattu ra di B u rro? La presenza di tru ppe israel iane d u ra nte l ' i ntervista l ' h a i nfl uenzata ? Perché g l i israel i a n i era no presenti ? I l Ti mes si è i n qua lche modo accordato con gli israel i a n i ? Perché g l i israeliani h a n no concesso l ' i ntervista ? I n quale m isura g l i israeliani appl ica no la censura? Perché i l Ti mes ha accettato che venisse appl icata la censura ? Burro era nervoso all'inzio dell'intervista, in teramente condotta in arabo, ma, col tempo, si è rilassato e infine sembrava parlare liberamente. Burro, come hanno definito le autorità israeliane, "non è che un ragazzino ".
Viene i n mente u n ragazzino del N ica ragua che era stato i ntervistato dalla sta m p a . l ragazzi n i sono più adatti per questi tipi d i i nterviste? Tutta questa storia è vera ? Viene i n mente la storia diffusa dal Washington Post su un tossicod i pendente di 1 2 a n n i , che si rivelò p u ra fa ntasia . Come faceva no a sa pere che era nervoso? Perché l'hanno riportato? Da che cosa h a n no ca pito che pa rlava l i beramente?
Voglio presumere che la mia classe, benché composta di lettori più smaliziati e maggiormente orientati in senso internazionale rispetto a un lettore medio di quotidiani, sia comunque abbastanza rappresentativa di un lettore attento. Vale a dire che mi sento di poter presumere che le domande riportate siano rappre sentative di quelle che chiunque può generare leggendo un articolo di giornale che trova interessante. Dato che il tipo di domande riportate è in qualche modo rappresentativo del tipo che ci si può aspettare, allora il problema è semplice mente: Come generiamo domande di questo genere mentre leggiamo? In che modo queste domande guidano il processo di comprensione? Qual è il fine ultimo di queste domande?
246
Modelli di spiegazione
Fo rmazione d e l l e domande Un modo di occuparsi di come le domande vengano generate nel processo della comprensione consiste nel cercare di classificarle in modo da capire meglio perché siano state generate. Le domande date in precedenza si possono rag gruppare essenzialmente nelle seguenti categorie: Domande di raccolta dei dati (DRO) Rievocazione bottom-up/domande di creatività (DR/E) Interessi idiosincratici per la verifica delle ipotesi (DVI) Insuccessi delle aspettative/domande di spiegazione (DS)
Consideriamole una per una. Domande di raccolta dei dati (DRD) sono quelle presenti prima di iniziare a leggere un testo o che sono generate dalle cose comuni che accadono mentre si legge un testo. Prima di cominciare a leggere una notizia sul terrorismo, abbiamo già qualche idea, spesso molto generale, sull ' argomento. Abbiamo idee su un gran numero di soggetti diversi - viaggi in aereo, ambasciate, relazioni tra paesi, e così via - su cui in genere, di tanto in tanto, ci poniamo delle domande. Queste domande sono sempre in circolazione, per così dire, ed emergono quando appare un argomento a cui si collegano. Queste sono le domande che costituiscono i MOP (Memory Organization Packages, pacchetti di organizzazione della memoria) e i TOP (Thematic Organization Points, punti di organizzazione tematica). Esse rappresentano la somma totale delle nostre conoscenze su un soggetto, comprese le prevedibili lacune, perché dopo tutto non si può sapere tutto quello che c 'è da sapere su un certo argomento. Si è sempre pronti ad apprendere di più. Queste domande rappresentano la materia su cui si vuole apprendere, e da cui si cerca di apprendere quando un certo soggetto appare in un testo. Talvolta,questa materia non è in alcun modo disponibile a livello conscio per chi deve effettuare l'elaborazione. Improvvi samente questi si ritrova a notare qualcosa e a porsi delle domande in proposito. A questo punto si fa delle domande abbastanza specifiche da tornare indietro nel testo, o andare oltre, per scoprire ulteriori dati che gli permettano di ri spondere alla domanda. Rievocazione bottom-up/domande di creatività (DRIE) che non si trovano all ' inizio del processo di lettura. Sono cose che ci si presentano quando leggiamo, e sono spesso l'espressione dei nostri veri interessi. Ciò c he accade
Capitolo 8: Qualche domanda finale
247
è semplice da descrivere, se non da simulare su un computer. Un episodio che leggiamo ora ci rievoca un episodio passato. A questo punto sembra ragionevole seguire la rievocazione, il che significa cercare di apprendere qualcosa dalla combinazione dei due episodi. Spesso questo comporta chiedersi cosciente mente se i due fatti siano realmente correlati e se ciò che viene rievocato può fornire qualche contesto in base a cui capire meglio il testo elaborato. Questo processo genera domande del tipo: "Mi chiedo se x, che ricorre nel testo che sto elaborando, ricorre per le stesse ragioni di y nell'episodio di cui mi sono ricor dato". Domande come queste ci permettono di apprendere cose a cui non ci aspettavamo nemmeno di pensare, ma su cui avevamo riflettuto in qualche misura in precedenza. Quindi, per le DRD si può dire di essere stati interessati in generale al soggetto della domanda, laddove per le DRIE in un certo senso ci si sorprende di essersi posti domande sul soggetto . Gli interessi idiosincratici per la verifica delle ipotesi (DVI) sono simili alle DRD per il fatto che sono presenti prima che si cominci a leggere la notizia, e simili alle DRIE perché sono ricavati da elementi del testo in modo simile alle rievocazioni. Spesso si possiede un insieme di interessi che colorano ogni cosa che si osserva. È possibile vedere ogni cosa in termini di ingiustizia sociale, relazioni fra razze, sesso, aspirazione al successo, o qualunque altra cosa a cui si è interessati. Vediamo le informazioni in funzione dei nostri interessi. Se poi siamo interessati a dimostrare che le cose stanno come X e non come Y, ci ritroviamo capaci di vedere molti particolari di vasta portata come "ancora un altro esempio di X" mentre non riusciamo a vedere prove di Y che potrebbero essere ugualmente plausibili. Questa miopia si conserva attraverso le DVI. Queste sono essenzialmente domande perrievocare, che fanno sì che l ' informazione sia costruita e ricostruita finché la si vede come qualcosa che "ricorda naturalmente uno degli X", dove X, guarda caso, è proprio una delle ipotesi favorite. Le domande generate, a questo punto, sono proprio come le DRIE, per il fatto che sono domande per l'uso di una situazione precedente al fine di spiegare quella in corso di elaborazione. Insuccessi delle aspettative/Domande di spiegazione (DS) sono natural mente i nostri vecchi amici del capitolo 4. In questo contesto il loro ruolo è ancora lo stesso. Quando si elabora un testo, è necessario collegare i fatti alle proprie esperienze. Quando queste esperienze non sono sufficientemente ampie da permettere la comprensione di una parte del testo, si rende necessario un
Modelli di spiegazione
248
tentativo di spiegare ciò che non si è riusciti a comprendere. Perciò generiamo domande il cui compito è far venire in mente gli MS come spiegazioni potenziali che debbono essere applicate alla situazione nuova. Le DS procedono quindi in senso ascendente (bottom-up) analogamente alle DRIE. Comunque, in questo caso non ci si ricorda di esempi specifici ma di spiegazioni standard generali. Come abbiamo visto, le D S generano domande particolari. Quindi le D S non ricevono una risposta diretta, bensl generano nuove domande il cui compito è rendere comprensibile ciò che è attualmente incomprensibile. In sintesi, quindi, le DRD sono per i problemi quotidiani che riguardano l ' ampliamento generale della propria conoscenza. Le DRIE riguardano le nuove idee creative che accade di trovare per caso osservando le connessioni di vari eventi, possibilmente molto poco correlati . Le DVI servono a rinforzare con nuovi dati le proprie convinzioni. Le DS hanno lo scopo di generare domande specifiche il cui intento è rendere comprensibile ciò che è incomprensibile. Il metodo più comune per farlo è l 'adattamento di un MS alla nuova situazione. In altre parole il compito di queste domande è permettere a un lettore di apprendere da ciò che legge. L'apprendimento ha quindi quattro forme: Tipo di apprendimento
Tipo di domanda corrispondente
Raccolta di dati
DRD
Combi nazione creativa
D Rl E
Estensione del l e convinzioni
DVI
Adatta mento creativo delle struttu re esistenti a l le nuove situazioni
DS
Tenendo presente questa classificazione, osserviamo alcune di queste domande più attentamente. Consideriamo, per esempio, il primo insieme di domande derivate dalla frase iniziale della notizia: 1 . Perché qua lcuno dovrebbe suicida rsi se non fosse i n uno stato di depressione? 2. Perché l e notizie ci riferiscono solo di a uto bomba Liba nesi ? Ci sono a uto bomba i sraeliane? 3. Questi ragazzi ci ricordano i ka mi kaze della I l g uerra mond iale. Sono motivati nello stesso modo 7
Capitolo 8: Qualche domanda finale
249
Possiamo pensare che la domanda l (D l) sia stata generata nel tentativo di applicare un MS standard sul suicidio e che, dopo l 'insuccesso delle condizioni in ingresso per questo modello, sia stata generata una DS che a sua volta ha generato una domanda specifica il cui intento era l'estensione dell' MS standard. A prima vista non è evidente da dove provenga 02 . Dopo tutto, stiamo cer cando di capire qualcosa che è piuttosto difficile da afferrare. Chi ha posto questa domanda ne ha formulate in realtà molte che hanno un tema comune, ovvero i pregiudizi del New York Times sulla situazione del Medio Oriente. Sostengo perciò che 02 è una DVI. 03 è un esempio piuttosto interessante di DRIE. Lo studente si è ricordato dei kamikaze, e ha cominciato a riflettere. Il risultato di questa DRIE è quello di produrre una serie di DRO il cui compito sarà raccogliere abbastanza dati per cercare di verificare le DRIE. (Vorrei far notare che a questo punto le DRIE e le DVI diventano indistinguibili: in effetti, le DVI e le DREM sono domande dello stesso tipo che hanno, però, origini in memoria completamente diverse.) 4. Perché sem bra che tutti gli a ra b i si chia m i no Mohammed? 5 Come fa n n o g l i israel iani a sa pere dove fare i l loro ra id? 6 Come son o i g iova n i l i banesi rispetto a quelli america n i ?
I n questa serie troviamo alcune domande d i natura apparentemente molto diversa. In effetti, D4 è una tipica DRO. Non sbaglieremmo certo di molto di cendo che quella domanda rivela una sorta di ipotesi dello studente che, ovviamente, gli aveva attraversato la mente. Nell'elaborare la notizia, lo studente doveva collocare l'informazione in un'opportuna casella in memoria. Così facendo, ha trovato altre notizie simili e ha notato una somiglianza superficiale su cui si è posto qualche interrogativo, generando così la DRD. Analogamente, anche 05 e 06 sono DRD. Presumibilmente, non erano do mande che circolassero già in qualche modo nella mente del lettore. Esse rappresentano perciò una sottoclasse di DRO che chiamerò DRO di amplificazione del testo (DRD-AT). Le DRD-AT sono funzionalmente identiche alle altre DRD, ma la loro origine è soltanto nel testo. Per questa ragione tendono ad essere piuttosto effimere, e le loro risposte tendono a essere dimenticate piuttosto velocemente. Non essendoci un precedente contesto in cui collocare la risposta, non rap presentano una forma molto potente di apprendimento. Sono un tipo di "curio sità futile". L 'insieme successivo è un po' più interessante: 7.
Perché prima non sono stati cattu rati vivi?
Modelli di spiegazione
250 8.
C he cosa pensano i genitori d e l suicida dell'addestra mento d e l figlio per q uesta attività?
9.
C ' è u n g ru ppo politico c h e organ izza i ba m b i n i ?
1 O.
Questa n otizia m i ricorda Oliver Twist. C'è q ualche Fagan Libanese che orga nizza i ba mbini senza casa per farli d iventa re dei suicid i ?
D7 è u n po ' sciocca, perché è evidente che i suicidi muoiono. Comunque, la domanda che sta dietro a questa, ovvero perché questo caso fosse diverso e il ragazzo non sia morto, è veramente una delle domande chiave della storia complessiva. Questa è veramente una DS che ci si può aspettare emerga pe riodicamente mentre si legge la notizia. Per dirla in altro modo, durante la lettura di una notizia interessante talune DS divengono domande chiave che guidano tutte le altre. Se siamo proprio interessati a questa notizia, vogliamo sapere perché quel ragazzo non sia morto. Cioè, dato il modello di spiegazione i fa natici commettono atti suicidi per promuovere una causa , per tutto l'articolo ci troviamo a chiederci in quale punto modificare questo MS che, in questo caso, sembra non abbia avuto successo. In un certo senso, possiamo definire l 'interes se in questo modo: l'interesse è la necessità di rispondere a una domanda generata con l'intento di correggere una aspettativa insoddisfatta . In questo caso un intero MS ha fallito. D8, "Che cosa pensano i genitori del suicida dell 'addestramento del proprio figlio per questa attività" è effettivamente una domanda molto interessante perché è strettamente collegata a un MS che è venuto meno ed è essa stessa una DS . C'è un MS chiamato i genitori spingono i bambini fuori dal nido perché comincino a lavorare, che qui sembra fallire completamente perché le sue motivazioni sono "preparare i figli a camminare con le proprie gambe" che in questo caso sembrano eluse. È quindi naturale chiedersi perché i genitori di quel ragazzo gli abbiano permesso di diventare un attentatore suicida. Cosi la domanda ora ha l 'aspetto di una DS . Si vuole sapere come sia stato possibile, ed emerge il bisogno di un MS per spiegarlo. D9 e D I O sono versioni diverse della stessa domanda; entrambe si collegano al problema generale di che cosa stia succedendo. D I O è un po' più interessante sotto questo aspetto perii fatto di essere una DRIE e quindi, per via di rievocazione, propone essenzialmente una soluzione del problema. La rievocazione sugge risce che c'è una risposta alla domanda del perché i giovani si mettano alla guida delle auto bomba; la risposta è che c'è un personaggio come Fagan che li raccoglie. In altre parole l ' MS gli uomini malvagi usano i bambini bisognosi
Capitolo 8: Qualche domanda finale
251
per i propri fini, che ha Oliver Twist come episodio collegato, viene proposto come risposta potenziale alla DS "Come possono i genitori permettere che succeda questo?"L' MS proposto poi può essere valutato nei termini della sua applicabilità. Ma (e questo è il punto importante), a differenza del caso in cui dovevamo valutare un modello solamente su una base interna, nell'elaborazione di un testo di linguaggio naturale possiamo operare una scelta. Possiamo cioè rinviare ulteriori decisioni fino all'arri vo di nuove frasi del testo. Detto altrimen ti, l'elaborazione di un testo si può vedere come l'emergere di nuove domande derivate dal testo, a cui è possibile rispondere attraverso l'esame ulteriore del testo stesso. Quindi, invece di avere un insieme arbitrario di domande scelte in anticipo che governano la lettura di un testo, le domande vengono scelte e sviluppate dinamicamente, non appena nasce il bisogno di elaborare spiegazioni e risulta c hiaro che non si riescono a trovare MS che fungano da risposte. Si può quindi vedere la comprensione di un testo in linguaggio naturale come un processo per mezzo del quale si cerca di apprendere dal testo tentando di spiegare ciò che si è letto; quando una spiegazione non è disponibile, si costruisce un insieme di domande che, se ricevessero una risposta, spiegherebbero il testo rendendolo perciò comprensibile. Nel mezzo di questo processo, si verificano tre altre cose. Primo, vengono raccolti i dati per il problema generale dell'espansione della propria base di conoscenza. Secondo, le ipotesi già esistenti su una vasta gamma di problemi vengono verificate attraverso l'input, man mano che arri va. Terzo, vengono sviluppate le rievocazioni, che si presentano in modo casuale, come modi creativi possibili per trarre conclusioni dal testo, in accordo con analogie e generalizzazioni derivate da esperienze precedenti. La comprensione, perciò, è un processo dinamico guidato da domande, e viene modificato sia dalle risposte a quelle domande sia dalle esigenze del nuovo input in arrivo.
Il p rocesso d i trasformazione delle domande In un certo senso, perciò, il fine di questa ricerca si deve collegare alla natura delle domande, al loro uso nell'elaborazione delle spiegazioni e alla trasforma zione di queste domande nella ricerca di risposte.
252
Modelli di spiegazione
La domanda con cui abbiamo iniziato era: Come si può dire che una macchina capisca ?
che si è trasformata in: Come fanno le persone a spiegare ciò che hanno capito?
che si è trasformata in: Perché le persone elaborano spiegazioni?
e questa in: Quali tipi di spiegazioni ci sono?
Alla fi.ne queste sono diventate: Qual è la na tura del processo di spiegazione?
Quindi ci siamo chiesti Quale insieme standard di domande può awiare il processo di spiegazione?
e C'è un insieme standard di risposte collegate a queste domande?
Abbiamo poi aggiunto un 'altra domanda: In che modo il processo della spiegazione produce spiegazioni creative?
Da qui abbiamo tratto la domanda: Come potrebbe cambiare la comprensione ordinaria dei testi se la conside rassimo guidata dal processo di generazione delle domande?
Questo libro ruota essenzialmente su se stesso. Non possiamo parlare di apprendimento, spiegazione, e comprensione, senza trasformare costantemente la domanda originale e arrivare alla fine al problema di come si trasformino esattamente le domande. Naturalmente, non c'è un metodo sistematico corretto per la trasformazione delle domande. Se ci fosse, potremmo prendere una domanda e trasformarla istantaneamente in una domanda corretta a cui sia più facile rispondere. Debbono esserci invece delle euristiche che aiutino a rendere più facile una domanda trasformandola, quando sembri difficile rispondervi. Naturalmente queste sarebbero euristiche totalmente interne, perché trasformerebbero le do-
Capitolo 8: Qualche domanda finale
253
mande senza curarsi dei problemi esterni. Riguardo al testo che abbiamo considerato finora, è chiaro che anche le circostanze esterne possono trasforma re le domande. Devono quindi esistere anche euristiche esterne, per mezzo delle quali le nuove informazioni possono trasformare una domanda esistente in una a cui sia più facile rispondere. Infine, possono esserci trasformazioni provenienti da influenze esterne, per esempio da amici durante una conversazione, che, senza dare regole di tra sformazione, servono a trasformare le domande. Abbiamo quindi tre cose che trasformano le domande. Con quale fine? Per far sì che sia più facile rispondere a una domanda; per rendere una domanda più specifica; per rendere una domanda più generale; per rendere una domanda più utile, e così via. In altre parole, le domande stesse hanno obiettivi, e questi obiettivi guidano il processo di formulazione delle domande. Gli obiettivi delle domande che abbiamo considerato qui servono tutti a spiegare meglio qualcosa, o a spiegare qualcosa in modo nuovo. Così, ogni volta che abbiamo parlato di euristica di trasformazione delle domande, l 'abbiamo fatto con quel fine in mente. In sintesi, perciò, questo libro si è interessato a come si possano trasformare le domande di spiegazione in domande a cui è più facile rispondere. A questo fine, possiamo dare un altro sguardo a ciò che abbiamo detto, vedendo il tutto in questa prospettiva. Quella che segue è una rassegna delle regole che abbiamo presentato in questo libro, ma in una prospettiva leggermente diversa. Sostenia mo che, per ottenere nuove idee, è necessario porre la domanda giusta. Se questa idea non è nuova per la scienza, lo è per l ' lA, almeno nel modo in cui la presento qui. Suggerisco cioè che le macchine debbano imparae a fare buone domande. Una parte importante nella formulazione della domanda giusta è la trasfor mazione di una domanda iniziale originale in una a cui è più facile rispondere. Diamo quindi uno sguardo ad alcune delle regole di trasformazione delle domande che abbiamo presentato implicitamente in questo libro e agli obiettivi che vi stanno dietro.
G l i obiettivi d ietro a l l e domande Abbiamo discusso come le spiegazioni siano pensate, in linea di principio, come additive. Uno degli obiettivi che stanno dietro al processo di trasformazione delle domande è quello di cambiare la domanda in una la cui risposta aggiungerà informazioni alla base di dati; chiamiamo questa regola TD 1 .
Modelli di spiegazione
254 TD 1 :
Cambiare la domanda in un 'altra la cui risposta aggiunga informa zione alla base di dati.
Questa è opposta a TD2:
TD2,
intesa a ridurre una domanda:
Cambiare la domanda in un 'altra a cui sia molto facile rispondere forzando una corrispondenza fra l'elemento che deve essere spiegato e un elemento che è già stato spiegato.
In base allo spettro dei bisogni del capitolo 3 , possiamo vedere che alcuni
operatori di trasfonnazioni di domande dipendono dal bisogno che li guida. Quindi, un tipo di obiettivo dietro a una trasfonnazione di domande è quello di cambiare la domanda in un'altra domanda che si riferisce a un bisogno corrente. Abbiamo quindi TD3 e TD4: TD3:
Se c'è il bisogno di empatizzare, trasformare la domanda in un 'altra il cui obiettivo sia trovare una situazione in memoria analoga a quella in esame.
TD4:
Se c'è il bisogno di fare una previsione, trasformare la domanda in un 'altra il cui obiettivo sia trovare un problema simile a quello in esame in modo da usare la soluzione del problema più vecchio nel caso nuovo.
Abbiamo poi in generale TD5 e TD6: TD5:
Quando si deve giustificare un problema, trasformare la domanda relativa al problema in una richiesta di ricerca in memoria per trovare una credenza giustificativa per quel problema.
TD6:
Quando un problema richiede una soluzione, trasformare la domanda sul problema in una richiesta di ricerca in memoria per trovare una rievocazione che guiderà una soluzione per analogia.
Nel capitolo 3 , abbiamo visto che erano attivi in realtà tre obiettivi fondamentali, e così vi sono tre tipi fondamentali di trasfonnazioni di domande che sono applicabili: TDl:
Trasformare la domanda originale sul perché X sia awenuto in: come posso prevedere correttamente il risultato di situazioni come X, la prossima volta?
Capitolo 8: Qualche domanda finale
255
TD8:
Trasformare la domanda originale sul perché X sia awenuto in: come posso correttamen te prevedere il ripresentarsi di X com prendendo il ragionamen to dell'a ttore in X?
TD9:
Trasformare la domanda originale sul perché X sia awenuto in: cosa avrei dovuto sapere per prevedere che X sarebbe awenuto?
Abbiamo inoltre discusso alcuni degli altri obiettivi che stanno dietro alle spiegazioni, e che corrispondono ai seguenti obiettivi di trasformazione delle domande: TD 1 0:
Trasformare la domanda sul fatto che sia accaduto qualcosa di positivo a X in: N Come posso far sì che questo succeda a me r.
TD 1 1 :
Trasformare la domanda sul perché sia accaduto qualcosa di negativo a X in: Tome posso evitare che questo succeda a me? ".
Abbiamo visto inoltre che le persone sanno (e perciò devono saperlo anche le macchine) trasformare "domande sul perché" in domande che si riferiscono ai particolari della catena credenza-azione. Abbiamo quindi: TD 1 2:
Trasformare una doma nda sul perché in una domanda sulla credenza che sta alla base un 'azione.
TD 13:
Trasformare una domanda sul perché in una domanda sul l'obiettivo che sta alla base di un 'azione.
TD 1 4:
Trasformare una doma nda sul perché in una domanda sul piano che sta alla base di un 'azione.
Nel capitolo 3 abbiamo anche discusso dei piani. Abbiamo visto che debbono essere trasformate anche le domande sui nuovi piani creativi: TD 1 5:
Se hai bisogno di un nuovo piano, cerca di ricordarti di un piano vecchio e modificato per ada ttarlo alla nuova situazione.
Abbiamo anche visto delle trasformazioni piuttosto povere: TD 1 6:
Per trovare una spiegazione paranoide, trasformare la domanda in un 'altra che collega il fa tto che bisogna spiegare col soggetto della paranoia.
256
TD 1 7:
Modelli di spiegazione Per trovare una spiegazione quasi-scientifica, trasformare la domanda in un 'altra che colleghi l'even to che bisogna spiegare con un altro simile e generalizzare.
In generale, quindi, possiamo vedere che queste regole collegano gli obiettivi, che si hanno nel costruire una spiegazione, ai metodi disponibili per cambiare una domanda piuttosto generale in un'altra che ha maggior probabilità di soddisfare l' obiettivo. Una macchina deve essere fornita di euristiche per trasformazioni di questo tipo, ma naturalmente per rendere effettive simili euristiche è necessario aggiungere due cose. Primo, le regole debbono essere molto più numerose e specifiche. Secondo, debbono collegarsi direttamente alle regole di ricerca che corrispondono alla struttura della base di dati. Le regole esposte sopra sono in effetti piuttosto generali, e quindi non molto utili. Le presento qui per dare un'idea del tipo di regole che bisogna creare per dare alle macchine la capacità �i domandare e spiegare. C 'è una serie di trasfromazioni di domande insita anche nel processo di spiegazione. Per esempio, l' obiettivo di scoprire un' anomalia guida anche il processo di trasformazione delle domande: TD 1 8:
Per stabilire se un 'azione è anomala, cambiare la domanda iniziale in un 'altra il cui intento sia scoprire se l'azione è fra quelle che solitamente l'a ttore compie.
TD 1 9:
Per stabilire se un 'azione è anomala, cambiare la domanda iniziale in un 'altra il cui intento sia scoprire se l'azione è fra quelle che faremmo noi.
TD20:
Per stabilire se un 'azione è anomala, cambiare la domanda iniziale in un 'altra il cui intento sia scoprire se l'azione giovi all'a ttore.
TD2 1 :
Per stabilire se un 'azione è anomala, cambiare la domanda iniziale in un 'altra il cui intento sia scoprire se l'azione faccia parte di un piano coerente.
TD22:
Per stabilire se un progetto è anomalo, cambiare la domanda iniziale in un 'altra il cui intento sia soprire se il piano sia al servizio di un obiettivo che l'attore potrebbe avere.
Capitolo 8: Qualche domanda finale
TD23:
257
Per stabilire se un obiettivo è anomalo, cambiare la domanda iniziale in un 'altra il cui intento sia soprire se c'è una convinzione in possesso dell'a ttore che potrebbe motivare l'obiettivo.
In generale, uno degli obiettivi principali della trasformazione di domande è: TD24:
Per stabilire se un 'azione è anomala, cambiare la domanda in un 'altra che stabilirà quale struttura in memoria potesse fornire l'aspetta tiva di questa azione e se ci siano ragioni per credere che quella struttura fosse attiva.
Gli obiettivi che stanno alla base del processo di spiegazione sono, natu ralmente, anche obiettivi che sottostanno al processo che sta dietro al processo di trasformazione delle domande: TD25:
Per stabilire se un 'azione è anomala, cambiare la domanda in un 'altra il cui intento sia stabilire se l'a ttore ha qualcosa di coerente in men te.
TD26:
Per spiegare un evento, trovare il contesto naturale per quel l'evento nella catena credenza-azione.
TD27:
Per spiegare a fini di comprensione futura, cercare nuove regole predittive per il comportamento di un individuo dato.
TD28:
Per comprendere le azioni degli individui, cercare regole pre dittive che valgano per i gruppi dei quali sono membri.
TD29:
Per sapere come operare meglio nel mondo, trovare e copiare le regole degli altri che sembrano efficaci.
Nel capitolo 4 abbiamo presentato un insieme di domande di spiegazione. Da un certo punto di vista, tutte le domande di spiegazione presentate erano in realtà trasformazioni di una domanda originale, ovvero "Qual è la spiegazione di questo fatto?" Questa domanda può essere trasformata in almeno 63 modi, 24 dei quali già discussi. Non c 'è bisogno di elencare ancora le DS; per dare un ' idea di ciò che intendo ne elencherò quattro, presentate come TD: TD30:
Per spiegare un evento, cambiare la domanda iniziale sul perché qualcuno abbia fatto qualcosa in un 'altra che riguardi le priorità degli obiettivi dell'attore nell'even to.
258
Modelli di spiegazione
TD3 1 :
Per spiegare un evento, scoprire il ragionamento della persona o dell'istituzione che in genere controllano l'attore in un evento di questo tipo.
TD32:
Per spiegare un evento, porre domande sui gruppi di cui l'attore dell'evento è membro, per vedere se i membri del gruppo partecipano di frequente a questo tipo di evento.
TD33:
Per spiegare un evento, cambiare la domanda in un 'altra che riguardi le conseguenze dell'evento vantaggiose per l'attore.
Finora, abbiamo visto che le TD sono essenzialmente di due tipi. Il primo tipo sembra tratto di peso dal manuale del buon investigatore, per quel che riguarda dove cercare l ' autore di un crimine. Come abbiamo visto nei primi capitoli, alla fine ci troviamo sempre a dover mettere l 'accento sulle convinzioni, gli obiettivi, i progetti che stanno alla base di un' azione, con il consiglio di lavorare a ritroso, partendo dai risultati di un'azione. Stando così le cose, si può notare che un evento ha una struttura molto complessa alle sue spalle; spiegare quell'evento significa in realtà completare quella struttura con gli aspetti che non si sono già capiti. Ciò che quindi abbiamo sono euristiche riguardanti il dove si possano trovare i tasselli di informazione che servono a completare il quadro nel suo insieme. Il secondo tipo di TD ci induce a considerare, in luogo di quella vecchia, una domanda completamente nuova che potrebbe illuminarci sulla domanda originale attraverso un'analogia. Questo è vero in particolare per le TD che riguardano il processo di estensione o tweaking. Naturalmente anche le regole di estensione sono regole di trasformazione delle domande. Per esempio abbiamo: TD34:
Per trovare una risposta a una domanda, allentare i vincoli per l'appartenenza a un insieme e porre una domanda diversa.
TD35:
Per trovare un modello che possa applicarsi, se può darsi che l'attore può abbia compiuto l'azione, chiedersi se possa averla fa tta qualcun altro.
TD36:
Se si può applicare una regola, chiedersi se si può applicare anche quella con traria.
Naturalmente, non c 'è molto da imparare dall'elenco di tutte le TD a cui si può pensare. Devono esistere molte altre regole TD come quelle esposte. Ci sono tantissime regole particolari che le persone usano nella loro ricerca quotidiana
Capitolo 8: Qualche domanda finale
259
di informazioni. Molte di esse hanno lo stesso "sapore" dei consigli che si danno ai bambini su come pensare correttamente. Naturalmente è proprio questo il punto. Come può un computer avere un'intelligenza senza tali euristiche? Se sono il tipo di regole che bisogna dare a un bambino, allora bisogna darle anche a una macchina. Consigli utili su dove cercare e come cercare l'informazione fanno parte dell'addestramento di studenti, bibliotecari, investigatori, avvocati, e così via. Le persone imparano a porre domande in entrambi i sensi che normalmente associamo alla parola apprendimento. Le persone apprendono le TD che ven gono dette loro, e che scoprono. Per far sl che un computer conosca queste regole, la cui necessità dovrebbe ora essere abbastanza chiara, bisognerebbe sia immetterle nella macchina sia fornire alla macchina le tecniche attraverso le quali scoprire nuove regole e nuove informazioni. Molte di queste regole riguardano la saggezza popolare che le persone hanno, ma che anche le macchine intelligenti dovrebbero avere. Un gran numero di proverbi, per esempio, condensano proprio questo tipo di saggezza in frasi brevi che intendono aiutare le persone a porre la domanda giusta al momento giusto. Sono queste le cose che sa la nonna? Certo. Comunque la nonna ha moltissime conoscenze che un computer non ha. Gli scienziati che studiano i processi mentali non necessariamente capiscono bene cos 'è che la nonna sa o come questa conoscenza venga usata. Se l 'lA deve essere il soggetto del processo di controllo delle "conoscenze della nonna" allora così sia. Le "conoscenze della nonna" sono assai più complesse di quanto si potrebbe pensare. Se il nostro obiettivo è sapere dove cercare una spiegazione, allora "le conoscenze della nonna" sono probabilmente cruciali. Forse le regole per il pensiero creativo sono strettamente legate anche alle "conoscenze della nonna". Se le cose stanno così, linguisti e filosofi non saranno certo interessati a elencare queste conoscenze, ma lo saranno sicuramente i ricercatori che vogliono costruire macchine intelligenti e gli psicologi che vogliono conoscere le regole da cui deriva il comportamento intelligente.
Concl usione Nel senso che comunemente si attribuisce al termine, una spiegazione è un insieme di parole, che una persona rivolge ad altri, che trasformano qualcosa di incomprensibile in qualcosa di comprensibile. Abbiamo visto però che una spiegazione è più simile a una struttura di conoscenza tipica dell' uso comune
260
Modelli di spiegazione
quotidiano. Il ruolo di una struttura di conoscenza come un copione, un piano, o un MOP, è trovare per un nuovo input una collocazione che permetta di interpretare, o rendere comprensibile quell 'input per mezzo di un insieme di eventi, assimilati in precedenza, che lo contengano. In quest'ottica, il processo di spiegazione ci appare sostanzialmente identico a quello della comprensione comune. In entrambi i casi, un nuovo input viene messo in corrispondenza con input precedentemente elaborati e da questi viene interpretato. La differenza è che, nella comprensione comune, i nostri processi mentali non ci sono cosl trasparenti come quando ci spieghiamo qualcosa o ci viene spiegato qualcosa. Il processo di spiegazione comporta il rendersi conto che non è disponibile una struttura di conoscenza già pronta e che bisogna fare un po' di lavoro straordinario. Non è interessante considerare cosa succeda quando qualcun altro ci fornisce una spiegazione. Il caso interessante invece si ha quando, in un primo momento, non riusciamo a capire qualcosa e poi riusciamo a costruire quella che riteniamo una spiegazione plausibile, che almeno temporaneamente ci fa credere di aver capito ciò che prima era incomprensibile. In un certo senso, che qualcuno ci dia una risposta è spesso una perdita di tempo. Il processo di costruzione di una spiegazione innesca il processo di apprendimento facendo sl che emergano delle domande che ci si può continuare a porre per molto tempo, anche dopo che è stata fornita una prima risposta. Conoscere l 'unica e sola risposta può mettere termine al processo. Quindi, per capire il processo dell' apprendimento e della comprensione, la domanda che ci dobbiamo porre è come costruiamo spiegazioni. A un primo sguardo sembrava che il processo di costruzione della spiegazione fosse molto complesso. Dopo tutto, la spiegazione di un evento incomprensibile può spesso essere molto creativa e piuttosto originale. Sicuramente questo comportamento originale deve essere molto complesso, ma perché dovrebbe essere più com plesso della comprensione stessa? Ricordo che, secondo la nostra visione della comprensione, per capire è necessario accedere a una struttura di memoria pertinente e quindi applicarla alla situazione in esame. La complessità di questo processo sta innanzitutto nell' accedere alla giusta struttura. Il problema è stabilire quali caratteristiche e quali aspetti della situazione sono indicativi della struttura di conoscenza corretta a cui accedere. I segnali che vanno dagli utensili tipici di una data azione (si consideri, per esempio, il titolo di un articolo di Chamiak, 1 977, "With fork in hand this must be the eating frame") fino all 'accostamento di obiettivi in competizione, possono aiutarci a isolare la giusta struttura di conoscenza. Il
Capitolo 8: Qualche domanda finale
26 1
problema della comprensione è l'indicizzazione. Dobbiamo poter astrarre gli indizi dalla situazione che elaboriamo, e usarli per accedere a una struttura di conoscenza che avevamo memorizzato in precedenza usando quei segnali. Per capire, perciò, dobbiamo sapere come indicizzare e come analizzare le nuove situazioni nei termini di quegli indici. E riguardo alla spiegazione? Cosa dobbiamo fare per spiegare? È in gioco proprio lo stesso processo. Spiegare significa trovare una struttura di conoscenza pertinente utile per interpretare il nuovo input. Come si differenzia quindi dal processo di c ompren sione in generale? La differenza è piuttosto semplice. Nel corso della c ompren sione, quando si accede a una struttura di conoscenza, c'è una risposta giusta. C'è il miglior adattamento possibile, nei termini di una struttura di conoscenza appropriata. Quando si viaggia in autobus, si deve usare solo il copione del viaggio in autobus e nessun altro. Sarebbe sbagliato usare un qualunque altro copione. Se non avessimo un copione per gli autobus, forse un copione per il treno ci aiuterebbe; in questo caso il copione dei treni è una sorta di ipotesi che in effetti ci dice che forse gli autobus sono abbastanza simili ai treni perché si possano adattare a un dominio informazioni provenienti dall'altro. L 'idea che le vecchie spiegazioni siano ipotesi per nuove situazioni avvia il processo di spiegazione; e come abbiamo visto, l 'idea che le vecchie spiegazioni si possano adattare a nuovi usi avvia il processo della creatività. In altre parole, spiegare qualcosa significa cercare di adattare una strut tura di conoscenza non completamente appropriata . Nelle situazioni rela tivamente lineari, questo significa cercare di adattare una precedente struttura di conoscenza, che sembra solo parzialmente pertinente alla situazione corrente, in modo che ci aiuti ad elaborare questa situazione. Ho discusso in precedenza questo fenomeno, ovvero la rievocazione (reminding). La rievocazione si presenta quando ciò che è inconscio diviene conscio. In questa condizione, cioè, quando non esiste alcuna struttura di conoscenza applicabile e si deve cercare la migliore soluzione prossimata, si ha rievocazione quando questa miglior soluzione approssimata non è poi tanto vicina. La ragione per cui si presenta questo fenomeno è evidente. Se una struttura nuova deve essere adattata a una situazione diversa, può succedere che non sia appropriata. La possibilità che ciò accada è abbastanza grande, ed è quindi importante che la mente consideri consciamente questa scelta. In altri termini, la rievocazione fa sl che vengano portate ali ' elaborazione cosciente strutture di conoscenza possibili, quando esiste la possibilità che la struttura candidata non sia appropriata. Cosl, possiamo vedere come la spiegazione sia proprio un processo più
262
Modelli di spiegazione
conscio in cui si cerca di esaminare i candidati uno alla volta, in modo da stabilirne la pertinenza. La tesi dunque è questa: c'è continuità fra comprensio ne, rievocazione e spiegazione. Spiegazione significa prendere una struttura di conoscenza completamente inappropriata e adattarla alla situazione corrente. Si può allora pensare che la spiegazione sia più difficile della comprensione comune solo nel senso seguente: la spiegazione richiede una procedura at traverso cui portare alla mente le strutture di conoscenza possibili e mani polari e in modo da vedere se saranno utili nella situazione corrente . Le spiegazioni non sono veramente originali. Ciò che è originale è l'uso di una struttura di conoscenza non appropriata in una situazione nuova e l 'adatta mento di questa struttura in modo da farla funzionare nella situazione nuova. La parte difficile della spiegazione è la ricerca e l'accettazione o il rifiuto di strutture in situazioni nuove. Quali sono allora le strutture peculiari della spiegazione stessa? Sarebbe ragionevole ipotizzare che le spiegazioni operino senza alcuna struttura pecu liare. Poiché le spiegazioni si basano invece su strutture di conoscenza prece dentemente impiegate, non dovrebbero richiedere, almeno in linea di principio, alcuna particolare struttura propria. Le cose, però, non vanno proprio così. Perché no? In linea di principio è possibile adattare qualunque struttura vecchia per nuovi scopi, ma, quando la comprensione non riesce, quando non abbiamo alcuna struttura che ci aiuti a capire, dobbiamo ricorrere all'adattamento di qualche altra struttura. Poiché cose di questo genere succedono continuamente, deve esistere qualche struttura il cui fine sia proprio essere usata in queste situazioni. Poiché le difficoltà di comprensione sono frequenti, ci si aspettereb be di trovare qualche metodo standard per trattare questi insuccessi. Esiste un insieme standard di strutture di conoscenza vere e provate che si sono evolute nella base di conoscenza degli individui proprio per far fronte a questa situazione. Queste strutture sono utili per la comprensione di eventi ordinari e anche per l'adattamento alle situazioni difficili da capire. Perché l ' lA possa diventare una realtà, è fondamentale cercare di stabilire come siano questi modelli di spiegazione, come innanzi tutto si apprendano, come siano richiamati alla mente quando è necessario, come vengano indicizzati e recuperati, e come siano modificati per creare nuovi modelli di spiegazione. La soluzione di questi problemi è fondamentale se i computer dovranno essere creativi; come ho detto, i computer che non sono creativi, che non hanno accesso ai loro processi mentali, che non sono curiosi e non si pongono domande non saranno mai intelligenti.
Capitolo 8: Qualche domanda finale
263
Nel capitolo l , abbiamo tracciato una distinzione fra tre tipi di comprensio ne, che abbiamo chiamato Dare Significato, Comprensione Cognitiva ed Empatia Completa. Abbiamo sostenuto che ora è possibile rendere i programmi capaci di Dare Significato a quello che leggono. Tuttavia, perché i computer siano capaci di capire al livello intermedio della Comprensione Cognitiva, abbiamo sostenuto che i computer debbono poter spiegare ciò che hanno letto, e spiegare cosa hanno fatto in una certa occasione, oltre il livello del "L 'ho fatto perché me lo hai chiesto". In questo libro, ho cercato di chiarire che cosa significhi per me che un computer, o una persona, spieghi qualcosa. Abbiamo visto che la spiegazione è la vera essenza dell'apprendimento. Inoltre abbiamo visto che la creatività, questo processo mistico noto solo agli umani, in fin dei conti non è niente di mistico, e che può ben essere possibile replicare il comportamento creativo su una macchina trasformando modelli di spiegazione standard. Da ciò segue che i processi della creatività e dell'apprendimento non sono così sfuggenti, e che forse in natura sono completamente algoritmici. In questo capitolo, nel tentativo di riassumere ciò che abbiamo discusso, ho corretto lievemente la rotta. La mia tesi è che la capacità di fare domande sia centrale per i nostri processi di comprensione, spiegazione inclusa, naturalmen te. Il fatto è che la capacità di fare domande si apprende, nel tempo, copiando o inventando regole di trasformazione delle domande. In altre parole, sostengo che apprendimento e comprensione sono processi che si basano sull' applicazio ne corretta di numerose euristiche, anziché sulla matematica dei principi universali che determinano la natura della mente. Per costruire una mente, bisogna costruire numerose euristiche e processi di controllo di queste euristiche. Per permettere a una macchina di comprendere, bisogna creare euristiche per la creazione di domande, per poter rispondere a queste domande internamente (introspezione) ed esternamente (esaminando un testo, per esempio). L 'intelli genza dipende, fra le altre cose, dal possesso di euristiche per fare domande ed euristiche per dare spiegazioni. La creatività rappresenta ulteriori euristiche, che operano sui risultati di altre. Nulla di meno semplice e nulla di meno complesso.
Append ice:
SWALE, u n
pro g ram m a
ch e spie g a
Alex Kass, David Leake, Christopher Owens
I ntrod uzione I capitoli precedenti hanno delineato una teoria della comprensione basata sulla spiegazione. Un passo importante nello sviluppo di una qualunque teoria di lA è lo sviluppo di programmi per computer, perché scrivere programmi mette alla prova la teoria e costringe i ricercatori ad affrontare particolari fondamentali su cui sarebbe altrimenti facilissimo sorvolare. Questo capitolo descrive gli stadi iniziali di un nostro tentativo di costruire un programma di comprensione basato sulla spiegazione, seguendo le linee tracciate in questo libro. swALE è un programma che produce spiegazioni nuove recuperando spiega zioni vecchie e modificandole in modo da adattarle alle situazioni nuove. Perciò senso swALE è sia un programma di comprensione che un programma di apprendimento. L' obiettivo di scoprire una spiegazione che gli permetta di capire un fatto anomalo guida le sue azioni, e in questo modo apprende nuove spiegazioni e le immagazzina per usi futuri. La filosofia del sistema segue lo schema che è stato delineato nei capitoli precedenti. Naturalmente la teoria copre più aspetti di quanti ne coprano i nostri sforzi di programmazione. Per esempio, non abbiamo avuto modo di trattare estesamente il problema della formazione delle Domande di Spiegazione,
Modelli di spiegazio ne
266
descritto nel capitolo 4. Invece, nel corso della programmazione abbiamo affrontato vari processi, come la verifica di spiegazioni, le strategie di ricerca degli MS e di estensione degli MS, a un livello di dettaglio che nel libro non viene raggiunto. L • algoritmo generale che il programma SWALE utilizza è il seguente: 1
. Scoperta di una anomalia (descritta nel capitolo 2) Tentativo di col loca re la notizia i n m emoria . Se ha successo
FATTO;
a ltri menti si è scoperta u n ' a nom a l i a .
2 . Ricerca degli MS (descritta in parte nel capitolo 5) Cerca re un MS che si possa usa re per spiega re l'anom a l i a . 3 . Accettazione degli MS Cerca re di appl ica re g l i Ms. Se h a successo, saltare a l passo S. 4. Estensione degli MS (introdotta in modo generale nel capitolo 6) Se non è possi bile a p pl ica re g l i MS d i retta mente a l lora bisog na cerca re d i esten derl i i n MS che si possa no a p p l ica re meglio. Se h a successo, i nvia re gli MS estesi a l passo 3 . S . In tegrazione degli MS e generalizzazione
Se dei risultati sono accettati , reinteg ra re i risu ltati i n memoria, facen do genera l izzazioni opportune.
I passi del precedente algoritmo sono stati suddivisi (un po' arbitrariamente) in un programma di controllo e due sottomoduli. Il programma principale, che chiameremo ACCETTATORE DI MS, è stato scritto da David Leake ed è respon sabile diretto dei passi l , 3 e 5. Un modulo separato, scritto da C hristopher Owens, si occupa della RICERCA DEGLI MS (passo 2) e della corrispondente indicizzazione degli MS descritta in seguito; Alex Kass ha scritto l 'ESTENSORE DEGLI MS (passo 4). La comunicazione fondamentale fra i moduli è riassunta nella figura della pagina a fronte. In questa appendice esamineremo alcune spiegazioni che SWALE produce e discuteremo di come sia implementato effettivamente ogni passo dell'algoritmo. L'idea è quella di mostrare come appaiono nella pratica, alcune delle idee presentate nei capitoli precedenti (come gli MS ) e, ovviamente, mostrare come funzioni un programma che utilizzi gli MS.
Appendice: SWALE un programma che spiega
l T
Fatti (input)
267
Spiegazioni (output)
Accettatore
Memoria generale
;/'.)" //
MS e problem
MS estesi
Estensore
�
lia
Esploratore
Biblioteca per la strategia di riparazione
Visione d ' i nsieme Cominceremo col descrivere alcuni campioni di input e output di SWALE. Alla fine di quest'appendice si troverà una traccia particolareggiata del processo di produzione per alcune delle spiegazioni che seguono. L 'episodio
Swale, un cavallo da corsa, un campione di 3 anni, fu trovato morto nel suo box una settimana dopo aver vinto il Belmont Stakes.
268
Modelli di spiegazione
Le spiegazioni
Quello che segue è un elenco delle spiegazioni ottenute da swALE. La spiegazione del ricordo di Jim Fixx
sw ALE aveva un difetto cardiaco congenito. Lo sforzo della corsa ha affaticato il suo cuore e ha rivelato il suo difetto latente. Ha avuto un attacco cardiaco ed è morto. La spiegazione dell'overdose
Il proprietario di Swale somministrava al cavallo delle droghe per migliorare le sue prestazioni. Gli ha dato accidentalmente una dose eccessiva che lo ha ucciso. La trilogia della scuderia
Come sarà descritto in seguito, l'elaborazione di SWALE lo porta a considerare l'idea che l 'aver pensato troppo al sesso abbia portato Swale alla morte. Cerca allora di immaginare i modi in cui potrebbe essere successo e sviluppa le tre spiegazioni che seguono: La spiegazione dell'eccitamento sessuale
Swa le pensava alla sua vita futura i n una scuderi a . Poiché era una creatura eccita b i le, pensa re a l le prospettive si d i mostrò troppo pesa nte per i l suo cuore. Ha avuto un attacco cardiaco ed è morto. La spiegazione dell'investimento
Swale pensava alla sua vita futu ra i n una scuderia es era affascinato dalle i nca ntevoli prospettive. Cominciò a va gare, sovra ppensiero, per l a strada e u n a utobus lo i nvestì . La spiegazione del suicidio per sconforto
Swale pensava alla sua castità forzata per tutta la d u rata della sua carriera . Cadde i n p reda a l lo sconforto e si uccise.
Gli MS
Ciò che segue è una descrizione sommaria dei vari MS che sw ALE usa nel l'elaborazione delle spiegazioni viste.
Appendice: SWALE un programma che spiega
MS Jim l
269
Fixx «basato su episodi»:
corridori corrono molto.
Correre p rod uce esa u rimento fisico perché è uno sforzo e g l i sforzi produ cono esa urim ento. L'esa urimento fisico i nsieme a un d ifetto ca rdiaco può provocare un attacco cardi aco. Un attacco ca rdiaco può provoca re la morte. MS Janis Joplin
«basa to su episodi»:
Essere una stella del lo spettacolo può porta re stress perché sulla vetta c'è sol itu dine . Essere stressati può porta re a l bisogno d i fug g i re e ri lassa rsi. I l bisogno d i fuggire e rilassa rsi può porta re a p rendere d roghe ricreative. Prendere drog he ricreative può porta re a un'overdose. Un'overdose porta a l l a morte. MS sugli eccessi di sesso
«basato sul folk/ore»:
Trop po sesso uccide. MS preoccupazione
«modello causale fondamentale»:
La preoccupazione per qualcosa provoca ma nca nza di attenzione. La m a nca nza d i attenzione può porta re a vagare nel traffico. Se si vaga nel traffico si rischio d i fa rsi i nvestire da un'a uto. Essere investiti da un'auto può porta re a l la morte. MS swcidio
per sconforto «modello causale fondamentale»:
Pensa re a qualcosa che si desidera ma che non si può avere porta a l lo sconforto. Lo sconforto può porta re a l suicidio.
Modelli di spiegazione
270
I l p rocesso del l a spiegazione 1. Scoperta di anomalie. Quando sw ALE legge una notizia, cerca di collegare ogni input alla conoscenza già esistente; un fatto è anomalo se non può essere integrato nella memoria. Ci sono due modi in cui il programma collega i fatti di input alla memoria. Primo, cerca di far combaciare ciascun fatto in entrata con una struttura di memoria pertinente. Quando un input successivo fornisce un'informazione ulteriore su un fatto, il programma usa l'informazione per guidare il posizionamento del fatto in una struttura più specifica. Per esempio, supponiamo che un cavallo da corsa vinca una corsa importante; allora l 'elemento di memoria per il cavallo, che originariamente era del tipo "cavallo da corsa", viene specificata al tipo "cavallo da corsa vincente". (Lytinen, 1 984). Immagazzinare l 'etichetta sotto questo tipo dà accesso a conoscenze ulteriori: "cavallo da corsa vincente" porta con sé aspettative su grande valore economico dell ' animale, dei cavalli, condizione fisica eccellente, ecc. Questa conoscenza viene u sata per valutare la ragionevolezza degli input successivi. Una volta saputo che Swale ha vinto una corsa importante, sarebbe sorprendente leggere che le sue condizioni fisiche erano di fatto scarse, e il programma riconoscerebbe in questo un' anomalia. Il secondo modo di collegare i fatti in input consiste nel collegarli con aspettative di livello più alto, come quelle che nascono dai MOP (Schank, 1 982) e dalla conoscenza dei piani attuali, degli obiettivi e dei ruoli tematici in possesso degli attori (Schank e Abelson, 1 977). Per esempio, ci aspettiamo che i cavalli da corsa partecipino alle corse. Il programma accetta la vittoria di Swale a Belmont collegandola al MOP M-vita dei cavalli da corsa , come si vede nel seguente frammento di output: lnput:
Swale ha vinto il Belmont Stakes
ra p presentato come: [CO RSA-DI -CAVALLI ATIO R E-SWALE LUO G O-B ELM O NT TEM PO-TEM PO-TO K- 1 3 1 RISULTATO-VITIO RIA]
Appendice: SWALE un programma che spiega
271
Output del programma: I nteg razione di C O RSA D I CAVALLI DI SWALE in memoria
.
Tentativo d i col legare C O RSA DI CAVALLI DI SWALE a i copioni attivi di Swale. I l fatto C O RSA D I C AVALLI DI SWALE sarè i m magazzi nato come la riga C O RSA D I CAVALLI i n VITA DA CA VALLO DA CORSA DI SWALE.
Quando il programma legge che Swale è morto, capisce che la sua morte è prematura, poiché M-vita dei cavalli da corsa dice che i cavalli da corsa in genere anni dopo aver concluso la loro carriera. Il programma scopre l'anomalia nel modo seguente: lnput:
Swale è morto dopo una settimana
ra ppresentata come: [ M O RTE ATIO R E-SWALE TEM PO-TEM PO-TOK-1 89] ; TEM PO-TO K- 1 89 ra ppresenta un pu nto nel tem po posteriore di alcune settimane ; rispetto a l TEM PO-TO K- 1 3 1 precedente.
L'output del programma è: I nteg razione di M O RTE DI SWALE in memoria . Tentativo di collegare M O RTE DI SWALE a i copioni attivi di SWALE. Il fatto M O RTE D I SWALE sa rà i m m a gazzinato come riga M O RTE in VITA DA CAVALLI DA C O RSA D I SWALE. l n d ivi d uazione d i a nomalia tem pora le: M O RTE D I SWALE si presenta troppo presto i n VITA DA CAVALLI DA C O RSA
Quando il programma individua un' anomalia, trova un MS che spiega come il fatto sorprendente sia in effetti ragionevole.
2. Trovare un MS Lo scopo dell' ESPLORATORE è quello di cercare modelli di spiegazione che si possano applicare a un episodio. L'ESPLORATORE è completamente libero per
272
Modelli di spiegazione
quanto riguarda ciò che ritiene applicabile; propone modelli di spiegazione che possono o meno essere utili e lascia la decisione di accettarli ali ' ACCETTATORE e all 'ESTENSORE. Attualmente, il programma cerca di trovare MS a tre livelli: Ricerca di routine,Ricerca di caratteristiche insolite e Spiegazionefolkloristica. Questi livelli sono presentati nell'ordine della loro applicabilità specifica all'episodio elaborato. La Ricerca di routine scopre MS che sono strettamente indicizzati con il tipo di episodio spiegato. Questo metodo di ricerca dipende solo dalla categoria generale dei fatti spiegati e non dalle caratteristiche specifiche dell'evento. Se c ' è una morte, per esempio, la Ricerca di routine restituisce candidati ovvii come Vecchaia e Malattia. La Ricerca di routine fornisce tipi di modelli di spiegazione che sono applicabili come spiegazioni di eventi stereotipici non anomali. Se la ricerca di routine non riesce a ottenere un modello di spiegazione utile, il programma deve cercare un "quasi centro" - un modello di spiegazione che, sebbene non applicabile direttamente all'input, sia un candidato probabile per l 'estensione. Per questo tipo di ricerca è centrale l ' idea che una qualsiasi struttura di conoscenza esplicativa che condivida un numero ragionevole di caratteristiche con l'episodio da spiegare essere utile nell 'elaborazione di una spiegazione. Si può quindi definire il compito così : scegliere alcune caratteri stiche deli ' episodio che è probabile siano indici utili per gli MS, e quindi trovare gli MS indicizzati con quelle caratteristiche scelte. Una euristica per il reperimento di MS è la Ricerca di caratteristiche insolite, che si basa sulla coordinazione di anomalie, metodo discusso in precedenza nel libro. Il fatto importante di questa euristica è che è più probabile che le persone, quando elaborano una spiegazione di un fatto, considerino le caratteristiche insolite prima di quelle ordinarie. La Ricerca di caratteristiche insolite richiede la scelta di caratteristiche dell'episodio e si basa su quanto insolite sono rispetto agli episodi normativi dello stesso tipo; non si bada alla maggiore o minore probabilità che ognuna di queste caratteristiche faccia parte alla fine di una spiegazione dell'episodio. Poiché le caratteristiche scelte sono insolite, vengo no usate semplicemente come indici per trovare MS . Swale, il personaggio centrale dell'episodio morte, viene confrontato con i casi normativi di categorie di cui potrebbe esser membro. Swale, in confronto ad altri cavalli da corsa, per esempio, è molto fortunato e giovane. Il programma indicizza nella sua memoria I ' MS con "morte di un giovane fortunato" e trova l ' MS J anis J oplin. Analogamente, rispetto ad altri cavali, i cavalli da corsa sono
Appendice: SWALE un programma che spiega
273
di solito in condizioni fisiche eccellenti. Indicizzato con "morte di qualcuno in condizioni fisiche eccellenti" c'è l'episodio Jim Fixx, con il relativo modello di spiegazione. MS come questi possono essere esaminati ed estesi per adattarli all ' episodio corrente. Ciò che fa il programma è confrontare Swale con le generalizzazioni di Swale. Tuttavia, questa ricerca non potrà essere completamente generale, altrimenti fornirà troppe risposte. Non possiamo confrontare Swale con tutte le generalizzazioni di Swale, perché in una qualunque memoria ragionevole Swale risulterebbe membro di molti gruppi. Il confronto con i casi normativi di alcune classi a cui Swale appartiene è sicuramente utile; per altre classi di cui è membro, invece, il confronto non avrebbe alcuna utilità. Per esempio, Swale è una "cosa pelosa"; o un abitante del Kentucky; o un oggetto di grandi dimensioni. Alcune di queste sono categorie realistiche, altre non lo sono. Quale strada prendere nella rete dei ricordi per focalizzare i confronti? Non possiamo basarci sulla memoria per procurarci tutto ciò che vogliamo attraverso una gerarchia di tipo ISA. Questo non è davvero realistico. Il programma supera questo problema lasciando che la ricerca sia guidata dal tipo di fatti che cerchiamo di spiegare. Qui cerchiamo di spiegare una morte, e ha senso solo usare generalizzazioni di Swale che riempiono la casella Attore di Morte. La casella Attore di Morte viene di solito riempita con Cosa vivente. In altre parole, usiamo concetti che sono generalizzazioni di Swale ma specificazioni di Cosa vivente. Questo circoscrive di molto la ricerca. Qui l'ESPLORATORE trova l ' MS Jim Fixx: Cerca re spiegazioni d i M O RTE di SWALE. Considera re M O RTE d i SWALE come u n esempio di M O RTE genera l izzata . I l N O M E di SWALE è SWALE, mentre i l N O M E genera l izzato di CAMPION E- CAVALLO-DA C O RSA è SCON OSC I UTO . Non c'è niente che col leghi (NOM E SWALE) con M O RTE. una SALUTE genera l izzata d i CAMPION E- CAVALLO-DA C O RSA è B U O N A mentre l a SALUTE genera l izzata d i CAVALLO-DA C O RSA è S C O N OSC I UTA. Non c'è n iente che col leg h i (BUONA SALUTE) con M O RTE.
Modelli di spiegazione
274
La condizione fisica genera l izzata di CAM PION E-C AVALLO-DA C O RSA è B UONA mentre la C O N DIZION E-FISICA genera l izzata d i CAVALLO-DA C O RSA è SCONOSCIUTA . Trovato JIM FIXX-Ms-263 i n d icizzato sotto M O RTE con i n d ice: (BUONA C O N DIZION E-FISICA).
Dopo la Ricerca di caratteristiche insolite, il programma prova Ricerca di MS flokloristici. Comunque, non c'è garanzia che queste spiegazioni siano convin centi. Per come è implementata, la Spiegazione folkloristica fornisce un elenco di MS indicizzati solo con il tipo di fatto spiegato. MOR'IE, per esempio, fornisce l ' MS MOR'IE-PER-TROPPO-SESSO. Queste strategie di ritrovamento devono ovviamente avere qualche stretta relazione con gli strumenti grazie ai quali gli MS sono stati originariamente in dicizzati in memoria. Dato che abbiamo strategie per scegliere le caratteristiche di un episodio e possiamo usarle come indici per trovare MS, dobbiamo pos sedere strategie corrispondenti per indicizzare gli MS con le caratteristiche che, in seguito, saranno usate per recuperarli. Si discuterà di queste strategie alla fine di questo capitolo. Una variante importante della Ricerca di caratteristiche insolite si basa sul provare a vedere l'evento da spiegare sotto una luce diversa. Per esempio, possiamo provare a considerare la morte di Swale non come una morte ma come la distruzione di un pezzo di proprietà. Consideriamo ora il dispositivo di riempimento delle caselle normative della distruzione di un pezzo di proprietà (che è un possesso fisico). Dal confronto di Swale con le generalizzazioni di Swale che sono anche specificazioni di PROPRIET À FISICA, vediamo che una caratteristica insolita di Swale è il suo grande valore monetario. Indicizzato con DISTRUZIONE, insieme a GRANDE VALORE MONETARIO, troviamo FRODE AL L' ASSICURAZIONE, un MS che possiamo inviare all ' Accettatore. Cominciare la ricerca con la nozione di alto livello DISTRUZIONE DI PRO PRIETÀ invece che MORTE avrà come risultato la scelta di un insieme diverso di caratteristiche, e in corrispondenza la scoperta di un insieme diverso di MS.
3. Decidere se un MS va bene Una volta che è stato trovato un MS, l'Accettatore deve controllare che si ap plichi all 'anomalia corrente. L' Accettatore verifica un MS vedendo se può credere ai Controlli di applicabilità predisposti nell ' MS. Ogni controllo diventa
Appendice: SWALE un programma che spiega
275
una domanda alla memoria per verificare una certa condizione. Parte dell 'infor mazione necesaria deriva dali' uso della gerarchia deli' astrazione. Questa è utile innazitutto per rispondere a domande come "Quali erano le condizioni fisiche di Swale? "Poiché Swale era un cavallo da corsa di successo, sappiamo che probabilmente erano eccellenti. Quando proviamo ad applicare gli MS, siamo spesso interessati agli attributi che non si possono verificare in modo così diretto. A domande come "Swale era un corridore?" o "Swale faceva molto sesso?" non si può rispondere semplice mente guardando in una casella particolare. Per trattare la vasta gamma di domande possibili e recuperare informazioni, l' Accettatore ha quattro strategie fondamentali : Eredità di proprietà In formazione sui riempitivi norma tivi Scomposizione di azioni fondamen tali lndicizzazione diretta con insiemi di concetti
La memoria del programma è organizzata in una rete di astrazioni. Per esempio, fra le astrazioni di Swale vi sono i cavalli da corsa di successo (che hanno come ulteriori astrazioni cavallo da corsa, cavallo, cosa vivente ecc.) e possesso. Ogni astrazione sulla gerarchia fornisce attributi di default ai suoi riempitivi. Per esempio, si suppone che un cavallo - da corsa - di successo sia in buone condizionifisiche. Quando si deve stabilire il valore di un riempitivo di caselle, l ' Accettatore si muove verso l ' alto sulla rete delle astrazioni finché non trova un riempitivo per la casella in esame. Eredità di p roprietà.
Ogni nodo nella memoria di Swale ha informazioni sui riempitivi normativi delle sue caselle. Per esempio, di solito è un attore umano che corre, anche se possiamo immaginare che si possa addestrare una scimmia a farlo. Data un 'azione ipotizzata, l'informazione sui riempitivi normativi la filtra rapidamente e dice se è probabile. (Poiché sap piamo che i cavalli da corsa non fanno jogging, inizialmente rifiutiamo l ' MS Jim Fixx come spiegazione della morte di Swale.) Informazione sui riempitivi normativi.
Come abbiamo osservato a proposito del jogging, un riempitivo di ruolo insolito non esclude il verificarsi di una azione, o di uno stato. Per vedere se un 'azione insolita è possibile, l' Accettatore la scompone nei suoi costituenti e individua quelli problematici. In un MOP, Scomposizion e d i azioni fondamental i.
276
Modelli di spiegazione
osserva le singole scene. Per esempio, potremmo voler sapere se Swale possa essere attore nel MOP M-prendere-droghe-ricreative . Quest' ultimo è scomponi bile in scene come comprare droga e assumerla. Visto che Swale non aveva mani, gli sarebbe stato impossibile procurarsela e somministrarsela. Quindi Swale è escluso come attore possibile. lndicizzazione diretta con insiemi di concetti . Le strategie descritte prima comportano l 'uso di informazioni accessibili attraverso un percorso diretto a partire da un concetto dato. Per vedere se la spiegazione popolare "Troppo sesso uccide" si possa applicare a Swale, dobbiamo sapere se abbia avuto troppo sesso, ma qui le strategie precedenti falliscono. Dobbiamo poter chiedere "Cosa sai sul rapporto fra cavalli e sesso?" e individuare un nodo nella memoria. È chiaro che le persone possono farlo facilmente: qualcuno che abbia familiarità con i cavalli da corsa, alla domanda "Cosa sai sul rapporto fra cavalli e sesso?" risponderebbe immediatamente con "I cavalli vanno in scuderia (per la riprodu zione) alla fine della loro carriera". Una delle strategie del programma per verificare fatti è quella che studia l' uso dell'informazione indicizzata con insiemi di concetti. In SWALE, i nodi della memoria possono essere indicizzati da una serie di concetti. Il problema immediato che nasce, non appena si usa questo tipo di indicizzazione, è: dati una domanda e un concetto collegato ad essa in qualche modo, come si è in grado estrarne informazioni utili? Quando il problema sarà studiato ulteriormente, cercheremo di analizzare quale debba essere il processo che sta alla base del recupero in memoria di un elemento collegato a un insieme di indici. Nel trattare gli MS popolari, l' Accettatore prova prima a usare l 'eredità di proprietà per vedere se Swale abbia avuto molto sesso. Se questo non riesce, dà gli indicizzatori "cavallo da corsa" e "sesso" che si fermano sul MOP M-SCU DERIA. Per usarlo, l' Accettatore lo collega sia a Swale (come evento atteso del suo futuro) che a SESSO (l 'azione principale di M-SCUDERIA ) , per vedere se può dare sostegno all'idea che Swale avesse molto SESSO. Sebbene SESSO sia una componente di scuderia, questo non spiega se Swale abbia ora molto sesso, così l' Accettatore non riesce a verificare l' MS popolare. 4. Estensione degli MS
Quando l ' Accettatore rifiuta un MS come "quasi centro", lo passa, insieme alla ragione del rifiuto, ali 'Estensore. L' obiettivo dell 'Estensore è quello di generare un nuovo MS (o un insieme di MS ) che potrebbe andar meglio. L 'Estensore è più
Appendice: SWALE un programma che spiega
277
un sintetizzatore che un analizzatore; il suo compito è escogitare nuove ipotesi (che potrebbero dimostrarsi direttamente utili, totalmente inutili, o candidate per un'estensione ulteriore). Resta in attesa finché l ' Accettatore non passa valutazioni sulla ragionevolezza delle ipotesi; l 'Estensore è progettato per avere buone idee, non per evitare quelle cattive. La struttura di controllo di livello piH alto dell'Estensore è molto semplice. Ci sono solo due passi: 4. 1 . Recuperare Strategie per riparare MS da una biblioteca di strategie in possesso dell 'Estensore. Ogni strategia è un programma progettato per rappre sentare un MS che ha qualche problema in un insieme di MS modificati che non hanno quel problema. 4.2. Applicare ogni strategia recuperata restituendo gli MS risultanti. Natu ralmente, i particolari di ciò che succede in questa fase di elaborazione dipendono completamente dalla natura della Strategia per riparare MS. Questo processo è modellato liberamente sul processo usato nel programma CHEF di Hammond (Hammond, 1 984), per riparare gli insuccessi dei piani. Dove CHEF usa configurazioni obiettivo-fallimento per indicizzare strategie perriparare piani, Swale usa Tipi di Fallimenti degli MS perindicizzare Strategie per riparare MS. Al di là di questo li vello, i problemi coinvolti divergono poiché le spiegazioni sono diverse dai progetti; Non funzionano per ragioni diverse e richiedono tipi diversi di riparazioni . Comunque, l 'idea di usare la caratterizzazione dei falli menti per indicizzare programmi di riparazione risale a questa ricerca. Il recupero di un insieme appropriato di Strategie per riparare MS si basa sull' uso dei Tipi di fallimenti degli MS, sviluppato al passo 3 , come indice nella biblioteca di Strategie di riparazioni. Nelle implementazioni future, potrebbero essere usati come indici anche gli aspetti dell ' MS che devono essere riparati, ma attualmente il programma usa solo i Tipi di fallimenti degli MS. Ogni Strategia di riparazione viene immagazzinata nella biblioteca insieme a un modello di tipi di fallimenti. Il passo 4.1 comporta essenzialmente che i Tipi difallimenti degli MS creati al passo 3 vengano messi in corrispondenza con quei modelli e che si raccolgano le strategie associate ai modelli che sono entrati con successo in una corrispondenza. Alcuni dei Tipi di fallimenti degli MS generati nella versione corrente del programma sono riportati nella prossima pagina.
278
Modelli di spiegazione
; Una spiegazione d i routine per la morte deg l i a n i m a l i è l ' investimento da parte di un veicolo. Quando il prog ra m m a cerca di a p p l ica re questa spie gazione alla morte di Swa le ; restituisce l'errore seguente: l' MS ha fa l lito perché rich iedeva un a n i male piccolo ;ed era stato appl icato a l la morte di uno gra nde. [MS-ERRORE D ESC RIZIO N E-PROBLEMA-[VALO RE-ATIR IB UTO- C O NTRADD ETIO ATIRIBUTO- MISU RA VALORE-C REDUTO-G RAN D E ETI C H ETIA-C RED ENZA-AN I MALE-PICCOLO] ; Qua ndo cerca di appl ica re la spiegazione J i m Fixx, i l sistema restituisce la descrizione di i nsuccesso: ; L' M S non va a buon fine perché la credenza relativa a l jog g i n g richiede u n attore uma no, mentre è stato forn ito qua lcosa c h e n o n corrisponde alla descrizione. [MS-ERRORE TI PO-TEMA-INAPPLICAB I LE D ESC RIZIO N E-PROB LEMA-[TI PO-NONAD EG UATO ATIRIBUTO-DESIDE RATO-#{TI PO-NODO- 1 40-U MANO}] ETIC H ETIA-C RED ENZA-CO RSA] ; L' i nsuccesso seguente indica perché la spiegazione della morte di Swa le per troppo sesso è fa l l ita . ; U n 'azione che I ' M s si aspettava awenisse i n u n certo momento era pro g ra m m ata per molto p i ù ta rdi. (Swa le era un cava llo da corsa i n attività e i cava l l i da corsa non vanno alla monta finché non si ritira no da l le com petizioni . ) [MS-ERRORE TI PO-TEMA-I NAPPLICABILE C R EDENZA-ETIC H ETIA-SESSO D ESC RIZIO N E-PRO BLEMA-[D I FETI0-1 M POSTAZION E-C OPION E POSIZIONAM ENTO-PROB LEMA-[AZION E-PREMATU RA] N O M E-C OPION E-VITA-DA-CAVALLO-DA-C O RSA U LTI MA-ELAB ORAZION E-RIUSC ITA-RIGA-4 MATC H I N G -RIGA-3
Appendice: SWALE un programma che spiega
279
; I n risposta a l l ' ipotesi che Swa le fosse morto per aver pensato troppo a l sesso, viene restitu ito u n differente tipo d i errore. N o n c ' è stato fal l i mento di una pa rticolare credenza bensì sisono dimostrati poco convincenti i col lega menti che sostenevano una credenza pa rticolare. [MS-ERRO R E TIPO-NONC ONVINTO-AZIONE ETI C H ETTA-C R EDENZA-MORTE D ESC RIZION E-PROBLEMA-[SU PPO RTO-NONC O NVI NC ENTE)
Per fare il loro lavoro, la maggior parte delle Strategie per riparare MS debbono far uso della struttura interna di un MS. Se gli MS fossero usati solo per spiega zioni immediate, in cui venissero applicati direttamente, la loro struttura interna sarebbe molto semplice. Servirebbe solo l 'insieme degli indici richiesti per recuperare l' MS e le caratteristiche che dovrebbero essere presenti per permet tere l' uso dell'MS . Quando si dà una spiegazione immediata, le relazioni fra le caratteristiche in un MS non sono affatto interessanti. Comunque, se l ' MS deve essere modificabile, se deve servire come punto di partenza per la creazione di MS nuovi e originali, allora la rappresentazione delle relazioni fra gli elementi dell' MS diventa un problema molto più impor tante. La domanda è questa: quando una credenza non vale in un MS, come si può riparare l ' MS? Si può generalizzare, cancellare, sostituire la credenza? Quali sono i vincoli di adeguatezza di una sostituzione? Se un sistema deve rispondere a queste domande, deve sapere perché la credenza era importante neli' MS originale e come sostenesse o fosse sostenuta da altre credenze nell'MS.
La struttura di un MS Un MS è uno schema di spiegazione cristallizzato, cosl come i copioni sono schemi di piani cristallizzati. Gli MS contengono delle variabili, cosi l' appli cazione di un MS comporta semplicemente che si vincolino le variabili per produrre una spiegazione specificata. Il disegno degli MS tiene conto di varie operazioni a cui gli MS prendono parte. L' Accettatore vuole poter prendere una decisione veloce e semplice sulla possi bilità di applicare direttamente una spiegazione standard. Gli MS contengono perciò una sezione chiamata Controlli di applicabilità. Se un MS supera i controlli di applicabilità, l' Accettatore lo applica senza richiedere indagini ulteriori.
280
Modelli di spiegazione
Quando qualcuno dei Controlli di applicabilità dà esito negativo, l ' Accettatore deve decidere se trascurare completamente l ' MS o se considerarlo un buon candidato per l'estensione. Per questo motivo, l ' MS ha anche una sezione di Controlli di pertinenza. L' Accettatore li u sa per stabilire quanto sia pertinente l ' MS. Quanto più l' MS collima con i controlli di pertinenza tanto più è probabile che valga la pena di estenderlo. Il grado di riuscita che l' Accettatore richiede dipende dai suoi obiettivi. L' Accettatore di solito non esamina le altre credenze che formano la spiegazione; queste tuutavia sono necessarie per il completamento della spie gazione stessa. Queste sono le Credenze interne: il sistema le usa quando deve presentare la sua spiegazione all'utente e quando deve estendere la spiegazione. Il sistema adotta queste credenze quando decide di adottare la spiegazione. Il vocabolario usato nelle sezioni delle credenza degli MS non ha nulla di speciale: segue le stesse linee della maggior parte degli schemi proposti per la rappresentazione di fatti (come la teoria della Dipendenza Concettuale). Gli MS correnti includono i seguenti tipi di convinzioni: Descrizione di azioni:
La convinzione che sia stata fatta qua lche azione. S pec ifica le sol ite i nformazioni come l 'attore, l 'azione e l ' oggetto. Esempio: Mary p icchiò J oh n .
Descrizione di temi:
C o m e u n a descrizione d i azio n i ma descrive u na credenza i n u n ' azione ri petuta regolarmente . Ese m pio: J i m F i xx aveva i l tema jogg i n g .
Descrizione di stati:
Descrive q ualche stato riten uto vero. Esempio: JanisJoplin possedeva delle d roghe.
Descrizione di valori:
Descrive i l va lore d i qua lche attri buto per un attore: I l va lore dei successi d i Swale era a lto.
Descrizione di confenzionamen to:
Descrive q ualche classe a c u i u n og getto a p partiene, e da c u i perciò eredita i nferenze. Esempio: i cava l l i da corsa sono cava l l i e a nche atlet i .
28 1
Appendice: SWALE un programma che spiega
Descrizione degli obiettivi:
U n obiettivo che u n attore h a . Esem pio: l'obiettivo dei proprieta ri dei cava l l i da corsa è che i loro cava l l i vincano le corse.
La sezione finale deli ' MS è detta Rete di sostegno delle credenze. Questa sezione descrive le relazioni di sostegno fra le credenze delle prime tre sezioni. La Rete di sostegno delle credenze ci dice perché il fatto di adottare alcune delle credenze di un MS porti il sistema ad adottare altre credenze. Un nodo di sostegno delle credenze contiene puntatori per la credenza (o le credenze, se è un nodo congiunti v o) che dà sostegno e per quella che riceve sostegno. Contiene anche un 'indicazione del tipo di sostegno in causa e un puntatore alla conoscen za generale che permette l 'inferenza. Il tipo di conoscenza generale a cui si punta dipende dal tipo di sostegno che il nodo rappresenta. Per esempio, se chi deve spiegare crede che John prenda parte al copione dei ristoranti allora crederà anche che pagherà il conto. Questo sarebbe rappresentato nell ' MS come un nodo di sostegno da copione. La credenza di sostegno è che John stesse seguendo il copione dei ristoranti e quella sostenuta era che avrebbe pagato il conto. La conoscenza generale sarebbe un puntatore per il copione dei ristoranti insieme con il numero di riga della scena "pagare il conto". Ecco un altro esempio. Se chi spiega crede che Jill faccia regolarmente sollevamento pesi, crederà anche che abbia muscoli sodi. In questo caso il tipo di sostegno sarà Causalità-Fisica e la conoscenza generale sarà un puntatore per la regola causale in memoria che indica che esercizi pesanti rassodano i muscoli. Qui di seguito sono elencati alcuni tipi di sostegno delle convinzioni che il sistema utilizza. Causalità-Fisica
Ese m pio: l'overdose porta a l l a morte.
Causalità-Emotiva
Esem pio: le persone si stressa no q u a n d o pretendono troppo da s e stesse.
Causalità -Sociale
Materia di legge o costume. Esem pio: le stelle del Rock ha n n o a m ici tossicoma n i .
Causalità-Economica
Ese m pio: i proprietari vogl iono che i loro cava l l i vinca no, così guadagnera n no d i p i ù .
Da copione
Ese m pio: chi v a i n u n ristora nte m a n g i a u n pasto.
282
Modelli di spiegazione
Specificazione
Esempio: le persone d i spettacolo che han no successo son o delle star (e perciò è legittimo riguardo a esse tra rre i nferenze col legate alle sta r).
Attivazione di Co-obiettivi
Esempio: quando le persone sono stressate cercano di riporta re il loro stress a livelli normal i .
Soddisfacimento di C-obiettivi Esempio : i politici vog l iono essere eletti .
Stra tegie per riparare MS
L'idea dietro alle Strategie per riparare MS si spiega meglio discutendo qualche esempio reale. Vediamo quattro delle strategie che risiedono nella biblioteca d�l programma. Abbandonare la credenze. Questa è la strategia più semplice. Qualche volta una credenza in un MS non è strettamente necessaria. Può verificarsi che l' MS abbia sostegno più che sufficiente per la sua conclusione, e queste parti dell' MS possono essere sfrondate senza rendere lo stesso MS poco convincente. Questa strategia elimina la credenza problematica e mette in questione tutte le altre convinzioni dell' MS che dipendono da essa. In base alle richieste, l ' Accettatore può eliminare anche queste. Questa strategia viene usata per modificare l ' MS Janis Joplin per adattarlo a Swale poiché molte delle credenze non sono pertinenti, sebbene il nucleo lo sia. Sostitituzione di temi alternativi. Questa strategia è utile quando la credenza che viene meno è un tema (un copione in cui l 'attore è impegnato regolarmente, previsto dall 'MS ) rifiutato perché l 'attore era in qualche modo fuori luogo nella sceneggiatura corrente. Qui l'idea è scoprire quali righe del tema inappropriato siano effettivamente importanti nell' MS (per esempio, quale sostiene altre con vinzioni dell ' MS), e cercare un altro tema. Il nuovo tema deve essere appropriato per l 'attore corrente, e avere le righe necessarie. In altre parole, l ' MS porta dentro di sé la conoscenza del perché una credenza particolare sia importante per l' MS, e questa strategia usa quell'informazione per scoprire un altro tema che si adatti in modo simile. Alla fine di questa sezione ci sarà qualche cesempio di output di questa Strategia per riparare MS, in cui il tema corsa di cavalli è stato so stituito con jogging.
Appendice: SWALE un programma che spiega
283
Sostituire l'anticipazione di un fatto previsto. Questa è una strategia di ripa razione più sofisticata di quelle citate finora. Si applica quando il problema è relativo alla collocazione temporale degli eventi. Questa strategia viene invo cata quando l ' MS viene meno perché richiede che un'azione venga eseguita in un momento precedente a quello in cui è, in realtà, stabilito che avvenga. Quando ciò accade è ragionevole considerare l 'idea che pensare al fatto che dovrà accadere possa giocare un ruolo nella spiegazione. Questa strategia elimina quindi la convinzione che il fatto sia effettivamente avvenuto e inserisce la convinzione che l 'attore stesse pensando all'evento futuro. Questa strategia viene usata, per esempio, quando si capisce che la spiegazione basata su una eccessiva attività sessuale di Swale non può essere corretta, perché Swale era troppo giovane per la scuderia. La strategia, allora, "ripara" questo MS assu mendo l'idea che Swale pensasse troppo al sesso. Scoperta di connessioni. Qualche volta, un MS si mostra poco convincente per l' ACCETTATORE, non perché una singola credenza sia inaccettabile, ma perché non sono convincenti le connessioni fra alcune credenze. Per esempio, se dico che forse Swale è morto perché la luna era piena, voi potreste rifiutare questa spiegazione, non perché non credete alla morte di Swale o alla luna piena, ma perché non vedete la connessione. Questa strategia cerca di porre rimedio a tale problema scoprendo un altro MS che connetterà le due convinzioni in questione. Per farlo viene richiamato l ' ESPLORATORE. Se non si riesce a trovare un MS che connetta direttamente le credenze, si cercherà una catena limitata di cause. Dopo ogni anello della catena l'ESPLORATORE richiamerà se stesso ricorsivamente, usando la credenza appena in ferita. Questa viene usata, per esempio, per trovare la connessione fra il pensare al sesso e la morte. Quella che segue è la traccia di una delle strategie operanti per dare un 'idea più concreta di come funzioni il si stema. Tentativo di a pp l ica re una strategia di mod ifica : 'Sostitu i re u n a ltro tema che sia p i ù appropriato per l'attore' al MS: MS-FIXX Il tema sba g l iato: [TEMA ATTO RE-SWALE C O PI O N E-$JOG R U OLO-ATTO R E]
Modelli di spiegazione
284
La credenza etichettata con JOG è d i sostegno nei modi seg uenti :
È d i sostegno per la credenza - C ORSA: [DESC RIZIONE-AZION E ATIORE-SWALE AZIONE-MOTO-PARTI-DEL-CORPO PARTI-PIEDI VELOC ITA-RAPIDA] attraverso i l tipo d i sostegno Copione-Riga. Richiesta i n memoria per a ltri tem i di vita per Swale Tem i associati : SWALE ha spesso i l ruolo d i A TTORE nel tem a CORSA DI CA VALLI. SWALE ha spesso i l ruolo di ATTORE nel tem a MANGIATORE DI A VENA.
Sto vedendo se uno di q u esti tem i può essere sostituito . . . Sto cercando d i sta b i l i re delle con nessioni d i sostegno alternative. Il tipo di sostegno è Copion e-Riga il nome del copione è CA VALLO DA CORSA. ,
Sto cercando d i trova re una riga nel copione che com baci con la credenza CORSA . Ho trovato:
[DESC RIZI O N E -AZI O N E AZION E-M OVI M ENTO-PARTI-D EL-C O R P O VELOC ITÀ-RAPIDA PARTI-PIEDI]
;Il tema CAVALLO DA C O RSA prod uce un'estensione che ha s uccesso ! O ra si tenta con MANG IATO RE D'AVENA. Sto cercando di sta b i l i re delle connessioni d i sostegno a lternative . I l ti po di sostegno è C O P I O N E-RI GA, i l nome d e l copione è MANG IATO RE D'AVENA. Sto cercando di trova re una riga nel copione che com baci con la convinzione Corsa . Errore. Il copione non è a p p ropriato ; MANG IATOR E D'AVENA non fornisce sostegno per I' Ms, perciò viene re stituito sola mente i l tema C AVALLO DA C O RSA.
Appendice: SWALE un programma che spiega
285
5. Integrazione di spiegazioni nuove in memoria Dopo che l 'ESTENSORE ha prodotto un nuovo MS e l' ACCEITATORE lo ha ac cettato, la spiegazione viene collocata in memoria per gli usi futuri . Se sarà possibile, gli MS nuovi e vecchi verranno generalizzati, e la generalizzazione verrà installata. SWALE prova a generalizzare un MS esteso concentrandosi sui controlli di applicabilità degli MS nuovi e vecchi e scegliendo nuovi controlli di applicabilità (e le corrispondenti condizioni nelle sottostanti catene di sostegno delle credenze) che includano quelli originali. L' MS FIXX originale ha come condizione di applicabilità che il defunto facesse jogging, mentre l' MS esteso richiede che gareggiasse nelle corse di cavalli. Per quanto riguarda il nuovo MS, vorremmo trovare una generalizzazione di questi due temi. Senza un modo per guidare questa generalizzazione, un sistema ricco di conoscenza dovrebbe scegliere tra un numero enorme di generalizzazioni possibili. Ma, poiché la struttura causale delle due spiegazioni è nota, l' ACCEITATORE può imporre un vincolo su quali generalizzazioni considerare: una qualunque condizione generalizzata deve sostenere le stesse catene causali che sono sostenute dalle condizioni che include. Nella gerarchia delle astrazioni, fare j ogging e gareggiare nelle corse dei cavalli hanno entrambe la generalizzazione di fare esercizi fisici, e fare esercizifisici supporta lo stesso ragionamento causale delle condizioni originali. Di conseguenza, questa gene ralizzazione è quella scelta, rispetto a generalizzazioni del tipo "l' attore passa il suo tempo sulle piste". L 'output del passo della generalizzazione è: Osservare la possi bile genera l izzazione degli M S estesi e ori g i na l i . Cerca re l a genera l izzazione d i $JOG e CORSA DI CA VALLI che sosterrà l e stesse catene ca u sa l i . I l tema del l 'attore i n ESERCIZIO FISI C O rende conto d i tutti i fatti necessa ri.
Per applicare il nuovo MS, si debbono scegliere le caratteristiche predittive del nuovo MS. Dai controlli nel nuovo MS, che si basano sulla struttura causale sottostante, l' ACCEITATORE seleziona le caratteristiche predittive osservabili nel caso in esame. Nell'esempio Fixx, all'inizio non c'era motivo di sospettare che Swale avesse un difetto cardiaco, ma sarebbe stato banale confermare che facesse esercizi fisici. Dunque si sceglie come caratteristica predittiva del nuovo MS un tema di esercizio fisico, come si vede nel seguente output.
Modelli di spiegazione
286
Considera le precond izioni deii' Ms per vedere q u a l i fossero osservab i l i La precondizione [TEMA RUOLO-ATTO R E C O P I O N E-ES ERC IZIO FISICO ATTO RE-SWALE] era osserva bile, e sa rà mantenuta come caratteristica pred ittiva. Dal momento che la precondizione [DESC RIZION E-PAC C H ETTO OG G ETTO-[D ESC RIZION E-CAS ELLA CASELLA-VIRTUALE-C UORE-DI RUOLO-C U O R E M O P-DI F ETTO-EREDITARIO-C U O R E] non è osserva b i le nell'a nom a l ia i n esame, non sa rà ma nten uta come una ca ratteristica p red ittiva .
Quando un MS nuovo è installato, diventa una specificazione del tipo di fatti che prima erano anomali, con le caratteristiche predittive usate per stabilire quando è appropriato specificare la classe di fatti che MS organizza. Usando la spie gazione per classificare la morte di persone apparentemente sane, viene creata una sottocategoria di MORTE che viene installata come una specificazione del nodo di memoria per MORTE. Oltre a questa indicizzazione immediata, gli MS debbono essere indicizzati anche mediante strategie di scelta di caratteristiche compatibili con i metodi che usa l 'Esploratore. Per fornire indici all' MS si possono usare varie classi di caratteristi che. La categoria più semplice è quella che si ottiene scegliendo le caratteristiche dell'episodio originale che entrano a far parte della spiegazione causale e usando la per l'indicizzazione. Queste sono più importanti per il processo della spiegazione delle caratteristiche non incluse nel ragionamento causale. Per una spiegazione della morte di Swale, per esempio, il fatto che Jim Fixx facesse jogging è più importante del fatto che fosse uno scrittore, perché fare jogging è nel ragionamento causale sulla sua morte. Il processo della spiegazione non riguarda mai il fatto che fosse un autore, perché questa conoscenza non fa parte della catena di ragionamento causale contenuta nell'MS Jim Fixx.
Appendice: SWALE un programma che spiega
287
La determinazione dell'importanza delle caratteristiche è specifica per l ' MS, e non riguarda l'episodio stesso in memoria. Ci sono altri modelli di spiegazione possibili che riguardano la morte di Jim Fixx in cui il fatto che fosse un autore sarebbe estremamente pertinente. Per esempio, se tentassimo di ottenere un modello sulle morti ironiche, potremmo confrontare Jim Fixx, morto in con seguenza di un'attività che egli difendeva vivamente, con Euell Gibbons, che sosteneva i benefici di una dieta a base di pigne e che è morto di cancro allo stomaco. Per fare questa generalizzazione dovrebbe esserci un MS relativo a Jim Fixx in cui il suo ruolo di autore di libri sullo jogging avesse una parte rilevante. Una seconda fonte molto importante di caratteristiche di indicizzazione richiede l ' uso dell'anomalia che un MS cerca di spiegare. Per esempio, l ' MS Jim Fixx è indicizzato con Buone condizioni fisiche perché l 'anomalia implicita in questo MS è che le persone in buone condizioni fisiche non muoiono all'improvviso. La buona condizione fisica di Jim Fixx non partecipa causalmente alla spiegazione della sua morte, né è una caratterizzazione primaria dell'evento. È comunque un indice importante perché permette al programma di scoprire la spiegazione, data la storia di Swale. Il programma non sa ancora come scegliere inizialmente questa categoria finale di indici quando memorizza un MS, ma può usarli per trovare un MS indicizzato manualmente.
Uso d i un M S n uovo Un a volta installato, un MS può essere usato in elaborazioni future. Per esempio, quando diamo al programma una notizia simile a quella della morte di Swale, esso applica l ' MS che ha appreso nel caso di Swale: input:
Last C ha nce Louie era un cava l l o da corsa . Vi nse i l Kentucky Derby. Morì una settimana dopo.
output dell 'elaborazione della morte di Last Canee Louie una settimana dopo la vittoria: I nteg ra re in m emoria la M O RTE di LAST C HANC E LOU I E.
Modelli di spiegazione
288
Cerca di col legare la M O RTE di LAST C HANC E LOU I E a i copioni attivi di LAST C HANC E LOU I E. I l fatto MORTE di LAST C HANC E LOU I E sa rà i m magazzi nato come riga M O RTE nella VITA DA CAVALLO DA C O RSA d i LAST C HANC E LO U I E . Anomalia tem pora le i n d ividuata : La M O RTE di LAST C HANC E LOU I E awiene troppo presto rispetto a quanto p revisto i n Vita da Cavallo da Corsa . Cerca d i risa l i re a g l i MS indicizzati con l ' a nomalia Risa l i re a MS- 1 -F/XX, MS MORTE PREMA TURA PER ECCESSIVO CORRERE, MS MORTE PREMA TURA PER MALA TTIA. Controlla se uno d i q uesti MS è pertinente viene accettato MS- 1 -FIXX.
Esempio del p rocesso d i spiegazi one La sezione seguente delinea il modo in cui il programma spiega la morte prematura di Swale. •
Usare la ricerca d i routine per trova re MS riguarda nti la morte p rematura degl i a n i m a l i .
•
Trovare morte per malattia e per investimento d'auto .
•
Questi MS non si possono applicare perché Swale non era a m m a l ato e non era u n animale piccolo. L' i nsuccesso è abbasta nza g rave d a i n d u rre ad abbandona re questi MS senza a lcun tentativo di estensione.
•
Cerca re MS i ndicizzati con caratteristiche insol ite di Swa le. l cava l l i da corsa sono i n con d izioni fisiche eccel lenti; morte + con dizione eccellente porta a i i ' Ms Jim Fixx.
•
Swale non faceva jogg ing, e quindi Jim Fixx non si applica . Cerca re d i estenderlo.
•
Poiché i l p roblema era la non val i d ità del tema, prova re l a strategia d i riparazione Sostituire tema alternativo . l tem i noti di Swa le sono " corsa di cava l l i " e " m a n giatore di avena " .
Appendice: SWALE un programma che spiega
•
•
289
S i sceg lie i l tema " corsa d i cava l l i " perché sostiene la sua attività (correre), e I'Ms esteso è Poiché Swale aveva un difetto cardiaco, lo sforzo della corsa ha affaticato il suo cuore . Controllare che i l modello sia convi ncente. t ra gionevole, ma poiché i l d ifetto cardiaco n o n p u ò essere confermato, conti nuare a cercare a ltri MS.
•
Non si trova alcun altro modello regolare, p rova re q u i ndi le spiegazioni fol kloristiche d i morte; la vecchia storia del "Troppo sesso uccide " .
•
Ai cava l l i è vietato i l sesso nel periodo d i attività, non ci sono più d ivieti q uando si ritirano nella suderi a . Cerca re di estendere.
•
Poiché il problema era l'arrivo prea mturo della morte, p rovare la strategia di estensione sostituzione di previsione . Forse Swale è morto proprio per aver pensato a quella che sa rebbe stata la sua vita in u n a scuderia .
•
I l nuovo Ms non è convi ncente. Prova re a estendere per rafforzare i l sostegno.
•
Per rafforzare, usa re la strategia Trovare un MS di connessione. G l i effetti del pensiero del sesso sono disattenzione, eccita mento e depressione. La d isattenzione si collega a l l a morte attraverso I' Ms Morto per esser pas sato davanti a un autobus. L'eccita mento può provoca re la Morte per a ttacco cardiaco . La depressione può porta re a l l a Morte per suicidio .
•
l tre MS sono pla usi bili, ma ancora non convi ncenti . La ricerca conti n u a .
•
Non si trova alcun altro Ms.
•
Ognuna delle n uove spiegazioni d i pende da con dizion i che non posson o essere confermate. L' Ms Fixx era la possibl ità che i l ricercatore ha trovato i m mediata mente, perciò viene accettata la versione estesa di Fixx com e spiegazione più p roba bile.
•
La ca ratteristica ca usale significativa che Fixx e Swale con d ivideva n o era che faceva no sforzi fisici . L' Ms viene genera l izzato per a p p l icarlo alle persone che h a n no come te ma lo sforzo.
•
L'Ms genera l i zzato viene i nsta l lato nella memoria per g l i usi futu ri .
290
Modelli di spiegazione
Concl usioni I n questo capitolo abbiamo descritto un programma che crea spiegazioni per un fatto insolito facendo riferimento alle esperienze precedenti e adattando le spiegazioni, che in passato hanno funzionato, per adattarle alla nuova situazione. Il programma procede individuando le anomalie, cercando modelli di spiega zione pertinenti nella memoria, applicando questi modelli se si mostrano adatti, aggiustandoli se non lo sono, e installando i risultati nella memoria in vista di elaborazioni future. Il programma SWALE ha trattato concretamente i problemi che nascono in ognuna di queste fasi . S WALE è un programma che deve ancora crescere. Attualmente lavora su una storia in input e genera un insieme di nuove spiegazioni. La sua biblioteca di modelli di spiegazione è piccola, come la sua biblioteca di strategie di riparazione, la sua biblioteca di strategie di ricerca e la sua base di dati di regole. Questa piccola base di conoscenza rende molto prevedibile il comportamento del programma. Nonostante ciò, siamo molto soddisfatti dei risultati prelimina ri. Crediamo che la struttura fondamentale del programma sia solida e pensiamo di sapere quale forma di rappresentazione di conoscenza svilupperà. Il passo successivo è quello di sviluppare una base di conoscenza molto più ampia, in modo che il programma acquisti flessibilità e possa produrre sorprese. Abbiamo già visto anticipazioni di questo comportamento. Ad un certo punto il pro gramma non rappresentava la differenza fra correre e camminare; inaspettata mente il programma ha congetturato che Swale sia morto per lo sforzo di camminare sul suo trogolo per la biada. Abbiamo considerato questa spiegazione un bug, che abbiamo sistemato rendendo più particolareggiata la rappresentazione, ma non è completamente incomprensibile. Una volta che il programma avrà accumulato spiegazioni e conoscenze con cui lavorare, speriamo che andrà spesso oltre la produzione di quelle spiegazioni per cui l ' abbiamo progettato. Il nostro obiettivo è quello di sviluppare un programma che possa produrre spiegazioni interessanti e creative che nessuno di noi ha mai immaginato.
Riferi menti
Abelson, R . , Carroll, J . ( 1965). "Computer Simulation of Individuai Belief System s in American Behavioral Scientist, 8, pp. 24 - 30. Carbonell, J. (1 979). Subjective Understanding: Computer Models of Belief Systems, Ph.D. Thesis, Yale University. Col by, K. M. ( 1 973 ). The Structure ofBeliefSystems, Schank, R. C., and Colby , K.M. ed s., Computer Models ofThought and Language, W.H. Freeman and Company, S an Francisco, pp. 25 1 - 286. Col by, K.M., e Smith, D.C . ( 1 9 6 9 ) . Dialogues between Humansandan Artificial BeliefSystem, Walker, D .E. e Norton , L.M. eds., Estratti della Intemational Joint Conference on Artificial Intelligence, IJCAI, Boston. Cullingford, R . ( 1 9 78 ) . Script Application: Computer Understanding of Newspaper Stories, Ph. D. Thesis, Yale University, Researche Report # 1 16. DeJ on g, G. (1 979). Skimming Stories in rea l Time: An Experiment in lntegrated Understanding, Ph . D . Thesis, Yale University. Dre y fu ss H.L. (1 972). What Computers C an' t Do: A Critique of Artificial reason, H arper e Row, New York. Hammond, K. ( 1 984). /ndexing and Casuality: the organization ofplans and strategies in memory. Technical Rep ort 35 1 , Y ale University Department of Computer Science. K o g os , F. ( 1 970). Book of Yiddish Proverbs, Poplar Books, Secaucus, NJ. Lebowitz, M . ( 1 980). Generalization and Memory in an lntegrated Understanding System, Ph.D. Thesis, Yale University. Lytinen, S. ( 1 9 84). The Organization ofKnowledgeln aMulti-lingual, lntegrated Parser, P h. D. Thesis, Yale University. Research Report # 340. Newel l, A., & Simon, H. ( 1 9 7 2) . Human Problem Solving, Prentice-Hall, E n glewood Cl iffs , NJ. Restak, R.M. ( 1 979). The Brain: The Last Frontier, Doubleday, Garden City, NY. ",
,
Rieger, C. ( 1 975). "Conceptual Memory and Interference", in Conceptual Jnformation Processing, North-Holland, Amsterdam. Schank, R. C. ( 1 972 ). Conceptual Dependency: A Theory ofNa turai Language Understanding, Cognitive Psychology, 3/4, pp. 552 - 63 1 . Schank, R.C. ( 1 975). Fundamental Studies in Computer Science, Volume 3: Conceptual lnformation Processing, North-Holland, Amsterdam. Schank, R. C. ( 1982). Dynamic Memory: A Theory oflearning in Computers and People, Cambridge University Press[tr. it.: Memoria dinamica, Marsilio, Venezia 1987] . Schank, R.C., e Abelson, R. ( 1977). Scripts, Plans, Goals and Understanding, Lawrence Erlbaum Associates, Hillsdale, New Jersey. Schank, R.C., e Riesbeck, C . ( 1 98 1) . lnside Computer Understanding: Five Programs with Miniatures, Lawrence Erlbaum Associates, Hillsdale, New Jersey. Searle, J .R. ( 1980). Minds, Brains and Programs, The Behavioral and Brain Sciences, 3, pp. 4 1 7 - 424 [tr. it. : Menti, cervelli e programmi, CLUP-CLUED Milano, 1 984] . Shortliffe, E.H., Axline, S.G., Buchanan, B.G., Merigan, T.C., e Cohen, N.S. ( 1 973). An Artificial Intelligence Program to Advise Physicians Regarding Antimicrobal Therapy, Computers and Biomedica/ Research, 6, pp. 544 560. Turing, A.M. ( 1 963). Computing Machinery and Intelligence, Feigenbaum, E. A., and Feldman,J. eds., Computers andThought, McGraw-Hill, New York [ tr. i t. "Macchine calcolatrici e intelligenza" in La filosofia degli atomi a cura di R. Cordeschi e V. Somenzi, Boringhieri, Torino, 1 986] . Weizenbaum, J. ( 1 976). Computer Power and Human reason:from Judgement to Calculation, Freeman, San Francisco [tr. it. : Il potere del computer e la ragione umana, Gruppo Abele, Torino, 1 987] . Wilensky, R. ( 1 978). Understanding Goal-Based Stories, Ph.D. Thesis, Yale University, Research Report # 140. Winograd, T. ( 1 972). Understanding Natural Language, Academic Press, New York.
Finito di stampare nel mese di Dicembre presso la Nuova Stampa Mondadori Cles Gruppo Mondadori Stampato in Italia - Printed in Italy
1990 (TN)