136 0 5MB
Italian Pages 563
Prologo
L’E CONOMIA E LA R ICCHEZZA DELLE N AZIONI E DEI P OPOLI
[L’economia è lo studio del] comportamento umano come rapporto fra obiettivi dati e mezzi limitati... L. Robbins (1935, p.16)
Una transazione economica è un problema politico risolto... L'economia ha guadagnato il titolo di Regina delle Scienze Sociali scegliendo come dominio i problemi politici risolti. Abba Lerner (1972, p. 259).
Per i suoi fondatori, l’oggetto dell’economia politica era la ricchezza delle nazioni e dei popoli. Nel XIV secolo, Ibn Battuta, uno dei principali geografi ed esploratori dell’epoca, viaggiò in lungo e in largo in Asia, Africa, Medio Oriente, Russia e Spagna. Nel 1347, visitò la regione oggi chiamata Bangladesh. “È un …paese… ricco di riso”, scrisse. Egli descrisse i viaggi lungo i corsi fluviali, che scorrevano “tra villaggi e frutteti, quasi stessimo attraversando un bazar.”1 Sei secoli dopo, un terzo della popolazione del Bangladesh è sottonutrita, ed il paese è tra i più poveri al mondo. Al tempo del viaggo di Ibn Battuta in Bangladesh, l’Europa era soggiogata dalla peste bubbonica, che tolse la vita a più di un quarto della popolazione di molte città. A Londra la mano d’opera, probabilmente tra le più ricche nel continente, consumava meno di 2000 calorie al giorno.2 La scarsità di forza lavoro dovuta alla 1
Il suo racconto è pubblicato in Battuta (1929):267, 271. Una seconda fonte, Yule (1886):457 riporta questa annotazione “Non ho mai visto una regione nel mondo dove le provviste siano così abbondanti,” ma si può trattare di un’errata traduzione di Yule o della fonte francese a cui egli attinge. 2 Per questi dati si veda Allen (2001). Per le serie sui salari del dopo ‘900 si veda Bowles, Samuel and Edwards (1993).
2 | MICROECONOMIA
peste fece aumentare i salari reali in qualche misura sino alla metà del secolo successivo, tuttavia nei successivi quattro secoli i salari reali dei lavoratori non aumentarono in nessuna città europea per la quale esistano dati, e per la maggior parte i salari diminuirono considerevolmente (nel Nord Italia dimezzarono il loro livello iniziale). Negli ultimi due secoli, tuttavia, i salari reali sono aumentati bruscamente, prima in Inghilterra, dove sono aumentati di venti volte, e successivamente, per un ammontare anche maggiore, nelle altre città europee. Che cosa può spiegare un così drammatico capovolgimento della sorte? La risposta più plausibile, molto brevemente, è la seguente. L’emergere e il diffondersi di un nuovo assetto istituzionale, che prenderà il nome di capitalismo, causò un’ampia espansione della produttività del lavoro umano. Ciò portò a più alti salari in un momento in cui il potere di contrattazione dei lavoratori era aumentato a causa dell’espansione dei diritti politici dei lavoratori e a causa dell’indisponibilità di nuove assunzioni nell’agricoltura, nella produzione familiare e in altri settori dell’economia non organizzati secondo queste nuove istituzioni. Tutto ciò accadeva in Europa, ma non in Bangladesh. Ciò che accadde in Bangladesh, così come in gran parte dell’Impero Mughal e in quella che divenne l’India Britannica, fu un crescente radicarsi del potere e dei diritti di proprietà dei potenti proprietari terrieri chiamati zamindari. La loro influenza era già notevole prima dell’Impero Britannico, tuttavia durante la Presidenza bengalese fu rafforzata molto dal Permanent Settlement del 1793. Questo atto dei sovrani coloniali conferì de facto poteri di governo agli zamindari, dando loro il diritto di riscuotere le tasse (e di tenerne una parte considerevole per se stessi). Il fatto che il sistema di tassazione britannico e la politica sul possesso delle terre non fosse uniforme ovunque nel Raj, fornisce un esperimento naturale per provare l’importanza delle istituzioni. Banerjee e Iyer (2002) hanno confrontato i risultati economici e gli indicatori sociali relativi al periodo successivo all’Indipendenza (1948) delle regioni dell’India contemporanea nelle quali agli zamindari fu dato il controllo dai sistemi coloniali di proprietà terriera e di tassazione, con le regioni nelle quali i zamindari furono aggirati a favore delle comunità locali o della tassazione diretta dei singoli coltivatori. Essi hanno riscontrato che le regioni controllate dagli zamindari avevano tassi di crescita della produttività agricola significativamente più bassi, derivanti da più bassi tassi di investimento e da un minore uso di risorse moderne. Le regioni controllate dagli zamindari stentavano a progredire, anche in modo
PROLOGO
|3
significativo, nel campo dell’educazione e della salute.3 Queste conclusioni suggeriscono una notevole persistenza degli effetti di un’innovazione istituzionale avvenuta un secolo, o più, prima. La persistente importanza delle istituzioni è ugualmente suggerita dal lavoro di Sokoloff ed Engerman (2000), che riguarda un analogo capovolgimento di sorte del Nuovo Mondo. Essi stimano che nel 1700, il reddito pro capite del Messico era circa lo stesso delle colonie britanniche, che sarebbero diventate gli Stati Uniti, mentre Cuba e le Barbados erano più ricche almeno della metà. Alla fine del XVII secolo Cuba aveva un reddito pro capite leggermente più alto di quello degli Stati Uniti, ed Haiti era probabilmente la società più ricca al mondo. All’inizio del XXI secolo, tuttavia, il reddito pro capite del Messico era meno di un terzo del livello di reddito degli U.S., e quello di Haiti era ancora più basso. In una serie di lavori Sokoloff e Engerman forniscono la seguente spiegazione.4 Nelle regioni del Nuovo Mondo in cui lo zucchero e gli altri raccolti delle piantagioni poterono crescere (Cuba, Haiti) o in cui i minerali e il lavoro indigeno erano abbondanti (Mexico), le élites economiche poterono contare su lavoro forzato o schiavi e consolidarono il loro potere e i privilegi materiali attraverso istituzioni molto esclusive. Ciò limitò l’accesso dei meno abbienti alla scolarizzazione, alle terre pubbliche, alla protezione brevettuale, alle opportunità imprenditoriali e alla partecipazione politica. Uno dei risultati, nei secoli successivi, anche dopo la scomparsa della schiavitù e di altre forme di coercizione del lavoro, fu che le opportunità di risparmio, innovazione e investimento furono monopolizzate dalle categorie abbienti. L’alfabetizzazione rimase bassa e la proprietà delle terre molto concentrata. Durante il passaggio delle risorse della terra da un’estrazione naturale al settore manifatturiero e ai servizi, queste economie, fortemente disuguali ristagnarono, mentre economie molto più inclusive, quali quelle degli Stati Uniti e del Canada, crebbero rapidamente. Il modo in cui le loro istituzioni meno esclusive hanno contribuito al successo delle economie nord americane rimane al quanto oscuro, ma un’ipotesi plausibile è che l’ampio accesso alla terra, le opportunità imprenditoriali ed il capitale umano abbiano stimolato la crescita. L’origine delle differenze istituzionali tra le colonie del Nuovo Mondo sembra derivare dalle loro dotazioni iniziali di fattori di produzione, piuttosto che dalle 3
I dettagli del legame causale tra il controllo dei latifondisti e i conseguenti risultati resta da esaminare. In quanto le pratiche coloniali cambiarono nel tempo in risposta ad eventi esogeni (come la rivolta dei soldati in India nel 1857) e nello spazio in risposta ad idiosincrasie degli amministratori locali, Banerjee e Iyer sono stati in grado di identificare fonti indipendenti di variazione nel possesso della terra e nelle politiche di tassazione, che non sono dovute a condizioni preesistenti. 4 Si veda anche Engerman, Sokoloff e Mariscal (2002) e Acemoglu, Johnson, e Robinson (2002).
4 | MICROECONOMIA
differenti culture o dalle politiche coloniali degli Stati Europei che le conquistarono. Le britanniche Belize e Guyana seguirono lo stesso cammino delle spagnole Honduras e Colombia, Barbados e Jamaica seguirono il cammino di Cuba e Haiti. I puritani che costituirono Providence Island nei pressi della costa del Nicaragua abbandonarono i loro ideali politici e divennero schiavisti. Sull’isola c’erano più schiavi che puritani quando fu invasa dagli spagnoli nel 1641. Secondo il principale storico dell’isola “[…] la colonia puritana […] con la sua economia sostenuta dall’iniziativa privata e dalla schiavitù, somigliava molto ad una qualsiasi colonia dell’India occidentale.”(Kupperman, 1993, p.2) Nel periodo della sua caduta, Providence Island era un’attrattiva per gli emigranti che provenivano dalle colonie puritane del nord, molto più conosciute, e due navi cariche di sfortunati pellegrini arrivarono dal Massachussetts poco dopo l’occupazione spagnola. Un ultimo esempio è dato dal precipitoso collasso del Partito Comunista che governava l’Unione Sovietica e dei suoi alleati dell’Est Europa intorno al 1990 e dalla transizione dei nuovi stati ad un’economia basata sul mercato. La figura P.1, che mostra i livelli del prodotto interno lordo pro capite relativi agli anni ’90 per quindici di queste nazioni, rivela differenze di andamento drammatiche. Dopo una decade di transizione, il reddito pro capite della Polonia si stabilizzò un 40 percento sopra il livello iniziale (contrassegnato dalla P nella figura), mentre il reddito della Russia era diminuito di un terzo, e quello della Moldavia era sceso a meno del 40 percento del livello iniziale. Nello stesso periodo il reddito pro capite della Cina era più che raddoppiato (il dato non è mostrato). Tra queste economie solo la Polonia ha superato la media (non ponderata) delle economie OCSE. Mentre il successo delle riforme graduali della Cina è stato oggetto di studio approfondito, le differenze tra i paesi che hanno intrapreso una rapida transizione sono scarsamente comprese. Una possibile spiegazione è che, a cominciare da istituzioni molto simili, piccole differenze nel contenuto o nella scelta del momento opportuno per attuare il pacchetto di riforme o le occasioni date dagli eventi hanno avuto come risultato profonde e cumulative differenze nei risultati, dovute al fatto che alcuni paesi (per esempio, Ungheria e Polonia) furono in grado di cogliere gli effetti sinergici delle complementarietà istituzionali, mentre altri non ne furono capaci (Hoff e Stiglitz, 2002). Altre spiegazioni sottolineano le sostanziali differenze istituzionali tra i paesi o i loro divergenti livelli di fiducia o altre norme sociali. Ciò che non è controverso è che divergenze nei risultati di tale portata, che emergono in meno di una decade, suggeriscono sia l’importanza rivestita dalle istituzioni economiche sia l’influenza pervasiva degli effetti di feedback positivo, per cui sia il
PROLOGO
|5
successo che il fallimento sono cumulativi.
Anni
Figura P.1. la divergenza del PIL reale pro-capite nei paesi ex-comunisti (anno base 1990). Fonte: World Bank (Statistical Information Management Analysis data base).
Ho scelto deliberatamente casi che enfatizzano il ruolo centrale delle istituzioni. Altre comparazioni avrebbero potuto suggerire conclusioni diverse o non così evidenti. Nel periodo che va dal 1950 al 1990, per esempio, paesi con regimi democratici e autoritari sembrano differire sorprendentemente poco nell’insieme dei loro risultati economici (controllando anche per altri fattori), mentre differenze maggiori si notano solo nei loro dati anagrafici (una crescita più lenta della popolazione nelle democrazie (Przeworski, Alvarez, Cheibub e Limongi, 2002). Nondimeno, gli esempi sopra riportati – la differenza dei livelli di vita in Europa rispetto a molte altre parti del mondo, il capovolgimento di sorte nel Nuovo Mondo, e le conseguenze eterogenee della liberalizzazione nelle nazioni un tempo comuniste – sono di estrema importanza in quanto tali e, come gli esempi successivi mostrano, difficilmente possono essere considerati atipici. Che cosa può dirci l’economia moderna circa la ricchezza e la povertà delle nazioni e dei loro popoli? Non meno importante, che cosa si può fare a tal proposito? §
6 | MICROECONOMIA
Contrariamente alla sua reputazione conservatrice, l’economia politica si è sempre occupata di cambiare il modo in cui il mondo funziona. I primi economisti – i mercantilisti e i fisiocratici – erano i consiglieri dei sovrani assolutisti dell’Europa all’inizio dell’epoca moderna, oggigiorno i macroeconomisti, i consiglieri dello sviluppo economico e gli architetti della transizione dal comunismo alle società basate sul mercato continuano questa tradizione di impegno nel mondo reale. Gli economisti non sono mai stati estranei alla politica attiva e alla creazione delle costituzioni. La speranza che gli economisti possano aiutare ad alleviare la povertà ed assicurare le condizioni sotto le quali popoli liberi possano fiorire, è al tempo stesso la nostra vocazione più ispirante e la più grande sfida. Come tanti, sono stato attratto dall’economia con questa speranza. Avendo studiato da ragazzo in India ed avendo insegnato in una scuola secondaria in Nigeria prima di dedicarmi all’economia, naturalmente ho approcciato questo campo con l’aspettativa che esso potesse affrontare il persistente problema della povertà globale e dell’ineguaglianza. All’età di undici anni avevo notato come fossi simile rispetto ai miei compagni di classe della Scuola Pubblica di Delhi – nello sport, nei lavori scolastici, in quasi ogni cosa. Da allora una domanda mi ha assillato: com’è possibile che gli Indiani siano tanto più poveri degli Americani, dato che come popolo siamo così simili nelle nostre capacità? Così ho iniziato il Ph.D. sperando che l’economia potesse, per esempio, spiegare perché i lavoratori negli Stati Uniti producono in un mese quello che in India si produce in quasi un anno, e perché la popolazione indiana è corrispondentemente povera (Hall e Jones, 1999). Noi ora sappiamo che le spiegazioni economiche convenzionali hanno fallito: in base a qualsiasi calcolo ragionevole, la differenza nel rapporto capitale-lavoro e nel livello di scolarizzazione della forza lavoro degli Stati Uniti e dell’India spiegano molto meno di quanto faccia la metà della differenza di produttività. Sembra plausibile che il divario derivi da cause più difficili da misurare e, fino a poco tempo fa, meno studiate dagli economisti: ossia differenze nell’esperienza storica, nelle istituzioni e nei comportamenti convenzionali. Questo è l’oggetto principale del presente libro. I Principi di Alfred Marshall (1842-1924) è stato il primo grande testo nell’economia neoclassica. Apre con queste righe: Adesso, in fine, ci stiamo ponendo seriamente la domanda se e’ necessario che esista la cosidetta “classe bassa”: ossia se debba esserci tantissima gente condannata dalla loro nascita a lavorare duro per fornire agli altri i requisiti per una vita raffinata e acculturata, mentre ad essi stessi e’precluso dalla loro povertà e dal loro lavoro, di avere una qualsiasi parte o partecipare a quella vita. ... La risposta dipende in gran parte da fatti ed inferenze, che si trovano nell’ambito dell’economia; e questo è quello che dà agli studi economici il loro principale e più alto interesse.
PROLOGO
|7
(Marshall, 1930, pp.3-4)
Marshall scrisse ciò nel 1890. Immagino che egli sarebbe deluso dal progresso che l’economia ha fatto nei confronti di quei nobili obiettivi nel secolo successivo. § Il paradigma neoclassico che Marshall aiutò a fondare mal si attagliava al compito che egli pose. Le sue ipotesi definitorie preclusero l’analisi di molti aspetti chiave del progresso e della stagnazione economici, tra cui l’esercizio del potere, l’influenza dell’esperienza e di condizioni economiche sulle preferenze e sulle congetture (beliefs) della gente, le dinamiche di disequilibrio e il processo di persistenza e cambiamento istituzionale. Attingendo ai contributi di molti – tra economisti e non – questo libro presenta una teoria su come i comportamenti individuali e le istituzioni economiche interagiscono nel produrre risultati aggregati, e su come sia gli individui che le istituzioni cambino nel tempo. Esso è basato su ipotesi che sono completamente diverse da quelle che definiscono il paradigma neoclassico. In quel che segue, userò il termine paradigma walrasiano (da Leon Walras (1834-1910), un altro dei fondatori dell’economia neoclassica), preferendolo al più ampio termine neoclassico. Con la parola walrasiano intendo riferirmi a un approccio economico che ipotizza che gli individui decidano le loro azioni in base a una valutazione di lungo periodo delle loro conseguenze, basata su preferenze che sono autostimate ed esogenamente determinate, che le interazioni sociali prendono esclusivamente la forma di scambi contrattuali, e che gli aumenti nei rendimenti di scala possono essere ignorati nella maggior parte delle applicazioni. Con alcuni raffinamenti, queste ipotesi spiegano i successi analitici caratteristici e l’orientamento normativo dell’approccio walrasiano. Il termine paradigma allude agli insegnamenti centrali dell’approccio, insegnati agli studenti. L’approccio qui sviluppato conserva molti dei principi fondamentali del paradigma walrasiano e della scuola classica, che ha sostituito. Tra questi vi sono tre idee molto conosciute, ovvero: che, quando gli individui agiscono, essi cercano di conseguire qualcosa; che un’azione intenzionale è vincolata dagli effetti della competizione; e che i risultati aggregati di un gran numero di individui che interagiscono in questo modo sono tipicamente involontari. Questi principi hanno fornito le basi per lo sviluppo dell’economia sin dall’inizio e spiegano molte intuizioni analitiche. Altri aspetti del paradigma walrasiano, tuttavia, sono stati sostituiti.
8 | MICROECONOMIA
L’approccio walrasiano rappresenta il comportamento economico come la soluzione ad un problema di ottimizzazione vincolata affrontata da un individuo perfettamente informato in un ambiente in pratica libero da istituzioni. La celebre definizione di Robbins del problema riflette questa equazione dell’economia con ottimizzazione vincolata. Il passare del tempo è rappresentato semplicemente da un tasso di sconto; le persone non apprendono o acquisiscono nuove preferenze, le istituzioni non evolvono. Le azioni di tutti gli altri non sono rappresentate da niente di più complicato di un vettore dato di prezzi market-clearing, mentre la prossimità è rappresentata da un costo di trasporto. I diritti di proprietà e le altre istituzioni economiche sono rappresentate semplicemente da un vincolo di bilancio. Un agente economico in questo modello è grosso modo Robinson Crusoe con prezzi che si sostituiscono alla natura. I Crusoe dell’economista abitano un mondo in cui i beni sono scarsi, ma tutte le istituzioni necessarie per coordinare le loro attività in maniera ottima sono liberamente disponibili. L’“offerta” di istituzioni ottime può così essere ignorata, per la stessa ragione per cui Adam Smith spiegava che gli economisti non hanno bisogno di formulare delle teorie sul valore dell’acqua: essi sono beni liberi. Questa descrizione del paradigma walrasiano è naturalmente una cariacatura, sebbene riconoscibile, di ciò che gli economisti hanno insegnato nei principali programmi di dottorato fino ai primi anni ’80. Da allora una combinazione di nuovi strumenti analitici – in particolar modo la teoria dei giochi e l’economia dell’informazione – e la sempre più evidente inadeguatezza empirica del modello walrasiano si sono combinati ed hanno modificato il modo in cui l’economia viene insegnata ed esercitata. Gli agenti economici non interagiscono più soltanto con la natura o con un qualche altro ambiente parametrico, bensì gli uni con gli altri, in maniera strategica. Le loro interazioni non sono più descritte completamente dai prezzi dei beni che essi scambiano, in quanto alcuni aspetti delle loro transazioni non sono espresse in contratti enforceable (il cui rispetto può essere assicurato). Nondimeno, nella pratica, anche se alcune delle ipotesi tipicamente walrasiane sono venute meno, i principi comuni del vecchio paradigma sono evidenti in molti dei nuovi approcci. Robert Solow li definiva come “equilibrio, avidità e razionalità”, volendo intendere che quando gli economisti “spiegano” qualcosa – ad esempio, la disoccupazione – essi vogliono dire che può essere rappresentata come un unico risultato stazionario in un modello di interazioni tra individui autointeressati e con capacità cognitive e predisposizioni avanzate. Altri modi per “spiegare” la
PROLOGO
|9
disoccupazione possono essere presi in considerazione, ma questa è l’opzione di base. L’interesse di Solow sull’adeguatezza dei tre principi di base è sempre più supportata da progressi sia empirici che concettuali. L’approccio che presento in questo libro si basa sui più modesti, ma forse più duraturi, principi classici dell’azione intenzionale e della competizione. Proprio come il paradigma walrasiano suppone che vi sia un particolare tipo di interazioni sociali come caso standard – rappresentato in precedenza da Robinson Crusoe – l’approccio qui riportato è concepito per mettere in luce una situazione generica sulla base di tre caratteristiche, osservate empiricamente, delle strutture di interazione sociale, dei comportamenti individuali e delle tecnologie. Qui abbozzo semplicemente quelli che considero essere i fatti salienti di queste generiche interazioni e dimostro alcune importanti implicazioni. Mi faccio carico del compito di definire un modello di queste interazioni (e di fornire alcune rilevanti prove empiriche) nei seguenti capitoli. Interazioni sociali non contrattuali. Quando gli individui interagiscono, è l’eccezione, non la regola, che tutto ciò che avviene tra di loro sia regolato da un contratto perfetto e facilmente enforceable. Invece, le interazioni sociali non contrattuali sono onnipresenti nei vicinati, nelle imprese, nelle famiglie, negli ambienti comuni, nei progetti politici e nei mercati. Benché molte di queste interazioni sociali non contrattuali si collochino in un ambiente non di mercato, esse sono importanti anche per la determinazione dei risultati economici in mercati fortemente competitivi. Per questo motivo, nelle pagine che seguono, tratterò il mercato dei beni in presenza di contrattazione completa – un elemento basilare per un manuale di economia introduttiva – come un caso speciale. Il caso generico è illustrato dai mercati del lavoro e dai mercati del credito – nei quali non è scontato che la promessa di lavorare sodo o di restituire il prestito sia enforceable – o dai problemi della gente comune in un ambiente locale circoscritto – nel quale lo sfruttamento delle risorse individuali impone delle ripercussioni, non contrattabili, sugli altri. Una caratteristica dei mercati con contratti incompleti è che uno o entrambi i partecipanti ad una semplice transazione bilaterale tipicamente ricevono delle rendite, cioè, dei pagamenti superiori al valore della loro prossima miglior alternativa disponibile. Nei mercati del lavoro e del credito alcuni lavoratori e debitori non sono in grado di trattare sulle quantità che essi preferiscono alle condizioni di scambio in vigore, cioè, essi sono limitati quantitativamente, e i mercati che ne risultano non sono in bilancio, manifestando un eccesso di offerta (per esempio, di lavoro) o un eccesso di domanda (di prestiti). Se molti aspetti delle interazioni economiche non sono regolati attraverso i
10 | MICROECONOMIA
contratti, come possono essere regolati? La risposta è: gli aspetti non contrattuali delle interazioni sono regolati attraverso una combinazione di norme e potere. Un contratto di lavoro non richiede alcun particolare livello di sforzo; ma l’etica del lavoratore o il timore del licenziamento o una pari pressione da parte dei compagni di lavoro potrebbero compiere ciò che l’enforcement dei contratti non può. L’ipotesi che il potere sia esercitato regolarmente nelle transazioni dei mercati competitivi colpirà alcuni lettori come un luogo comune; ma ad altri apparirà una contraddizione in termini. Per gli economisti neoclassici (come Abba Lerner, nella citazione introduttiva) “una transazione è un problema politico risolto”. Esso è “risolto” attraverso lo strumento dei contratti completi, così che tutto ciò che è d’interesse per tutte le parti, ai fini di una transazione, può essere applicato attraverso i tribunali. Con tutti i termini di una transazione specificati contrattualmente, non rimane nulla da fare per l’esercizio del potere. Per la stessa ragione, le norme sono ridondanti: se il contratto di un lavoratore specificasse un ammontare dato di lavoro per un ammontare dato di paga e se lo sforzo lavorativo fosse verificabile facilmente, allora il datore di lavoro si interesserebbe poco dell’etica lavorativa dei suoi lavoratori. L’alleggerimento dell’ipotesi di contrattazione completa in questo modo non solo spiega perché in molti mercati non si raggiunge l’equilibrio della domanda con l’offerta, ma rivela anche un importante ruolo economico sia per il potere che per le norme, rendendo la teoria più vicina al modo in cui gli osservatori e i partecipanti guardano gli scambi del mondo reale. Comportamenti adattivi ed etero-interessati. Il recente lavoro sperimentale di alcuni economisti (confermando ed estendendo un primo lavoro di altri studiosi di scienze sociali) così come osservazioni in un ambiente naturale suggeriscono una riconsiderazione sia della “razionalità” che dell’”avidità” nei tre principi di Solow. Gli individui perseguono intenzionalmente i loro obiettivi, ma lo fanno per lo più attingendo ad un repertorio limitato di risposte comportamentali acquisite attraverso l’esperienza passata piuttosto che attraverso l’impegno in processi di ottimizzazione con aspettative razionali, i quali sono considerati nello stesso modo dall’approccio walrasiano e dalla maggior parte della teoria classica dei giochi. In molte situazioni, emozioni come la vergogna, il disgusto o l’invidia si mescolano con la consapevolezza nel generare una risposta comportamentale. Inoltre, benché l’interesse personale sia una motivazione forte, le motivazioni etero-interessate sono altrettanto importanti. Negli esperimenti e nella vita reale, le persone frequentemente sono disposte a ridurre il proprio benessere non solo al fine di aumentare quello degli altri, ma anche al fine di penalizzare coloro il cui comportamento ha danneggiato
PROLOGO
|11
loro o altri, o che hanno violato una norma etica. Queste cosiddette “preferenze sociali” aiuteranno a spiegare perché spesso le persone cooperano per raggiungere fini comuni, anche quando la defezione produrrebbe vantaggi materiali maggiori, perché i piani di incentivo basati sull’interesse personale a volte hanno un effetto contrario, e perché le imprese non vendono i posti di lavoro. Modelli adeguati di gran parte delle interazioni non possono essere popolati da individui identici che si conformano agli assiomi dell’interesse personale dell’Homo economicus, ma piuttosto devono tener conto del fatto – confermato negli esperimenti e nell’ambiente naturale – che le persone sono eterogenee – alcune più autointeressate, altre più attente civicamente, per esempio – e versatili – le nostre azioni si adattano alle situazioni, piuttosto che riflettere una predisposizione comportamentale per un qualsiasi singolo scopo. Come risultato sia della eterogeneità che della versatilità comportamentali, vedremo, piccole differenze nelle istituzioni possono provocare grandi differenze nei risultati, con alcune situazioni che inducono gli individui egoisti ad agire in cooperazione, ed altre che inducono comportamenti egoistici in coloro che sono predisposti a cooperare. Gli economisti hanno comunemente considerato i comportamenti che violano i canoni rigorosi della razionalità formale comportamenti idiosincratici, instabili o irrazionali, in breve, che non mostrano le regolarità che si accorderebbero con l’analisi scientifica. Ma il fatto che i soggetti sperimentali mostrino delle “irrazionalità” come l’intransitività, l’avversione alle perdite, l’incoerenza nello sconto temporale e la sopravvalutazione di eventi con una bassa probabilità, suggerisce che questi comportamenti sono non solo comuni, ma anche suscettibili di analisi. Il processo attraverso il quale le persone acquisiscono le loro risposte comportamentali comprende il copiare i comportamenti di coloro che si è osservato che in situazioni simili hanno ottenuto dei risultati giudicati positivi secondo un qualche standard, o l’agire al fine di massimizzare i propri guadagni date determinate congetture circa le azioni degli altri. Ma vi sono anche altri fattori che agiscono, incluso il conformismo e altre forme di apprendimento basate sulla frequenza e non correlate ai risultati associati ai comportamenti. Conseguentemente, le previsioni di comportamento basate su una massimizzazione dei payoff futuri (forward-looking) potrebbero essere abbastanza fuorvianti. Inoltre, le risposte comportamentali acquisite dagli individui in un particolare ambiente è improbabile che siano acquisite dagli stessi individui in un ambiente totalmente differente. In questo senso non solo le opinioni individuali (sulle conseguenze delle loro azioni) sono endogene. I “fini dati” invocati da Robbins sono una utile semplificazione in molti lavori analitici, ma
12 | MICROECONOMIA
sono una restrizione arbitraria e fuorviante in altri.
Rendimenti crescenti generalizzati. Le interazioni economiche e sociali spesso conducono a percorsi denominati da Gunnar Myrdal (1956) di causazione cumulativa, o di quelli che sono oggi chiamati feedback positivi. I feedback positivi includono le economie di scala nella produzione; tuttavia il termine si riferisce più in senso lato ad ogni situazione in cui il guadagno (payoff ) per chi agisce in un modo è crescente nel numero di persone che agiscono nello stesso modo. Il fatto che i benefici derivanti dall’apprendimento di una particolare lingua dipendano dal numero di coloro che la parlano o che il guadagno dall’impegnarsi in un’azione collettiva dipenda dal numero dei partecipanti, sono illustrazioni più generiche. Per distinguere questa ampia classe di casi di feedback positivi dal sottoinsieme basato sui rendimenti di scala crescenti nella produzione, userò il termine rendimenti crescenti generalizzati. Le sinergie tra istituzioni possono essere molto simili a questi rendimenti crescenti generalizzati. Per esempio, il possesso privato della proprietà, i mercati competitivi e le norme legislative spesso implementano le soluzioni molto efficienti per i problemi allocativi; ma solo se tutte le tre componenti sono presenti e quasi tutti i membri della società aderiscono a questi principi. Rendimenti crescenti generalizzati dovuti a queste complementarietà istituzionali sembrano essere una fonte di divergenza negli andamenti di crescita del Nuovo Mondo e delle economie ex-comuniste, menzionate in precedenza. Possono inoltre aiutare a spiegare l’aumento nella disuguaglianza tra la gente del mondo nell’ultimo secolo e mezzo, nonostante il recupero di Giappone, Cina e altre nazioni dell’Asia dell’Est.5 Questi feedback positivi creano degli ambienti economici in cui piccoli eventi casuali hanno conseguenze durevoli per un lasso temporale molto lungo, e in cui le condizioni iniziali possono avere effetti persistenti, cosiddetti di lock-in. Le “trappole di povertà”, affrontate dai popoli e dalle nazioni così come i “cicli virtuosi” di benessere goduti dagli altri, mostrano queste influenze. La ragione è che, in presenza di rendimenti crescenti generalizzati, tipicamente si ha il caso in cui esiste più di un risultato stazionario con la proprietà che piccole deviazioni da quel risultato si autocorreggono. Questi equilibri stabili multipli possono essere sostituiti da quelli che appaiono nel nostro modello come shock esogeni, mutazioni, o azioni idiosincratiche, ma che nel mondo reale prendono la forma di guerre, cambiamenti climatici, o altri eventi non inclusi nel modello in esame.
5
Si veda Bourguignon e Morrison (2002) e le opere qui citate.
PROLOGO
|13
Un risultato può essere periodi rari ma drammatici di cambiamento nelle istituzioni, i comportamenti, le tecnologie e altro e di conseguenza una popolazione si sposta dall’intorno di un equilibrio a un altro, spesso seguito da lunghi periodi di stabilità. I biologi usano il termine equilibri punteggiati per riferirsi a questo modello alternante di stasi e rapido cambiamento (Eldredge e Gould, 1972). Il collasso del comunismo è un esempio; un altro è la scomparsa della fasciatura dei piedi delle giovani donne in Cina. Questa dolorosa e inabilitante consuetudine è durata per un millennio, resistendo ai tentativi di porvi fine nei secoli; tuttavia è scomparsa nel corso di appena una decade e mezzo nella prima parte dell’ultimo secolo (Macie, 1996). L’esistenza di equilibri multipli può spiegare anche perché popolazioni apparentemente simili potrebbero finire per avere norme, gusti e costumi abbastanza differenti, spesso avendo per risultato un modello, largamente osservato, di omogeneità locale ed eterogeneità globale, cucine nazionali e gusti sul cibo differenti forniscono un esempio. Non ci sono ragioni e vi sono poche prove che suggeriscano che le istituzioni e i comportamenti che ne conseguono siano in qualche senso ottimi. Seguendo la caduta del comunismo nell’Unione Sovietica e nell’Europa dell’Est, per esempio, molti economisti predissero con sicurezza che non appena la proprietà di stato fosse stata abolita, una configurazione realizzabile di istituzioni capitaliste sarebbe emersa spontaneamente. Ma in Russia e molte delle altre economie in transizione, una decade di assenza di legge e di cleptocrazia hanno creato una concentrazione enorme della ricchezza sotto istituzioni che forniscono pochi incentivi per la crescita della produttività e degli investimenti. I risultati economici deludenti della fine del dominio comunista in questi paesi sottolinea la fallacia del parere convenzionale per cui in un mondo di scarsità materiale, delle buone istituzioni siano libere. Nelle pagine che seguono, le istituzioni, come i beni, sono considerate scarse. Le tre assunzioni fondamentali abbozzate in precedenza – la natura non-contrattuale delle interazioni sociali, i comportamenti adattivi ed etero-interessati, e i rendimenti crescenti generalizzati – definiscono il caso generico, la mia situazione di base. I tre sono correlati. L’alleggerimento dell’ipotesi di contrattazione completa senza la modifica delle ipotesi comportamentali dell’economia walrasiana non è convincente, poichè l’importanza delle preferenze etero-interessate come vedremo, aumenta considerevolmente se si prende in considerazione un contesto di contrattazione incompleta. Allo stesso modo, il processo attraverso il quale le preferenze mutano, mostra forti rendimenti crescenti generalizzati. La ragione è che le norme generalmente prendono la forma di convenzioni, alla cui adesione si ha interesse soltanto finché molti altri lo fanno. Così, l’alleggerimento delle ipotesi
14 | MICROECONOMIA
comportamentali convenzionali aumenta i dubbi sui rendimenti non-crescenti. Infine, se i rendimenti crescenti generalizzati sono comuni, gli stati che è probabile osservare dipenderanno in modo critico da istituzioni che governano le dinamiche rilevanti, incluse cose come l’esercizio del potere, l’azione collettiva e altre forme di interazione sociale non contrattuale. § Benchè molto di ciò che segue sia il risultato di una ricerca recente, praticamente tutti i modelli e le idee presentati sono stati anticipati da scrittori mezzo secolo fa o più, a volte molto di più. L’importanza degli agenti adattivi (con capacità cognitive e predisposizioni realistiche), i cui comportamenti erano basati su un’informazione locale, era una parte centrale del lavoro di Frederich Hayek (1945) e Herbert Simon (1955). Il lavoro pionieristico di Simon sulla natura incompleta del contratto di lavoro (Simon, 1951) e il ruolo dell’autorità nel funzionamento delle imprese formalizza il precedente lavoro di Coase (1937) e molto prima di Coase, Marx (1976). I concetti base della teoria dei giochi, la contrattazione e altre interazioni sociali non di mercato furono introdotte nei primi scritti di John Nash (1950a), von Neumann e Morgenstern (1944), Thomas Schelling (1960) e Luce e Raiffa (1957). Nash propose persino le idee base della teoria dei giochi evolutivi nella sua dissertazione dottorale (1950b). La famosa soluzione di Nash al problema della contrattazione fu proposta per la prima volta assai precedentemente da F.Zeuthen (1930), in un lavoro introdotto in maniera entusiastica da Joseph Schumpeter. Le preferenze endogene erano centrali nel lavoro di James Duesenberry (1949) e Harvey Leibenstein (1950), che hanno entrambi attinto all’assai precedente lavoro di Veblen (1899/1934) ed hanno sviluppando temi inizialmente sollevati da Smith (1776) e Marx. Il famoso paradosso di Maurice Allais (1953) dimostrava problemi con ipotesi di utilità attesa che solo recentemente hanno attratto una seria attenzione. Il modo in cui feedback positivi sostengono equilibri multipli era l’idea chiave nelle lezioni al Cairo di Gunnar Myrdal nel 1955, già menzionato. L’applicazione di ragionamenti biologici all’economia ora importante nella teoria dei giochi di evoluzione fu introdotta mezzo secolo fa da Armen Alchian (1950) e Gary Becker (1962). Il fatto che molte delle idee chiave presentate nelle pagine che seguono siano state anticipate durante gli anni ’50 o prima, ma ignorate nelle decadi seguenti pone un’intrigante domanda. Perché il paradigma walrasiano divenne praticamente il sinonimo dell’economia per i tre quarti del secolo precedente, soltanto per essere
PROLOGO
|15
sostituito alla fine del secolo da un insieme di idee, molte delle quali erano state articolate da accademici noti appena prima che crescesse l’importanza del paradigma walrasiano? Herbert Gintis ed io, (Bowles e Gintis, 2000) abbiamo provato a dare una risposta alla questione, ma affrontarla qui sarebbe una digressione. § L’allentamento delle ipotesi walrasiane, per tenere conto delle interazioni sociali non contrattuali, dei comportamenti adattivi etero-interessati, e dei rendimenti crescenti generalizzati, richiederà un metodo basato più empiricamente e meno deduttivo del tipico approccio walrasiano. Facendo scarso riferimento a specificità di tempo, o spazio, o in effetti a qualsiasi fatto empirico, il paradigma walrasiano ha dedotto alcune predizioni piuttosto forti riguardanti i risultati che verosimilmente si osservano nell’economia. L’espansione del dominio dell’economia sino a includere la famiglia, l’organizzazione della produzione, e l’attività politica come la fornitura volontaria di beni pubblici, la creazione di lobby e le votazioni, ha prodotto preziose intuizioni, che non si sarebbero potute raggiungere usando i metodi convenzionali della sociologia e delle scienze politiche. Ma la ricerca in queste aree così come il ritorno all’importanza dell’interesse degli economisti classici per la crescita e la distribuzione economiche di lungo termine hanno fatto sorgere dei dubbi sulla generalità delle ipotesi standard. Per rispondere al malessere, che ora è provato tra gli economisti, il Journal of Economic Perspectives dell’American Economic Association dedica regolarmente una colonna alle “anomalie” che essi definiscono come segue: L’economia può essere distinta dalle altre scienze sociali per la convinzione che la maggior parte (il totale) dei comportamenti possono essere spiegati assumendo che gli agenti razionali con preferenze ben definite e stabili interagiscono nei mercati in cui (alla fine) la domanda e l’offerta sono uguali. Un risultato empirico si qualifica come una anomalia se è difficile da “razionalizzare” o se ipotesi non plausibili sono necessarie per spiegarlo all’interno del paradigma.
I lettori risposero avidamente all’invito di scrivere con i loro esempi preferiti. Invece di dedurre da pochi assiomi comportamentali e istituzionali (un tempo) non controversi l’economia si è spostata sempre più (seppure non deliberatamente per la maggior parte) verso un approccio che combina i progressi matematici dell’ultimo secolo con alcuni dei metodi degli economisti classici. Da Adam Smith a John Stuart Mill e Karl Marx (eccetto David Riccardo) gli economisti classici non avevano un approccio disciplinare (le discipline non erano state inventate), si preoccupavano dei dettagli empirici dei problemi sociali dei loro giorni, ed erano modesti circa il grado di generalità a cui le loro teorie potevano aspirare. Vi sono tre implicazioni. Primo, lo studio dell’economia doveva avvicinarsi a
16 | MICROECONOMIA
comprendere tutto delle scienze comportamentali, incluse ecologia e biologia. Le ipotesi walrasiane fornivano un fondamento logico per una divisione rigida del lavoro tra le discipline. Le sue ipotesi definitorie permettevano agli economisti walrasiani di sconfessare un interesse nei confronti dei comportamenti etero-interessati delle norme, dell’esercizio del potere, o della storia, in quanto di interesse di qualche altra disciplina e non pertinente con i lavori dell’economia walrasiana. Benché il movimento attraverso i confini disciplinari nell’ultimo mezzo secolo sia consistito principalmente nell’esportazione di metodi economici verso le altre scienze comportamentali, vi è molto da esportare nell’economia, se si debbono comprendere il ruolo del potere, le norme, le emozioni e i comportamenti adattivi. Secondo, l’alleggerimento delle ipotesi walrasiane ci mette di fronte all’imbarazzo della scelta. In assenza di certe restrizioni empiriche o di perfezionamenti speculativi, un paradigma rimarrà vuoto. Questa era la conclusione di Hugo Sonnenschein (1973, p. 405) circa la teoria walrasiana della domanda di mercato: “La morale […] è semplicemente questa: se tu ci metti molto poco, produrrai molto poco.” Ma la stessa cosa si applica ad ogni paradigma post walrasiano. Poche previsioni empiriche saranno raggiunte se gli individui si comportano in modo auto-interessato o no a seconda delle persone e delle situazioni, se alcune interazioni sono governate dai contratti, altre da una stretta di mano, ed altre dalla forza bruta, e se esistono equilibri multipli stabili. La necessità di una base empirica per le ipotesi non è in nessun contesto più chiara che nell’analisi del comportamento individuale, in cui il processo di arricchimento delle ipotesi convenzionali sulla conoscenza e le preferenze può facilmente discendere in una spiegazione ad hoc a meno che non sia disciplinato da un riferimento a fatti circa ciò che la gente reale fa. Non è sufficiente sapere che l’interesse personale non è la sola motivazione; abbiamo bisogno di sapere quali altre motivazioni sono importanti e sotto quali condizioni. Queste restrizioni derivano molto più probabilmente da una delle fonti che ha minato il paradigma walrasiano, ovvero i grandissimi progressi nelle scienze sociali empiriche derivanti dalle nuove tecniche nell’econometria, il miglioramento nelle capacità di calcolo e la disponibilità di dati, le tecniche sperimentali e i continui progressi nella storia quantitativa. La teoria, inoltre, può fornire delle restrizioni utili sull’insieme di ipotesi e risultati plausibili. Il modello dell’evoluzione genetica e culturale, per esempio, può aiutare a restringere il campo delle ipotesi comportamentali plausibili attraverso la distinzione tra emozioni, capacità cognitive e altre influenze sui comportamenti, la cui insorgenza e diffusione possono essere spiegate in maniera plausibile nei periodi
PROLOGO
|17
rilevanti della storia umana, da quelle che non possono esserlo. Allo stesso modo, sebbene i rendimenti crescenti generalizzati possano supportare un ampio numero di equilibri, alcuni di questi equilibri sono assolutamente irraggiungibili come esito di un qualsiasi processo dinamico plausibile. Invece, altri equilibri possono essere sia accessibili che robusti. In questo caso, una specificazione di un processo dinamico esplicito – per esempio un resoconto di come gli individui adattano i loro comportamenti alla luce delle loro recenti esperienze e delle esperienze di coloro che essi osservano – permetterebbe l’eliminazione di quelli che potrebbero essere denominati equilibri evolutivamente irrilevanti. La realizzazione delle dinamiche che regolano un sistema esplicito ci dà un resoconto del suo comportamento fuori dall’equilibrio e così non solo ci aiuta nel processo di selezione dell’equilibrio, ma anche nello studio della risposta a shock e ad altri problemi per i quali il metodo della statica comparata non è appropriato. Terzo, la ricerca di teorie sempre più generali continuerà ad impegnare gli studiosi di economia e c’è ancora molto da imparare attraverso lo studio di argomenti come i mercati in generale. Ma, per quanto si possa prevedere in futuro, sembra probabile che le intuizioni provengano, probabilmente, da modelli che tengono conto di specifici aspetti istituzionali e di altri aspetti di particolari tipi di interazioni economiche. Per gli economisti classici era evidente che i mercati del lavoro differivano in maniera fondamentale dai mercati della moneta, i quali a loro volta differiscono dai mercati delle camicie o dai mercati di scambio, e così via. I modelli potrebbero essere più specifici rispetto al tempo e allo spazio, in modo da cogliere l’importanza delle istituzioni che variano nel tempo o delle differenti culture. Se le entusiasmanti novità dell’era walrasiana furono teoremi molto astratti di sorprendente generalità, l’entusiasmo negli anni a venire potrebbe derivare da convincenti risposte a questioni che sono sollevate dai puzzle empirici che riguardano la ricchezza delle nazioni e dei popoli, con cui ho iniziato. Sarebbe salutare per gli economisti focalizzarsi di più sul dare risposta a tali questioni e meno sul dimostrare l’uso dei nostri strumenti sempre più sofisticati. Ma sembra che un approccio guidato più dal problema e meno dallo strumento avrà bisogno di strumenti comunque più sofisticati. Le domande matematiche della struttura speculativa che sto proponendo saranno più grandi, non meno, di quelle del paradigma walrasiano. La ragione è che i modelli che rappresentano interazioni sociali non contrattuali, tra individui che sono sia eterogenei sia versatili nei loro comportamenti in presenza di rendimenti crescenti generalizzati, non consentono le semplificazioni standard, come gli insiemi di comportamenti con prezzi dati e di produzione convessa, che rendevano i modelli walrasiani facili da usare. Come è stato
18 | MICROECONOMIA
riconosciuto a lungo in fisica e biologia, molti importanti problemi non danno soluzioni con una forma chiusa semplice, o in effetti, non danno nessuna soluzione che sia soggetta ad una interpretazione semplice. In questi casi – alcuni dei quali si incontreranno nei capitoli 11 e13 – le simulazioni computerizzate di interazioni sociali rilevanti si dimostreranno intuitive come un complemento (non un sostituto) per i metodi analitici più tradizionali. Le simulazioni sono state usate ampiamente nello sviluppo di idee a cui questo libro attinge. Le simulazioni non danno teoremi o proposizioni che siano veri in generale, piuttosto, come gli esperimenti, esse danno una ricchezza di dati che potrebbe indicare conclusioni ambigue, oppure spesso no. § Benché motivato da un interesse per l’impatto che le istituzioni economiche hanno sul benessere umano, ho adottato un approccio evoluzionistico, piuttosto che di ingegneria sociale. Come l’idea di “geni egoisti” che cercano di massimizzare la loro riproduzione o quella di un banditore che presiede ad un processo di scambio di equilibrio generale, così l’ingegnere sociale onnisciente ed onnipotente che cerca di massimizzare il benessere sociale è una invenzione la cui utilità dipende dal tenere a mente la sua caratteristica fittizia. I risultati sociali – anche quelli che riguardano gli stati e altre strutture potenti – sono la conseguenza combinata di azioni compiute da un ampio numero di persone che agiscono individualmente. Espedienti come banditori fittizi, ingegneri sociali o geni antropomorfici, non si possono sostituire alla comprensione di come gli individui reali si comportano e il modo in cui istituzioni distinte generano dinamiche nei livelli di popolazione, che aggregano questi comportamenti per produrre dei risultati sociali. Il carattere evolutivo dell’analisi diventerà evidente nel modo in cui i comportamenti individuali vengono modellati, nel tipo di dinamiche a livello di popolazione studiate, nei modi in cui i comportamenti e le istituzioni coevolvono, e nell’assenza di un eccezionale programma per il miglioramento umano. L’approccio evolutivo è modesto per quanto riguarda ciò che degli interventi possono conseguire, ma esso non limita l’economista a ricerche puramente contemplative. Tratterò le questioni del buon governo e della buona politica nel capitolo conclusivo. La prima parte del libro introduce una varietà di modelli applicati a ciò che ho appena chiamato l’interazione sociale generica, vale a dire, interazioni sociali non contrattuali tra agenti adattivi in presenza di rendimenti crescenti generalizzati. Comincio con due capitoli sulle istituzioni e l’evoluzione delle strutture di interazione
PROLOGO
|19
sociale, prima di tornare alle preferenze e alle opinioni. L’ordine poco convenzionale di questi argomenti – la maggior parte dei testi di microeconomia inizia con le preferenze – riflette l’importanza delle istituzioni come fattore di influenza sulle norme, i gusti e la comprensione che gli individui conducono alle situazioni in cui essi agiscono. Successivamente, si analizzeranno le inefficienze allocative che avvengono nelle interazioni non contrattuali, e il problema della divisione dei profitti della cooperazione, che emerge quando queste inefficienze possono essere superate. La parte centrale del libro riguarda le istituzioni del capitalismo e, specialmente, i mercati, le istituzioni di prestito, e le imprese. Si presterà particolare attenzione al modo in cui la natura incompleta della maggior parte dei contratti dà origine sia a ben definite strutture politiche dell’economia sia a un importante ruolo delle preferenze sociali. L’ultima parte riguarda il processo di cambiamento culturale ed istituzionale, nella quale sarà attribuito rilievo al ruolo del cambiamento tecnologico, dell’azione collettiva e del conflitto tra i gruppi, come parti costituenti del processo attraverso il quale le regole che governano le interazioni sociali e i comportamenti individuali coevolvono. In quella sede si affronterà l’evoluzione delle istituzioni familiari, come la proprietà privata e le regole consuetudinarie della divisione, così come l’inspiegabile successo evolutivo dei comportamenti individuali etero-interessati. Il capitolo conclusivo compara tre strutture che regolano le interazioni economiche – i mercati, gli stati e le comunità – ed esplora i modi in cui esse potrebbero costituire approcci complementari ai problemi trattati di allocazione e redistribuzione. Nel 1848, John Stuart Mill (1900) pubblicò i Principles of Political Economy, il primo grande manuale di microeconomia. Esso fu l’elemento principale dell’istruzione nel mondo anglofono fino ad essere sostituito dai Principles di Marshall mezzo secolo dopo. I lettori di Mill sarebbero stati rassicurati dal leggere: “Fortunatamente, non c’è nulla nelle leggi sul valore che resti da spiegare per il presente o un futuro scrittore, la teoria in oggetto è completa.” (p.420). Quando io ho studiato economia negli anni ’60, durante i tempi d’oro del paradigma walrasiano, regnava un simile autocompiacimento. Questo libro non comunica tale sicurezza. La nostra comprensione della microeconomia è fondamentalmente in uno stato di flusso. Poco è stabile. Niente è completo.
20 | MICROECONOMIA
Bibliografia Acemoglu, Daron, Simon Johnson, and J.A. Robinson. 2001. "Reversal of Fortune: Geography and Institutions in the Making of the Modern World Income Distribution." Alchian, Armen. 1950. "Uncertainty, Evolution, and Economic Theory." Journal of Political Economy, 58, pp. 211-21. Allais, Maurice. 1953. "Le comportement de l'homme rationnel devant le risque, critique des postulats et axiomes de l'ecole Americaine." Econometrica, 21, pp. 503-46. Allen, Robert. 2001. "The Great Divergence in European Wages and Prices from the Middle Ages to the First World War." Explorations in Economic History, 38, pp. 411-47. Banerjee, Abhijit and Lakshmi Iyer. 2001. "History, Institutions and Economic Performance: The Legacy of Colonial Land Tenure Systems in India." Battuta, Ibn. 1929. Travels in Asia and Africa: 1325-1354. London: Routledge and Kegan Paul, Ltd. Becker, Gary S. 1962. "Irrational Behavior and Economic Theory." Journal of Political Economy, 70:1, pp. 1-13. Bowles, S. and H. Gintis. 2000. "Walrasian Economics in Retrospect." Quarterly Journal of Economics, 115:4, pp. 1411-39. Bowles, Samuel and Richard C. Edwards. 1993. Understanding Capitalism: Competition, Command and Change. New York: Harper-Collins. Coase, R. H. 1937. "The Nature of the Firm." Economica, 4, pp. 386-405. Duesenberry, James S. 1949. Income, Saving, and the Theory of Consumer Behavior. Cambridge, MA: Harvard University Press. Eldredge, Niles and S.J. Gould. 1972. "Punctuated Equilibria: an Alternative to Phyletic Gradualism," in Models in Paleobiology. T.J.M Schopf and J.M. Thomas eds. San Francisco: Freeman, Cooper, pp. 82-115. Engerman, S., K. Sokoloff, and E. Mariscal. 1998. "Schooling, Suffrage, and the Persistente of Inequality in the Americas, 1800-1945." University of California, Los Angeles. Hall, Robert and Charles Jones. 1999. "Why do some countries produce so much more output per worker than others?" Quarterly Journal of Economics, 114:1, pp.
PROLOGO
|21
83-116. Hayek, F.A. 1945. "The Use of Knowledge in Society." American Economic Review, 35:4, pp. 519-30. Hoff, K. and J. E. Stiglitz. 2002. "After the Big Bang: Obstacles to the rule of law in post-Communist societies." Kupperman, Karen Ordahl. 1993. Providence Island, 1630-1641: The Other Puritan Colony. New York: Cambridge University Press. Leibenstein, H. 1950. "Bandwagon, Snob, and Veblen Effects in the Theory of Consumers' Demand." Quarterly Journal of Economics, 64, pp. 183-207. Lerner, Abba. 1972. "The Economics and Politics of Consumer Sovereignty." American Economic Review, 62:2, pp. 258-66. Luce, R. Duncan and Howard Raiffa. 1957. Games and Decisions. New York: John Wiley. Mackie, Gerry. 1996. "Ending Footbinding and Infibulation: A Convention Account." American Sociological Review, 61, pp. 999-1017. Marshall, Alfred. 1930. Principles of Economics (Eighth Edition). London: MacMillan (original publication 1890). Marx, Karl. 1976. Capital I. Harmondsworth: Penguin (original publication, 1859). Milanovic, Branko. 1999. "True World Income Distribution, 1988 and 1993: First Calculation Based on Household Surveys Alone." World Bank: Washington DC. Mill, John Stuart. 1900. Principles of Political Economy. New York: The Colonial Press (first published in 1848). Myrdal, Gunnar. 1956. Development and Underdevelopment: A note on the mechanismof national and international economic inequality. Cairo: National Bank of Egypt. Nash, John F. 1950a. "Equilibrium Points in n-Person Games." Proceedings of the National Academy of Sciences, 36, pp. 48-49. Nash, John F. 1950b. "Non-cooperative games." (doctoral dissertation) Princeton University. Neumann, John Von and Oskar Morgenstern. 1944. Theory of Games and Economic Behavior. Princeton, NJ: Princeton University Press. Przeworski, A, Michael E. Alvarez, Jose Antonio Cheibub, and Fernando Limongi. 2000.
22 | MICROECONOMIA
Democracy and Development: political institutions and well-being in the world, 1950-1990. Cambridge: Cambridge University Press. Robbins, Lionel. 1935. An Essay on the Nature & Significance of Economic Science. London: Macmillan. Schelling, Thomas. 1960. The Strategy of Conflict. Cambrdige, MA: Harvard University Press. Schultz, T.P. 1998. "Inequality in the Distribution of Personal Income in the World: How it is Changing and Why." Journal of Population Economics, 11, pp. 307-44. Simon, Herbert. 1951. "A Formal Theory of the Employment Relation." Econometrica, 19:3, pp. 293-305. Simon, Herbert. 1955. "A Behavioral Model of Rational Choice." Quarterly Journal of Economics, 69, pp. 99-118. Smith, Adam. 1776. An inquiry into the nature and causes of the wealth of nations. London,: W. Strahan and T. Cadell. Sokoloff, K. and S. Engerman. 2000. "Institutions, Factor Endowments, and Paths of Development in the New World." Journal of Economic Perspectives, 14:3, pp. 217-32. Sonnenschein, Hugo. 1973. "The Utility Hypothesis and Market Demand Theory." Western Economic Journal, 11, pp. 404-10. Thaler, Richard. 2001. "Anomalies." Journal of Economic Perspectives, 15:1, pp. 219. Veblen, Thorsten. 1899/1934. The Theory of the Leisure Class. New York: Modern Library. Yule, Henry. 1886. Cathay and the Way Thither: Being a collection of medieval notices of China. London: The Haklyut Society. Zimmerman, L.J. 1962. "The Distribution of World Income, 1860-1960," in Essays in Unbalanced Growth: A Century of Disparity and Convergence. E. De Vries ed. S'Gravanhage: Mouton, pp. 28-47.
I
I NTERAZIONI S OCIALI E S CHEMA I STITUZIONALE
Due confinanti possono accordarsi per drenare un prato che possiedono in comune, dato che è facile per essi sapere cosa l’altro pensa, e ognuno percepisce che la conseguenza immediata della rinuncia a fare la sua parte è l’abbandono dell’intero progetto. Ma è molto difficile, anzi impossibile, che migliaia di persone possano mettersi d’accordo su azioni del genere poiché è difficile concertare un progetto così complicato e ancora più difficile metterlo in pratica; ognuno infatti cerca un pretesto per sottrarsi alla preoccupazione ed alla spesa e cerca di scaricarne l’intero peso sugli altri. - David Hume, A Treatise of Human Nature, Volume II (1739)
Gli uomini potrebbero acquisire facilmente una idea approssimativa del mutuo impegno e dei vantaggi che ne derivano osservandolo in questo modo…In una battuta di caccia al cervo, ognuno dei cacciatori è abbastanza consapevole del fatto che per raggiungere lo scopo egli debba mantenere fedelmente la propria postazione; ma se una lepre passasse a portata di uno tra loro, senza dubbio chiunque l’inseguirebbe senza pensarci due volte e, avendo ottenuto la propria preda, si preoccuperebbe molto poco del fatto di esser stato la causa della perdita della preda dei propri compagni. - Jean-Jacques Rousseau, Discourse on the Origin and Foundations of Inequality among Men (1755)
CERCANDO
L E G IU S T E R E G O L E
Come il treno notturno che mi abbandonò in un luogo deserto distante dalla mia destinazione, così il processo di sviluppo economico ha aggirato la maggior parte delle duecento o poco più famiglie che costituiscono il villaggio di Palanpur. Esse sono rimaste povere, anche se rapportate agli standard indiani: meno di un terzo degli adulti sono alfabetizzati e molti hanno dovuto sopportare la perdita di un figlio a causa della malnutrizione o di altre malattie ormai dimenticate da molto tempo in altre parti del mondo. Ma tranne che per qualche raro orologio da polso, bicicletta o pompa di irrigazione, Palanpur appare come un luogo dell’India dove il tempo si è fermato, che non è stato neanche lontanamente sfiorato dalla crescita economica
2 | MICROECONOMIA
trainata dal settore all’avanguardia del software e dalle regioni agricole maggiormente sviluppate. Cercando di capirne i motivi, mi avvicinai ad un mezzadro e alle sue tre figlie che stavano arando un piccolo appezzamento di terreno1. La conversazione alla fine cadde sul fatto che i contadini di Palanpur seminano le proprie sementi invernali molte settimane dopo la data che permetterebbe loro di massimizzare il proprio raccolto. I contadini non hanno dubbi sul fatto che seminando prima otterrebbero maggiori raccolti, ma il contadino spiegò che nessuno vuole essere il primo a piantare in quanto le sementi di un singolo appezzamento sarebbero rapidamente mangiate dagli uccelli. Chiesi allora se mai un numero relativamente maggiore di contadini fosse mai riuscito ad accordarsi per anticipare la semina, piantando nello stesso giorno per cercare di minimizzare le perdite. “Se sapessimo come fare questo,” mi disse alzando lo sguardo dalla sua zappa, “non saremmo poveri”. Piantare nel momento giusto, come drenare con successo il prato nell’esempio di Hume o prevenire lo scioglimento della compagnia nella battuta di caccia al cervo di Rousseau, è una soluzione al problema definito come dilemma sociale o problema di coordinamento. Thomas Hobbes e gli altri fondatori della filosofia politica europea, così come i grandi economisti classici da Adam Smith fino a John Stuart Mill, cercarono di scoprire quali istituzioni, indirizzandosi alla soluzione di problemi come questi, fossero le più appropriate al raggiungimento del benessere umano. Per essi una domanda era sempre presente: come è possibile strutturare le relazioni sociali in modo tale che le persone siano libere di scegliere le proprie azioni evitando allo stesso tempo risultati che nessuno sceglierebbe? Definisco tale quesito come la sfida costituzionale classica. Ora si potrebbe dire: essi erano interessati nella ricerca delle giuste regole. Una versione contemporanea della sfida definirebbe come “risultati” gli equilibri di un gioco specificato dalla struttura delle interazioni sociali tenendo in considerazione come gli individui, dato l’ambiente istituzionale, possono giungere ad agire in modo tale che un risultato particolare (forse uno dei molti equilibri stabili) possa essere raggiunto e persistere per molti periodi. “Evitando allo stesso tempo risultati che nessuno sceglierebbe” potrebbe essere riformulato come il perseguimento di un risultato Pareto-efficiente, cioè di un risultato tale che nessun altro risultato realizzabile sarebbe preferito da almeno un individuo e non meno preferito da alcuno degli altri.
La prima epigrafe è tratta da Hume (1964:304), la seconda da Rousseau (1987:62). 1 Lanjouw e Stern (1998) forniscono una dettagliata descrizione dell’economia e della struttura sociale di Palanpur.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|3
Dato che farò un uso esteso della nozione di efficienza paretiana, un commento sui suoi difetti è dovuto. Come criterio base per la scelta tra allocazioni, il concetto standard di efficienza paretiana è allo stesso tempo troppo forte e troppo debole. E’ troppo forte perché in ogni applicazione pratica è coinvolto un largo numero di persone e quasi sempre si verifica che cambiamenti politici o istituzionali infliggono dei costi a qualche partecipante, anche nel lungo periodo. In questo caso, il concetto standard di efficienza paretiana ha una forte inclinazione a mantenere lo status quo. Ma il concetto di efficienza paretiana può essere troppo debole in quanto tale criterio non prende in considerazione caratteristiche che per una certa allocazione potrebbero essere desiderate. La più importante di queste è il principio che la distribuzione dei benefici che derivano da una certa allocazione sia giusta. Difficilmente si può credere che i fini costituzionali si riducano all’idea di produrre buone regole che sostengano equilibri Pareto-efficienti, ma, tenendo conto di questi due vincoli, tale idea rientra certamente tra questi fini. Sfortunatamente, l’adozione dell’efficienza paretiana come obiettivo non fornisce molte indicazioni al momento di effettuare scelte politiche. Ci possono essere molte ragioni per preferire un risultato Pareto-inefficiente ad uno Pareto-efficiente; ciò che è escluso è soltanto la preferenza per uno specifico risultato quando un altro possibile risultato è Paretosuperiore rispetto ad esso. Ma poche scelte pratiche assumono tale forma: molte opzioni politiche alternative non possono essere ordinate in questo modo. La sfida costituzionale ha un’ampia rilevanza contemporanea; si pensi alla protezione ambientale su scala globale, alla determinazione dello sforzo lavorativo tra membri di una reparto di produzione, alla produzione e alla distribuzione di informazione, e alla costruzione dei rapporti di vicinato tra individui che vivono in una stessa zona. Il fatto che sin dalla nascita del capitalismo, l’effetto aggregato di milioni di individui, ognuno dei quali agisce in modo indipendente per perseguire i propri obiettivi, ha rappresentato un miglioramento nel lungo periodo nelle condizioni di vita materiali di molti di coloro che vi hanno partecipato suggerisce che delle buone e tollerabili soluzioni possono essere trovate per problemi molto più impegnativi della questione del periodo di semina dei contadini in Palanpur, del prato di Hume e della caccia al cervo di Rousseau. Come possa succedere che un gran numero di individui tra loro sconosciuti, con poca o nessuna preoccupazione per il benessere degli altri, agiscano in modo continuativo in modo tale da apportare mutuo beneficio è uno dei grandi puzzle della società umana ed è uno di quelli che proverò di chiarire. Ma ci sono anche evidenti casi di fallimento nel risolvere i moderni problemi di coordinamento: sovrasfruttamento sistematico di alcune risorse (ambiente naturale) e sottoutilizzazione di altre (capacità produttive umane), per esempio, e la persistente povertà delle persone di Palanpur e di altri villaggi simili in ogni parte del
4 | MICROECONOMIA
mondo. La ragione per la quale attività non coordinate di individui che perseguono i propri fini spesso producono risultati che tutti cercano di evitare è che le azioni di ogni persona influenzano il benessere di altri e che questi effetti spesso non sono inclusi nei processi di ottimizzazione o nelle regole empiriche adottate nei processi di decisione di agenti individualisti. Tali effetti sugli altri sono chiamati esternalità. In passato gli economisti trattavano questi effetti esterni come eccezionali, l’esempio standard è quello delle api dell’apicoltore che impollinano gli alberi di mele del contadino confinante. Ma, come gli esempi precedenti suggeriscono, molti sono i casi nell’economia moderna. La sfida costituzionale classica può essere posta nella seguente maniera: quali regole che governano le interazioni tra le persone potrebbero facilitare il perseguimento dei propri fini inducendo allo stesso tempo ognuno a tenere in adeguata considerazione gli effetti delle proprie azioni sugli altri? La prima proposizione (“perseguimento dei propri fini”) semplicemente riconosce che ogni soluzione ai problemi di coordinamento sarà sostanzialmente decentralizzata, e che una soluzione che cerchi semplicemente di scavalcare le intenzioni individuali non funziona né tanto meno è desiderabile. La sfida centrale è nella seconda proposizione: in circostanze in cui le azioni di una persona influenzano il benessere degli altri, come possono questi effetti essere resi sufficientemente rilevanti da influenzare il comportamento degli agenti in modo appropriato? Se gli altri sono i nostri parenti, o i nostri vicini, o amici, la nostra preoccupazione per il loro benessere o il nostro desiderio di evitare sanzioni sociali può indurci a prendere in considerazione gli effetti delle nostre azioni su di loro. Come riflesso di ciò, un’importante risposta alla sfida costituzionale – una antecedente gli economisti classici – è che le preoccupazioni per il benessere di altri potrebbe estendersi verso tutti quelli con i quali si interagisce, in modo da internalizzare gli effetti delle proprie azioni sugli altri. Con la crescita della dimensione dei mercati nell’ultimo mezzo millennio, comunque, le persone hanno cominciato ad interagire non con poche dozzine di individui, ma con centinaia e indirettamente con milioni di sconosciuti. E quindi, con la maturazione del capitalismo e la crescente influenza del ragionamento economico, il compito del buon governo si è spostato dal coltivare la virtù civica alla sfida di progettare istituzioni che funzionino ragionevolmente bene in sua assenza. Le moderne teoria dell’implementazione, teoria del “mechanism design” e teoria del contratto ottimale incorporano questa tradizione chiedendosi quali forme di contratto,
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|5
diritti di proprietà o altre regole sociali debbano essere utilizzate per poter raggiungere alcuni auspicabili obiettivi sociali aggregati quando questi obiettivi non sono condivisi da nessuno dei partecipanti. Un esempio rilevante è il Teorema Fondamentale dell’Economia del Benessere, che identifica sotto quali condizioni diritti di proprietà ben definiti e mercati competitivi supportano equilibri Paretoefficienti. Il teorema fornisce una formalizzazione di quanto sosteneva Adam Smith, cioè che in presenza di condizioni istituzionali appropriate, individui che perseguano il proprio interesse saranno “condotti da una mano invisibile” al raggiungimento di risultati socialmente desiderabili. Il problema del drenaggio del prato presentato da Hume, così come quello di prevenire lo scioglimento della battuta di caccia al cervo di Rousseau sono esempi interessanti proprio perché – come quasi tutte le interazioni sociali – sono situazioni nelle quali gli assiomi piuttosto stringenti del Teorema Fondamentale non trovano riscontro. Quanto difficile possa essere sostenere i livelli di cooperazione necessaria ad ottenere un risultato che comporti benefici sociali in questi casi dipende dalla sottostante struttura delle relazioni sociali, ossia dalle credenze (beliefs) e dalle preferenze degli individui, dai rapporti di causa ed effetto che governano la trasformazione di azioni in risultati, dalla circostanza che l’interazione sia occasionale o periodica, dal numero delle persone coinvolte e così via. La difficoltà nel risolvere il problema dipende anche dalla struttura dell’informazione nell’interazione – chi conosce cosa, quando e se l’informazione può essere usata per assicurare l’enforcement di contratti o regolamentazioni governative. Ognuno di questi aspetti può influenzare il possibile successo o fallimento del drenaggio, della caccia al cervo o qualsiasi altro progetto comune che dipende dalle particolari istituzioni che regolano le interazioni tra partecipanti. Mercati, famiglie, governi, comunità e altre istituzioni rilevanti per un’interazione influenzano i vincoli e gli incentivi così come le informazioni, le norme e gli altri criteri di valutazione dei partecipanti all’interazione. Un’analisi adeguata dei problemi di coordinamento e della loro possibile attenuazione potrà chiarire come queste istituzioni funzionano. Per assolvere questo compito, la minimale rappresentazione delle istituzioni nel paradigma Walrasiano è sostanzialmente inferiore al più elaborato modo di modellarle reso possibile dalla teoria dei giochi. Il mio obiettivo principale in questo capitolo è sia quello di introdurre alcune nozioni di base della teoria dei giochi sia quello di usare queste nozioni per fornire una tassonomia delle interazioni sociali e dei loro risultati. Posporrò al capitolo 3 un’approfondita riflessione sugli individui e le loro preferenze. Ovviamente molte
6 | MICROECONOMIA
istituzioni non sono progettate – o almeno il loro funzionamento non risponde ad alcun progetto – ma rimanderò la trattazione riguardante le istituzioni come risultato di un processo evolutivo piuttosto che di progettazione al capitolo 2. Anche le questioni relative alla stabilità degli equilibri (o del perché ci si deve interessare agli equilibri) saranno trattate in modo sintetico in questo capitolo dato che potranno essere trattate in modo migliore quando si avrà a disposizione un modello esplicito che spieghi come le cose cambiano in situazioni fuori dall’equilibrio che verrà introdotto nel capitolo 2. Inizio con un esempio che illustra la struttura formale delle sfide lanciate da Hume e Rousseau.
C O O R D IN A M E N TO
E C O N F L IT TO : U N E S E M P I O
Garret Hardin (1968), in una famosa descrizione di un gruppo di pastori che sfruttano eccessivamente un pascolo portandolo alla rovina, coniò il termine tragedia dei comuni (tragedy of the commons) e diede alle scienze sociali una delle metafore più evocative dopo la mano invisibile di Smith. Anzi, Hardin chiamò la sua tragedia un “rifiuto della mano invisibile”. Queste due metafore sono efficaci in quanto catturano due situazioni sociali essenziali ma fortemente in contrasto tra loro. Quando le interazioni sociali sono guidate da una mano invisibile, queste riconciliano scelte individuali e risultati socialmente desiderabili. Invece, le dramatis personae della tragedia dei comuni che inseguono i loro obiettivi privati portano disastrose conseguenze per sé stessi e gli altri. Hardin sceglie un ambiente bucolico per la sua tragedia esclusivamente per ragioni di concretezza; il problema sottostante si può applicare ad un’ampia classe di situazioni nelle quali gli individui tipicamente non possono o non vogliono prendere in considerazione gli effetti delle proprie azioni sul benessere degli altri. Queste includono il traffico congestionato, il pagamento di tasse o altri contributi per la realizzazione di progetti comuni, la protezione della reputazione di un gruppo, il lavoro di squadra e molte altre ancora. Un esempio sarà utile a chiarire la struttura del problema, dando vita ad un ampio numero di punti di discussione che saranno analizzati in maggior dettaglio nei capitoli successivi. Consideriamo due pescatori, Jay e Eye, che condividono l’accesso ad un lago e che consumano ciò che in esso pescano. Vi sono pesci in abbondanza, così che impiegare più tempo nella pesca consente ad entrambi di pescare più pesce, ma più pesci uno pesca, meno pesci riesce a pescare l’altro in un’ora di pesca. Ognuno di loro decide quanto tempo dedicare alla pesca, scegliendo l’ammontare che massimizza il suo benessere. Supponiamo che questo processo di ottimizzazione, quando è effettuato singolarmente e senza nessun accordo vincolante tra i due, porti
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|7
ognuno a pescare 8 ore al giorno e che i benefici netti di questa attività siano appena sufficienti ad uguagliare la miglior alternativa disponibile a ciascuno (ad esempio, lavorare come salariato nella vicina città). Tabella 1.1. Tragedia dei pescatori: un dilemma del prigioniero
Indichiamo i benefici scaturenti da quella che viene definita “posizione di riserva” (fallback position), cioè il risultato che si ottiene in assenza di accordo nella contrattazione, come u > 0 per entrambi i pescatori. Essi sanno che se entrambi pescassero meno, ciascuno potrebbe raggiungere una posizione migliore in quanto il minor tempo dedicato alla pesca sarebbe più che compensato dal maggior tempo libero che avrebbero a disposizione. Assumiamo che essi studino la faccenda e determinino di quanto potrebbero migliorare la propria situazione se entrambi si limitassero a pescare 6 ore (assumeremo che questa è l’unica alternativa alle 8 ore di pesca), e se uno dovesse pescare 8 ore e l’altro 6. Essi normalizzano i loro payoff2 in modo tale da assegnare 1 al risultato corrispondente al pescare meno entrambi e 0 al risultato corrispondente alla circostanza che solo uno di essi riduce la quantità di tempo dedicata alla pesca. La tabella 1.1 mostra i payoff relativi (come da convenzione, il primo payoff in ogni casella si riferisce al giocatore riga quindi, nella tabella 1.1, Jay.). La tragedia dei pescatori è un dilemma del prigioniero. Questa è una situazione in cui per ogni individuo esiste un’azione che, se adottata, porta ad un payoff più alto rispetto a quello connesso alle altre azioni disponibili, indipendentemente dall’azione scelta dall’altro individuo (le altre azioni vengono dette dominate). Ma quando gli individui agiscono in modo da massimizzare i propri payoff scegliendo questa azione, il risultato finale è per entrambi peggiore rispetto al risultato che essi avrebbero potuto ottenere se si fossero comportati in modo differente. Così pescare per 6 ore è dominato perché > 0 e u > 0 ed è Pareto-superiore rispetto ad 8 ore perché u < 1. Potrebbe sembrare una faccenda semplice determinare che i due si debbano solo mettere d’accordo affinché ognuno peschi 6 invece di 8 ore, ma non è così, per due ragioni. La prima è che potrebbe non esistere il modo per far rispettare un accordo o anche solo per sapere se tale accordo è stato violato. Se è possibile che ognuno dei due possa essere a conoscenza di quante ore ha pescato l’altro in una 2
In teoria dei giochi, il payoff rappresenta la vincita (o la penale) associata alla scelta da parte di un giocatore di una determinata strategia, date le scelte degli altri.
8 | MICROECONOMIA
giornata di cielo limpido, lo stesso non si può dire in una giornata nebbiosa e, ad ogni modo, le informazioni di cui ognuno dei due è in possesso circa le quantità pescate dall’altro possono essere insufficienti a far imporre l’osservanza dell’accordo per vie giudiziarie dinanzi un tribunale. Questo è il problema dell’informazione asimmetrica o non verificabile, laddove il primo termine si riferisce a situazioni in cui un individuo ha informazioni di cui altri non sono a conoscenza, mentre il secondo al caso in cui informazioni di cui un soggetto è a conoscenza non possono essere usate in giudizio. Il secondo problema sorge dal fatto che l’accordo di pescare 6 ore al giorno è un accordo sia per pescare meno, sia implicitamente per dividere i benefici ad esso collegati in un certo modo, cioè in parti uguali. Ma i pescatori naturalmente si rendono conto che non necessariamente devono accordarsi per lavorare ognuno 6 ore. Potrebbero mettersi d’accordo che Eye pescherà 8 ore e Jay 6 ore, o viceversa. I pescatori hanno due problemi, non uno. Il primo, che riguarda l’allocazione, è determinare quanto pescare in totale, cioè come limitare le ore di pesca,. Il secondo, che concerne la distribuzione, è come dividere i benefici di pescare meno. La figura 1.1 illustra le opportunità e i problemi che i pescatori hanno di fronte. Nella figura 1.1, come prima, 6 e 8 ore di pesca sono le uniche alternative in un certo giorno, ma ora Eye e Jay in un certo periodo di tempo possono adottare strategie per le quali essi pescano 8 ore un giorno e 6 quello successivo, così come altre combinazioni. Inoltre, si assume che ogni allocazione debba essere concordata da entrambi i pescatori. I payoff {1 , 1} sono realizzabili e possono essere implementati applicando la regola delle 6 ore, ma accordi più complessi possono implementare ogni punto che si trova all’interno dell’insieme abcd. Per esempio, il punto d può essere implementato semplicemente se Eye concorda di pescare 6 ore ogni giorno e Jay 8 ore. Mentre Eye sicuramente non sarà d’accordo con questo (Eye ottiene un risultato peggiore rispetto al caso in cui si pesca 8 ore), Jay potrebbe offrirsi di pescare 6 ore per un certo periodo di tempo pari a u + ( è un infinitesimale numero positivo) e 8 ore il resto del tempo chiedendo a Eye di pescare 6 ore tutto il tempo, minacciando di pescare sempre 8 ore qualora Eye dovesse rifiutare. Eye potrebbe accettare, aspettandosi che per un certo periodo di tempo il suo guadagno netto sarà di u + e per il resto del tempo sarà 0, in quanto l’alternativa sarebbe di ottenere u in tutto il periodo, il che potrebbe succedere se Jay tenesse fede alla sua minaccia. Jay in tal modo avrebbe un guadagno netto di 1 quando entrambi pescano 6 ore, il che succede ( u + ) volte del tempo, e di ( 1 + ) il resto del tempo, quando Jay pesca 8 ore ed
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|9
Eye solo 6. Il contratto proposto da Jay è indicato dal punto f nella figura 1.1. Tutti i punti lungo cfd possono essere ottenuti da un contratto della seguente forma: Jay lavora 6 ore per una certa frazione di tempo, , e 8 ore il resto, mentre Eye lavora 6 ore tutto il tempo, ottenendo un’utilità pari a ui = e ui = + (1 )(1 + ) . Naturalmente Eye rifiuterà contratti lungo fd.
Figura 1.1. La tragedia dei pescatori. Nota che in c entrambi i pescatori pescano 6 ore mentre in a entrambi pescano 8 ore.
Se Jay ha la capacità di impegnarsi a presentare un’offerta per primo, è detto first mover3 e ha un vantaggio da first mover. Naturalmente, Eye potrebbe avere un’analoga offerta per Jay. In questo caso l’ordine del gioco (incluso chi è il primo a giocare) fa differenza. Un momento di riflessione ci confermerà che non esiste solo uno ma piuttosto un infinito numero di accordi che sono allo stesso tempo mutuamente benefici (rispetto alla regola delle 8 ore) ed efficienti. Un accordo efficiente è un accordo rispetto al quale non esiste alcuna alternativa che consenta ad almeno uno dei due pescatori di trarre beneficio senza peggiorare la condizione dell’altro. Questi cosiddetti miglioramenti Paretiani (rispetto all’equilibrio in strategie dominanti) e accordi Pareto-efficienti sono tutti i punti lungo fcg nella figura (chiamata la frontiera di Pareto). I pescatori potrebbero mettersi rapidamente d’accordo su una limitazione congiunta a 6 ore di pesca se questa fosse l’unica alternativa al pescare entrambi 8 ore. Ma essi potrebbero fallire nel raggiungere l’accordo in presenza di un’ampia gamma di accordi possibili; essi potrebbero ritenere che più opzioni sono peggio di 3
In un gioco sequenziale, ossia in un gioco in cui i giocatori non effettuano simultaneamente la scelta della loro strategia, è detto first mover colui che effettua la prima mossa.
10 | MICROECONOMIA
poche. Questo perché l’indeterminatezza nella divisione dei benefici derivanti dalla riduzione delle ore di pesca fa sorgere il problema dell’equità (fairness) nella loro suddivisione, ed apre la strada ad alcune considerazioni che non sono catturate dal gioco così come descritto sopra. Eye, per esempio, potrebbe rifiutare lo svantaggioso “prendere o lasciare” offerto da Jay. Ma lo stesso risultato potrebbe risultare accettabile qualora fosse ottenuto in modo imparziale (per esempio lanciando una moneta), o qualora i benefici derivanti dal pescare meno venissero devoluti ad una giusta causa piuttosto che essere appropriati da Jay. Se Eye e Jay non possono mettersi d’accordo su una certa suddivisione, può essere che nessun accordo per limitare il tempo di pesca sia possibile. Ma un soggetto terzo, il governo, potrebbe imporre un limite di 7 ore ad entrambi i pescatori e dopo lasciare che essi contrattino per perfezionare, qualora ne fossero capaci, un qualche accordo tra loro. Oppure i pescatori potrebbero rispettare una norma ambientale che induca in modo indipendente ognuno di essi ad autolimitarsi nella pesca. La norma potrebbe trasformare il gioco comportando una nuova matrice di payoff nella quale vengono presi in considerazione la preoccupazione per i danni ambientali arrecati o l’imposizione di costi all’altro pescatore. Ed è proprio verso questo tipo di indeterminatezza che tanto le istituzioni economiche quanto le altre si rivolgono, rispondendo a domande come: chi si trova in condizione di effettuare una offerta del tipo prendere o lasciare? Quali azioni sono a disposizione per le parti in causa rilevanti? Quali asimmetrie informative o mancanza di verificabilità derivano da un certo problema (e, come risultato, quali accordi si possono far osservare da terze parti)? E, infine, quali norme possono alterare il risultato di un conflitto? I veri pescatori, naturalmente, non stanno recitando come nel copione di una tragedia, come Hardin aveva supposto; né essi sono prigionieri del dilemma che affrontano. Essi sono spesso pieni di risorse nella ricerca di soluzioni all’eccessivo sfruttamento della pesca. I pescatori turchi, per esempio, prima assegnano a sorte i luoghi di pesca e successivamente procedono a rotazione. La condivisione di informazioni tra pescatori scoraggia la violazione degli accordi, mentre la regolamentazione governativa sostituisce l’osservanza delle regole basata sulla locale rete di contatti sociali (Ostrom, 1990). Le esistenti regole che determinano l’accesso alla pesca rappresentano una piccola selezione – di un insieme più ampio di altre regole sperimentate – che ha funzionato almeno abbastanza bene da permettere alle comunità che l’hanno adottata di durare e di non abbandonare le loro regole di comportamento in favore di altre. Come vedremo, il persistere di regole non richiede che esse siano efficienti, solo che esse siano ripetute nel tempo. Ciononostante,
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|11
potremmo aspettarci che una comunità di pescatori, che si è battuta per trovare un modo di sostenere una limitazione congiunta a 6 ore, possa fare meglio in competizione con gruppi che sfruttano eccessivamente la pesca, ed essere quindi imitati da altri gruppi. Ritorneremo sull’esempio dei pescatori nel capitolo 4 per esplorare dal punto di vista analitico come tassazione, relazioni di potere asimmetriche tra agenti, norme sociali e altri aspetti delle interazioni sociali possano modificare i risultati. Come può la teoria dei giochi far luce sulla tragedia dei pescatori e su problemi simili?
G IO C H I I giochi rappresentano un modo di modellare interazioni strategiche, cioè, situazioni in cui le conseguenze di azioni individuali dipendono dalle azioni intraprese da altri, e questa mutua interdipendenza è riconosciuta da coloro che vi sono coinvolti. Un gioco è costituito da una completa identificazione dei giocatori, un elenco per ogni giocatore delle azioni a sua disposizione (includendo azioni contingenti sulle azioni effettuate da altri, o su eventi fortuiti) – conosciuto come insieme di strategie – così come l’ordine di gioco e chi sa cosa, in quale momento del gioco. I giocatori possono essere individui o organizzazioni come imprese, sindacati, partiti politici, o stati nazionali. Nelle applicazioni biologiche, anche entità subindividuali come cellule o geni sono giocatori. Anche questa breve introduzione rivela due grandi pregi della teoria dei giochi nel contribuire allo studio delle istituzioni e dei comportamenti economici (prenderò in considerazione gli svantaggi nella penultima sezione del capitolo). Primo, poche interazioni sociali possono essere ridotte all’interazione di un agente in un ambiente dato (come previsto dall’assioma del prezzo dato e da altre irrealistiche ipotesi del modello Walrasiano). La maggior parte delle interazioni ha una componente strategica e la teoria dei giochi è costruita per analizzare il modo in cui le azioni individuali sono influenzate dal fatto che questa interdipendenza è comunemente riconosciuta da una o più parti in un’interazione. Secondo, la completa specificazione di un gioco richiede un’attenzione dettagliata all’ambiente istituzionale nel quale l’interazione ha luogo; i risultati dipendono spesso da questo dettaglio (per esempio, chi compie la prima mossa) in un modo che potrebbe non essere rivelato in strutture teoriche che sopprimono piuttosto che mettere in risalto i dettagli istituzionali. La teoria dei giochi non fornisce intuizioni reali più di quelle date dalla matematica o da ogni altro tipo di linguaggio. Ma spesso fornisce un chiaro modo per esprimere intuizioni originate altrove e per comprendere il ruolo di particolari ipotesi in una
12 | MICROECONOMIA
certa linea di pensiero. L’esempio della “tragedia dei pescatori” è un gioco, presentato nella sua cosiddetta forma normale (o strategica). Ciò significa che la sequenza delle azioni effettuate da ogni giocatore non è esplicitamente rappresentata, essendo le ipotesi fatte a riguardo tali che ogni giocatore muove senza conoscere la mossa effettuata dagli altri. La forma estesa di un gioco invece rende esplicito in che ordine agiscono i giocatori, e chi conosce cosa ad ogni stadio del gioco. Naturalmente, le mosse effettuate prima in ordine di tempo non devono essere conosciute in anticipo da coloro che effettuano le loro mosse successivamente. Un esempio di un gioco in forma estesa è la rappresentazione in forma d’albero dell’“ultimatum game” utilizzato in un contesto sperimentale nel capitolo 3. La forma estesa trasmette più informazioni riguardo all’interazione nel senso che molti giochi in forma estesa possono essere rappresentati da uno stesso gioco in forma normale. In genere, se si usa rappresentare un gioco in forma normale, ciò è dovuto al fatto che l’informazione addizionale nella forma estesa è ritenuta irrilevante rispetto al modo in cui il gioco sarà giocato.4 Come vedremo nel capitolo 3, i comportamenti sperimentali dei soggetti sembrano essere abbastanza sensibili a dettagli che di primo acchito non sembrano influenzare la struttura del gioco (il nome assegnato al gioco, per esempio, o la classificazione dei giocatori). Così, non è una buona idea ridurre un gioco in forma estesa alla sua forma normale a meno che non ci siano buone ragioni per ritenere che la sequenza temporale nel gioco non avrà nessun effetto sul comportamento dei giocatori. Il risultato di un gioco è un insieme di azioni effettuate dai giocatori (ed i relativi payoff). I risultati di un gioco non possono essere dedotti esclusivamente dalla struttura del gioco ma richiedono in aggiunta un plausibile concetto di soluzione, ossia una specificazione di come i soggetti coinvolti possono giocare. La relazione tra i giochi e i loro risultati è lontana dall’essere stabilita, con approcci tra loro fortemente contrastanti. La teoria dei giochi classica pone in rilievo il fatto che talvolta i giocatori debbano avere valutazioni cognitive sul futuro abbastanza forti. Al contrario, la teoria dei giochi evolutiva pone in risalto comportamenti dettati da regole empiriche che sono aggiornati da un processo di apprendimento rivolto al passato, ossia, alla luce della recente esperienza propria e degli altri individui. Due concetti di soluzione sono ampiamente utilizzati nella teoria dei giochi classica: dominanza ed equilibrio di Nash. Il concetto di dominanza ha il valore di 4
Chi muove per primo può influenzare il comportamento del secondo anche se questo non conosce cosa il primo giocatore ha fatto. Alcuni esempi vengono forniti in Camerer e Weber (2004) e Rapoport (1997).
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|13
indicare cosa non succederà (e in alcuni casi, tramite un processo di eliminazione, fornisce chiarimenti a riguardo di cosa succederà). Il concetto di dominanza predice in modo forte i risultati nei giochi come il dilemma del prigioniero in cui ogni giocatore sceglie una qualche particolare strategia senza tener conto delle scelte effettuate dagli altri giocatori. (I giochi risolti con il concetto di dominanza sono interazioni strategiche degenerate nelle quali le azioni intraprese da ognuno non dipendono dalle azioni effettuate dagli altri). L’idea alla base del concetto di equilibrio di Nash è che possono esistere uno o più risultati tali che nessun individuo ha alcun incentivo a modificare la sua strategia date le strategie adottate dagli altri giocatori. Sia il concetto di dominanza che quello di equilibrio di Nash si basano sulla nozione di strategia della risposta ottima (best response strategy). Una strategia può essere un’azione incondizionata (come, per esempio, guidare sulla destra), ma può essere anche un modo di agire contingente dettato dalle precedenti azioni degli altri individui o dal caso. “Pescare 6 ore al giorno indipendentemente da tutto” è una strategia, così come “Pescare oggi per lo stesso numero di ore in cui l’altro ha pescato ieri” (strategia chiamata “tit-for-tat”, ossia del “colpo su colpo”). Il salario offerto da un’impresa e il piano di promozione correlato alle prestazioni di un lavoratore costituiscono una strategia, così come la scelta del proprio livello di sforzo da parte di un dipendente; il tasso di interesse applicato da una banca, il sistema di monitoraggio dei propri clienti e i metodi di gestione delle situazioni di insolvenza rappresentano a loro volta una strategia, e così via. Così, una strategia è una descrizione di un’azione o di un insieme di azioni effettuabili in ogni situazione che può essere contemplata nel gioco. Un individuo, oltre alle strategie pure che compongono l’insieme delle strategie, può adottare una strategia mista, assegnando delle probabilità ad alcune o a tutte le strategie pure contenute nel suo insieme di strategie. Per esempio, si potrebbe lanciare una moneta per determinare se pescare 6 o 8 ore.5 Si consideri che ci siano n giocatori indicizzati con i = 1… n, e per ognuno un insieme di strategie indicato come Si . Supponete che il j-esimo giocatore scelga una particolare strategia s S . Siano s la strategie adottate da tutti gli altri giocatori (scelte dai loro insiemi di strategia S e (s, s ) il payoff che riceve con il profilo strategico (s, s ) . Il payoff è la valutazione di del risultato prodotto dal profilo strategico (s, s ) . La strategia è la risposta ottima di nei confronti delle strategie j
j
j
j
j
j
j
adottate dagli altri giocatori se nessuna strategia a disposizione di payoff maggiore per . Ossia, 5
si traduce in un
Se le strategie miste forniscono un utile espediente nella trattazione dei modelli (e.g., nell’esempio del monitoraggio e del lavoro nel capitolo 8), hanno ricevuto molta più attenzione da parte degli studiosi di teoria dei giochi più per ragioni tecniche di quanto giustificato da qualsiasi scoperta sul comportamento umano.
14 | MICROECONOMIA
(s, s ) (s', s ) s' S , s' s j
j
j
j
j
L’espressione precedente può essere così letta: il payoff di che gioca la contro il dato profilo strategico di tutti gli altri giocatori (s ) è non strategia inferiore al payoff ottenuto giocando qualsiasi altra strategia s' nell’insieme di strategia j
contro s . Una risposta ottima in senso forte (strict best response) è una strategia in corrispondenza della quale si verifica una stretta disuguaglianza per tutte le strategie s' , mentre una risposta ottima in senso debole (weak best response) è una strategia in corrispondenza della quale l’espressione precedente si verifica come disuguaglianza per almeno una strategia alternativa s' . Una strategia dominante in senso debole (weakly j
dominant strategy) è una strategia tale che nessuna strategia comporta un maggior payoff indipendentemente dalla scelta strategica degli altri giocatori e che per alcuni profili strategici comporta maggiori payoff. Cioè s è dominante in senso debole se (s, s ) (s', s ) s' S and s S j
j
j
j
j
j
j
con la disuguaglianza in senso stresso che si verifica per almeno un profilo strategico. Una strategia è strettamente dominante (strictly dominant) se nessuna strategia la domina in senso debole, ossia, quando la precedente disuguaglianza è stretta in tutti i casi. Riservo i termini “risposta ottima” e “dominanza” (senza l’aggettivo debole o forte) per il concetto più forte. Se esiste una strategia dominante per ogni giocatore, allora il profilo strategico nel quale tutti i giocatori adottano la loro strategia dominante è definito equilibrio in strategie dominanti (equilibrium in dominant strategies). L’eccesso di sfruttamento nella pesca nella tragedia dei pescatori ne è un esempio. Sorprendentemente, non sempre può aver senso giocare una strategia dominante, ma per vedere perché, avrò bisogno di introdurre un altro importante concetto di soluzione – dominanza di rischio (risk dominance) – che tra breve presenterò. Un equilibrio di Nash è un profilo strategico in cui ciascuna delle strategie dei giocatori costituisce una risposta ottima alle altre strategie nel profilo; se tutte le risposte ottime che compongono questo profilo strategico sono uniche (non includono risposte ottime in senso debole), allora l’equilibrio di Nash viene detto stretto. Dato che i giocatori non hanno nessuna ragione di cambiare i loro comportamenti (l’equilibrio è una risposta ottima reciproca), tale equilibrio è detto stazionario, ed è questa caratteristica che giustifica che si possa chiamarlo equilibrio. Questa interpretazione è basata sull’ipotesi che gli individui non possano mettersi d’accordo congiuntamente per alterare le loro strategie. Rispondendo all’obiezione di John Von Neumann secondo la quale le persone sono davvero tutto eccetto che non cooperative, John Nash (verso il quale siamo in debito per questo e altri contributi nella teoria dei giochi) chiamò l’assunto di comportamento non cooperativo “il
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|15
modo americano”. Infine, la dominanza iterata è una procedura per la quale un giocatore può non prendere in considerazione alcune delle strategie degli altri giocatori che sono strettamente dominate (e.g. che potrebbero non essere vantaggiose da adottare in corrispondenza di qualsiasi profilo strategico). Riducendo gli insiemi delle strategie degli altri giocatori con tale procedura cambia la struttura del gioco in modo tale che il gioco ridotto dalla dominanza iterata può avere un equilibrio di Nash o in strategia dominante anche se il gioco completo non lo aveva.
LA
STRUTTURA DELLE INTERAZIONI SOCIALI
Le persone interagiscono in una varietà infinita di modi, ma esistono generiche classi di interazione. Un po’ di terminologia della teoria dei giochi ci fornirà una classificazione intuitiva. La prima distinzione – tra giochi cooperativi e non cooperativi – si riferisce alla struttura istituzionale che regola l’interazione. La seconda – tra giochi di interesse comune e di conflitto – si riferisce alla misura in cui i payoff del gioco esibiscono conflitto o un interesse comune tra i giocatori. Giochi cooperativi e non cooperativi. Immaginate un’interazione nella quale tutto ciò che influenza sia le azioni dei giocatori che ciò che li riguarda è soggetto ad un accordo vincolante (ossia che può esser fatto rispettare senza costi). Questa è definita una interazione cooperativa (o un gioco cooperativo; uso i termini gioco e interazionein modo intercambiabile, quando appropriato). Il termine non si riferisce alle opinioni che le parti hanno degli altri ma semplicemente agli ordinamenti istituzionali che governano le loro interazioni. Come vedremo, i giochi cooperativi possono essere altamente conflittuali: per esempio, l’acquisto di una casa mette generalmente l’uno contro l’altro gli interessi dell’acquirente e del venditore, ma se un accordo è raggiunto, in genere si può far osservare e i termini dell’accordo coprono tutti gli aspetti del trasferimento che sono di interesse per le parti. Più comunemente, comunque, qualche aspetto dell’interazione non è soggetto ad accordi vincolanti. Tali situazioni sono modellate come giochi non cooperativi. In alcuni casi, parte di un’interazione si può sviluppare in modo cooperativo, come quando un datore di lavoro e un lavoratore contrattano su salario e ore di lavoro. Altri aspetti della stessa interazione possono essere non cooperativi a causa dell’impossibilità di scrivere o di far osservare i relativi contratti. Tra gli esempi si possono includere gli aspetti relativi alla definizione dell’impegno con il quale debba lavorare un lavoratore o la scelta del datore di lavoro di investire i profitti che ricava nello stabilimento che li ha prodotti o altrove. Come nel caso delle interazioni
16 | MICROECONOMIA
cooperative, le parti coinvolte in interazioni non cooperative possono avere forti conflitti di interesse, o condividere ampiamente obiettivi comuni; il termine “non cooperativo” si riferisce semplicemente al fatto che la loro interazione non è completamente coperta da un accordo vincolante. Molti aspetti delle relazioni affettive tra amici e parenti hanno lo stesso segno di interazioni non cooperative; per esempio, la promessa di fare del proprio meglio per trovare un lavoro ad un amico può essere completamente sincera, ma non è un accordo vincolante. Interesse comune e conflitto. Alcune interazioni hanno il carattere dei flussi di traffico: gli ingorghi stradali sono in genere un risultato poco desiderabile, e un impegno attivo per evitarli beneficerebbe tutti. In altre interazioni, come quelle che comportano la fissazione di un prezzo per un bene che deve essere scambiato o la suddivisione di una torta, se qualcuno ottiene di più, qualcun altro ottiene necessariamente di meno. Molte delle differenze tra studiosi e politici che affrontano le questioni dell’“institutional design”, ossia della progettazione e definizione delle istituzioni, derivano da credenze diverse circa la questione se i mali della società siano il risultato di problemi di interesse comune come gli ingorghi stradali o di problemi di conflitto di interesse come la suddivisione di una torta di dimensione data. Nel primo caso le istituzioni possono assumono il ruolo di risolutori di problemi e nel secondo caso quello di responsabili dell’enforcement delle regole. Ma molte istituzioni ricoprono entrambi i ruoli. In tal caso può essere impossibile analizzare gli aspetti di risoluzione di problemi e gli aspetti distributivi separatamente. Può essere utile avere qualche termine per differenziare tra queste classi di problemi; per fare questo mi riferirò agli aspetti di interesse comune e di conflitto di un’interazione, partendo dai casi puri. Un gioco nel quale il payoff di solo uno dei profili strategici è ottimo dal punto di vista Paretiano e i payoff associati a tutti i profili strategici possono essere ordinati dal punto di vista Paretiano può essere descritto come un gioco di puro interesse comune.6 La dimensione del conflitto è interamente assente poiché un risultato è migliore di tutti gli altri per almeno un partecipante e non peggiore per qualunque altro partecipante, ed esiste un secondo migliore risultato (second best) che, se Pareto inferiore al primo, è però Pareto superiore agli altri, e così via. Cioè, non esiste risultato tale che ogni giocatore preferirebbe in modo stretto un risultato rispetto al risultato preferito da qualsiasi altro giocatore. Qui di seguito viene riportato un 6
Il termine “gioco di interesse comune” è stato usato per riferirsi ad una struttura di payoff tale che tutti i giocatori preferiscono un certo risultato rispetto ad ogni altro (per esempio, Aumann e Sorin 1989 e Vega-Redondo 1996); la definizione qui è più forte (quindi “pura”) dato che richiede non solo che esista un risultato mutuamente preferito, ma che tutti i risultati siano classificabili dal punto di vista paretiano. I risultati possono essere classificati dal punto di vista paretiano se l’ordine delle preferenze dei risultati - dai maggiori ai minori preferiti – di tutti i partecipanti sono tali che se un individuo preferisce il risultato A rispetto al risultato B, nessun individuo preferisce B ad A.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|17
esempio. Un’impresa è costituita da un datore di lavoro e un dipendente: se l’impresa funziona e ha successo, entrambi ricevono un payoff pari a 1; se fallisce, entrambi ricevono 0. La probabilità di successo dipende dalle azioni intraprese (in modo non cooperativo) dai due: il datore di lavoro può investire nell’impresa oppure no, e il dipendente può lavorare nell’impresa con o senza impegno. Se il datore di lavoro investe nell’impresa e il lavoratore vi si impegna seriamente, l’impresa sicuramente avrà successo. Tabella 1.2. Payoff in puro interesse comune: il gioco della sopravvivenza dell’impresa
Nota: il datore di lavoro è il giocatore colonna, il dipendente il giocatore riga con .
In caso contrario, l’impresa senza dubbio fallirà (tabella 1.2). Se il datore di lavoro investe e il dipendente non lavora, l’impresa avrà successo con probabilità , mentre nel caso opposto l’impresa avrà successo con probabilità . Supponiamo che entrambi i giocatori scelgano le azioni che massimizzano il valore atteso dei loro payoff, ossia, la somma ponderata dei payoff che si ottengono per ogni strategia scelta dagli altri giocatori, pesata dalla probabilità che ogni giocatore assegna ad ognuno di questi eventi. E’ facile confermare che i giochi di puro interesse comune hanno un equilibrio in strategia dominante, cioè un singolo risultato Paretoottimale. (Questo è un gioco nel quale il valore atteso dei payoff dipende da un risultato probabilistico – il successo dell’impresa – che è influenzato da un profilo strategico adottato dai giocatori. La realizzazione di un processo stocastico è talvolta chiamato mossa della natura). Un’interazione è definita un gioco di puro conflitto se tutti i possibili risultati sono ottimali dal punto di vista Paretiano. Un esempio è dato da un qualsiasi gioco a somma zero (ciò significa che per ogni profilo strategico la somma dei payoff è pari a zero). Il puro conflitto è illustrato dall’insieme di equilibri di Nash in senso stretto nel Gioco della Suddivisione originalmente proposto da Schelling (1960). Un dollaro deve essere diviso tra due individui secondo le seguenti regole: senza che a priori ci possa essere comunicazione, ogni giocatore sottopone una richiesta di un qualsiasi valore e, se la somma delle richieste è uguale a 1 o inferiore, la richiesta viene soddisfatta, altrimenti ogni giocatore riceve zero. Una parte della matrice dei payoff di questo gioco è rappresentato dalla tabella 1.3 (dove si assume che le richieste debbano essere state fatte in centesimi). Le coppie di strategie poste al di fuori della
18 | MICROECONOMIA
diagonale chiaramente non sono equilibri di Nash in senso stretto (e.g. la coppia in basso a destra è una mutua debole risposta ottima e quindi un equilibrio di Nash in senso non stretto, così come una richiesta di zero è anche una risposta ottima ad una richiesta di 100). Le coppie di strategie in grassetto sono gli equilibri di Nash in senso stretto del gioco (ve ne sono 101). Notate che ognuno di essi è Pareto-ottimale, così i risultati che compongono l’insieme degli equilibri di Nash del Gioco della Suddivisione descrivono una interazione di puro conflitto. Il fatto che tutti i risultati dei giochi di puro conflitto siano efficienti dal punto di vista Paretiano non significa che le regole che definiscono il gioco siano efficienti; ci possono essere altre regole (cioè altri modi di regolare l’interazione data la sua sottostante struttura) che potrebbero condurre a risultati che sono superiori dal punto di vista paretiano rispetto quelli definiti da un gioco di puro conflitto. Ritorneremo su questo. Tabella 1.3. il gioco della suddivisione
La figura 1.2 mostra i payoff di un generico gioco tra due persone nel quale ogni giocatore ha due strategie; quindi, ci sono quattro profili strategici e relativi payoff classificati da a fino a d. In un gioco di puro conflitto i payoff sono disposti in direzione “nord-ovest – sud-est” (dato che ognuno è un ottimo paretiano, nessun risultato può trovarsi in direzione “nord-est” o qualsiasi altra direzione diversa), mentre nel caso di un gioco di puro interesse comune i payoff si dispongono lungo un asse in direzione “sud-ovest – nord est”, indicando che si possono classificare in senso paretiano. Il gioco della sopravvivenza dell’impresa è un esempio della classe dei giochi di puro interesse comune nei quali i payoff che i giocatori ricevono sono identici per ogni profilo strategico (condividono un “destino comune”) così che i risultati in figura 1.2 potrebbero essere disposti lungo un raggio di 45° uscente dall’origine. Allo stesso modo, un gioco a somma zero è una forma forte di un gioco di puro conflitto in cui i payoff potrebbero essere disposti lungo una retta con pendenza -1.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|19
Figura 1.2. Giochi di puro conflitto e di puro interesse comune. Nota: i punti a, b, c e d indicano i payoff dei due giocatori per ognuno dei quattro profili strategici.
Molte interazioni sociali sono tali che aspetti di conflitto di interesse e di interesse comune sono compresenti. Guidare sul lato destro o sinistro della strada è indifferente per la maggior parte delle persone fin quando gli altri fanno lo stesso. Al contrario, se ci sono mutui guadagni per tutte le persone che parlano tra loro la stessa lingua, le persone sono lontane dall’essere indifferenti rispetto alla scelta di quale lingua si parli; in migliaia sono morti in guerre sul punto. Una delle ragioni per le quali il dilemma del prigioniero ha attirato così tanta attenzione è che esso combina sia gli aspetti di interesse comune che di conflitto d’interesse. La figura 1.1 (la tragedia dei pescatori) illustra entrambe le dimensioni di conflitto (direzione nord-ovest – sud-est) e di interesse comune (sud-ovest – nord est) dei payoff. Una misura naturale dell’estensione degli aspetti dell’interesse comune nei confronti degli aspetti di conflitto è disponibile nei giochi simmetrici come la tragedia dei pescatori. (un gioco simmetrico è un gioco in cui la matrice dei payoff di un giocatore è la trasposta della matrice dei payoff dell’altro). Questa misura, , è data dal valore del miglioramento reso possibile dalla cooperazione (1 u) , relativa alla differenza nei payoff quando i due adottano strategie differenti, (1 + ) : =
1 u . 1 +
Per valori di u e tali che i payoff descrivono un dilemma del prigioniero ( 0, 1 ) , dove valori prossimi a zero indicano praticamente puri conflitti, e valori prossimi all’unità praticamente puro interesse comune.
20 | MICROECONOMIA
Figura 1.3. Aspetti delle interazioni sociali. Nota: non è difficile pensare a certi diritti di proprietà che dovrebbero essere inseriti nel lato del conflitto nel grafico; allo stesso modo si possono pensare alcuni aspetti dell’evoluzione del linguaggio che si sono evoluti via imposizione coercitiva (cioè in modo cooperativo) piuttosto che in modo non cooperativo.
La distinzione dei giochi in cooperativi/non-cooperativi e conflitto/interesse comune ci dà la tipologia delle interazioni presentata nella figura 1.3 con alcuni esempi esplicativi. Per esempio, il rimborso dei prestiti (analizzato nel capitolo 9) è un’interazione conflittuale non cooperativa poiché il rimborso beneficia il prestatore dato che chi prende a prestito gli paga un costo, ma l’enforcement della promessa del prenditore di restituirgli somma e costo non è possibile da far rispettare (se chi prende a prestito non ha fondi). L’evoluzione dei diritti di proprietà individuale durante il periodo della storia umana prima dell’esistenza degli Stati può essere stata almeno inizialmente un’interazione di interesse comune non-cooperativa. Al contrario, i moderni diritti di proprietà sono determinati da interazioni cooperative che prendono la forma di restrizioni enforceable (il cui rispetto può essere assicurato) sugli usi possibili. Un altro aspetto importante delle interazioni sociali è la struttura temporale. Un’interazione può essere ripetuta per molti periodi dagli stessi giocatori per un numero noto di periodi o con una nota probabilità che l’interazione si interrompa al termine di ogni periodo. Questi sono definiti giochi ripetuti; i giochi non ripetuti sono spesso chiamati “one-shot”, cioè giochi a turno unico. Infine, molte interazioni assomigliano a scambi nei quali c’è un singolo compratore ed un singolo venditore; ma in aggiunta a questi giochi a due persone ci sono molte interazioni che coinvolgono numerose persone, genericamente indicate come giochi con n-persone. Giochi simmetrici a due persone con solo due strategie sono chiamati giochi 2 x 2.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
FA L L IM E N T I
|21
D E L C O O R D IN A M E N TO
Torniamo ora alla sfida costituzionale, inizialmente espressa come la sfida di assicurare che il perseguimento degli interessi individuali non porti a “risultati che nessuno sceglierebbe”. Questi risultati indesiderabili sono i fallimenti del coordinamento che si realizzano quando l’interazione non-cooperativa di due o più persone conduce a risultati che non sono Pareto-ottimali.7 Intendo come problemi di coordinamento quelle situazioni in cui i fallimenti del coordinamento occorrono con probabilità significativa. Fallimenti di mercato familiari quali quelli che risultano da esternalità ambientali sono un tipo di fallimento del coordinamento, ma il concetto più ampio include tutte le forme di interazione non cooperativa, non solo quelle che hanno luogo nelle interazioni di mercato. Corsa al riarmo e ingorghi stradali sono esempi di fallimento del coordinamento. Una classe importante di fallimenti del coordinamento – i fallimenti dello Stato – sorgono quando le azioni di equilibrio degli organi ufficiali di governo hanno come esito un risultato Pareto-inferiore. Uso la definizione più ampia di fallimenti del coordinamento (piuttosto che fallimenti di mercato) per attirare l’attenzione sul fatto che tutte le strutture istituzionali condividono con i mercati la tendenza ad implementare risultati inefficienti in senso Paretiano. I fallimenti del coordinamento possono sorgere in situazioni fuori equilibrio, ma dal punto di vista analitico l’attenzione si è focalizzata sui risultati di equilibrio, nei quali i fallimenti del coordinamento avvengono in due casi. Nel primo caso, uno o più risultati Pareto-inferiori possono essere equilibri di Nash; nel secondo caso, non esiste nessun risultato Pareto-ottimale che è un equilibrio di Nash. Come base considerate un gioco 2 x 2 nel quale esiste un singolo equilibrio di Nash ed è Paretoottimale, come nella tabella 1.4. Lo chiamo Gioco della Mano Invisibile perché le azioni individualiste di entrambi i giocatori portano ad un risultato che massimizza il benessere di ciascuno. (Cioè, se Riga coltiva pomodori e Colonna coltiva grano, essi ricevono entrambi 5, che è il meglio che essi possano fare). In questo caso, ognuno non solo persegue i propri obiettivi individualistici ma beneficia del fatto che l’altro fa lo stesso. La scelta di Riga di una strategia dipenderà da cosa egli crede che farà Colonna. Immaginate che Riga Razionale nota che per Colonna coltivare pomodori è una strategia dominata e di conseguenza (usando un ragionamento di dominanza iterata) decide di coltivare pomodori. Ma supponete che invece di perseguire il proprio interesse, Colonna Pazza lanci una moneta e come risultato del lancio decida di coltivare anch’egli pomodori. L’esempio sottolinea che anche se c’è un unico
7
Questa è una definizione inclusiva del termine fallimento della coordinamento, che talvolta è ristretta a situazioni in cui si ottiene un equilibrio Pareto inferiore quando un altro equilibrio (Pareto superiore) esiste. La mia definizione include casi in cui nessun equilibrio esiste.
22 | MICROECONOMIA
equilibrio di Nash, ci resta da capire come i giocatori arrivino ad esso, un argomento sul quale torneremo nel capitolo 2. Invece, nel gioco del Dilemma del Prigioniero abbiamo visto che un equilibrio in strategia dominante esiste ed è Pareto-inferiore. Il fallimento del coordinamento deriva dal fatto che il danno inflitto all’altro dalla propria defezione non si riflette nei payoff di chi la compie, così nessuno dei due prigionieri prende in adeguata considerazione gli effetti delle proprie azioni sull’altro. Tabella 1.4. Il gioco della mano invisibile
Per lo stessi motivo si hanno fallimenti del coordinamento nei Giochi di Assicurazione (Assurance Game). Ma la struttura del gioco differisce per un aspetto sostanziale dal dilemma del prigioniero: la matrice dei payoff del gioco di assicurazione è tale che esistono molteplici equilibri, uno (o più) dei quali può essere Paretoinferiore. (I giochi con questa struttura sono talvolta chiamati giochi di coordinamento, ma non voglio usare questo termine per evitare confusione con i termini di “fallimenti del coordinamento” e “problemi di coordinamento” precedentemente introdotti). Così, se un profilo strategico Pareto-ottimale può essere il risultato del gioco, non necessariamente è detto che esso sia raggiunto. Esempi possono essere dati dalla scelta di imparare una lingua o un programma di scrittura per il PC (il valore che se ne trae dipende da quante altre persone hanno imparato la stessa lingua o lo stesso programma), di partecipare ad azioni collettive quali uno sciopero o un cartello (i benefici attesi dipendono dal numero delle persone partecipanti), e la determinazione dell’occupazione in una economia nel suo complesso (se tutti i datori di lavoro assumono, il salario pagato sosterrà un livello di domanda aggregata tale da giustificare un alto livello d’occupazione). Altri esempi includono l’adozione di uno standard comune (sistemi di pesi e misure, credenziali accademiche, sistemi operativi per computer, sistema VHS in luogo della tecnologia video Betamax), imprese che formano il proprio personale qualificato (se i lavoratori si possono trasferire tra imprese, i guadagni privati per una certa impresa dipendono dal numero delle altre imprese che si impegnano nella formazione), e reputazioni di gruppo (se la vostra comunità commerciale è conosciuta come opportunista, può anche essere per voi una risposta ottima comportarsi in modo opportunistico). Come questi esempi suggeriscono, nei giochi di assicurazione i fallimenti del
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|23
coordinamento si hanno o a causa di guadagni crescenti generalizzati o di quelle che talvolta sono definite come complementarità strategiche: i payoff individuali crescono all’aumentare del numero delle persone che intraprendono la stessa azione. Se io adotto lo stesso programma di scrittura dei miei colleghi, trasmetto loro dei benefici, ma questi benefici non sono inclusi nel mio processo decisionale. (Comparate questo con il precedente Gioco della Mano Invisibile nel quale la specializzazione è vantaggiosa, in modo tale che la coltivazione del grano da parte di una persona rende i payoff relativi alla coltura del grano inferiori per l’altro). Poiché le complementarità strategiche possono dar vita a equilibri multipli, i risultati possono essere path-dependent8 nel senso che, senza conoscere la recente storia di una popolazione, è impossibile dire quale equilibrio si avrà. In questo caso sono possibili risultati abbastanza differenti per due popolazioni con identiche preferenze, tecnologie e risorse ma con storie diverse. Per poter vedere questo, ritorniamo ai contadini di Palanpur, i cui raccolti sarebbero maggiori se tutti seminassero prima nel corso dell’annata. Ma se un contadino dovesse seminare da solo prima, le sementi verrebbero mangiate dagli uccelli che si affollerebbero sul suo terreno. Supponete che ci siano solo due contadini che interagiscono in modo non cooperativo in un periodo singolo con payoff indicati nella tabella 1.5. Ipotizzerò che piantare tardi garantisca un guadagno più alto se l’altro pianta prima rispetto al caso che entrambi piantino tardi. Il primo piantatore subisce tutti i danni dei predatori, ma se i due piantano simultaneamente, i predatori vengono “suddivisi” equamente. Se l’equilibrio che deriva dal piantare congiuntamente prima è chiaramente il solo Pareto-ottimo, piantare congiuntamente tardi è anch’esso un equilibrio. Tabella 1.5. Coltivare a Palanpur: un gioco di assicurazione
La matrice dei payoff descrive una trappola della povertà: individui identici in un identico scenario possono conoscere tanto uno standard di vita adeguato quanto la povertà, e ciò dipende solo dalla loro storia. Il problema di Coltivare in Palanpur è un tipo particolare di gioco d’assicurazione nel quale esistono due o più equilibri simmetrici in strategia pura (ciò significa che tutti i giocatori adottano la stessa strategia pura). Tali equilibri sono chiamati convenzioni, ossia risultati derivanti da una mutua risposta ottima che sono sostenuti dal fatto che in pratica tutti i giocatori credono che tutti gli 8
Un modello viene detto “path-dependent” quando ha una forte dipendenza dalle sue condizioni iniziali e all'evoluzione della sua dinamica.
24 | MICROECONOMIA
altri giocatori giocheranno la risposta ottima. (Ritorneremo sulla contingenza storica dei risultati nel capitolo 2, nel quale verranno introdotti strumenti analitici quali la dinamica nei livelli della popolazione). I giochi finora introdotti (più un altro gioco comunemente giocato dai bambini) permettono di illustrare le fonti dei fallimenti del coordinamento elencate nella tabella 1.6. Nel gioco da bambini, conosciuto in tutto il mondo (gli anglofoni lo chiamano “Sasso Carta Forbice”, in Italia è chiamato anche “Morra Cinese”, in altri paesi è conosciuto come “Forbicina Uomo Elefante”) non c’è nessun equilibrio in strategie pure.9 Cioè, nessun Pareto-ottimo è un equilibrio di Nash, ma dato che il gioco è un gioco a somma zero (la somma dei payoff per ogni profilo strategico è uguale a zero) tutti i risultati sono ottimi paretiani. Dato che non si possono dare risultati Pareto-inferiori, Sasso Carta Forbice non rappresenta un problema di coordinamento, e dunque non esiste un modo ragionevole di giocare questo gioco (e questo è il motivo del perché è divertente giocarlo). La rappresentazione di diverse strutture delle interazioni sociali come giochi ha permesso una tassonomia di come i problemi di coordinamento possono nascere. Suggerisce anche una strategia da indirizzare nei confronti della sfida costituzionale: se il probabile risultato di un’interazione è Pareto-inferiore rispetto altri risultati realizzabili, è possibile introdurre politiche o diritti di proprietà tali da cambiare la struttura del gioco per rendere il secondo risultato più probabile. Qui di seguito un esempio. La differenza cruciale tra dilemma del prigioniero e giochi di assicurazione è che nel primo il risultato indesiderato è l’unico equilibrio di Nash, cosicché l’unico modo per sostenere uno degli altri risultati è un intervento permanente volto a cambiare i payoff o le regole del gioco. Nel gioco di assicurazione, invece, un risultato desiderabile (piantare prima congiuntamente, per esempio) è un equilibrio, così la sfida per i giocatori o per gli organi di governo è limitata al meno difficoltoso problema del come raggiungere l’equilibrio piuttosto che al più gravoso problema del come stare nell’equilibrio. Nei dibattiti sulle modalità appropriate (e la durata) degli interventi dello Stato nell’economia, differenze chiave tra gli economisti riguardano
9
Qui di seguito una variante del gioco: tra tre mosse tu e il tuo compagno di giochi potete scegliere di gettare avanti o il palmo della vostra mano (carta), il pugno (roccia) o due dita a forma di V (forbice) con le seguenti regole: la roccia batte (“rompe”) la forbice, la forbice batte (“taglia”) la carta e la carta batte (“avvolge”) la pietra; il vincitore e lo sconfitto vincono e perdono rispettivamente un punto. (Un pareggio non assegna punti, ma può far scoppiare le risa di entrambi generate dalle battaglie di pietre, guerre di forbici e sovrapposizioni di carta). Come in altre lingue la forbicina possa battere l’uomo rimane per me ancora un mistero; ma allora cercate di spiegarmi perché la carta batte la pietra. Vedi Sato, Akiyama e Farmer (2002).
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|25
l’opinione sul fatto che il problema sottostante rappresenti un Dilemma del Prigioniero o un Gioco d’Assicurazione. Interventi possono essere richiesti in entrambi i casi, ma gli interventi indirizzati a risolvere i problemi correlati ai giochi d’assicurazione possono essere ragionevolmente rappresentati da singoli interventi piuttosto che da interventi permanenti. Ed è, in parte, per questa ragione che un approccio comune per evitare fallimenti del coordinamento è quello di escogitare politiche o costituzioni che trasformino la matrice dei payoff in modo tale da convertire un dilemma del prigioniero in un gioco d’assicurazione rendendo il risultato della mutua cooperazione un equilibrio di Nash. Un’interazione che è un dilemma del prigioniero se si ripete una sola volta, può diventare un gioco d’assicurazione con mutua cooperazione come equilibrio di Nash se ripetuta più volte, come vedremo nel capitolo 7. Tabella 1.6. Fonti dei Fallimenti di Coordinamento
Anche se esiste un equilibrio di Nash Pareto-ottimale in un Gioco d’Assicurazione, questo fatto da solo non è sufficiente a garantire che la soluzione che assicura mutui benefici sia raggiunta; fallimenti del coordinamento che prendono vita da interazioni che hanno forma di Giochi d’Assicurazione sono onnipresenti. Un’importante ragione è che la decisione su come giocare dipende da supposizioni su come gli altri giocheranno, e il modo in cui le persone affrontano questa situazione di indeterminatezza può portare a risultati sub-ottimali. Il problema è illustrato nella figura 1.4, in cui i payoff attesi di piantare tardi e presto ( e , rispettivamente) l
e
sono semplici funzioni lineari dei payoff della matrice del gioco Coltivare in Palanpur presentato prima. Supponete di essere il contadino Riga di Palanpur e di non avere informazione sul probabile modo di giocare del contadino Colonna, e di assegnare una stessa probabilità alle due strategie di Colonna. Voi sceglierete piantare tardi perché il vostro payoff atteso è di 2 (cioè, (3) + (2)), mentre il payoff atteso di piantare prima è di 2. Anche se l’equilibrio in cui si pianta congiuntamente fosse in qualche modo raggiunto, potrebbe essere difficile sostenere la convenzione di piantare prima nel caso in cui voi pensaste che l’altro potrebbe cambiare strategia per dispetto o errore. Per vederne il perché, immaginate che il payoff zero nella figura sia -100, ossia il payoff associato alla distruzione del seminato di uno dei contadini porti come risultato il fatto di restare senza cibo. Dato che l’idea di fondo qui presentata ricorrerà anche nelle prossime pagine,
26 | MICROECONOMIA
poche definizioni (che si riferiscono esclusivamente ai giochi 2 x 2) potranno essere d’aiuto. Chiamiamo una convenzione nella quale entrambi i giocatori adottano la strategia un k-equilibrio. L’altra strategia è . Definiamo il fattore di rischio di un kequilibrio come la probabilità minima tale che se un giocatore crede che l’altro giocatore sta per giocare
con probabilità maggiore di (e con una probabilità minore di (1 p) ) allora e la risposta ottima in senso stretto da attuare per l’individuo. L’equilibrio con il minor fattor di rischio è l’equilibrio rischio dominante. Nell’esempio precedente, il fattore di rischio dell’equilibrio dato dal piantare tardi è 1/3, che è inferiore rispetto al fattore di rischio dell’equilibrio dato dal piantare presto (2/3). Piantare tardi è definita strategia rischio dominante di Riga, ossia la strategia che massimizza i payoff attesi di un giocatore che attribuisce uguale probabilità alle strategie a disposizione dell’altro giocatore. Poiché questo è vero anche per il giocatore Colonna, piantare congiuntamente tardi è l’equilibrio rischio dominante. La figura 1.4 illustra questi concetti. La frazione di coloro che piantano presto è
,
mentre e sono i payoff attesi rispettivamente dal piantare tardi e presto, condizionali alle supposizioni di ognuno circa . L’equilibrio dato dal piantare l
e
presto è definito l’equilibrio dominante nei payoff: un equilibrio è dominante nei payoff se non esiste altro equilibrio che lo domina in senso stretto dal punto di vista Paretiano. Nel nostro esempio, piantare presto è dominante nei payoff perché i payoff in questo equilibrio eccedono i payoff per entrambi i giocatori nell’equilibrio piantare tardi. Notate che si assume che i contadini massimizzino i payoff attesi, il che implica che essi siano neutrali al rischio, così il fatto che l’equilibrio rischio dominante ma inferiore in senso paretiano possa realizzarsi non presume avversione al rischio da parte di essi. (Neutralità al rischio e avversione al rischio sono discussi nei capitoli 3 e 9). Notate anche che il fallimento del coordinamento non è dovuto in questo caso a un conflitto di interesse tra i contadini, come nel dilemma del prigioniero affrontato dai pescatori. Ciascun pescatore preferisce essere colui che pesca di più e che sia l’altro a pescare di meno. Ma entrambi i contadini preferiscono piantare presto congiuntamente rispetto ogni altro risultato. Il loro fallimento nel coordinarsi per ottenere il risultato desiderato è dovuto all’incertezza circa le azioni intraprese dagli altri e non ad un conflitto di interesse. La previsione che l’equilibrio rischio dominante sarà favorito rispetto all’equilibrio payoff dominante è fortemente supportata dall’effettivo modo di giocare di soggetti sottoposti a giochi sperimentali catturanti la logica del problema di Coltivare a Palanpur (Van Huyck, Battalio e Beil 1990). Vedremo (nel capitolo 12) che gli equilibri rischio dominanti possono persistere per molti periodi anche quando esiste un equilibrio payoff dominante.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|27
Figura 1.4. Piantare tardi è rischio dominante. Nota: p* = 2/3 così l > e per p =1/2. Le intercette degli assi verticali sono i payoff nella matrice di payoff su p.
Così, anche se un intervento di politica volto a cambiare un Dilemma del Prigioniero in un Gioco d’Assicurazione viene effettuato, il risultato Pareto-ottimale desiderato potrebbe non darsi. Un obiettivo ancora più ambizioso è cambiare l’interazione sociale sottostante da dilemma del prigioniero a Gioco della Mano Invisibile. Per vedere come questo sia possibile, considerate un generico dilemma del prigioniero con i payoff a , b , c , d nella tabella 1.7. (Ignorate i payoff in grassetto per il momento). L’interazione è un dilemma del prigioniero se a > b > c > d e a + d < 2 b , dove la seconda condizione esprime il fatto che il payoff atteso sia del giocatore Riga che del giocatore Colonna è maggiore se essi cooperano rispetto al caso in cui uno di loro defeziona e l’altro coopera, con l’assegnazione dei due ruoli decisa a sorte. Supponete che Riga e Colonna decidano di scegliere “cooperare” come norma e adottare una regola di responsabilità secondo la quale chiunque violi la norma deve risarcire colui i cui payoff si sono ridotti a causa della violazione con una compensazione tale che sia esattamente sufficiente a bilanciarne la perdita (posponiamo al momento l’importante questione relativa all’enforcement dei nuovi diritti di proprietà, ovvero ai mezzi per garantirne il rispetto). Così se Riga tradisce Colonna, Riga inizialmente ottiene a come prima ma dopo deve pagare a Colonna il costo inflitto dal suo tradimento, cioè una compensazione sufficiente a garantire a Colonna un payoff di b (il payoff che avrebbe ottenuto se la norma non fosse stata violata). Se entrambi tradiscono, entrambi ottengono c ma dopo devono risarcire all’altro con un trasferimento di pari a b - c . La matrice trasformata dei payoff per Riga è data dai valori in grassetto nella tabella. Tabella 1.7. Implementare un risultato desiderato trasformando i diritti di proprietà
28 | MICROECONOMIA
I payoff trasformati sono in grassetto.
Si è avuto un miglioramento nei diritti di proprietà? Poiché a – b + d < b per la definizione di Dilemma del Prigioniero, cooperare è una risposta ottima nei confronti di cooperare e la mutua cooperazione è un equilibrio di Nash. Cooperare è anche una risposta ottima rispetto a tradire (poiché b > c ), così cooperare è una strategia dominante e mutua cooperazione è l’equilibrio in strategie dominanti. Cioè, ridefinendo i diritti di proprietà (così da tenere in conto la responsabilità per danni) implementa un ottimo sociale inducendo ognuno a prendere in considerazione gli effetti delle proprie azioni sugli altri. La ridefinizione dei diritti di proprietà ha trasformato il gioco da un gioco con i caratteri misti del conflitto d’interesse e dell’interesse comune in un gioco di puro interesse comune. Comunque, come vedremo nei prossimi capitoli, molti fallimenti del coordinamento non permettono soluzioni così semplici. La ragione è che l’identificazione della defezione e la stima dei danni pertinenti richiedono informazioni che possono o non essere disponibili alle parti coinvolte, o non essere utilizzabili in un tribunale o in un qualsiasi altro ente incaricato di farne osservare i diritti.
GIOCHI
E D I S T I T U Z IO N I
Possono i giochi spiegare le istituzioni? Le istituzioni (come uso io il termine) sono leggi, regole informali e convenzioni che danno una struttura durevole alle interazioni sociali tra i membri di una popolazione. La conformità ai comportamenti prescritti dalle istituzioni può essere assicurata da una combinazione di coercizioni imposte centralmente (leggi), sanzioni sociali (regole informali) e mutue aspettative (convenzioni) che rendono la conformità una risposta ottima praticamente per tutti i membri del gruppo principale. Le istituzioni influenzano chi incontra chi, quali compiti svolgere, la possibile sequenza delle azioni e quali sono le conseguenze delle azioni svolte congiuntamente. Appare chiaro da questa definizione che le istituzioni possono essere formalmente rappresentate da un gioco. Le istituzioni del mercato del lavoro che verranno esaminate nei capitoli 8 e 10 sono modellate in questo modo: le istituzioni pertinenti definiscono cosa il datore di lavoro può fare (variare il salario, dato che è il primo giocatore; interrompere un rapporto di lavoro) e cosa non può fare (punire fisicamente il lavoratore) e analogamente per il lavoratore (variare il livello dello sforzo lavorativo) con i payoff dei due che dipendono dal profilo
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|29
strategico. Queste istituzioni sul mercato del lavoro a livello di impresa sono modellate come giochi. Le innovazioni istituzionali quali il salario minimo o i regolamenti che governano la fine dei rapporti di lavoro possono essere considerate come modi di alterare gli insiemi di strategia, i payoff, la struttura delle informazioni e i giocatori in modo tale che l’equilibrio del gioco possa essere spostato. Ma per capire perché le istituzioni possano cambiare, potrebbe essere illuminante talvolta rappresentare un’istituzione non come un gioco ma piuttosto come l’equilibrio di un sottostante gioco. Poiché le istituzioni sono persistenti anziché essere momentanee, è naturale rappresentarle come equilibri stabili di un gioco sottostante nel quale l’insieme delle strategie abbraccia un ampio raggio di possibili azioni (frustare il lavoratore scansafatiche, rifiutarsi di consegnare le merci prodotte al datore di lavoro) che non sono osservate nell’ambiente istituzionale descritto prima ma che potrebbero essere parte di un equilibrio derivante da un qualche altro profilo strategico. Cioè, continuando con l’esempio datore di lavoro – lavoratore, l’aspettativa che il datore di lavoro e non il lavoratore avrà il possesso dei beni prodotti è una mutua risposta ottima, cioè, un risultato di un qualche gioco (o più probabilmente, di più giochi), presumibilmente uno in cui i giocatori che sono inclusi non sono solo il datore di lavoro e il lavoratore ma anche la polizia, gli ufficiali giudiziari e altri ancora. Quando un particolare insieme di mutue risposte ottime è adottato in pratica universalmente in una popolazione in un periodo esteso di tempo, questo giunge a costituire una o un insieme di istituzioni. Nei capitoli 2 e dall’11 al 13 modellerò i diritti di proprietà, la mezzadria, le regole che governano la suddivisione delle risorse e altri esempi come equilibri e studierò il modo in cui questi equilibri possono evolvere in risposta ad eventi fortuiti, ad azioni collettive da coloro che ne sono coinvoltiti e a cambiamenti indotti in modo esogeno nella struttura del collegato gioco sottostante. Nel capitolo 2 modellerò il processo della segregazione razziale di una zona residenziale per chiarire come un’istituzione (residenze segregate) possa essere intesa come equilibrio di un gioco.
Rappresentando le istituzioni allo stesso tempo come giochi e come equilibri di un sottostante gioco non si è inconsistenti e si incorre in pochi rischi di far confusione. L’interpretazione appropriata dipenderà dal problema analitico che bisogna trattare. Se siamo interessati a capire perché i poveri hanno vincoli di credito (capitolo 9), modellare il rapporto tra il prestatore e colui che prende a credito come un gioco risulta essere adeguato (e rispondere al quesito dell’origine della responsabilità limitata e gli altri sottostanti diritti di proprietà è un di più). Dall’altro
30 | MICROECONOMIA
lato, se vogliamo conoscere perché esiste la responsabilità limitata, dovremo modellare questo aspetto dei diritti di proprietà come il risultato di un gioco sottostante. In ugual modo, se vogliamo conoscere perché la primogenitura è meno comune in Africa che in Asia, avremo bisogno di modellare le regole di eredità come convenzioni, cioè come equilibri di un Gioco d’Assicurazione. Il termine “istituzione” è qualche volta usato anche per riferirsi a singoli enti quali possono essere un’impresa, un sindacato o una banca centrale; ma per evitare confusione chiamerò questi enti organizzazioni. Uno può trattare anche le organizzazioni come se fossero giocatori individuali in un gioco; questo può essere intuitivo nel momento in cui si può aver ragione di pensare che l’ente agisca come una singola unità; trattare l’impresa come una singola persona può avere maggior senso se si applica la stessa logica alla “classe operaia”. La caccia al cervo descritta da Rousseau illustra la relazione tra giochi e istituzioni. Supponete di osservare un gruppo di cacciatori che caccia la lepre, sebbene ci siano anche cervi nei loro dintorni nella foresta. Vi stupite del perché non stiano cacciando il cervo e quindi consultate il Gioco della Caccia al Cervo (tabella 1.8) alla ricerca di una spiegazione. Ipotizzate che ci si siano due cacciatori che decidono, indipendentemente e senza sapere l’uno cosa faccia l’altro, se cacciare un cervo (catturandone e consumandone in parti uguali uno se entrambi lo cacciano, o altrimenti non catturando – e dunque non consumando - niente) o cacciare lepri (catturandone e consumandone una indipendentemente da cosa faccia l’altro). Per il momento, assumiamo che i cacciatori non si aspettino di incontrarsi di nuovo. Infine, ogni cacciatore valuta un terzo del cervo uguale ad una lepre. La tecnologia di caccia (non i payoff) è riassunta nella tabella 1.8. Il gioco cattura importanti aspetti delle istituzioni rilevanti; per esempio, che i soggetti non decidono congiuntamente cosa cacciare (o, per essere più precisi, non hanno strumenti per vincolare se stessi a qualsiasi decisione essi possano prendere), che se entrambi partecipano alla caccia al cervo la preda sarà divisa equamente e anche che se uno caccia la lepre, rendendo la caccia al cervo dell’altro infruttuosa, può consumare la lepre stessa senza doverla dividere. Questo può servire da esempio di come, usando un gioco, si possa descrivere un’istituzione, con le attinenti relazioni di causa ed effetto circa la tecnologia data. Tabella 1.8. La caccia al cervo di Rousseau
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|31
Nota: i valori sono i risultati del giocatore Riga; i payoff possono essere calcolati sapendo che un terzo di un cervo è valutato da ogni giocatore come una lepre.
Comunque, di per sé il gioco da solo non chiarisce molto. Dati i payoff, sia cacciare lepre separatamente che cacciare cervo in modo congiunto sono convenzioni (si tratta di un Gioco d’Assicurazione), così che senza conoscere niente delle credenze di ciascun cacciatore in merito alle più probabili azioni dell’altro non possiamo essere in grado di prevedere quale tra la caccia alla lepre e la caccia al cervo è la convenzione a rischio. Immaginate ora che l’interazione stia nuovamente avvenendo e che nel periodo precedente entrambi abbiano cacciato la lepre (non importa quale sia il motivo); uno dei cacciatori in questa interazione invece prende in considerazione l’opportunità di cacciare il cervo. Affinché questo sia di interesse per il cacciatore (considerando solo i payoff di questo periodo), questi si deve attendere che anche l’altro faccia lo stesso, assegnando una probabilità che ciò accada di almeno 2/3. Nel fare questa stima dovrebbe avere bisogno di conoscere qualcosa della storia del gruppo di cacciatori e, in particolare, i risultati ottenuti in passato nel gioco, includendo, se possibile, risultati complessi quali cacciare il cervo il fine settimana e cacciare lepre nei giorni feriali. Se il cacciatore indeciso non ha questi elementi per poter assegnare una probabilità maggiore e, quindi, assegna un’identica probabilità alle due azioni a disposizione dell’altro cacciatore, per lui è chiaro che cacciare congiuntamente il cervo è l’equilibrio dominante nei payoff e cacciare lepre è l’equilibrio rischio dominante. Così, le mutue aspettative (sia che sorgano da esperienza storica o da qualsiasi altra fonte) svolgono a loro volta un ruolo importante nello spiegare perché è la caccia alla lepre piuttosto che la caccia al cervo il risultato che si realizza, avendo fatto l’ipotesi che essi non hanno modo di impegnarsi uno nei confronti dell’altro a stringere accordi vincolanti. Notate anche che alcuni aspetti del gioco presi come dati ed esogeni nel precedente esempio possono essere spiegati come il risultato di altre istituzioni, cioè di equilibri di sottostanti giochi. La pratica di permettere ai cacciatori di lepre di consumare la loro preda anche se l’altro non ha catturato niente o di dividere il cervo in parti uguali può (come vedremo in seguito) essere modellata come il risultato di un gioco sottostante nel quale questi particolari diritti di proprietà sono un equilibrio e nel quale altri diritti di proprietà potrebbero essere ottenuti (dividere la lepre, per esempio, o che il cervo è di colui al quale appartiene la freccia che lo ha colpito). Anche se la teoria dei giochi spiega molti aspetti importanti delle istituzioni e del comportamento economico, ci sono comunque serie lacune nel nostro attuale livello di conoscenza. Primo, mentre molti degli usi che si fanno nelle scienze sociali della teoria dei giochi concernono giochi 2 x 2 del tipo qui introdotto, in molte
32 | MICROECONOMIA
interazioni sociali i numeri coinvolti sono molto più grandi e l’insieme delle strategie molto più complesso. L’analisi di giochi con n-persone o giochi con grandi insiemi di strategia manca della semplicità, trattabilità e trasparenza dei giochi precedenti. I giochi 2 x 2 prima introdotti possono quindi essere considerati di gran lunga come metafore di problemi molto più complessi, spesso indicanti importanti aspetti delle interazioni, ma vanno poco lontano nel fornire una adeguata analisi. Comunque i passi per avvicinarsi alla descrizione della realtà non devono costare un prezzo troppo alto né andare a discapito della trattabilità. Le interazioni tra due persone sono spesso incastonate in interazioni all’interno di popolazioni molto più grandi, come nell’analisi del livello della popolazione del Gioco del Falco e della Colomba presentato nel capitolo 2, nei giochi di scambio nel capitolo 7 e nelle convenzioni studiate dal capitolo 11 al 13. Ed è spesso possibile modellare un insieme complesso di interazioni come una serie separabile di interazioni tra due o più persone. Quando ritorneremo all’analisi dell’impresa, per esempio, questa sarà analizzata usando una interazione tra due persone, il datore di lavoro e il dipendente; usando una distinta interazione tra due persone, l’impresa e l’istituzione che fornisce prestiti; e usando una più ampia interazione fra n soggetti sul mercato competitivo dei beni. Ma molte delle soluzioni decentralizzate ai problemi di coordinamento basate sulla ripetizione dei giochi e la reputazione (presentate nel capitolo 7) hanno sicuramente ampia applicabilità nelle interazioni tra due persone (o con un numero limitato di persone) rispetto ad interazioni coinvolgenti un grande numero n di persone che caratterizza molti dei problemi di coordinamento d’interesse. L’esagerata enfasi posta sui giochi a due persone (dovuta in parte al loro valore pedagogico), i quali portano a soluzioni in una struttura di gioco ripetuto, può avere contribuito a formare l’opinione che i fallimenti del coordinamento sono eventi eccezionali piuttosto che aspetti generici delle interazioni sociali.10 Il fatto che la teoria dei giochi abbia compiuto meno progressi con le interazioni non cooperative con n-persone rispetto sia ai giochi cooperativi, sia ai giochi con due persone, può difficilmente essere considerata una critica mossa a questo tipo di approccio, dato che queste difficoltà sorgono in quanto la teoria dei giochi si indirizza intrinsecamente verso aspetti complessi delle interazioni umane dai 10
La pedagogia, non il realismo, deve anche spiegare perché così tanta attenzione è stata data ai giochi simmetrici. I giochi che le persone reali giocano sono asimmetrici nel senso che i giocatori spesso vengono (o acquisiscono) etichette che assegnano loro differenti insiemi strategici e payoff: uomini e donne, insiders e outsiders, datori di lavoro e lavoratori interagiscono tipicamente in modo asimmetrico. Giochi asimmetrici sono comuni nei modelli di teoria dei giochi relativi al mercato del lavoro, del credito e altre situazioni nelle quali le istituzioni assegnano agli individui posizioni diverse per distinguere posizioni strutturali (prenditore di fondi in prestito, concessore di prestiti) con diversi insiemi strategici. Questi modelli appaiono nel capitolo 2 e dal capitolo 5 fino al capitolo 10.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|33
quali si astrae in altri approcci. Ciò che rende l’analisi delle interazioni tra molti individui non trattabile è l’ipotesi che essi agiscano strategicamente invece di prendere le azioni degli altri come date. Quando si può astrarre dalle azioni strategiche – come nei mercati competitivi dei beni governati da contratti completi e in cui si ha solo l’equilibrio di scambio, ossia il paradigmatico caso Walrasiano - molta dell’analisi è ridotta ad un singolo individuo che interagisce con un dato insieme dei prezzi, tecnologie e vincoli. Ma, come vedremo, ci sono molte importanti interazioni – mercati del lavoro, mercati del credito, mercati dell’informazione e dei beni con qualità variabile – per i quali questo particolare modo di raggiungere la trattabilità non è intuitivo. Secondo, i principali concetti di soluzione della teoria dei giochi classica – dominanza (diretta, iterata, e di rischio) ed equilibrio di Nash – sono intesi a fornire gli standard riguardo i ragionevoli modi nei quali il gioco potrebbe essere giocato. Ma non sono interamente adeguati come guida per prevedere cosa succederà. Oltre il dilemma del prigioniero, pochi altri giochi hanno equilibri in strategie dominanti (o in dominanza iterata) e alcuni giochi (in strategia pura) non hanno neanche equilibri di Nash. La dominanza iterata può non essere robusta come concetto di soluzione poiché è un modo ragionevole di giocare solo se gli altri giocatori hanno lo stesso modo di intendere il gioco e i suoi payoff, se stanno usando lo stesso concetto di soluzione e non sono inclini a commettere errori (ipotesi di razionalità comune e conoscenza comune). Il concetto di equilibrio di Nash è più robusto: se è nostra preoccupazione trovare una spiegazione ai fenomeni persistenti (piuttosto che a quelli temporanei), è naturale guardare a risultati per i quali è vero che nessuno con la capacità di alterarli tramite le sue azioni da solo non ha alcun interesse a farlo. Così possiamo dire che un equilibrio di Nash è un risultato per il quale non ci sono fonti endogene di cambiamento (questa è una adeguata definizione per ogni equilibrio). Confinando la nostra attenzione sugli equilibri di Nash stabili, il concetto diventa considerevolmente più utile. Ma come guida per i risultati, anche sotto le ipotesi di razionalità comune e di conoscenza comune, gli equilibri stabili di Nash sono incompleti per due motivi. Primo, abbiamo bisogno di sapere come il giocare in modo ragionevole dovrebbe portare ad un equilibrio di Nash e il perché l’esito potrebbe essere stabile. Questo richiede attenzione su cosa i giocatori fanno in situazioni fuori equilibrio. In alcuni casi, non ha molto senso pensare che giocare in modo ragionevole dovrebbe portare ad un equilibrio di Nash. Secondo, molti giochi hanno molti equilibri di Nash, così il Nash in sé non può predire i risultati; le informazioni circa le condizioni iniziali più un’analisi del comportamento fuori dall’equilibrio sono richieste per capire quale tra i
34 | MICROECONOMIA
molteplici equilibri di Nash si avrà. Per questo, sia la contingenza storica che la dinamica (incluso l’apprendimento) sono necessari complementi al concetto di Nash. Il problema dell’indeterminatezza che sorge dalla molteplicità degli equilibri è stato trattato in modi diversi dalla teoria dei giochi classica e dalla teoria dei giochi evolutiva. La teoria dei giochi classica ha cercato di limitare l’insieme dei possibili risultati tramite restrizioni sui comportamenti dei giocatori basate su sempre più forti nozioni di razionalità. Queste restrizioni aggiuntive, chiamate raffinamenti, escludono equilibri che coinvolgono strategie includenti minacce non credibili (e.g. quelle che non possono essere risposte ottime ex post difficilmente saranno ), o che non sono robusti a piccole deviazioni dal giocare la risposta ottima (“tremanti”) o payoff o che sono supportate da credenze non corrette quando si fa un uso appropriato di tutte le informazioni a disposizione (e.g. che non fanno uso di induzione al contrario o dominanza iterata). Invece, la teoria dei giochi evolutiva e comportamentale tratta le limitazioni precedentemente descritte rilassando le ipotesi di conoscenza comune e di razionalità comune e usando ipotesi fondate sull’osservazione empirica (per la maggior parte sperimentale) del modo in cui le persone reali interagiscono. La teoria dei giochi evolutiva, per esempio, generalmente assume che gli individui hanno informazione limitata sulle conseguenze delle loro azioni e che essi aggiornano le loro credenze tramite metodi di “trial-and-error” (tentativo ed errore) usando una conoscenza locale basata sulla recente esperienza passata propria e di altri. Al contrario dei giocatori molto intelligenti e rivolti al futuro della teoria dei giochi classica, i soggetti della teoria dei giochi evolutiva sono “intellettualmente limitati” e rivolti al passato. Poiché c’è poca evidenza che gli individui siano capaci di (o predisposti a) condurre le alquanto esigenti operazioni cognitive che abitudinariamente sono ipotizzate dalla teoria dei giochi classica, procederò (nei capitoli 2 e 3) a sviluppare un insieme di ipotesi maggiormente in linea con la conoscenza empirica. Una seconda ragione per mettere in dubbio l’approccio classico è che pensare che l’indeterminatezza tra equilibri possa essere risolta dalla teoria dei giochi stessa, senza far riferimento alla storia particolare dei giocatori appare un errore. Accogliere piuttosto che tentare di circoscrivere il fatto che i risultati sociali sono influenzati dal recente passato – che la storia conta – attesta una necessaria insufficienza della teoria, non la sua debolezza. Un terzo motivo di dubbio riguardo all’uso della teoria dei giochi come fondamento dell’analisi delle istituzioni e del comportamento economico è il suo scopo limitato. La società non è ben modellata come gioco singolo o come un gioco con una struttura immodificabile. Un approccio ai giochi che potrebbe essere
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|35
adeguato per capire la società dovrebbe prendere in considerazione le seguenti caratteristiche. I giochi sono sovrapposti: le persone regolarmente partecipano a molti e differenti tipi di interazione sociale che vanno dalle imprese, ai mercati, alla famiglia, alle relazioni tra stato e cittadini, associazioni di quartiere, squadre di calcio e così via. I mercati del credito sono spesso legati ai mercati del lavoro e dei terreni, per esempio, e accordi sui prestiti che non si possono concludere nel mercato del credito considerato di per sé possono essere possibili quando colui che prende a prestito lavora per colui che dà a prestito, o è l’affittuario della sua terra ed in entrambi i casi può essere buttato fuori nel caso sia inadempiente. Il carattere di sovrapposizione dei giochi è anche importante perché la struttura di un gioco insegna ai giocatori ed incide sulla direzione dell’evoluzione culturale, influenzando non solo il modo in cui essi giocano il gioco nei periodi successivi ma quello in cui essi giocano gli altri giochi nei quali sono coinvolti. I cittadini che dispongono di libertà individuali ben definite e diritti democratici nelle loro relazioni con il governo possono, per esempio, cercare di invocarli sul posto di lavoro. I giochi, in altre parole, sono costitutivi delle preferenze dei giocatori. In più, non solo i giocatori si evolvono; anche le regole fanno lo stesso. I giochi sono cioè ricorsivi nel senso che tra i risultati di alcuni giochi ci sono cambi nelle regole dello stesso o di altri giochi. Nelle pagine che seguono introdurrò giochi sovrapposti e asimmetrici nell’analisi delle imprese, dei mercati del credito, dei rapporti di impiego e struttura di classe. Giochi costitutivi e ricorsivi saranno usati per analizzare la co- evoluzione delle preferenze e delle istituzioni.
C O N C L U S IO N I Perché, allora, i contadini di Palanpur rimangono poveri, coltivando tardi e sostenendo i costi del fallimento del coordinamento che sembra limitare le loro opportunità economiche? Perché i canali rimangono non drenati e i cervi girano nella foresta indisturbati? La lunga persistenza di risultati Pareto-inferiori è un puzzle che rappresenta una immensa sfida intellettuale e di importanza pratica.
Numerosi possibili impedimenti alla soluzione dei problemi di coordinamento sono stati menzionati (ritornerò su di essi nei prossimi capitoli). Fallimenti del coordinamento che sono rapidamente evitati quando l’interazione riguarda due individui, possono porre ostacoli insormontabili se centinaia o migliaia di individui interagiscono tra loro così come Hume puntualizza nel suo commento sulla difficoltà di assicurare il drenaggio del prato. La sottostante interazione può essere tale che la strategia dominante sia non cooperare (come nel dilemma del prigioniero). A causa dell’informazione non verificabile o per altre ragioni, può non esserci modo di
36 | MICROECONOMIA
trasformare il gioco per rimuovere quest’ostacolo. Cambiamenti nelle regole del gioco necessari ad evitare un particolare fallimento del coordinamento possono trovare resistenze dovute al limitato campo d’intervento delle istituzioni e alla paura della perdita che possono subire alcuni giocatori per effetto di cambiamenti istituzionali in qualche altro gioco. Anche se un equilibrio dominante nei payoff esiste, questo può non ottenersi perché qualche altro equilibrio è rischio dominante e non c’è modo di coordinare le aspettative. Se, come spesso è il caso, non può essere assicurata una divisione accettabile dei guadagni, coloro che sono coinvolti preferiscono la non cooperazione alla cooperazione. Infine, laddove il grado di interesse comune è limitato (rispetto al grado di conflitto), i guadagni della mutua cooperazione possono essere insufficienti a giustificare il rischio o il costo di assicurare le condizioni per implementare la cooperazione. In passato era ampiamente condivisa l’idea che l’intervento governativo avrebbe potuto attenuare rapidamente i fallimenti del coordinamento più gravi. Ma pochi oggi condividerebbero l’ottimismo di Hume, espresso nella frase immediatamente successiva al passaggio citato nell’epigrafe: “La società politica [intendendo il governo] facilmente rimedia […] questi inconvenienti” (Hume, 1967:304). “Ci sono persone,” scrive Hume, “che noi chiamiamo […] i nostri governatori e governanti, i quali non hanno nessun interesse per alcun atto di ingiustizia […] e hanno un interesse immediato […] nel sostenere la società” (pp. 302-3). Tra le ragioni del nostro moderno scetticismo circa il fatto che “la società politica facilmente rimedia questi inconvenienti” è il fatto di aver realizzato che le istituzioni e le politiche non sono semplicemente strumenti pronti ad essere impiegati dai buoni servitori pubblici di Hume. Piuttosto, esse sono prodotte dall’evoluzione e dalla progettazione e sono esse stesse soggette alle stesse specie di fallimenti del coordinamento introdotte in precedenza. Nelle pagine precedenti ho identificato un certo numero di risultati Paretoinferiori come equilibri di Nash. Comprendere i sottostanti fallimenti del coordinamento, gli impedimenti alla loro soluzione, e come essi possano essere superati richiede il comprendere perché gli individui effettuano le azioni che implementano e sostengono equilibri di Nash inefficienti per lunghi periodi di tempo. Per rispondere a queste domande abbiamo bisogno di capire come sia i comportamenti individuali, sia le istituzioni sociali evolvono nel tempo. Nel capitolo 2 introdurremo gli strumenti dei modelli evolutivi per rispondere a questi problemi.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|37
Riferimenti bibliografici Aumann, R. and S. Sorin (1989). "Cooperation and bounded recall." Games and Economic Behavior 1(1): 5-39. Camerer, C., M. Knez, et al. (2004). "Timing and Virtual Observability in Ultimatum Bargaining and 'Weak Link' Coordination Games." Experimental Economics (in press). Hardin, G. (1968). "The Tragedy of the Commons." Science 162(3859): 1243-1248. Hume, D. (1967[1742]). A Treatise of Human Nature. Oxford, Clarendon Press. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Ostrom, E. (1990). Governing the Commons: The Evolution of Institutions for Collective Action. Cambridge, UK, Cambridge University Press. Rapoport, A. (1997). "Order of Play in Strategically Equivalent Games in Extensive Form." International Journal of Game Theory 26: 113-136. Rousseau, J.-J. (1987). Discourse on the Origin and Foundations of Inequality Among Men. Basic Political Writings. D. A. Cress. Indianapolis, Hackett Publishing Company (original publication, 1755): 25-109. Sato, Y., E. Akiyama, et al. (2002). "Chaos in learning a simple two person game." Proceedings of the National Acadamy of Science 99(7): 4748-4751. Schelling, T. (1960). The Strategy of Conflict. Cambrdige, MA, Harvard University Press. Van Huyck, J., R. Battalio, et al. (1990). "Tacit Coordination Games, Strategic Uncertainty, and Coordination Failure." American Economic Review 80(1): 234-248. Vega-Redondo, F. (1996). Evolution, Games, and Economic Behavior. Oxford, Oxford University Press.
II
O RDINE S PONTANEO : L’A UTO - ORGANIZZAZIONE DELLA V ITA E CONOMICA
Tali furono i Doni di quello Stato; I loro crimini cospiravano per renderli Grandi; Pertanto ogni singola Parte era piena di Vizio; Tuttavia l’intera Massa, un Paradiso;… La peggiore di tutte le Moltitudini Fece Qualcosa per il Bene Comune - Bernard Mandeville, The Fable of the Bees, or Private Vices, Publick Benefits (1705)
Osservo che sarà nel mio interesse lasciare un altro nel possesso dei suoi beni, a patto che egli agisca allo stesso modo nei miei riguardi […] E questa può essere propriamente chiamata convenzione […] La stabilità del possesso […] sorge gradualmente, acquisisce forza attraverso un lento progresso, e tramite la nostra esperienza ripetuta dello svantaggio nel trasgredirla […] Similmente, le lingue sono gradualmente fissate mediante convenzioni umane senza nessuna promessa. Allo stesso modo oro e argento diventano misure comuni di scambio. - David Hume, A Treatise of Human Nature, Volume II (1739)
! Nel Milwaukee, a Los Angeles e Cincinnati, oltre la metà dei residenti bianchi ha affermato che avrebbe preferito vivere in un quartiere in cui il 20 per cento o più dei co-residenti fosse Afro-Americano (uno su cinque preferirebbe un ugual numero di entrambi; Clark 1991). Pochi vivono in quartieri integrati; le loro preferenze si manifestavano nel corso di cause concernenti la segregazione abitativa in queste e in altre città. (La maggior parte degli Afro-Americani preferiva quartieri equamente distribuiti.) Gli intervistati, naturalmente, possono aver travisato le proprie preferenze, ma quelli che cercavano sinceramente quartieri integrati, sarebbero stati delusi. Il mercato immobiliare in queste città forniva pochi quartieri misti del tipo Bianco-Afro Americano, pur se apparentemente richiesti. A Los Angeles, per esempio, tutti i bianchi (più del 90 per cento) vivono in quartieri con meno del 10 per cento di
2 | MICROECONOMIA
residenti di colore, mentre il 70 per cento degli abitanti di colore vive in quartieri con meno del 20 per cento di bianchi (Mare e Bruch, 2001). Perché il risultato aggregato appare opposto alla distribuzione delle preferenze? Si immagini la sorpresa se un’indagine riportasse che una persona su cinque desidera una piscina dietro casa e sarebbe disposta a pagarne il costo; sarebbero ancora in pochi a possedere una piscina? Perché la capacità di pagare concede loro una piscina e non un quartiere integrato? Una delle grandi sfide delle scienze sociali è il comprendere come gli esiti aggregati siano spesso differenti dai fini individuali, alcune volte migliori (come suggeriscono Bernard Mandeville nell’epigrafe precedente e Adam Smith, citato nel capitolo 6) ma a volte peggiori, come potrebbe sospettare una famiglia americana in cerca di un quartiere multi-razziale. Gli economisti sono specializzati nello studio delle conseguenze involontarie e, a partire da Bernard Mandeville e David Hume, hanno studiato il modo in cui le azioni di molti, che agiscono nel proprio interesse, producono risultati aggregati non programmati. Molti modelli complessi che si occupano di questo processo rappresentano uno dei contributi caratteristici dell’economia. Inoltre, più importante dei modelli stessi è la percezione che nessuna relazione evidente leghi le motivazioni delle persone coinvolte in un’interazione e le proprietà normative dei risultati aggregati che derivano dalle interazioni stesse. Le così dette “argomentazioni della mano invisibile” mostrano come l’alchimia di buone istituzioni può trasformare stimoli iniziali in risultati di valore, così che, come nella “favola della api” di Mandeville, “la peggiore di tutte le moltitudini fece qualcosa per il bene comune”. Questo ci riporta indietro al problema classico degli economisti, “comprendere le regole”. Anche le “giuste” istituzioni, per la maggior parte, non sono progettate a livello costituzionale. Al contrario, particolari diritti di proprietà e altre forme di governo economico devono la loro esistenza e funzionamento alle conseguenze di azioni path-dependent, spesso non coordinate, rischiose, eseguite da una moltitudine di attori nel corso di un lungo periodo di tempo. Si possono citare come esempi l’emergere e il persistere di regole consuetudinarie ed altri aspetti dei diritti di proprietà (come l’equa ripartizione delle quote di raccolto e la regola per la quale chi trova qualcosa può appropriarsene), le norme che disciplinano gli scambi di mercato, e l’uso convenzionale di pronomi come espressione di rispetto o solidarietà. Questo capitolo si propone di dare risposta a questo interrogativo: come possono evolvere, in assenza di un progetto volontario, strutture persistenti di interazione in popolazioni
ORDINE SPONTANEO |3
numerose? Questa non rappresenta altro che una formulazione moderna dell’antico interrogativo sull’evoluzione istituzionale: Che cosa spiega l’emergere, il diffondersi e la scomparsa delle regole sociali? Gli economisti classici erano egualmente interessati al modo in cui si formano le regole e alla loro comprensione. Frederick Hayek, il cui approccio a volte viene definito “la teoria dell’ordine spontaneo” o “l’auto-organizzazione della società”, rappresenta un moderno ed importante esponente della corrente evolutiva introdotta da Hume e Smith. In contrasto con l’approccio costituzionale, che presuppone un pianificatore sociale benevolente o altri attori che agiscano per ottenere risultati aggregati ottimali dal punto di vista sociale, nei modelli evolutivi nessun attore ha preferenze definite sui risultati aggregati. Le due correnti - costituzionale ed evolutiva - schierano tecniche analitiche diverse e metafore distinte. La dottrina delle “istituzioni programmate” rappresenta le regole sociali come dispositivi, traenti origine dall’immaginazione umana, valutati secondo la loro capacità di risolvere problemi ed implementati nel caso in cui soddisfino un test di efficacia. I metodi analitici standard di quest’approccio sono la classica teoria dei giochi cooperativi e non cooperativi. Queste tecniche sono usate non solo dagli economisti ma anche da filosofi come Robert Nozick, John Rawls e David Gauthier. La dottrina dell’ordine spontaneo vede, al contrario, le istituzioni come linguaggi: l’evoluzione delle regole sociali, come l’acquisizione di un accento, è il prodotto di innumerevoli interazioni, le cui conseguenze sono spesso involontarie. Le istituzioni quindi evolvono per tentativi ed errori, sviluppandosi, come una volta Marx disse, all’insaputa dei partecipanti. Il titolo del famoso libro di Richard Dawkins paragona i processi evolutivi ad un Orologiaio Cieco. Le metafore di Dawkins o Marx affermano, però, solo cosa questo processo non è, e non chiariscono cosa esso sia in realtà. La tecnica analitica scelta per questo approccio, la teoria dei giochi evolutiva, rappresenta un metodo per fare chiarezza su questo processo. Inizieremo con l’introdurre la struttura base del ragionamento evolutivo. In secondo luogo, con l’aiuto di un esempio – la segregazione abitativa – illustreremo alcuni strumenti usati dai modelli evolutivi. In seguito, presenteremo un modello formale del processo di riproduzione differenziale, il modello dinamico del replicatore. I concetti di stabilità evolutiva, che verranno introdotti, forniscono un fondamento comportamentale al concetto di equilibrio di Nash. Per illustrare come questi strumenti analitici possono essere usati per studiare le istituzioni economiche, useremo un’estensione del gioco Falco-
4 | MICROECONOMIA
Colomba per modellare l’evoluzione dei diritti di proprietà. Infine, termineremo con una valutazione critica dell’approccio evolutivo.
S C IE N Z A S O C I A L E E V O L U T I VA Studiamo il comportamento individuale principalmente per comprendere i risultati aggregati. Il nostro interesse non si concentra sul perché una determinata persona è senza lavoro, ma sul tasso di disoccupazione, non quanto sia scrupoloso un individuo nel pagare le tasse bensì la distribuzione della propensione a pagare le tasse nella popolazione. Comprendere le preferenze e le credenze individuali, e il modo in cui le istituzioni organizzano i vincoli che gli individui affrontano, permette la previsione del comportamento individuale. Per spiegare i risultati aggregati, tuttavia, non è possibile semplicemente sommare i comportamenti individuali previsti. Le azioni intraprese da ciascun individuo, tipicamente, influiscono sui vincoli, sulle credenze o sulle preferenze degli altri. Per poter tenere conto di questi effetti di reazione bisogna utilizzare modelli (population-level) che collegano le azioni individuali a risultati per la popolazione intera. L’approccio population-level maggiormente sviluppato nelle scienze sociali è il modello generale di equilibrio economico concorrenziale, perfezionato a metà dell’ultimo secolo da Kenneth Arrow, Gerard Debreu, Tjalling Koopmans, e altri. Con assunzioni piuttosto restrittive, questo modello aggrega le azioni individuali di produttori e consumatori, un vettore ampio di prezzi, output e l’allocazione di risorse per usi alternativi. Il modello di equilibrio generale prepara lo scenario per il Teorema Fondamentale dell’Economia del Benessere (citato nel capitolo 1 ed approfondito nel capitolo 6). Versioni semplificate di questo modello hanno richiamato numerose applicazioni in economia e nelle scienze sociali in genere, nelle quali sono state trovate analogie all’equilibrio economico competitivo, nella competizione elettorale, nel mercato matrimoniale, e simili. Nell’introduzione, abbiamo menzionato i limiti del modello e ritorneremo su questo argomento, brevemente, nelle pagine che seguono, specialmente dal capitolo 6 al 10. All’infuori del modello di equilibrio generale Walrasiano, la sola classe pienamente sviluppata di modelli population-level è quella che descrive le dinamiche evolutive dei sistemi biologici sulla base dell’influenza congiunta di casualità, eredità, e selezione naturale. La similitudine tra questi due approcci (quello economico e quello biologico) è sorprendente: entrambi modellano sistemi di competizione in cui proliferano le consuetudini o i progetti a cui corrispondono payoff più elevati. Nemmeno questo deve sorprenderci: Charles Darwin (1809-1882) ebbe l’idea della selezione naturale, nel 1838, durante la lettura dell’economista classico Thomas
ORDINE SPONTANEO |5
Malthus (1766-1834). La stretta associazione dei due approcci preannuncia anche questo; la prima precisa trattazione di una dinamica evolutiva in un modello biologico di cui siamo a conoscenza ( un modello predatore-preda del tipo reso famoso da Alfred Lotka [1880-1949] e Vito Volterra [1860-1940]) fu pubblicata appena dieci anni dopo “ La ricchezza delle nazioni”, da Joseph Townsend (1971) nella sua “Una Dissertazione sulle Leggi per i Poveri da parte di Uno che desidera il bene dell’Umanità” . I modelli biologici però differiscono da quelli economici per alcuni particolari importanti. I biologi impiegano i concetti di equilibrio in maniera simile agli economisti, ma prestano maggior attenzione al modellare esplicitamente i processi dinamici che governano la distribuzione dei caratteri in una popolazione. Questo compito è facilitato dal fatto che dispongono di un modello del processo di innovazione ereditabile basato sulla mutazione e sulla ricombinazione. L’economia, diversamente, non ha in genere accettato la teoria dell’innovazione a dispetto del diffuso riconoscimento della sua importanza. Le applicazioni del modello biologico all’evoluzione umana hanno prodotto importanti risultati. Queste, però, trascurano la capacità, che gli esseri umani hanno, di produrre cambiamenti intenzionalmente, spesso attraverso azioni collettive; e questo non può essere semplicemente spiegato dalla casualità. (Affronteremo questo argomento nel capitolo 12.) Inoltre, nell’approccio economico l’ottimizzazione è un postulato comportamentale, mentre esso rappresenta necessariamente un espediente (un as if ) nei modelli biologici, dove il lavoro di ottimizzazione è messo in pratica dal processo di competizione e selezione piuttosto che mediante la consapevole scelta di strategie ad opera dei membri individuali di una specie. Pertanto, se i modelli economici esigono troppo dalle capacità cognitive umane, i modelli biologici applicati agli esseri umani domandano troppo poco. Negli ultimi anni, antropologi, biologi, economisti e altri hanno adattato i modelli biologici allo studio delle popolazioni umane nelle quali i caratteri possono essere trasmessi sia mediante il processo di apprendimento sia geneticamente. Un primo indirizzo di questa letteratura ha sviluppato modelli di evoluzione culturale modificando i modelli biologici per tenere conto delle particolari capacità umane, specialmente l’abilità di imparare dalla propria e dall’altrui esperienza, e la capacità di aggiornare le strategie alla luce delle informazioni ottenute.
6 | MICROECONOMIA
Un secondo indirizzo, la teoria dei giochi evolutiva, ha modificato la teoria dei giochi classica per tenere conto delle nostre capacità cognitive limitate, assumendo che gli agenti aggiornano i loro comportamenti basandosi su informazioni locali non perfette. Le due correnti, la teoria dell’evoluzione culturale e la teoria dei giochi evolutiva, hanno perfezionato due differenti punti di partenza, accrescendo il livello di capacità cognitiva assunto nel primo caso, riducendolo nel secondo. Entrambe le teorie descrivono l’interazione di agenti adattivi, tralasciando sia gli agenti ad intelligenza zero dei modelli biologici standard sia quelli ad elevata conoscenza dei modelli di teoria dei giochi. Gli agenti adattivi adottano comportamenti nello stesso modo in cui si adotta un accento o si parla una particolare lingua. Le decisioni basate sulla previsione dei payoff ottenibili non sono completamente assenti (ad esempio coloro i quali aspirano ad elevarsi socialmente adotteranno accenti “aristocratici”), ma l’ottimizzazione consapevole non basta a spiegare tutto. La risposta alla domanda “perché parli in questo modo?” è generalmente “perché sono nato dove la gente parla in questo modo” non “ho considerato tutti i modi di parlare e ho deciso che la mia utilità sarebbe stata massimizzata parlando in questo modo”. Questo significa che gli individui sono “depositari” di regole comportamentali. L’analisi è volta ad osservare il successo o il fallimento di queste regole comportamentali, intendendo per successo la loro diffusione in una popolazione, e per fallimento l’essere confinate in una nicchia più ristretta o l’eliminazione. I protagonisti della dinamica sociale non sono gli individui, bensì le regole comportamentali: il modo in cui esse si muovono assume una rilevanza principale; cosa gli individui fanno è, inoltre, importante alla luce del fatto che le azioni individuali contribuiscono al successo o al fallimento delle regole comportamentali. Altre caratteristiche particolari dell’approccio evolutivo includono il modo in cui vengono modellate la casualità, la riproduzione differenziale, le dinamiche fuori dall’equilibrio e la struttura della popolazione. Il caso gioca un ruolo centrale nelle dinamiche evolutive, anche quando gli eventi stocastici sono piccoli o non frequenti. Gli eventi casuali possono prendere la forma di cambiamenti ereditabili (mutazioni). Il caso può essere introdotto anche come innovazione comportamentale che (come la mutazione) non è una risposta ottima. A differenza delle mutazioni, le innovazioni comportamentali non sono trasmissibili geneticamente. Possono, invece, essere passate alla generazione
ORDINE SPONTANEO |7
successiva e copiate da altri attraverso una trasmissione culturale, cioè, attraverso un processo di apprendimento di agenti adattivi. Un altro modo in cui il caso influisce sulle dinamiche evolutive è il così detto matching noise (disturbo derivante dall’appaiamento casuale). Quando un piccolo numero di individui, in una popolazione eterogenea, viene accoppiato in modo casuale, la distribuzione di tipi con cui si è accoppiati, realizzata in un determinato periodo di tempo, può differire significativamente dalla distribuzione attesa. La differenza tra la distribuzione realizzata e quella attesa riflette un “disturbo” di abbinamento e può avere effetti sostanziali. Nessuno può dubitare che gli eventi casuali abbiano un’incidenza: i cambiamenti esogeni nei gusti o nelle tecnologie modificano il prezzo e la quantità di equilibrio nel modello standard di statica comparata di un equilibrio di mercato. In cosa i modelli evolutivi sono diversi? In primo luogo, le mutazioni, le innovazioni comportamentali e i disturbi di abbinamento sono differenti in quanto queste fonti di eventi stocastici risultano essere endogene ai modelli evolutivi. In secondo luogo, in presenza di rendimenti di scala crescenti, eventi casuali di piccola portata spesso hanno effetti ampi e persistenti a causa delle reazioni positive che essi provocano, piuttosto che essere neutralizzati da reazioni negative. Si può credere che gli eventi casuali introducano il “disturbo” nei modelli evolutivi e che ciò influisca solo sulla velocità del cambiamento o sulla presenza di stati di equilibrio esatti oppure di stati in un intorno dell’equilibrio. Questo non è assolutamente ciò che accade: spesso la casualità influisce sulla direzione (non solo sulla velocità) del cambiamento evolutivo e spesso ci permette di dire di più (piuttosto che meno) sul probabile risultato. (Esempi di questo genere vengono trattati di seguito e nei capitoli 5 e 12). Il caso e l’innovazione intenzionale non sono però sufficienti per comprendere l’evoluzione dei comportamenti e delle istituzioni umane. Queste fonti di cambiamento combinate con la seconda caratteristica dell’approccio evolutivo – la replicazione differenziale (talvolta chiamata selezione) – dirigono i processi evolutivi. L’idea principale è che le caratteristiche istituzionali e comportamentali degli individui e delle società che noi comunemente osserviamo sono state copiate e diffuse – cioè replicate – mentre regole, credenze e preferenze alternative a queste si sono estinte (o sono state replicate solo in nicchie marginali). Come mostreremo a breve, la replicazione differenziale può assumere molte forme, che possono essere distinte in “genetiche” e “culturali”. La distribuzione dei comportamenti che sono
8 | MICROECONOMIA
influenzati da geni può cambiare a causa della proliferazione di alcuni genotipi piuttosto che di altri. La distribuzione dei genotipi cambia nel tempo a causa di eventi casuali (deviazione) e a causa della selezione naturale. In questi modelli, i payoff misurano il successo riproduttivo dei fenotipi associati, in altre parole, la fitness1. Ignorare i dettagli dell’eredità genetica e della relazione tra genotipo e fenotipo, trattare un comportamento come se esso fosse l’espressione fenotipica di un singolo gene e studiare le determinanti del successo riproduttivo di quel gene semplifica e non induce necessariamente in errore. (Ne vedremo un esempio nel gioco del Falco e della Colomba). La correlazione tra geni e comportamenti è, tuttavia, per la maggior parte, sconosciuta e certamente contiene poche se non nessuna delle semplici corrispondenze gene-comportamento assunte da questo metodo. I caratteri culturali si riferiscono a comportamenti che sono acquisiti piuttosto che trasmessi geneticamente dai genitori. L’apprendimento familiare è definito trasmissione culturale verticale mentre l’apprendimento scolastico o derivante da appartenenti alla generazione dei genitori è detto trasmissione obliqua. Imparare da membri di un gruppo della propria generazione è detto trasmissione orizzontale. Il concetto analogo alla fitness differenziale nei modelli di evoluzione culturale è il tasso al quale la gente abbandona un comportamento in favore di un altro. Questo processo di riproduzione differenziale, come l’eredità genetica, è difficile da comprendere, ma implica la tendenza ad adottare un dato comportamento per via di una o più delle seguenti ragioni: poiché è comune in un determinato luogo (conformismo, mimesi), poiché nella propria esperienza passata esso ha prodotto payoff maggiori rispetto ad altri comportamenti (apprendimento rinforzato), o poiché il comportamento massimizza i payoff attesi, date le credenze individuali sulla distribuzione dei comportamenti altrui nella popolazione (aggiornamento delle risposte ottime). Per la semplicità e la versatilità della sua trattazione la trasmissione culturale sarà qui modellata utilizzando l’aggiornamento delle risposte ottime combinato con il conformismo. I processi di evoluzione genetica e culturale sono influenzati !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 1
Quando due o più assortimenti di caratteri ereditari conferiscono ai rispettivi organismi un diverso successo riproduttivo, allora si dice che presentano una fitness diversa. Si tratta di un termine che può essere tradotto come “idoneità”. La fitness si misura per mezzo del successo riproduttivo, cioè dal numero medio dei figli in grado, a loro volta, di riprodursi. Il numero di figli, da solo, non è rilevante in questo contesto. Poiché nessun individuo è identico a un altro, anche il suo valore di fitness sarà diverso da quello dei propri simili. Detto in altri termini, nell’ambito di una specie ogni individuo è dotato di capacità riproduttive legate al particolare genotipo di cui è portatore. I processi ereditari non sono, quindi, “perfetti” proprio perché caratteri diversi conferiscono fitness diverse agli organismi.(Ndt)
ORDINE SPONTANEO |9
fortemente dalla struttura sociale - assortimento, modelli di residenza, migrazione, e simili. Questi, e molti altri aspetti della struttura sociale, si basano su comportamenti acquisiti. Per questo motivo, la distribuzione di caratteristiche trasmesse culturalmente in una popolazione può influenzare l’evoluzione genetica. Questo, assieme al processo inverso – per il quale le distribuzioni genetiche influenzano l’evoluzione culturale – sono definiti processi evolutivi gene-cultura (un esempio è presente nel capitolo13). I cambiamenti genetici e culturali si influenzano vicendevolmente, ma la velocità dei cambiamenti culturali è di gran lunga maggiore di quella genetica. I cambiamenti nella distribuzione genetica avvengono con il passare delle generazioni e in risposta a rari eventi casuali, mentre l’apprendimento culturale può avvenire sottoforma di un’epidemica diffusione di comportamenti, come è accaduto con la proliferazione dell’uso generale dei pronomi informali in molte lingue europee durante il corso di una sola decade, gli anni ’60. Il processo di riproduzione differenziale, sia esso culturale o genetico, è sviluppato mediante l’uso delle equazioni del replicatore che descrivono una dinamica riproduttiva. Una dinamica riproduttiva fornisce un’analisi alternativa alla statica comparata e ad altri approcci in cui il tempo non è modellato esplicitamente. Questo approccio fornisce una panoramica completa dei movimenti delle frequenze della popolazione fuori dall’equilibrio. Si basa su assunzioni empiricamente plausibili sulle capacità cognitive e sui comportamenti individuali e su una rappresentazione dei dettagli delle interazioni sociali (chi incontra chi, per fare cosa, con quali payoff, con quale informazione, e simili). Una terza caratteristica degli approcci evolutivi, quindi, è lo studio delle dinamiche fuori dall’equilibrio. L’analisi esplicita della dinamica evolutiva comporta due vantaggi. Primo, si possono scoprire quelli che noi definiamo equilibri irrilevanti per l’evoluzione. Le dinamiche esplicite illuminano la relazione tra i concetti di soluzione del capitolo precedente – l’equilibrio di Nash e la dominanza – e la più completa e robusta nozione di stabilità evolutiva. Vedremo (qui, nel capitolo 6, e specialmente nel capitolo 12) che, quando si tiene conto dei processi evolutivi, utilizzando particolari modelli di replicazione differenziale, alcuni equilibri di Nash possono divenire irrilevanti rispetto al comportamento reale della società. Un secondo vantaggio che deriva dal modellare esplicitamente i processi dinamici è l’esistenza di stati di non equilibrio di sostanziale importanza per il funzionamento delle economie reali. Illustreremo con un esempio pratico questo concetto in quanto la precedente affermazione sfida un principio base del pensiero
10 | MICROECONOMIA
economico comune. Molti mercati mostrano una coesistenza di lunga data di quelli che sono comunemente definiti vincitori e perdenti, contrariamente a ciò che ci aspetteremmo di osservare se le economie fossero in equilibrio. Tra le imprese che producevano lo stesso prodotto e che vendevano agli stessi consumatori nell’industria metallurgica degli Stati Uniti nei primi anni Novanta, per esempio, le imprese più produttive lo erano ben oltre tre volte di più delle minori, con il settantacinquesimo percentile pari a circa due volte il venticinquesimo (Luria 1996). Nell’industria elettronica indonesiana – una parte del fortemente competitivo mercato globale – i dati degli ultimi anni ’90 mostrano che le imprese nel settantacinquesimo percentile erano otto volte più competitive delle imprese posizionate nel venticinquesimo (Hallward-Driemeier, Iorossi e Sokoloff 2001). Naturalmente, il caso indonesiano è estremo, alcune di queste differenze sono solo disturbi statistici, e le imprese ad alto rendimento si espanderanno e quelle a basso rendimento usciranno dall’industria. Tuttavia, il processo di selezione sembra sufficientemente debole, anche in queste industrie molto competitive, da far dubitare dell’assunzione che tutte le imprese operino sulla frontiera delle possibilità produttive. Il raggiungimento istantaneo dell’equilibrio è ancor meno probabile da osservare in ambienti in cui l’entrata e l’uscita sono più limitate, ambienti in cui i soggetti in questione non sono specialisti nel fabbricare denaro ma semplicemente individui che affrontano la vita. Non considerare gli stati di non equilibrio sulla base del fatto che essi sono solo passeggeri è generalmente poco utile. Continuando con l’esempio sopra citato, un significativo contributo alla fine dell’età dell’oro di rapida crescita produttiva nell’economia statunitense, successivo alla seconda guerra mondiale, fu offerto dalla riduzione del tasso al quale le imprese a bassa produttività venivano tagliate fuori dal mercato (Bowles, Gordon, e Weisskopf, 1983). L’elevato tasso di crescita produttiva nell’economia svedese durante il terzo quarto del secolo passato fu in parte dovuto allo spostamento del lavoro e di altre risorse dalle imprese a bassa produttività a quelle ad alta produttività e il conseguente fallimento delle imprese a basso rendimento, indotto da una politica di pareggiamento dei salari (Hibbs, 2000). Sebbene illuminante su queste questioni di politica e su altro, l’analisi delle dinamiche fuori dall’equilibrio è considerevolmente più esigente dell’approccio convenzionale di statica comparata. I comportamenti medi di lungo termine delle variabili di interesse possono però essere spesso studiati analiticamente o simulati, producendo spesso risultati abbastanza robusti. Ne sono forniti esempi nei capitoli 11 e 13. Una quarta idea caratteristica nei modelli evolutivi è che le popolazioni sono
ORDINE SPONTANEO |11
strutturate gerarchicamente, e la riproduzione differenziale può agire su più di un livello. Individui interagiscono con individui, ma gli individui costituiscono anche gruppi (ad esempio, famiglie, imprese) e altre entità di ordine superiore (nazioni, gruppi etnici), e anche questi gruppi multi-individuali interagiscono. Gli individui a loro volta sono un raggruppamento di cellule che interagiscono. Questo significa che il processo di riproduzione differenziale avviene a molti livelli: all’interno degli individui, tra individui, tra gruppi e così via. All’interno di un’impresa, ad esempio, differenti comportamenti (lavorare sodo o non sforzarsi affatto) possono essere replicati o abbandonati dagli individui. Tra imprese, le strutture organizzative delle più profittevoli saranno replicate mentre, al contrario, le meno profittevoli falliranno. Ne deduciamo che le caratteristiche individuali come le preferenze o credenze possono essere o meno replicate; ma le istituzioni e altre caratteristiche di gruppo delle imprese, comunità etniche, o nazioni sono anche esse soggette alla riproduzione differenziale. Una teoria adeguata deve essere in grado di far luce sia sul processo mediante il quale una struttura di gruppo emerge in una popolazione di individui, sia sul come i confini tra le entità di alto livello siano mantenuti e come essi svaniscano. Il lavoro simultaneo di replicazione a più di un livello, detto selezione multi-livello (o selezione di gruppo), produce il così detto processo co-evolutivo che governa le traiettorie dinamiche delle caratteristiche sia individuali che di gruppo. (Un esempio della co-evoluzione delle preferenze individuali e delle strutture di gruppo è fornito nel capitolo 13.) La tabella 2.1 riassume la molteplicità dei processi introdotti in precedenza, distinguendo tra i replicatori (caratteri copiati) e i livelli di selezione (le unità tra le quali ha luogo la competizione implicita per il successo nella riproduzione). Un replicatore è qualcosa che viene copiato; i geni sono replicatori, come lo sono le preferenze individuali, le credenze, le consuetudini di gruppo e altre istituzioni.
Tabella 2.1. Alcuni processi alla base dell’evoluzione comportamentale
Livello di selezione Replicatore
Individuo
Comportamenti appresi
Apprendimento sociale ( conformismo, apprendimento per rinforzo, risposta ottima )
Geni
Successo riproduttivo differenziale, deriva (drift)
Gruppi di individui Emulazione di consuetudini appartenenti ad altri gruppi, assimilazione culturale di gruppi fallimentari Estinzione biologica di gruppi fallimentari, fitness ridotta di popolazioni sottomesse
12 | MICROECONOMIA
! Spiegare i comportamenti e le istituzioni riferendosi alla riproduzione differenziale può sembrare un’ovvia tautologia. La replicazione differenziale è un sistema contabile estremamente utile per verificare la logica di un argomento complesso ma è anche una struttura analitica che offre intuizioni difficilmente ottenibili da altre prospettive. Naturalmente, per sostanziare questa affermazione sarà necessario un resoconto del processo di replicazione stesso, sia esso la regolamentazione della sopravvivenza o della fine delle imprese con diverse strutture organizzative, l’adattamento biologico differenziale o l’emulazione culturale di individui con modelli comportamentali differenti, la diffusione o la fine di istituzioni della società attraverso il processo di conflitto all’interno dei gruppi o qualche altro processo di selezione. Un esempio chiarirà alcune delle diverse caratteristiche dell’approccio evolutivo.
L A S E G R E G A Z IO N E A B I TAT I VA : U N P R O C E S S O E V O L U T I V O Come può uno studioso di scienze sociali spiegare la coesistenza di preferenze per quartieri multirazziali con l’evidenza empirica che solo pochi quartieri sono in realtà integrati? Introdurremo un esempio che illustra alcuni risultati caratteristici dei modelli evolutivi: equilibri multipli e dipendenza storica (path dependency) dei risultati, il modello di omogeneità locale e eterogeneità globale e la persistenza di lungo termine di risultati Pareto-Inferiori. Consideriamo un singolo quartiere (uno di tanti) nel quale tutte le unità abitative sono egualmente desiderabili da tutti i membri della popolazione. Le preferenze di ogni individuo dipendono solo dalla composizione razziale del quartiere. In questo quartiere e nella popolazione circostante i “verdi” preferiscono vivere in un quartiere misto in cui essi sono più numerosi dei “blu” per una piccola frazione, e i “blu” non preferiscono la segregazione ma non vorrebbero essere superati in numero dai “verdi”. Rappresenteremo queste preferenze mediante i prezzi p e p , che i verdi e i blu, rispettivamente, sono disposti a pagare per una casa nel g
b
quartiere. Ciascuno di essi dipende dalla frazione di case nel quartiere occupata dai verdi, f [0 , 1] . Le equazioni seguenti esprimono le preferenze sopra descritte (vedi figura 2.1): p (f) = (f +) - (f +)2 + p b
p ( f) = (f - ) - (f - )2 + p g
(2.1)
Dove (0 , ) e p è una costante positiva che riflette il valore intrinseco di case identiche. Differenziando entrambe le funzioni rispetto ad f ed eguagliando il
ORDINE SPONTANEO |13
risultato a zero possiamo notare che il quartiere ideale per i verdi (che massimizza p ) è composto da + verdi, mentre i blu preferiscono un quartiere con - verdi. g
Poiché la differenza tra i due quartieri ottimali è 2, ci riferiremo a come misura discriminante dei gusti dei due tipi ( può differire tra i due gruppi, oppure un gruppo può non curarsi affatto della composizione razziale). Normalizzeremo l’ampiezza del mercato all’unità in modo da poterci riferire indifferentemente alla frazione di verdi e al numero di verdi. Supponiamo che durante ciascun periodo una frazione , sia di blu che di verdi, del quartiere decida di vendere la propria casa ad un membro della popolazione circostante. Gli eventuali acquirenti esterni alla zona visitano il quartiere in proporzione all’attuale composizione del quartiere stesso. La frazione dei potenziali acquirenti verdi è perciò f . Potenziali acquirenti e venditori sono accoppiati in maniera casuale. Si immagini che i compratori bussino alla porta di una casa selezionata a caso. In ogni periodo, il numero atteso di verdi che cerca di vendere la propria casa contattato da un acquirente blu sarà f (1 f ) . Ciascun venditore potenziale incontra solo un compratore per periodo, che venda o meno. La probabilità di effettuare una vendita dipende dalla differenza tra la valutazione del compratore sulla casa e quella del venditore (se il primo supera il secondo), entrambi dati dall’equazione (2.1). Quindi, se un venditore blu incontra un verde e se f è tale che p > p allora la probabilità che una vendita sia effettuata sarà ( p p ) , Dove è una costante positiva che collega la differenza nei prezzi alla probabilità di vendita. g
g
b
b
Il nostro obiettivo è lo studio dell’evoluzione nel tempo della distribuzione di tipi nel quartiere. Assumiamo che il quartiere sia grande abbastanza in modo tale da poter considerare i valori attesi come una buona approssimazione dei valori realizzati. Usando il simbolo (‘) per indicare il “periodo successivo” possiamo indicare f’ come funzione di f. In ogni periodo alcuni verdi possono vendere a tipi blu e alcuni blu a tipi verdi. Quindi, f ' = f f (1 f ) p ( p p ) + (1 f ) fp ( p p ) b
b
g
g
g
(2.2)
b
Dove p = 1 se p > p e uguale zero altrimenti, e p = 1 se p p e uguale a zero altrimenti. (Ovviamente, p + p =1 ). b
b
g
g
b
g
b
g
L’equazione può essere interpretata in questo modo: la frazione attesa di verdi nel periodo successivo è rappresentata dalla frazione di verdi di questo periodo meno tutti i verdi che abbiano venduto ad un blu (il secondo termine nel membro destro
14 | MICROECONOMIA
dell’equazione), più tutti i blu che abbiano venduto ad un verde (il terzo termine). Il secondo termine del lato destro dell’equazione, per esempio, rappresenta la perdita di verdi dovuta ad una vendita ai blu; f rappresenta il numero di verdi che cerca di vendere, di questi (1 f ) sarà accoppiato con un blu, e se il prezzo del blu eccede quello del verde, la vendita avrà luogo con probabilità ( p p ) . Il terzo termine b
g
può essere interpretato analogamente. Nel caso in cui i prezzi dei verdi superino i prezzi dei blu questi ultimi venderanno ai verdi. Usando il fatto che p + p =1 possiamo rielaborare l’equazione in questo modo: b
g
f = f ' f = f (1 f ) ( p p ) g
b
(2.3)
Dalla quale risulta chiaro che f = 0 se p = p (non verrà effettuata nessuna vendita tra i potenziali venditori e acquirenti di diversi tipi che si incontrano poiché gli acquirenti non valutano le case più dei venditori). Inoltre, f = 0 anche se f = 0 o g
b
f =1 (quando la popolazione è già omogenea il quartiere è visitato solo da potenziali
acquirenti dello stesso tipo).
L’equazione (2.3) è detta “equazione dinamica del replicatore”. Con qualche altra manipolazione l’equazione (2.3) può essere presentata in una forma più conveniente: f = f ( p p) dove p rappresenta il prezzo medio, ossia g
p = fp + (1 f ) p . g
b
Un valore stazionario di f rappresenta un equilibrio stabile se un cambiamento esogeno in f produce (tramite la dinamica descritta nell’eq.2.3) un f di segno opposto, in altre parole, se df /df < 0 . Se questa disuguaglianza è soddisfatta un cambiamento in f è auto-correttivo.
La figura 2.1 illustra questo modello. Un’analisi della figura (e un po’ di calcoli) conferma che una composizione del quartiere equamente distribuita tra tipi blu e verdi è un equilibrio ( f = 0 poiché p = p ), ma non è stabile (poiché df /df > 0 ). g
b
Ciò significa che una piccola variazione casuale della frazione di verdi (o di blu), rispetto alla distribuzione paritaria, non sarà auto-correttiva ma piuttosto si accumulerà portando ad un quartiere totalmente segregato. Si noti inoltre che per p (1) = p (0) .) b
g
b
g
ORDINE SPONTANEO |15
Gli equilibri stabili di “segregazione razziale” che ci aspettiamo essere gli unici risultati solidi di questa interazione sono Pareto-inferiori ad un insieme di composizioni di quartieri integrati che non rappresentano però in questo modello equilibri stabili. Questo risultato è mantenuto anche quando è arbitrariamente piccolo. Risultati di segregazione completa vengono riscontrati anche se i due gruppi hanno effettivamente gli stessi gusti e il quartiere ottimale per entrambi è molto vicino alla parità dei tipi (50-50). Infine, risulta semplice confermare che la completa segregazione è (per ogni tipo) un equilibrio stabile.
! Figura 2.1. Segregazione spontanea in una comunità abitativa. Le due funzioni rappresentano il prezzo massimo che un blu ed un verde sono disposti a pagare per una casa come funzione di f , la frazione di verdi nella comunità- Si noti che sia i verdi che i blu preferiscono un quartiere integrato invece che vivere unicamente con vicini dello stesso tipo in una comunità completamente segregata.
Questo significa che i quartieri saranno localmente omogenei e, diversamente, quartieri identici saranno composti interamente da gruppi diversi, esibendo una eterogeneità globale. La composizione di un quartiere dipenderà dalla storia passata: se, nel recente passato, f è stato inferiore a f *, ci aspetteremo di trovare per esempio, f = 0.
Il problema di coordinamento riscontrato in questo caso dipende dal fatto che quando una persona decide di vivere in una comunità, la sua scelta influenza sia la comunità da cui si muove che quella in cui arriva. La composizione di una comunità è quindi sia il “bene” che la famiglia sta scegliendo, sia il prodotto non intenzionale delle scelte di tutte le famiglie. Non c’è nessuna ragione per cui il risultato debba essere efficiente, indipendemente dal fatto che la selezione sia basata sulle preferenze di composizione razziale, come in questo caso, su preferenze relative al livello culturale dei vicini (Benabou 1993), sul fatto che il quartiere sia abitato da proprietari (Hoff e Sen 2002), oppure su altri aspetti.
16 | MICROECONOMIA
Abbiamo modellato il processo di riequilibrio del mercato tracciando esplicitamente i risultati delle interazioni sociali (chi incontra chi, e cosa essi fanno). Gli individui fanno uso solo di una conoscenza locale: essi non fanno l’affare migliore, essi semplicemente effettuano una transazione con probabilità positiva se ne possono beneficiare entrambe le parti, altrimenti non effettuano nessuna transazione. La composizione razziale del quartiere è determinata da un processo di replicazione che determina l’occupazione delle case da parte di membri di entrambi i gruppi. La dinamica della composizione del quartiere è derivata dallo studio di quali abitazioni abbiano replicato il loro modello di proprietà e quali invece lo abbiano cambiato. Nel capitolo 6 contrapporremo a questo approccio di interazione sociale un approccio che modella i mercati secondo il modello Walrasiano.
M O D E L L A R E L ’ E V O L U Z IO N E
D E L C O M P O RTA M E N TO
La distribuzione delle regole di comportamento individuale o le caratteristiche istituzionali dei gruppi in una popolazione e la loro evoluzione nel tempo, come la composizione razziale del quartiere, dipendono dai caratteri copiati e da quelli abbandonati. I “caratteri” rappresentano qualsiasi caratteristica di un individuo che possa essere adattata ad altri, abbandonata, oppure conservata. Se i figli di Cattolici conservassero con maggiore probabilità la religione dei genitori, mentre i figli dei Protestanti non lo facessero, la frazione di Cattolici, in una popolazione, aumenterebbe (assumendo che tutte le famiglie abbiano lo stesso numero di bambini e che questi siano gli unici due tipi nella popolazione). Se le imprese che ammettono un’organizzazione sindacale tra i dipendenti fallissero ad un tasso maggiore che le imprese che non la riconoscono, e se le nuove imprese tendessero a copiare le più redditizie, il tasso di sindacalizzazione si ridurrebbe. La replicazione differenziale (asimmetrica) può derivare da persone o da organizzazioni che hanno deliberatamente acquisito caratteri, regole, di comprovato successo. La replicazione differenziale, comunque, può anche avere luogo in modi meno strumentali: il processo di riproduzione (di copia) può essere descritto mediante un processo di trasmissione conformista secondo il quale la riproduzione dei caratteri dipende dalla frequenza, con i caratteri maggiormente prevalenti in una popolazione favoriti rispetto agli altri2. Sebbene a volte il processo di replicazione differenziale venga detto “spontaneo”, esso può agire attraverso il potere coercitivo delle nazioni, classi, o organizzazioni, come nel caso di popolazioni sconfitte in guerra e costrette ad assimilare e adottare le culture, l’istruzione e le costituzioni dei !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 2
Alcune ragioni per cui bisogna ritenere importante la trasmissione conformista sono offerte in Boyd e Richerson (1985) e Bowles (2001). Nel capitolo 11 verrà discusso un modello di aggiornamento conformista.
ORDINE SPONTANEO |17
vincitori. I dettagli del processo di trasmissione sono importanti; raccoglieremo questi ed altri casi complessi nei seguenti capitoli quando verrà modellato il modo in cui l’economia e altre istituzioni danno forma all’evoluzione delle preferenze. Adesso modelleremo un caso importante, se pur estremamente semplice, in cui i comportamenti di successo vengono copiati. Questo è il processo di aggiornamento monotono dei payoff, ossia, la classe dei meccanismi di trasmissione con la proprietà che comportamenti con payoff sopra la media sono adottati dagli altri e di conseguenza aumentano le loro quote nella popolazione. Assumiamo che gli individui sono accoppiati casualmente per interagire. Assumiamo, inoltre, che sia presente in ciascun membro di una popolazione3 numerosa uno dei due caratteri (x e y), mutuamente esclusivi. I caratteri possono essere fedeli a diverse regole comportamentali, gusti alimentari, o qualunque aspetto durevole del comportamento che possa influenzare i payoff. X potrebbe essere “il prezzo dei beni al livello del costo marginale”, “lavorare duro”, “avere un altro figlio”, “ricambiare i regali”, o “mangiare una colazione sana ogni giorno”. Il carattere y rappresenta una regola alternativa in ciascun caso. Il modello è semplicemente estendibile a popolazioni con più di due caratteri. Noi modelliamo l’evoluzione di caratteri culturali, ossia, i caratteri acquisiti mediante apprendimento (dai genitori, altri appartenenti alla precedente generazione, coetanei, etc.) piuttosto che attraverso eredità genetiche. Pertanto, il modello rappresenta l’aggiornamento comportamentale come processo di passaggio da un carattere ad un altro piuttosto che la produzione differenziale (o asimmetrica) di discendenza. (Il modello presentato a breve è in ogni caso facilmente adattabile al caso di trasmissione genetica dei caratteri, come mostreremo nell’esempio del Falco e la Colomba.) Ci chiederemo quante copie di ciascun carattere vi siano alla fine di ciascun periodo. (Un individuo che non lascia copie nel periodo successivo è passato all’altro carattere; un individuo che lascia due copie ha mantenuto il carattere ed è stato copiato da un altro.) Assumiamo che gli individui vivono per sempre e sono semplicemente portatori dei caratteri; sono i caratteri stessi che possono essere più o meno abili nel generare copie. L’ampiezza della popolazione è stata normalizzata ad uno. !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 3
La matematica dell’analisi dei sistemi dinamici alla base dei modelli presentati qui è riesaminata chiaramente in Weibull (1995) e presentata in maniera più completa da Hirsch e Smale (1974).
18 | MICROECONOMIA
La struttura del processo di trasmissione è questa: gli individui implementano la strategia, imposta dal carattere, in un gioco che assegna a ciascuno dei payoff, dipendenti dal loro comportamento e da quello degli altri. Di conseguenza, i caratteri sono ripetuti assieme ai caratteri i cui portatori guadagnano payoff più elevati, creando relativamente più copie e così generando una nuova frequenza di caratteri nella popolazione. Supponiamo che i membri della popolazione siano accoppiati in maniera casuale ed interagiscano in un gioco simmetrico con due giocatori, i cui payoff sono indicati con (i, j) , il payoff ottenuto giocando il carattere i contro il carattere j del partner. Per ogni frequenza del carattere x nella popolazione, p [0 , 1] , i payoff attesi sono !
!
!!!!!!!!!!!!!!!!b ( p) = p ( x, x) + (1 p) ( x, y) x
by( p) = p ( y, x) + (1 p) ( y, y)
(2.4)
La prima equazione può essere così interpretata: “Una persona dal carattere x con probabilità p è accoppiata ad un’altra persona dal carattere x , guadagnando così un payoff ( x, x) , e con probabilità (1 p) è accoppiata ad un individuo con carattere y , guadagnando così un payoff ( x, y) ”.
All’inizio di ciascun periodo, una frazione della popolazione, (0 , 1] , può aggiornare il suo carattere a seguito dell’esposizione ad un “modello culturale” (per esempio, un competitore, un insegnante, un collega, o un vicino). Il residuo della popolazione non si rinnova, indipendentemente dalla propria esperienza. Il fatto che non tutti i membri della popolazione si aggiornino, pone l’attenzione sul fatto che tipicamente si adottano comportamenti – spesso durante l’adolescenza – e si mantengono per un periodo di tempo, come suggerisce la citazione di J.S.Mill in apertura del capitolo 3. Naturalmente, il rinnovo di alcuni caratteri può essere più frequente – modo di vestirsi, per esempio – mentre altri caratteri vengono aggiornati solo occasionalmente – la religione, per esempio. La velocità di aggiornamento non è assunta come data, come per gli altri aspetti del processo di apprendimento, bensì risponde essa stessa alle pressioni evolutive. Abbiamo, in questo contesto, semplificato eliminando la natura endogena del processo di aggiornamento stesso. Se il modello culturale e l’individuo hanno lo stesso carattere, esso è mantenuto dall’individuo; questo accade con probabilità p per i caratteri x e con probabilità (1 p) per i caratteri y . (Sia il modello culturale che l’individuo producono una
singola replica – loro stessi – nel periodo successivo). Se invece l’individuo e il modello culturale hanno caratteri diversi, allora l’individuo mantiene o abbandona il
ORDINE SPONTANEO |19
carattere sulla base del payoff ottenuto da entrambi nel precedente periodo. I payoff ottenuti dal modello culturale e dall’individuo dipendono dal particolare appaiamento dei due e quindi variano a seconda della frequenza di ciascun carattere nella popolazione. Naturalmente, l’individuo potrebbe estrapolare informazioni dalle esperienze di payoff di un più ampio gruppo piuttosto che comparare i suoi payoff con quelli del modello, ma questo non comporterebbe grosse differenze. Se l’individuo cambia carattere il modello ottiene due copie (repliche), e l’individuo nessuna. (Nel capitolo 11, useremo questo modello per studiare l’emergere e la diffusione dei diritti di proprietà individuali). Si consideri un modello culturale (una persona di tipo y ) e un individuo x , che hanno ottenuto i payoff B e B , rispettivamente, nel periodo precedente (questi generalmente non saranno uguali a b e b , rispettivamente, a causa del disturbo di y
x
y
x
accoppiamento casuale). Una piccola differenza nei payoff non sarà necessariamente notata o indurrà un cambiamento, così possiamo affermare che con probabilità (B B ) l’individuo con carattere x cambierà se B < B . L’individuo non y
x
x
y
modificherà il suo carattere se B B . Il coefficiente è una costante positiva che riflette il maggior effetto sul cambiamento dovuto a differenze tra i payoff più ampie, scalato in modo tale che la probabilità di passaggio vari in un intervallo unitario. Supponiamo che p =1 , quando il payoff del tipo y eccede quello del tipo x , e sia x
y
y>x
uguale a zero altrimenti. Possiamo scrivere l’equazione che rappresenta la frequenza attesa del carattere x nella popolazione, indicata con p' come:
p' = p p(1 p) p (b b ) +
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
y>x
y
x
+ p(1 p)(1 p ) (b b ) y>x
x
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(2.5)
y
! Questa espressione può essere interpretata nel modo seguente: in ogni periodo ci sono p individui dal carattere x , una frazione dei quali potrà essere aggiornata, ciascuno di Questi p individui dal carattere x sarà accoppiato ad un modello di carattere y con probabilità (1 p) , e con probabilità p (b b ) l’informazione che essi acquisiscono circa i payoff li indurrà a cambiare. Controbilanciando la riduzione di carattere x , alcuni individui con carattere y incontreranno modelli con carattere x e y>x
y
x
mediante un processo analogo a quello precedente si convertiranno in persone con carattere x . Riordinando, possiamo esprimere l’equazione (2.5) come: p = p' p = p(1 p) (b b ) x
y
(2.6)
20 | MICROECONOMIA
Dall’equazione (2.6) si evince che la direzione e la velocità dell’aggiornamento dipendono dal valore di p in due modi. In primo luogo, la varianza del carattere, p(1 p) , misura il numero di persone x che saranno accoppiate con una persona y , e
valori estremi di p renderanno questa eventualità molto improbabile. Inoltre, l’espressione {b ( p) b ( p)} (che esplicita la dipendenza funzionale di b su p ) ci x
y
mostra l’effetto di p sui payoff e quindi sull’aggiornamento. Si noti che valori elevati di e di – una maggiore frazione di popolazione che si rinnova, e un cambiamento del carattere maggiormente sensibile alle differenze tra payoff – accelerano la dinamica quando b b . x
y
Se definiamo b = pb + (1 p)b come il payoff medio della popolazione, possiamo esprimere in maniera più compatta l’equazione (2.6): x
y
p = p (b b) x
(2.6’)
L’equazione (2.6’) rappresenta la forma generale (applicabile ad ogni numero di caratteri) della dinamica del replicatore in tempo discreto, un modo di modellare i sistemi dinamici formalizzato da Taylor e Jonker (1978) con ampia applicabilità alla biologia della popolazione e alle scienze sociali evolutive4. L’equazione (2.6’) evidenzia chiaramente che esistono due componenti necessarie nell’analisi del cambiamento evolutivo: la varianza e la replicazione differenziale. La varianza, rappresentata dal termine p(1 p) , è essenziale. Maggiore l’omogeneità della popolazione, minore sarà la velocità del processo evolutivo. Si noti che p(1 p) raggiunge un massimo per p =1/2 , così una popolazione equamente divisa, mantenendo costanti le altre influenze, massimizzerà il tasso di cambiamento in p . La replicazione differenziale – a volte detta selezione – è rappresentata dal termine {b ( p) b ( p)}. La pressione della selezione sarà debole se una piccola x
y
frazione della popolazione è soggetta ad aggiornamento, se le differenze nei payoff sono piccole, o se le risposte alle differenze nei payoff sono ridotte. Le equazioni (2.6) e (2.6’) ci danno una completa descrizione del sistema unidimensionale dinamico rilevante. Dato che esistono solo due caratteri, lo spazio degli stati in questa applicazione, ossia, tutti i possibili risultati, è semplicemente rappresentato da tutti i valori che p può assumere nell’intervallo unitario. Per questa ragione il sistema dinamico che ne risulta è detto “uni-dimensionale”. Si noti che !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 4
Abbiamo espresso l’equazione del replicatore in tempo discreto anziché continuo poiché molti dei problemi che affronteremo nelle pagine che seguiranno sono caratterizzati da unità naturali di tempo (come le generazioni). La versione discreta, in questo caso, risulta dare una interpretazione più chiara.
ORDINE SPONTANEO |21
l’equazione (2.6) è identica all’espressione (2.3)(che descrive le dinamiche del mercato immobiliare caratterizzato da quartieri segregati). Per ogni valore di p l’equazione del replicatore esprime la relazione p = ( p) , dove la funzione , detta campo vettoriale, definisce la direzione e la velocità del cambiamento nello stato (per ogni stato incluso nello spazio degli stati possibili). Siamo generalmente interessati a conoscere gli stati p * tali che ( p*) = 0 , chiamati stati stazionari (anche chiamati punti critici della dinamica), e le proprietà di stabilità di questi stati, determinate da ( p * + ) , dove rappresenta una perturbazione di p arbitrariamente piccola. Dall’equazione (2.6’) è chiaro che p = 0 se b ( p) b ( p) = 0 y
(2.7)
x
oppure se p è uguale a zero o uno (poiché quando p =1, b = b ). Per p (0 , 1) p assume il segno di b b , sottolineando il fatto che l’aggiornamento è monotono nei payoff. Data la natura uni-dimensionale di questo sistema dinamico, le proprietà di stabilità dei suoi stati stazionari sono facilmente descrivibili: un equilibrio è asintoticamente stabile (auto-correttivo) se la derivata dell’equazione (2.6’) rispetto a p è negativa (cioè dp /dp < 0 ). Questo si verifica quando: x
x
dby dp
y
dbx = ( y , x ) ( y , y ) ( x, x ) + ( x, y ) > 0 dp
(2.8)
Se la frequenza di x aumentasse per una ragione esogena, la differenza attesa tra i payoff di y e x aumenterebbe (la crescita di x verrebbe vanificata poiché l’aumento stesso genera una differenza nei payoff tale da favorire i tipi y ). La stabilità asintotica di uno stato stazionario, p *, deve essere intesa in questo modo: tutte le perturbazioni, sufficientemente piccole, nella composizione della popolazione producono cambiamenti che generano un ritorno a p * . La stabilità di Lyapunov richiede solo che tutte le piccole perturbazioni su p non implichino successivi movimenti di allontanamento da p * . (La stabilità di Lyapunov è talvolta chiamata stabilità neutrale). Utilizzeremo il termine “stabilità”, per indicare il concetto più forte, quello “asintotico” (auto-correttivo). La stabilità asintotica, ovviamente, implica la stabilità di Lyapunov. La differenza tra i due concetti di stabilità diventa importante quando i comportamenti individuali sono soggetti ad influenze stocastiche (pur se arbitrariamente piccole) come la mutazione, o il comportamento idiosincratico (risposta non ottimale). Questo caso è illustrato nel capitolo 11. L’equazione (2.8) sottolinea semplicemente che gli equilibri per essere asintoticamente stabili devono essere caratterizzati da effetti di reazione negativi:
22 | MICROECONOMIA
accrescere la frequenza di x riduce il vantaggio relativo di x stesso5. Quando l’equazione (2.8) non è verificata (ed è strettamente minore di zero), l’equilibrio è instabile a causa di reazioni positive: un aumento casuale di p beneficerà maggiormente il carattere x rispetto ad y e di conseguenza, allontanerà p da p * . Il processo di aggiornamento può quindi essere analizzato in due modi. Primo, se un equilibrio interno è stabile, si studia il modo in cui le influenze esogene possano rimuovere o spostare l’equilibrio. Si esamina principalmente come p * sia influenzato dai cambiamenti nel gioco e nel processo di rinnovamento.
Questo si ottiene differenziando la condizione di equilibrio (2.7) rispetto alle determinanti esogene dell’equazione del replicatore. Le determinanti esogene includono non solo qualunque dato tecnologico e non che determini la struttura dei payoff e altri aspetti del gioco, ma anche gli aspetti istituzionalmente determinati del processo di trasmissione, come la regola di appaiamento per il gioco o per i modelli culturali di incontro, la frequenza dell’incontro di dati agenti, e la possibile presenza di influenze sull’aggiornamento piuttosto che sui payoff, come il conformismo. Nei capitoli 3, 7 e 11, useremo questo approccio per studiare l’effetto delle istituzioni economiche sull’evoluzione delle preferenze. Secondo, se esiste un unico equilibrio interno instabile, avremo due equilibri stabili con una popolazione omogenea composta solo da x o da y (come nel caso del mercato abitativo segregato). In questo caso siamo interessati allo studio del processo (dipendente dalla storia passata) mediante il quale si può giungere ad uno dei due equilibri. Per indagare sulla realizzazione di uno dei due equilibri abbiamo bisogno del concetto di “bacino di attrazione di uno stato stazionario stabile”. Questo concetto è definito come l’insieme degli stati iniziali per i quali il sistema dinamico imperturbato si muove verso l’equilibrio. Nel sistema uni-dimensionale in questione, l’unico stato stazionario interno p * è instabile. In questo caso il bacino (o l’intervallo) di attrazione di p = 0 è il campo di valori di p in cui p = ( p) < 0 in modo tale che la popolazione graviti intorno a p = 0 . L’equilibrio interno (instabile) p * divide l’intervallo unitario in due bacini di attrazione, con p > 0 per p > p * e p < 0 per p < p *. Nel caso del modello di segregazione abitativa il bacino di
attrazione dell’equilibrio “tutti blu” comprenderebbe i valori di f < f *. Come vedremo, possono essere attutite molte delle semplificazioni usate per derivare il modello. Esiste, però un’assunzione cruciale ed essenziale, difficile da escludere e abbastanza limitante. Abbiamo considerato i valori attesi come approssimazioni !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 5
Esiste una difficoltà tecnica non affrontata. Nella dinamica in tempo discreto trattata qui è possibile che il processo di aggiornamento muova p verso p* quando esso è perturbato, ma lo superi. Assumiamo perciò che il periodo di tempo sia abbastanza breve (e quindi piccolo abbastanza) in modo da eliminare questa eventualità.
ORDINE SPONTANEO |23
ragionevoli dei payoff reali, ma l’ampiezza di molte popolazioni che studiamo – i residenti nel quartiere studiati nella sezione precedente, o i dipendenti di un’ impresa – non è così grande da poter giustificare questa assunzione. Quindi, se p è la frequenza degli individui che possiedono il carattere x e l’appaiamento è casuale, il valore atteso delle x accoppiate con le x è rappresentato da p . Questo valore potrebbe, però, essere in realtà (realizzarsi come) p(assumendo un numero pari di x ) o anche zero, ed entrambe le possibilità si realizzano 2
frequentemente nel caso di piccoli gruppi. Il problema del disturbo dovuto all’accoppiamento ed ad altre piccole influenze sulla dinamica evolutiva può sembrare un cavillo, ma non lo è. Nei capitoli dall’11 al 13 vedremo che gruppi di piccola ampiezza assieme alla casualità influiscono sulla velocità e sulla direzione delle dinamiche evolutive. Una seconda limitazione della dinamica evolutiva è che le equazioni che definiscono il sistema non dipendono dal tempo, cioè, il sistema è autonomo o omogeneo nel tempo. Il sistema, cioè, elimina le influenze storiche sulle equazioni, come ad esempio lo stato della conoscenza, la tecnologia, aspetti istituzionali assunti come dati, o il clima. Naturalmente, se si comprendessero le dinamiche di queste influenze variabili nel tempo, potremmo includerle come variabile di stato nel sistema dinamico. La natura omogenea rispetto al tempo della dinamica del replicatore può rappresentare un problema solo se lo studio in esame ne risente; per alcuni problemi, eliminare i cambiamenti climatici, per esempio, è ragionevole, e per altri meno. L’interpretazione dell’emergere dei diritti di proprietà individuali nel capitolo 11 è un caso in cui le variazioni metereologiche hanno particolare importanza. Se i processi di selezione descritti dalla dinamica del replicatore sono lenti rispetto ai cambiamenti nelle tecnologie e rispetto ad altri dati esogeni definiti nel gioco, il sistema dinamico potrebbe non raggiungere mai le vicinanze dei valori stazionari di p (poichè questi verrebbero continuamente spostati da cambiamenti esogeni). Un terzo problema connesso alla dinamica del replicatore è suggerito dal suo stesso nome: non può essere usata per studiare le innovazioni. Per studiare novità genuine (invece della ripetizione differenziale di caratteri esistenti), bisogna introdurre il concetto complementare di “ strategia evolutivamente stabile”.
S TA B I L I T À E V O L U T I VA
E
R IS U LTAT I S O C IA L I
Quali sono le condizioni per cui una popolazione incorre nel pericolo di “invasione” da parte di un nuovo carattere? Alcuni esempi concreti del tipo di invasione a cui ci riferiamo includono la rapida diffusione in molti paesi nell’ultimo
24 | MICROECONOMIA
secolo della pratica di avere piccole famiglie piuttosto che grandi. Si pensi anche all’ultima società feudale europea, “invasa” da un piccolo numero di italiani e altri mercanti che usavano nuove pratiche commerciali come la contabilità in partita doppia e il sistema di responsabilità sociale dell’enforcement contrattuale (Greif 2002, Padgett 2002). Gli invasori prosperarono ed infine trasformarono l’ordine feudale. Altri esempi includono pratiche commerciali corrotte che invadono una comunità di commercianti onesti, o i pronomi informali che “invadono” i modi rispettosi di rivolgersi di una comunità linguistica. Sebbene la dinamica del replicatore sia uno strumento analitico conveniente, uno dei suoi limiti risiede nel fatto che se un carattere è assente in una popolazione nel periodo t questo significa che esso non potrà essere copiato nel periodo t +1 . Ricordiamo che la condizione di stazionarietà per p è soddisfatta quando p =1 e p = 0 , e questo indipendentemente dai payoff che possono derivare dalla strategia assente, anche se fosse presente. Questi valori di p sono sempre stazionari nella dinamica del replicatore ma possono non rappresentare equilibri di Nash e possono non esser asintoticamente stabili: piccole perturbazioni nell’intorno di p =1 e p = 0 possono non essere auto correttive. Non è difficile, però, estendere il modello del replicatore in modo da considerare anche le innovazioni. Nei capitoli conclusivi ritorneremo su questi modelli evolutivi stocastici. Per ora, piuttosto che introdurre esplicitamente la casualità nell’equazione del replicatore, introdurremo un concetto nuovo, per incorporare l’innovazione, la nozione di “stabilità evolutiva”. Furono i biologi ad aprire la strada ai modelli sull’innovazione. Il loro interesse per la probabilità che un piccolo numero di mutanti potesse proliferare in un’ampia popolazione ha motivato il concetto chiave di strategia evolutivamente stabile. L’idea basilare è che una popolazione in cui si gioca interamente una strategia evolutiva stabile respingerà un’invasione di individui che giocano un’altra strategia. Si consideri un’ampia (per l’esattezza, infinita) popolazione in cui gli individui sono accoppiati in maniera casuale al fine di interagire (secondo il modello precedente). Si supponga, come prima, di considerare due caratteri comportamentali, x e y . Il carattere y è detto evolutivamente stabile rispetto a x se esiste una frazione della popolazione, p˜ , tale che, se la frazione della popolazione che gioca x è minore di p˜ , allora la strategia insediata precedentemente (la y ) si duplicherà più di x eliminando così la strategia in entrata. Introdurremo brevemente un caso in cui vedremo che la “barriera di invasione” p˜ (0 , 1) è un equilibrio interno instabile ed esso definisce il bacino di attrazione di p = 0 e p =1 precedentemente citato. Per vedere cosa implica la stabilità evolutiva cerchiamo di scoprire cosa accade
ORDINE SPONTANEO |25
in un’ampia popolazione, composta interamente dal carattere y , se viene introdotto un piccolo numero di x . Usando l’equazione (2.6’), questo significa valutare p in p = dove sarà arbitrariamente piccolo. Sappiamo che p avrà il segno di:
{
b ( ) b ( ) = ( x, x) + (1 ) ( x, y)} { ( y, x) + (1 ) ( y, y)} x
y
Un carattere comportamentale y è una strategia evolutivamente stabile (ESS) rispetto ad un’altra strategia x se e solo se b ( ) b ( ) < 0 , che, per un arbitrariamente piccolo, risulta quando x
y
( y, y) > ( x, y)
(2.9)
o quando ( y, y) = ( x, y)
e
( y, x) > ( x, x) .
Così, un ESS è una risposta ottima verso se stesso (almeno debolmente, e se esso è una risposta ottima debole verso se stesso allora l’altra strategia non è una risposta ottima a se stessa). Poiché piccole perturbazioni di p attorno ad un ESS si autocorreggono (secondo il precedente ragionamento), sappiamo che ogni ESS è un equilibrio di Nash simmetrico, e nella dinamica del replicatore asintoticamente stabile. Quando il mutante è una risposta ottima debole a se stesso (cioè, l’ultima disuguaglianza nell’equazione (2.9) non è stringente, bensì ( y, x) ( x, x) ), allora y potrebbe essere neutralmente stabile: l’invasore non può essere eliminato ma esso non prolifererà a causa dell’aggiornamento monotono dei playoff 6. Naturalmente, questo stato di stabilità neutrale (NSS) può essere perturbato attraverso un processo di deviazione (cioè, innovazioni successive generate esogenamente) e questo ha implicazioni importanti in alcune applicazioni (si guardi, ad esempio, il capitolo 11). L’NSS e l’ESS sono raffinamenti stringenti (in modo crescente) dell’equilibrio di Nash. Ogni ESS è un NSS ed ogni NSS è un equilibrio di Nash; ma naturalmente non è vero il contrario. Il concetto opposto alla stabilità evolutiva è la capacità di invasione, che Axelrod e Hamilton (1981) definirono capacità di sopravvivenza iniziale. Se x ha capacità di sopravvivenza iniziale contro allora y non è un ESS. Si noti che lo stato di y come ESS rispetto ad x non dice nulla sul suo stato rispetto a qualche altro carattere k o due mutanti k e x che esistano simultaneamente. !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 6
Ciò significa che ogni NSS è stabile secondo Lyapunov.
26 | MICROECONOMIA
A volte si vuole sapere se una popolazione mista (cioè, una in cui p (0 , 1) ) può essere invasa da un mutante raro. Notiamo, in primo luogo, che una popolazione in cui ognuno adotta la stessa strategia mista, è, per questa ragione, omogenea nelle strategie, anche se essa è eterogenea nei comportamenti, nel senso che in ogni momento individui diversi agiscono differentemente. Se rappresentiamo questa popolazione polimorfa come una popolazione in cui tutti gli individui adottano una strategia mista (giocando x e y con probabilità p * e (1 p*) rispettivamente), possiamo riferirci a questa strategia come ad un ESS
interno (o misto) rispetto a qualche altra strategia k se, introducendo un piccolo numero di k , questa venisse eliminata. Affinché p * sia un ESS, esso deve essere stabile asintoticamente e stazionario nella dinamica del replicatore; se non fosse così, i payoff attesi delle strategie miste della popolazione (chiamato il supporto della strategia mista) sarebbero diversi nell’intorno di p * . Il payoff di una delle strategie nel supporto potrebbe eccedere il payoff della strategia mista e un mutante, che sostiene questa strategia pura, potrebbe invadere. Si noti che come il modello del replicatore non spiega le dinamiche degli “estremi” di una popolazione (cioè, per p = 0 o p =1 ), allo stesso modo i concetti di vitalità iniziale e stabilità evolutiva non chiariscono la dinamica che governa p quando è un punto interno. Generalmente, è utile combinare i due approcci, ricavando la stabilità asintotica (ESS) dalla stazionarietà dei valori estremi di p. Il gioco del Falco e della Colomba servirà ad illustrare questi concetti. E’ risaputo che i Falchi sono aggressivi e le Colombe amano la pace. Il gioco è applicato comunemente a caratteri comportamentali umani trasmessi culturalmente o geneticamente come l’aggressività e la condivisione, ma è stato sviluppato inizialmente per studiare le competizioni tra animali. Il gioco si sviluppa in questo modo. Le Colombe, quando si incontrano, si dividono un premio, mentre quando i Falchi si incontrano, lottano per il premio, infliggendo costi gli uni sugli altri; e quando un Falco incontra una Colomba ottiene il premio. La metafora del pennuto, che si svolge in modo simile, in realtà, applicata alle automobili trasforma questa interazione nel “gioco del pollo” in cui i conducenti “ostinati” non sterzano mai, così quando si incontrano, si scontrano, ma quando incontrano un “pollo” (uno che sterza), guadagnano (presumibilmente psicologicamente) dei benefici, mentre colui che devia è umiliato.
ORDINE SPONTANEO |27
Tabella 2.2. Gioco del Falco e della Colomba (payoff dei giocatori di riga)
Falco a =(v-c)/2 c =0
Falco Colomba
Colomba b=v d = v/2
Nota: l’adattamento (numero di progenie generata) è uguale a più i payoffs del gioco
Il premio da dividere è indicato con v , c rappresenta il costo di perdere una lite, e la probabilità che un Falco ha di vincere una competizione con un altro Falco è (i Falchi sono identici) 1 2 . Le Colombe dividono il premio equamente e senza costi. La matrice dei payoff è raffigurata nella tabella (2.2). Si nota facilmente che fintanto c > v F e C non saranno un ESS. (Un modo pratico di cercare un ESS in ampie
matrici con payoff di riga è domandarsi se il termine sulla diagonale principale sia il maggiore della colonna. Se questo è vero, quella colonna rappresenta un ESS). I membri di questa popolazione sono accoppiati in modo casuale. Siano b ( p) f
e b ( p) i payoff attesi del Falco e della Colomba, rispettivamente, in una popolazione in cui la frazione di Falchi è p, i payoff attesi illustrati nella figura 2.2 sono: c
!
!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!b ( p) = pa + (1 p)b ! !
!
f
!
!
b ( p) = pc + (1 p)d
(2.10)
c
!
! ! Per illustrare l’uso dell’equazione del replicatore in un processo evolutivo basato sulla capacità riproduttiva (fitness), assumiamo che, alla fine di un periodo, ciascun membro della popolazione produca un numero di duplicati esatti (escludendo le mutazioni) uguale a più il payoff del gioco. In questo modo i payoff sono valutati in unità di figli sopravvissuti all’età riproduttiva, cioè, la fitness ( è chiamato “base di idoneità”). L’assunzione che un singolo membro (piuttosto che una coppia) generi progenie semplifica il modello; questa assunzione di clonazione o di riproduzione asessuata è una semplice (ma spesso utile) alternativa al modello più realistico basato sulla riproduzione sessuata. Normalizzando la popolazione totale all’unità, possiamo scrivere la frequenza di Falchi nella popolazione dell’anno successivo, come p' =
p(b + ) !! pb + (1 p)b + f
f
!
(2.11)!
!!!!!!!!!!!!!!!!
c
! Il numeratore deve essere interpretato in questo modo: “Quest’anno nella popolazione erano presenti p Falchi e ciascuno di loro ha generato b + figli, producendo p(b + ) Falchi il prossimo anno”. Il denominatore rappresenta il f
f
numero complessivo combinato di Falchi e Colombe per il prossimo anno. Data la normalizzazione dell’ampiezza della popolazione all’unità, i duplicati complessivi
28 | MICROECONOMIA
prodotti sono uguali alla media ossia a b .
!
Falchi come frazione della popolazione, p
!
Figura 2.2. I payoff dipendenti dalla frequenza nel Gioco del Falco e della Colomba. Il numero di copie è dato dai payoff più una costante
! Noi siamo interessati a p , quindi sottraendo p da entrambi i membri dell’equazione (2.11) avremo, p p' p =
{
p(b + ) p p(b + ) + (1 p)(b + )} ! !!!!!!!!!!!!!! (2.12)! b b f
f
c
Che, riordinando e usando i valori nella matrice dei payoff per esprimere (b b ) come 1/2(v pc) , diventa f
c
bp = p(1 p)(b b ) = p(1 p)1/2(v pc) !!!!!!!! f
c
!
(2.12’)!
La (2.12’) corrisponde esattamente all’equazione della dinamica del replicatore precedentemente derivata (mediante un percorso diverso) per il modello di segregazione abitativa e per il caso generale di rinnovamento del carattere culturale presentati nelle precedenti sezioni. I valori interni stazionari di p sono quelli per cui b ( p) = b ( p) . Usando l’equazione (2.10) e risolvendo per p * , la frequenza stazionaria f
c
di Falchi nella popolazione, abbiamo p* =
bd v = !! b+cad c
!
!!!!!!!!!!!!!!!
(2.13)!
! La (2.13) mostra come la frazione di equilibrio di Falchi sia crescente nel premio e decrescente nel costo della lotta. (Sostituendo p* = v /c nell’equazione (2.12’) si può verificare che il valore è stazionario). La condizione di eguaglianza nei payoff, che definisce la stazionarietà di p, rende chiaro che p * è un equilibrio di Nash: se la frazione di Falchi è p * , allora entrambe le strategie sono deboli risposte ottime. L’equilibrio su descritto è stabile? Notiamo che
ORDINE SPONTANEO |29
d(b b ) d {1/2(v pc)} = = 1/2c < 0 ! dp dp f
c
!!!!!!!(2.14)
!
! Ciò significa che un aumento nella prevalenza di Falchi svantaggerà i Falchi stessi (e di conseguenza indurrà una riduzione nella frequenza dei Falchi nel periodo successivo). La condizione di stabilità (2.14) richiede che la funzione del payoff atteso dei Falchi nella figura 2.2 sia “più ripida” (il valore assoluto della sua inclinazione sia maggiore) di quella delle Colombe. Nella dinamica del replicatore p =1 e p = 0 sono anche entrambi stazionari (il primo perché b (1) = b(1) , ma nessuno dei due è un equilibrio di Nash (come si può notare dal fatto che b (0) > b (0) e b (1) < b (1) ). Questo ci ricorda solo che, qualora esistesse un’unica strategia da replicare, la frequenza di una popolazione governata dalla dinamica del replicatore rimarrebbe invariata. Tale popolazione, però, potrebbe essere invasa da un mutante. f
f
c
f
c
Le proprietà di esistenza e stabilità di un equilibrio interno sono collegate al concetto di ESS nel seguente modo (per il caso generale in cui l’insieme di strategie è ( x, y) e p è la frazione della popolazione del tipo x ): se nessuna strategia è un ESS ,
ci sarà un equilibrio interno asintoticamente stabile. Se, invece, entrambe le strategie sono ESS, allora ci sarà un equilibrio interno non stabile mentre sia p =1 e p = 0 sono asintoticamente stabili (come vedremo a breve, nel gioco dell’assicurazione). In questo caso, l’equilibrio interno instabile è rappresentato dalla barriera d’invasione ( p˜ ) che è parte della definizione dell’ESS. Nella tabella 2.3 sono riassunte queste corrispondenze su una popolazione con due strategie, x e y . Tabella 2.3. ESS, l’esistenza e la stabilità di un equilibrio interno y è un ESS x è un ESS
y non è un ESS
p* (0,1) instabile p*=1 stabile
x non è un ESS p*=0 stabile p* (0,1) stabile Nota: p* è una frazione della popolazione di tipo x che è stazionaria nella dinamica del replicatore.
L’analisi della stabilità evolutiva fornisce previsioni sui risultati? Se nessuna delle due strategie è un ESS, se l’innovazione non viene impedita e se il processo di rinnovamento è governato dalla dinamica del replicatore, abbiamo allora una previsione chiara: dovremmo poter osservare frequenze della popolazione circa pari o esattamente uguali a p *. Se questo è il caso, ritornando agli esempi, ci aspetteremmo di trovare la coesistenza di famiglie ampie e piccole, pratiche commerciali oneste e corrotte, e simili. Otteniamo previsioni chiare anche in altri due casi: se una strategia è un ESS e l’altra no, allora ci aspettiamo di vedere una popolazione composta interamente da ESS. Questo accade perché, secondo le
30 | MICROECONOMIA
condizioni discusse in precedenza, ogni comportamento capace di invadere guadagnerà seguaci fino a diventare universale. Cosa accade se entrambe le strategie sono evolutivamente stabili? Come abbiamo visto nel capito 1, in questo caso la storia passata assumerà molto valore. Possiamo dire qualcosa di più. Si supponga che i membri di una popolazione numerosa siano accoppiati in modo casuale per giocare un gioco di assicurazione simmetrico i cui payoff sono descritti nella tabella 2.4 – per esempio, una variante del problema della piantagione di Palanpur nel capitolo 1 con cooperazione e defezione che rappresentano piantagione anticipata e piantagione ritardata, rispettivamente, e con i payoff come indicati. In un Gioco di Assicurazione, sia CC che DD sono risposte ottime reciproche, quindi i payoff devono essere tali che c < a e b < d , e (continuando l’esempio di Palanpur), assumeremo inoltre che a > d . Allora, sia p [0 , 1] la frazione di disertori nella popolazione; possiamo scrivere i payoff attesi come funzione di p , ed eguagliando i payoff attesi per le due strategie, Cooperare e Defezionare troviamo i valori stazionari di p: p* =
ca ba+cd
! ! !
! Tabella 2.4. Gioco dell’Assicurazione (payoff riga) Cooperare Non Cooperare (D) Cooperare "(C,C)=a "(C,D)=b Non Cooperare(D) "(D,C)=c "(D,D)=d Nota: "(D,C)"(C,D)
I payoff attesi dal Cooperare e Defezionare sono rappresentati da b e b , rispettivamente. Il denominatore di p * rappresenta l’effetto delle variazioni in c
d
p dovute alla differenza tra i payoff di cooperazione e i payoff di defezione ossia, d (bc bd ) dp
= (C , D ) (C , C ) + (D, C ) (D, D ) = b a + c d < 0 !
! Se > 0 , allora, b ( p * + ) < b ( p * + ) e quindi i disertori saranno relativamente avvantaggiati. Ciò implica che un piccolo aumento nella frequenza dei disertori causerà un ulteriore incremento di p. Un ragionamento simile mostra Che p = 0 e c
d
p =1 sono ESS ( e quindi sono equilibri di Nash simmetrici e stabili nella dinamica
del replicatore). “La storia conta” in questa situazione perché, escludendo eventi esogeni, una popolazione per cui p < p * nel recente passato, si muoverà verso p = 0 . Possiamo
ORDINE SPONTANEO |31
dire ancora di più. Si supponga di osservare un gran numero di isole sulle quali gruppi isolati di individui giocano lo stesso gioco di assicurazione in un solo round in un lungo periodo di tempo. Inizialmente le loro strategie sono state determinate casualmente, dopo di che essi hanno aggiornato il loro comportamento secondo la dinamica del replicatore. Se l’equilibrio interno instabile p * è minore di 1/2, allora, avremmo ragione di credere che la maggior parte dei gruppi sarà composta interamente da disertori. Se le strategie fossero inizialmente scelte in modo casuale, allora il valore atteso della frequenza iniziale della popolazione sarebbe 1/2, e quindi sarebbe vero che per la maggior parte dei gruppi p > p *, che implica p > 0 . Come risultato, molti gruppi evolverebbero verso una defezione uniforme. Si noti che questo può avvenire anche se (come nell’esempio di Palanpur) la mutua cooperazione fosse dominante in termini di payoff: dove l’equilibrio di defezione mutuale è dominante rispetto al rischio noi sappiamo (dalla definizione di dominanza rispetto al rischio) che p* 0 and y'' < 0
(8.1)
dove h è il numero di lavoratori in termini di ore acquistate (si può assumere che ogni lavoratore lavori un'ora, così che h sia il numero di lavoratori omogenei assunti). Il livello di produzione è contrattabile, ma il livello dell'impegno di ogni lavoratore non può essere dedotto dal livello della produzione a causa della natura collettiva e stocastica della produzione.
Quel che segue sintetizza il rapporto tra lavoratore e l'imprenditore. Il principale (il datore di lavoro) conosce la funzione di risposta ottima dell'agente (il lavoratore) e(w,m;z) , dato qualunque salario w ed il livello di supervisione m , con una rendita di riserva z determinata esogenamente (gli argomenti sulla destra del punto e virgola sono esogeni). All'inizio di ogni periodo il datore di lavoro sceglie (in modo da massimizzare i profitti) e annuncia: una probabilità di licenziamento t(e,m) [0,1] con t < 0 e t > 0 per ogni livello economicamente rilevante; un livello e
m
di salario, w ; e un livello di supervisione per ora di lavoro pagata m . Sia il salario che
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|5
la supervisione sono misurati nella stessa unità come produzione per periodo. In seguito all'annuncio del datore di lavoro della sua strategia "incentivo-supervisione", e conoscendo quanto detto sopra, il lavoratore sceglie e in modo da massimizzare il valore attuale della sua utilità intertemporale. Alla fine del periodo, il lavoratore è pagato e gode dell'utilità determinata dal suo impegno e dal suo salario, il suo rapporto di lavoro viene rescisso con probabilità t(e,m) o altrimenti prolungato. Se il lavoratore è licenziato, egli è sostituito da un lavoratore identico prima disoccupato e il valore attuale della sua utilità intertemporale è z . Se il lavoratore conserva il suo lavoro, il rapporto si rinnova con lo stesso meccanismo; di conseguenza l'interazione lavoratore-datore è stazionaria (o invariante nel tempo).
La funzione della probabilità di licenziamento t(e,m) è cruciale per il funzionamento del modello. Una tale semplice funzione potrebbe essere basata sull'idea che durante ogni periodo c'è una probabilità (m) , che il datore "veda" il lavoratore e che quindi, in quel caso, sappia esattamente se il lavoratore sta lavorando o no. Supponiamo che in assenza di supervisione il datore non "veda" il lavoratore, nel qual caso (0) = 0 e ' > 0 . Questo darebbe luogo ad una funzione di probabilità di licenziamento t = (m)(1 e) , dalla quale si può dedurre che t(0, (m)) = (m) e t(e, (m)) = 0 . Quello che è essenziale per il modello è che per livelli positivi di supervisione, un maggiore impegno riduce la probabilità di licenziamento, cioè t = (m) . Allo stesso modo, livelli maggiori di supervisione accrescono l'effetto marginale del lavorare con più impegno sulla probabilità di licenziamento: t = '(m) . e
em
La scelta ottimale del lavoratore. La funzione di utilità del lavoratore per periodo è u = u(w,e)
(8.2)
con u 0 e u 0 per ogni livello economicamente rilevante. Questo non significa che il lavoratore preferirebbe non impegnarsi affatto, ma piuttosto che ogni situazione in cui u > 0 non può essere una allocazione di equilibrio, dato che in questo caso il lavoratore potrebbe unilateralmente implementare un livello di impegno più alto, facendo aumentare i profitti del datore e la sua stessa utilità. Il lavoratore sceglie e in modo da massimizzare il valore attuale dell'utilità attesa su un w
e
e
orizzonte infinito, dato un certo tasso di preferenza intertemporale i : v=
u(w,e) + (1 t(e))v + t(e)z 1+i
(8.3a)
6 | MICROECONOMIA
o usando l'ipotesi di stazionarietà e dopo qualche manipolazione v=
u(w,e) iz +z i + t(e)
(8.3b)
dove il primo termine sul lato destro dell'equazione riformulata è la renditaincentivo introdotta nel precedente capitolo; in questo caso è anche chiamata la rendita da occupazione. Quindi abbiamo che: valore attuale del lavoro = rendita da occupazione + rendita di riserva. Data questa funzione-obiettivo, il lavoratore sceglie e così da rendere v =0
(8.4)
e
che implica: u = t (v z) e
(8.5)
e
Di conseguenza, il lavoratore sceglierà il livello di impegno che eguaglia il costo marginale dell'impegno al beneficio marginale dell'impegno. Cominciando da bassi livelli di e , il lavoratore dovrebbe aumentare l'impegno fino a che la disutilità marginale dell'impegno compensi il guadagno marginale in termini di valore attuale dell'utilità risultante dalla corrispondente riduzione della probabilità di licenziamento. Le precedenti condizioni del primo ordine (8.4 o 8.5) definiscono la risposta ottimale del lavoratore così come mostrato in figura 8.1.
Impegno
Salario Figura 8.1. Funzione di risposta ottima del lavoratore e offerta ottima dell'imprenditore. Il punto a, cioè, un'offerta di salario w* e un impegno di risposta e*, insieme soddisfano le condizioni del primo ordine del problema di ottimizzazione del lavoratore e del datore di lavoro. Il livello ottimale di supervisione è m*, la cui determinazione non è mostrata qui (vedi figura 8.3). Il punto b è uno degli ottimi Paretiani che sostituiscono la curva dei contratti efficienti (non mostrata). L'area ombreggiata indica gli esiti che sono Pareto superiori al punto a. L'inclinazione della retta ab è e* / (w*+m*).
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|7
Un esempio può chiarire la funzione di risposta ottima. Consideriamo un individuo per il quale il salario è un "bene" e il lavoro è un "male" la cui disutilità dipenda non solo dal livello di impegno, ma anche da quanto equamente sia ricompensato. Supponiamo che la funzione di utilità del lavoratore sia f
u=w
(aw / w) 1e
f
dove a è una costante positiva e w è un norma di salario esogena chiamata il "giusto salario". La disutilità dell'impegno rappresentata dal secondo termine è crescente nell'impegno (ad un tasso crescente). Nota che questo secondo termine è anche decrescente nel salario a parità di giusto salario, indicando che un alto livello di impegno equamente pagato è meno oneroso che un minor livello di impegno pagato ad un livello considerato non equo. La motivazione sottostante può riflettere una variante della funzione di preferenza reciproca introdotta nel capitolo 3: il lavoratore può interpretare l'offerta di lavoro come un indice del tipo di datore di lavoro e potrebbe avere una minore disutilità da impegno lavorando duramente per un capo più generoso e giusto. Supponiamo che il datore di lavoro possa osservare senza costi il lavoratore, ma che l'informazione non sia verificabile, come prima, e non contrattabile, la supervisione sia assente e la probabilità di licenziamento sia t =1 e . La precedente funzione di utilità ci dice che per un salario non infinito la disutilità dell'impegno diventa infinita appena e si avvicina a 1, così che il lavoratore non sceglierà e =1 e di conseguenza t sarà maggiore di 0 . Ipotizziamo che la rendita di riserva del lavoratore sia normalizzata a zero e che il tasso di preferenza intertemporale sia anch'esso 0 (questa semplificazione ci dà una espressione in forma chiusa per la funzione di risposta ottima, ma è ovviamente non realistica). Quindi riscrivendo 8.3b abbiamo u(w,e) w (aw / w)(1 e) = t(e) 1e f
v=
1
e dato che t = 1 possiamo scrivere l'equazione (8.5) per questo caso come e
aw / w w (aw / w)(1 e) = (1 e) 1e f
f
1
2
Questa funzione di risposta ottima può essere scritta come una funzione esplicita dell'impegno del lavoratore (semplicemente manipolando un pò i termini) come e =1
2aw w 2
f
(8.6)
8 | MICROECONOMIA
Come ci si potrebbe aspettare, il livello di impegno è crescente e concavo rispetto al salario e decrescente nel livello di giusto salario. Sarebbe istruttivo derivare la stessa funzione di risposta ottima ipotizzando preferenze convenzionali (senza motivi di equità) semplicemente eliminando il termine ( w / w ) dalla funzione di f
utilità. Un confronto delle due funzioni di risposta ottima mostra l'importanza delle preferenze sociali. Prima di andare avanti è necessario fare quattro osservazioni. Primo, abbiamo bisogno di verificare che la minaccia di licenziamento implicata dall'annuncio ex-ante dalla funzione della probabilità di licenziamento t(e,m) sia credibile (cioè sia nell'interesse del datore dare seguito ex-post alla minaccia, una volta che sia stato individuato un lavoratore che non si impegna). Perché un datore di lavoro licenzierebbe un lavoratore per assumerne uno identico? Ipotizzando che i lavoratori possano osservare il livello di impegno di ognuno, e che ogni licenziamento sia conoscenza comune, se l'atto di non impegnarsi non fosse punito con il licenziamento, i lavoratori smetterebbero di ritenere credibile l'annuncio di t(e,m) . Di conseguenza, il licenziamento di dipendenti fannulloni è necessario per sostenere la credenza che la funzione della probabilità di licenziamento sia effettivamente in vigore2. Secondo, in un'analisi più completa la funzione t(e,m) (non solo m ) sarebbe disegnata dal datore di lavoro (se un lavoratore è licenziato dipende, per esempio, dal costo di reperire e formare un sostituto), ma facendo così il modello si complicherebbe senza guadagnarne in capacità esplicativa. Terzo, l'ottimizzazione su un orizzonte infinito è solo un modo di derivare la funzione di risposta ottima che descrive il comportamento del lavoratore; non descrive in ogni caso il processo cognitivo del lavoratore. Il lavoratore potrebbe seguire una norma (che determina un certo livello di impegno) che evolve attraverso il processo di apprendimento basato sull'aggiornamento dei pay-off descritto nei capitoli 2 e 7. L'equazione 8.5 (la funzione di risposta ottima) descrive la norma nel mercato del lavoro che massimizza i pay-off e quindi tende ad essere adottata. Quarto, qualcuno potrebbe chiedersi, come fa il datore di lavoro a conoscere le funzioni di risposta ottima dei lavoratori? Così come un lavoratore può trovare la funzione di risposta ottima attraverso un metodo basato su tentativi ed errori (con 2
L’ipotesi che il gioco sia conoscenza comune e che sia stazionario significa che i lavoratori crederanno che t(e,m) sia in vigore in ogni caso. Comunque, modellare un processo dinamico attraverso il quale i lavoratori apprendano ex-post la funzione di probabilità di licenziamento come risultato dei licenziamenti effettivamente osservati, aggiungerebbe complicazioni sostanziali senza grandi vantaggi.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|9
aggiornamento dei pay-off), il datore di lavoro può arrivare ad una stima di tale funzione variando la sua strategia di disciplina del lavoro ed osservando gli effetti sulla produzione totale. Ovviamente ci sono molte circostanze nelle quali questo processo di apprendimento sarebbe inefficiente o distorto, ma ipotizzerò che il datore arrivi ad una stima accurata. (si ricordi: conoscere la funzione di risposta ottima non è la stessa cosa di riuscire a scrivere un contratto in e , perché e è non verificabile.) Massimizzazione del profitto. Il datore di lavoro, che fronteggia un mercato competitivo per il prodotto il cui prezzo è 1, varia m,w e h per massimizzare i profitti attesi (egli è neutrale al rischio). = y(he(w,m;z)) (w + m)h
(8.7)
Le condizioni del primo ordine per un massimo sono: = y'e (w + m) = 0 = y' he h = 0 = y' he h = 0 h
w
m
w
m
(8.7a) (8.7b) (8.7c)
dalle quali possiamo vedere che il massimo profitto richiede che, e =e w +m w +m y' = e
e = w
m
(8.8a) (8.8b)
La prima condizione implica che il livello medio di impegno per dollaro di spesa per il lavoro sia uguale all'impatto marginale di variazioni in salario e spese per supervisione. Questa è la cosiddetta condizione di Solow (dal nome di Robert Solow che per primo la derivò) generalizzata per includere i fattori di produzione della supervisione. L'altra condizione del primo ordine è analoga alla ben nota condizione per la massimizzazione del profitto: salario uguale al prodotto marginale del lavoro. Con impegno endogeno, questa condizione richiede che la produzione marginale dell'impegno sia uguale al costo di una unità di impegno (includendo il costo della supervisione). Espresse in modo equivalente come y'e* = w * +m * , le condizioni del primo ordine implicano che la produttività marginale del tempo lavorativo (valutata ai livelli determinati dalla condizione di Solow) sia uguale al costo orario di un’ora di lavoro come mostrato in figura 8.2.
10 | MICROECONOMIA
$
Ore di lavoro, h Figura 8.2. Il livello ottimale di ore di lavoro comprate dall'impresa. Nota: w*,m*,h*, ed e* sono le soluzioni delle condizioni del primo ordine nel testo.
Dato che h non compare nella funzione di risposta ottima, il processo di massimizzazione del profitto può essere descritto sequenzialmente: il datore di lavoro prima risolve il problema della disciplina del lavoro selezionando m e w per soddisfare eq. (8.8a). Poi, sostituendo e * e w * dall'equazione (8.8a) nell'equazione (8.8b), determina quante ore di lavoro comprare. Infine sostituendo e*,w*,m * e h * nell'equazione (8.7) determina se il suo piano di produzione è sufficientemente rimunerativo da essere intrapreso, dati gli usi alternativi del capitale necessario. Per illustrare il contratto di equilibrio, ritorniamo al precedente esempio. Si ricordi che m = 0 . Usando la funzione di risposta ottima (8.6), il salario sarà determinato in modo da soddisfare eq. (8.8a) o e 1 2aw / w 4aw = = w w w =e f
2
f
3
w
dove il salario ottimale w * è dato da w* = (6aw ) f
1/ 2
Se a =1 e w = 6 allora sarà ottimale per il datore di lavoro offrire il giusto salario. La risposta ottima del lavoratore in termini di impegno all'offerta di un salario ottimale da parte del datore di lavoro si ottiene sostituendo il valore di w * nell'eq. (8.6), dato che e* = 2 / 3. Se w = 24 , comunque, il salario ottimale sarà la metà del f
f
giusto salario. Per un giusto salario minore di 6, sarà ottimale per il datore di lavoro offrire qualcosa in più del salario equo. Scelta della Tecnologia. Ora si consideri una funzione di produzione più generale con un fattore di produzione che non sia lavoro, y(k,E) , dove k rappresenta il flusso del fattore diverso dal lavoro ad ogni periodo, E = he è la quantità totale di impegno
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|11
e come prima la funzione è crescente e concava nei suoi argomenti. Si supponga che variazioni in k siano associate a differenti spazi di lavoro o ad altri aspetti del processo produttivo che condizionano la capacità di monitorare più o meno facilmente il lavoro. Per esempio, processi altamente capitalizzati, come le catene di montaggio inventate da Henry Ford, hanno tempi scanditi dal funzionamento delle macchine che rendono l'identificazione di lavoratori che si impegnano poco enormemente più facile. Per catturare questa idea, la funzione di licenziamento ora è t = (m,k)(1 e) dove (m,k) è la probabilità di scoprire un lavoratore che non si
impegna. Come prima è crescente in m . Se è crescente in k (come suggerisce l'esempio delle catene di montaggio), allora t < 0 ; che tecnologie a più alto tasso di capitalizzazione facilitino la supervisione vuol dire che di fatto aumentano l'effetto (negativo) dell'impegno sulla probabilità di licenziamento. In questo caso potremmo dire che processi produttivi che usano in modo più intensivo il fattore k sono più ek
"trasparenti" dal punto di vista della supervisione mentre processi che lo usano meno intensivamente sono più "opachi". Casi opposti possono ugualmente esistere. La caratteristica importante non è il segno di t ma il fatto che la scelta della tecnologia ek
generalmente condizioni la facilità della supervisione in un senso o nell'altro, cioè che sia t = 0 . ek
Quale sarà l'effetto delle variazioni in k sulla funzione di risposta ottima del lavoratore? Usando la nuova funzione di licenziamento e calcolando il differenziale totale dell'eq.(8.5) rispetto a k ed e , troviamo de (v z)t = dk u (v z)t ek
ee
ee
che, usando la condizione del secondo ordine per il problema di massimizzazione del lavoratore, mostra che de / dk ha lo stesso segno di t . Di conseguenza, se tecnologie che usano in modo intensivo il fattore k sono meno trasparenti, aumenti di k spostano verso l'alto la funzione di risposta ottima (attraverso l'innalzamento del beneficio marginale derivante da un maggior impegno). La scelta del livello di k che massimizza i profitti rifletterà questo effetto. Sia il ek
prezzo per periodo di affitto di un'unità di k , differenziando parzialmente la funzione di profitto (usando la funzione di produzione estesa a k ) rispetto a k , otteniamo un'ulteriore condizione del primo ordine: = y + e hy = 0 k
k
k
E
(8.7d)
La scelta della quantità del fattore k uguaglierà quindi il prezzo di affitto del fattore k , non alla sua produttività marginale, ma alla sua produttività marginale più il
12 | MICROECONOMIA
suo effetto sull'offerta di impegno moltiplicato per la produttività marginale dell'impegno. La presenza di questo "effetto da disciplina del lavoro" sulla scelta della tecnologia significa che non varrà generalmente che y = μ y k
E
dove μ = (w + m) /e è il costo di una unità di impegno. Come conseguenza, il saggio marginale di sostituzione nella produzione (l'inclinazione dell'isoquanto di produzione) non sarà uguale al rapporto tra i prezzi dei fattori in equilibrio competitivo. La ragione sta nel fatto che i fattori produttivi sono valutati non solo per il loro contributo alla produzione, ma anche per i loro effetti sulla disciplina del lavoro. (La supervisione è un esempio puro di un tale fattore, dato che non compare affatto nella funzione di produzione.) Per tutto il resto del capitolo ignoreremo il fattore di produzione diverso dal lavoro k per favorire la semplicità di presentazione.
L E C A R AT T E R I S T I C H E
D E L L A T R A N S A Z I O N E D I E Q U IL I B R I O
I valori e,h,w ed m che soddisfano le eq. (8.5) e (8.8) determinano la transazione di equilibrio, ovvero una mutua risposta ottima da parte del lavoratore e del datore di lavoro. Seguono cinque osservazioni sull'equilibrio. Primo, i lavoratori generalmente subiscono vincoli di quantità. In generale, il vincolo di partecipazione non è effettivo, cioè v* > z . Questo implica che il mercato del lavoro non è in equilibrio: lavoratori identici che ricevono z preferirebbero essere impiegati ricevendo v , ma non possono effettuare la transazione. Questi lavoratori sono vincolati nella quantità, dato che non possono comprare o vendere tanto quanto vorrebbero ai termini correnti di scambio. Secondo, il risultante scambio (e*,w*) è Pareto inefficiente. Questo avviene perché a questi valori le condizioni del primo ordine del datore di lavoro e del lavoratore richiedono che: v =0
ma
>0
v >0
ma
=0
e
e
e w
w
(8.9)
e quindi esisteranno alcuni (sufficientemente piccoli) valori ( e,w ) tali che v(e * +e,w * +w) > v(e*,w*)
e
(e * +e,w * +w,...) > (e*,w*)
Di conseguenza esiste un piccolo incremento di impegno accompagnato da un
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|13
piccolo incremento di salario che costituirebbe un miglioramento Paretiano. Dato che il datore di lavoro ha selezionato non solo w ma anche m al fine di massimizzare i profitti, un’analoga dimostrazione mostra che un piccolo decremento in supervisione e un piccolo incremento in impegno costituiscono un miglioramento Paretiano3. Terzo, lavoro non produttivo e altri fattori non produttivi saranno impiegati in equilibrio competitivo. Un esempio di fattori assolutamente non produttivi sono i lavoratori usati nella supervisione. Questi non appaiono nella funzione di produzione, ma sono assunti da un'impresa massimizzante perché contribuiscono agli obiettivi dell'impresa in altro modo. Sappiamo che fattori assolutamente non produttivi saranno impiegati perché per m = 0, t = 0 (senza supervisione, lavorare più duramente non cambia la probabilità di licenziamento) così che e(w,0;z) = e (sarà e
scelto il livello di impegno di riserva). Se si assume che e = e non massimizza il profitto, ne segue che m* > 0 . Quarto, l'equilibrio competitivo è tecnicamente inefficiente: esiste una allocazione alternativa tale che la stessa produzione possa essere effettuata impiegando una minore quantità di un certo fattore e una quantità non maggiore degli altri (questa è la definizione di inefficienza tecnica). Si supponga che a un datore di lavoro sia richiesto (da un essere onnisciente) di alzare il salario di w e di abbassare il livello di supervisione di m , in modo appena sufficiente a riportare il livello di impegno al livello di equilibrio, così che e(w*,m*;z) = e(w * +w,m * m;z)
(8.10)
Se l'essere onnisciente decidesse anche che le ore di lavoro impiegate rimanessero come prima, la quantità di prodotto non cambierebbe, ma uno dei fattori, la supervisione, sarebbe stato ridotto: le risorse rappresentate da m sono così liberate per usi produttivi. Dunque l'equilibrio competitivo (e*,w*,m*,h*) è tecnicamente inefficiente nel senso classico come sopra definito. Questo è illustrato in figura 8.3.
3
L’approccio basato sulla disciplina del lavoro qualche volta è chiamato modello del “salario di efficienza” perché Leibenstein (1957) e altri successivi autori di questa letteratura hanno suggerito che per tener conto degli effetti dell’alimentazione, della variabilità dell’impegno e simili, il lavoro dovrebbe essere misurato in “unità di efficienza” piuttosto che in ore. L’uso è rimasto, ma è una definizione non appropriata, perché (in contrasto al modello Walrasiano) gli equilibri descritti dal modello sono sia tecnicamente inefficienti (vedi in seguito) sia Pareto inefficienti.
14 | MICROECONOMIA
Figura 8.3. Il livello di supervisione che massimizza il profitto è tecnicamente inefficiente.
Le ragioni dell'inefficienza sono istruttive. Strategie di incentivo generalmente combinano sia supervisione (che ha un costo opportunità sociale, dato che impiega risorse in usi alternativi a quello puramente produttivo come lo sono il lavoro del supervisore o le risorse richieste per equipaggiare la sorveglianza) e una rendita incentivante, in questo caso, v z (che è un puro trasferimento e quindi non implica nessun costo opportunità per la società). Di conseguenza, dato che sia la supervisione che il salario sono costosi per l'imprenditore, ma solo la supervisione è socialmente costosa, siamo in presenza del classico caso in cui i costi marginali privati sono differenti dai costi marginali sociali. Come ci si può aspettare, questo implica un fallimento del mercato. Dal punto di vista dell'efficenza sociale, quindi, discipline del lavoro determinate in modo competitivo generalmente usano troppo la supervisione e troppo poco rendite incentivanti. Più carota e meno bastone costituirebbero un miglioramento di efficienza tecnica. Nota che se tecnologie con un uso intensivo di capitale sono associate a processi di produzione più trasparenti (come nel precedente esempio), la stessa dimostrazione vale per i beni capitali: miglioramenti di efficenza tecnica potrebbero essere ottenuti (rispetto alla transazione di equilibrio competitivo) innalzando il salario e riducendo il capitale impiegato. Quinto, la transazione di equilibrio sarà anche caratterizzata da un livello Pareto subottimale di benefici sul posto di lavoro come ore di lavoro flessibile, un ambiente di lavoro rispettoso e salubre e simili. Nel classico modello Walrasiano il datore di lavoro è vincolato dalla decisione di offerta di lavoro del lavoratore (vincolo di partecipazione), e per questa ragione il datore è indotto a fornire benefici sul posto di lavoro come un mezzo per abbassare il costo del lavoro: un posto di lavoro più piacevole attrarrebbe futuri lavoratori ad un salario più basso. Dato che il vincolo di partecipazione del lavoratore è dato dal livello di utilità raggiungibile nella sua prossima migliore alternativa al lavoro, il datore massimizzerà i profitti valutando
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|15
l'importanza dei benefici sul posto di lavoro (rispetto ad altre specificazioni della funzione di utilità del lavoratore) esattamente come farebbe il lavoratore. Questo risultato vale ancora se il livello di impegno non è più contrattabile? Vedremo che la risposta è negativa. Si supponga che l'utilità del lavoratore sia generalizzata per includere una misura dei benefici sul posto di lavoro forniti dal datore (per ore di lavoro), u = (w, ,e)
con u > 0 nel dominio economicamente rilevante, e che fornire una unità di benefici costi al datore p per ora di lavoro impiegata Allora avremo una nuova espressione per il valore attualizzato dell'utilità v(e,w, ,z) del lavoro, una nuova
funzione di risposta ottima e(w,m, ,z) e una ulteriore condizione del primo ordine per il datore di lavoro = y' he hp = 0
(8.7e)
Questa condizione implica che il prodotto marginale dei benefici (il primo termine) sia uguale al costo marginale (e medio) del fornire benefici sul posto di lavoro. E' chiaro che il datore di lavoro terrà conto in qualche modo delle preferenze del lavoratore per i benefici dato che e > 0 ; avere un lavoro più piacevole indurrebbe
il lavoratore a impegnarsi di più (essendo così accresciuto il valore del lavoro). Ma il datore terrà sufficientemente conto delle preferenze del lavoratore? La risposta è no. I benefici sul posto di lavoro non sono diversi dal salario in questo modello; questi sono di valore per il lavoratore, ma costosi da fornire per il datore di lavoro. Abbiamo già visto che l'offerta da parte del datore di lavoro che massimizza i profitti, (w*,e*) sarebbe Pareto inferiore rispetto qualche altra combinazione di e e w caratterizzata da piccoli incrementi in entrambi i termini. Lo stesso ragionamento
vale alle condizioni di lavoro: dato che in equilibrio competitivo (e*,w*, *,m*) =0 e v >0
(8.11)
v =0 e >0
(8.12)
mentre e
e
così che piccoli miglioramenti nelle condizioni di lavoro accompagnati da piccoli incrementi di impegno sarebbero miglioramenti Paretiani. Cosa determina la differenza tra l'approccio Walrasiano e post-Walrasiano a questo problema? Nel primo, il vincolo di partecipazione è effettivo e quindi la curva di isocosto dell'impresa è tangente a quella di indifferenza del lavoratore, implicando
16 | MICROECONOMIA
un mercato del lavoro Pareto-ottimale. Nel secondo, invece, il vincolo di partecipazione non è effettivo e l'impresa è vincolata, in questo caso, dalla funzione di risposta ottima del lavoratore. Dato che la funzione di risposta ottima non coincide con il vincolo di partecipazione, l'equilibrio post-Walrasiano non è Paretoottimo.
IL
M E R C ATO D E L L AV O R O IN E Q U IL IB R IO G E N E R A L E
Il rapporto di lavoro in ciascuna impresa è ovviamente inserito in un sistema di mercato con molte imprese uguali ed altri attori. Per studiare questo aspetto, supponiamo che esista un numero molto grande di imprese identiche che impiegano lavoro come descritto precedentemente e che i mercati in questione siano perfettamente competitivi nel senso che non ci siano barriere all'entrata o all'uscita. Se i profitti delle imprese (ricavi netti meno il costo opportunità del capitale) sono positivi allora le imprese entrano nel mercato, mentre escono se sono negativi. Quindi il numero di imprese di equilibrio è determinato dalle precedenti condizioni del primo ordine e dalla condizione di profitto nullo: = y(he(w,m,z)) (w + m)h = 0
(8.13)
dove è un dato costo per periodo di fattori di produzione fissi (unità di capitale) e h,e,m,w soddisfano le condizioni del primo ordine di cui sopra. Osserva che z (la sola variabile insieme a in eq. (8.13) che non è determinata dalle precedenti condizioni del primo ordine), è ora rappresentata come endogena. Ma com'è determinata z ? La posizione di riserva del lavoratore. Per alcuni valori di e e w , abbiamo v(e,w) = z , così che il lavoratore è indifferente tra il suo lavoro - che implica fornire
impegno e e ricevere un salario w - e la migliore delle sue alternative, cioè z . In questo modo il vincolo di partecipazione del lavoratore è soddisfatto come un’uguaglianza. Possiamo vedere dall'equazione (8.5) che in questo caso deve valere u = 0 (il livello di impegno scelto quando la rendita da lavoro è zero è quello per il e
quale la la disutilità del lavoro è zero). Di conseguenza l'utilità della transazione (e,w) è l'equivalente z espresso in termini di flusso per periodo, cioè u(e,w) = iz . Il livello di impegno e è quindi l'ammontare di lavoro per ora che il lavoratore avrebbe scelto di fare in assenza di qualsiasi strategia di incentivo messa in atto dal datore di lavoro. Ma cosa è z ? Se si assume il lavoro come omogeneo, il salario atteso del lavoratore in lavori alternativi dovrebbe essere lo stesso dell'occupazione corrente, quindi il costo di essere licenziato è la riduzione in benessere provocata da un
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|17
periodo di inattività. Un lavoratore licenziato trascorrerà il periodo successivo disoccupato, ricevendo un sussidio di disoccupazione (o altri trasferimenti di sostituzione del reddito da lavoro) uguale a b senza lavorare (e presumibilmente impegnandosi nella ricerca di occupazione). Il disoccupato di conseguenza matura un 'utilità per periodo uguale a u(b,0) che può riflettere l'utilità del tempo libero, lo stigma sociale dell'essere senza lavoro e via dicendo. Alla fine di ogni periodo esiste una probabilità che un lavoratore disoccupato trovi lavoro e così esca dal gruppo dei disoccupati; quindi la durata del periodo di disoccupazione è 1/ . Quindi, u(b,0) + v + (1 )z 1+i u(b,0) + v = i +
z=
Questa rappresenta la rendita di riserva definita nello stesso modo che il valore attualizzato del lavoro. Notiamo che dz / d > 0 se v z > 0 , che a sua volta richiede che iv u(b,0) > 0 . Questo significa che un incremento nella probabilità di essere assunto accresce la posizione di rendita del lavoratore nella misura in cui il beneficio per periodo di avere un lavoro (iv) sia maggiore del beneficio per periodo di non averne (u(b,0)) . Statica Comparata. Ricorda che (w + m) /e = μ è il costo di una unità di impegno. Dato che un incremento nella posizione di rendita del lavoratore sposta la sua funzione di risposta ottima sulla destra, si può facilmente dimostrare che d/dz>0, che vuol dire che il costo unitario dell'impegno varia con z, cioè, d/dz y(h) . Inoltre dato che (H) è monotona l’equilibrio è unico.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|19
Supponiamo che i lavoratori membri siano identici, così che il sindacato semplicemente implementa l'unanime decisione dei suoi associati. Inoltre, ipotizziamo che l'informazione dei membri sull'operato di ciascuno permetta di usare una supervisione reciproca per implementare un livello comune di impegno. Questo significa che la transazione non è più vincolata dalle funzioni di risposta ottima dei lavoratori e quindi i risultati di equilibrio possono includere coppie {w,e} al di sopra della funzione di risposta ottima a condizione che il sindacato e il datore di lavoro riescano a raggiungere un accordo. Il resto della transazione come descritta in precedenza resta inalterata. In particolare, la funzione di licenziamento rimane in vigore e l'imprenditore determina il livello di occupazione nel modo già visto, cioè, uguagliando il prodotto marginale dell'impegno al suo costo effettivo. Ovviamente, il sindacato può negoziare sul tipo di supervisione, la funzione di licenziamento e il livello di occupazione, ma introdurre queste complicazioni non chiarirebbe il punto centrale di quello che segue. Riconoscendo la possibilità di un miglioramento Paretiano rispetto all'equilibrio competitivo {w*,e*}, il datore di lavoro e il lavoratore promettono di offrire rispettivamente { w > w *} e { e > e *} dove { w ,e } è un miglioramento Paretiano rispetto all'equilibrio di Nash non cooperativo {w*,e*}. Ogni coppia +
+
+
+
+
+
{ w ,e } nella regione dei miglioramenti Paretiani in figura 8.1 può rappresentare una
transazione come quella appena illustrata. Le due parti sono impegnate in una negoziazione nella quale i possibili esiti sono rappresentati dalla regione dei miglioramenti Paretiani e la cui frontiera è il luogo dei contratti efficienti. Il punto di partenza della negoziazione non è rappresentato dal risultato del rifiuto della transazione da parte delle due parti, ma piuttosto dal livello di transazione non cooperativo e Pareto inferiore costituito da {w*,e*}. Il problema della negoziazione, con i rispettivi guadagni per periodo, è illustrato in figura 8.4. Se fosse possibile ideare un accordo vincolante per implementare le due offerte +
+
+
+
w e e ci aspetteremmo che un risultato del tipo { w ,e } fosse abbastanza comune
almeno là dove i lavoratori fossero in grado di rendere effettiva la supervisione reciproca e a negoziare collettivamente con i datori di lavoro. In ogni caso, potrebbe essere impossibile rendere vincolante un tale accordo. Come spesso avviene, il datore di lavoro potrebbe non essere capace di identificare violazioni del livello di impegno contrattato solo osservando il livello aggregato di produzione se, ad esempio, fossero presenti altri fattori non osservabili che influenzano la produzione. Se non fosse possibile scrivere un contratto che vincoli le parti all'accordo, il datore di lavoro e il sindacato potrebbero essere capaci di implementare un miglioramento Paretiano adottando strategie di cooperazione condizionale: in ogni periodo ognuno mette in
20 | MICROECONOMIA
+
+
atto la propria parte della transazione Pareto superiore { w ,e } a condizione che l'altro abbia fatto lo stesso e devia sull'equilibrio Pareto inferiore { w*,e * } solo se l'altro ha deviato ( un "occhio per occhio" benevolo). Anche se queste strategie possono sembrare astratte, varianti di esse sono spesso osservate. Non è affatto raro per i sindacati minacciare lo "sciopero bianco" - cioè l'esecuzione solo delle mansioni esplicitamente menzionate nel contratto - mentre, d'altro canto, gli imprenditori spesso condizionano maggiori retribuzioni a cambi di regole che garantiscano livelli di impegno più alti. Si supponga che l'insieme delle azioni possibili siano ristrette rispettivamente a +
+
{ e*,e } per il sindacato e { w*,w } per il datore di lavoro e che le strategie a loro
disposizione siano di non cooperare senza condizioni o di cooperare condizionatamente (occhio per occhio benevolo) così come appena descritto. In realtà, sarebbero possibili molte altre strategie, ma questo insieme ridotto è sufficiente ai nostri fini. Usando la notazione di cui sopra, i valori attualizzati degli esiti attesi per i due negoziatori sono indicati nella tabella 8.1. Considera l'esito atteso del sindacato che adotti incondizionatamente e* se l'impresa offre condizionatamente w . Nel primo periodo ogni lavoratore riceve +
l'utilità per periodo corrispondente a ricevere un alta paga avendo lavorato poco +
u(e*,w ) e di essere poi licenziato con probabilità t(e*) , ricevendo la rendita di
riserva z come risultato, o di non esserlo con probabilità 1 t(e*) . Tuttavia nei periodi successivi il lavoratore riceverebbe gli esiti corrispondenti all'equilibrio non cooperativo (dato che l'impresa devia in risposta all' azione del sindacato e*). Gli altri esiti in tabella 8.1 possono essere interpretati in modo simile. Profitto del Datore di lavoro
Curva contratto efficiente
(e,w)
Utilità del Lavoratore,
u(e,w)
Figura 8.4. Il problema di negoziazione di impresa e sindacato: i rispettivi guadagni per periodo. Nota: l'area di negoziazione è la regione
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|21
delimitata dagli esiti nella interazione non cooperativa e dal luogo dei contratti efficienti. Se le strategie disponibili fossero {w+,w*} senza condizioni da parte del datore di lavoro e {e+,e*} senza condizioni per il lavoratore, il gioco sarebbe un dilemma del prigioniero. Il punto a è l'equilibrio del gioco non cooperativo (indicato dal punto a in figura 8.1) mentre il punto b è un punto sulla curva dei contratti efficienti (indicato dal punto b nella figura 8.1). Tavola 8.1. I Valori attualizzati degli esiti attesi nel gioco di negoziazione ripetuta. Datore di Lavoro Sindacato Condizionale
Condizionale
Non condizionale
u(e ,w ) iz v = +z i + t(e ) (w ,e ) = i u(e*,w ) + (1 t(e*))v * +t(e*)z 1+i (e*,w ) + * 1+i
u(e ,w ) + (1 t(e ))v * +t(e )z 1+i (e ,w*) + * 1+i v* = (e*,w*,z) (w*,e*) * = i
+
+
+
+
+
+
+
+
Non condizionale
+
+
+
+
+
+
Dato che v > v *, per un i sufficientemente piccolo può essere dimostrato che la strategia condizionale e è la risposta ottima alla strategia condizionale w . Il guadagno di un periodo per il lavoratore costituito da una paga alta per un livello basso di lavoro { e*,w } è più che compensato dalla differenza tra v e v * (e dalla più +
+
+
+
+
grande probabilità che il membro del sindacato che attua e * sia licenziato al termine del periodo e che quindi riceva z ). Allo stesso modo, per un livello sufficientemente basso di i, la strategia condizionale w sarebbe la risposta ottima alla strategia condizionale e . Quindi, l'esito { w ,e } è implementabile sotto certe condizioni. +
+
+
+
Naturalmente se il guadagno di un singolo periodo ottenuto interrompendo la cooperazione fosse grande abbastanza, o la probabilità di non essere licenziato piccolo a sufficienza, l'equilibrio cooperativo non sarebbe implementabile come equilibrio di Nash. Questa interazione stilizzata - la negoziazione di un esito cooperativo Pareto superiore rispetto all'equilibrio non cooperativo di partenza - cattura importanti evidenze empiriche delle relazioni nel mercato del lavoro. Spesso si possono osservare ambienti di lavoro sia cooperativi che non cooperativi (a volte anche altamente conflittuali) non solo nella stessa industria ma addirittura in differenti unità produttive della stessa impresa5. Tipicamente, la soluzione cooperativa è più probabile in grandi imprese che 5
Lo stesso modello ha una generale valenza in altri tipi di collaborazioni come ad esempio i matrimoni (Lundberg e Pollak 1993), nei quali sono spesso osservati sia esiti cooperativi che non cooperativi.
22 | MICROECONOMIA
dispongono di forza lavoro sindacalizzata. Il mercato del lavoro in queste imprese è chiamato talvolta mercato del lavoro primario, caratterizzato da occupazione stabile, percorsi di avanzamento di carriera ben definiti, rari licenziamenti per giusta causa e una divisione dei guadagni derivanti dalla cooperazione tra lavoratori e datori di lavoro. Negli altri settori dell'economia (spesso caratterizzati da occupazione precaria, contenute aspettative di carriera e bassi salari) dove è più facile osservare l'esito non cooperativo costituiscono il mercato del lavoro secondario. Queste differenze sono evidenti nell'esempio di negoziazione precedente dal fatto che t(e ) < t(e*) e dai +
maggiori guadagni distribuiti derivanti dalla cooperazione > * e v > v *. Seguendo questa interpretazione, una pura disciplina del lavoro si applicherebbe al mercato del lavoro secondario, mentre un modello ibrido costituito da una negoziazione rispetto all'esito di partenza non cooperativo e inefficiente, meglio descriverebbe il mercato del lavoro primario6. +
+
Come può la struttura di un'economia incentivare la cooperazione? Nota che la probabilità di essere licenziato ha lo stesso effetto del tasso di preferenza temporale. Se il licenziamento fosse probabile ( t è alto) l'esito cooperativo sarebbe difficile da sostenere. Consideriamo una funzione di licenziamento più realistica nella quale considereremo sia la probabilità di essere licenziato per giusta causa, t(e) , sia la probabilità di licenziamento per altre ragioni (per esempio, fluttuazioni della domanda o il riposizionamento dell'impresa). La tabella dei valori degli esiti, modificata per tener conto di licenziamenti che non dipendono da cause legate direttamente alla scelta del livello di impegno dei lavoratori, semplicemente mostra un aggiunto alla funzione t(e) lì dove quest'ultima appare nella tabella 8.1. Diventa così chiaro che alti livelli di licenziamenti non dipendenti dal livello di impegno rendono più difficile sostenere l'esito cooperativo. Di conseguenza, miglioramenti Paretiani basati su scambi "salario-per-impegno" sono più probabili laddove coesistano due tipi di istituzioni: sindacati con la capacità di negoziare con i datori di lavoro e di implementare supervisione reciproca, da un lato, e politiche macroeconomiche che attenuino la volatilità della domanda aggregata dall'altro. Questo è un esempio di complementarietà istituzionale, una situazione nella quale i benefici di una istituzione sono accresciuti dalla presenza dell'altra. (Ritorneremo sulle complementarietà istituzionali nel capitolo finale.) Dove le complementarietà istituzionali sono forti ci aspetteremo di vedere o la coesistenza di un’efficace 6
Un’interpretazione alternativa offerta da Bulow e Summers (1986) spiegherebbe i salari alti del mercato del lavoro primario derivanti da un’applicazione del “salario di efficienza” solo in quel mercato e non in quello secondario che risulterebbe caratterizzato da un equilibrio in corrispondenza di salari bassi. Comunque, in presenza di alti livelli di disoccupazione involontaria tra gruppi demografici in cerca di lavoro nel mercato secondario, la loro interpretazione sembra quantomeno dubbia.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|23
negoziazione collettiva e un'efficace stabilizzazione macroeconomica o l'assenza di entrambe.
PERCHÉ
L E I M P R E S E N O N V E N D O N O L AV O R O ?
Potrebbe esistere un modo molto più semplice non solo per raggiungere un miglioramento Paretiano rispetto all'esito non cooperativo, ma anche per implementare un esito Pareto-efficiente. Il risultato chiave nella precedente dimostrazione della Pareto inefficienza è nel fatto che il vincolo di partecipazione del lavoratore non è soddisfatto come un'uguaglianza e per questo egli riceve quello che abbiamo chiamato una rendita incentivante. Perché dovrebbe essere così? Il datore di lavoro potrebbe non aver visto un'occasione per accrescere i profitti? L'impresa, sapendo che il lavoratore riceverebbe un sostanziale aumento nel valore attuale dell'essere occupato, non potrebbe richiedere semplicemente un pagamento per la garanzia del posto di lavoro (Carmicheal 1985)? Se l'impresa sfruttasse questa opportunità, il lavoratore potrebbe ripagare un’ammontare pari a v*-z* e di conseguenza, avendo pagato questa "tassa" sul lavoro, sarebbe indifferente tra accettare il lavoro o meno, ma, soprattutto, non sarebbe indifferente a perderlo. Vediamo come questo avviene. La tassa per il lavoro da considerare è un trasferimento eseguito in un unico periodo, non rimborsabile, richiesto dal datore di lavoro come condizione per l’offerta di un posto (a volte questo trasferimento è stato erroneamente chiamato obbligazione). Ipotizziamo che la ricchezza totale di un lavoratore sia v+k dove, come prima, v è il valore del posto di lavoro e k è costituito da altra ricchezza e che la tassa non abbia alcun effetto marginale sul comportamento del lavoratore. Dato che il lavoratore finanzia la tasse sul lavoro dall'ammontare di ricchezza k, il pagamento ne riduce semplicemente l'ammontare. Inoltre, la funzione di risposta ottima del lavoratore rimane inalterata a causa dell'assenza di effetti di sostituzione. Ipotizziamo ancora che il datore di lavoro incontri effettivamente dei vincoli (per ragioni legate alla reputazione) nell’adottare strategie opportunistiche, come ad esempio licenziare i lavoratori per trarre vantaggio dal pagamento della tassa proveniente dai nuovi assunti. Il costo per il lavoratore di ridurre la propria ricchezza di un euro è equivalente alla riduzione di un euro di ricchezza v. Dato che h è il numero di lavoratori assunti, questo rappresenta anche il numero di pagamenti raccolti. Per semplificare l'esposizione astrarremo interamente dagli effetti e dai costi della supervisione (e è conosciuto dal datore di lavoro ma l'informazione non è verificabile).
24 | MICROECONOMIA
Il datore varia h,w e B per massimizzare = y(he(w)) hw + iBh
(8.14)
soggetta al vincolo v(e(w),w iB) z
dove i è il tasso di rendimento, B è l'ammontare del pagamento richiesto e v(.) è il valore attualizzato ex ante del posto di lavoro tenendo conto della tassa da pagare B. Il termine w-iB è il salario netto, tenendo conto del costo opportunità dei
rendimenti iB sostenuto dal lavoratore sulla sua ricchezza. La Lagrangiana associata al problema di massimizzazione è data da r = y(he(w))-hw + iBh - {v(e(w), w-iB) - z}
dalla quale si ottengono le seguenti condizioni del primo ordine: r r r r
w
h
B
= y' he' h + (v + v e') = 0 = y'e w + iB = 0 = ih iv = 0 =v z =0 w
e
w
(8.15a) (8.15b) (8.15c) (8.15d)
Dalla (8.15b) possiamo determinare il livello di occupazione che uguaglia il prodotto marginale dell'impegno y con il costo di un'ora di lavoro (w-iB) per unità di impegno oraria, o il costo di un'unità di impegno, cioè (8.16)
y' = (w-iB)/e
Il coefficiente Lagrangiano è interpretato come il prezzo ombra del vincolo di partecipazione e dall'equazione 8.15 possiamo scriverlo come: (8.17)
= -dr/dz = h/vw
L'equazione (8.17) rappresenta l'effetto sui profitti di una variazione della posizione di riserva del lavoratore, cioè l'incremento in salario necessario a soddisfare il vincolo di partecipazione del lavoratore ( 1/ v ) volte il livello di occupazione. w
Inoltre, possiamo vedere che per livelli di occupazione positivi e valendo l'ipotesi di non sazietà ( v > 0 ) >0, il vincolo di partecipazione risulta effettivo. w
Eliminando h dalla (8.15a) e sostituendo nella precedente espressione per abbiamo y'e' 1 = 1
e' v v w
e
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|25
che dopo qualche semplice passaggio diventa y' =
v v
(8.18)
e
w
Combinando le equazioni (8.16) e (8.18) abbiamo (w iB) v = e v
e
(8.19)
w
che implica l'uguaglianza tra il costo di una unità di impegno sopportato dall'impresa (il lato sinistro dell'uguaglianza) e (l'opposto) del tasso di sostituzione tra salario ed impegno sulla curva "iso-valore-attuale" del lavoratore (il lato destro). Il problema e la sua soluzione possono essere interpretati come segue. In figura 8.5, l'asse orizzontale rappresenta sia il salario ricevuto dal lavoratore, w, che il costo del salario pagato dal datore di lavoro, w-iB. L'imprenditore identifica la iso-v curva per la quale v=z (dato che lui sa che il vincolo di partecipazione sarà effettivo). Lungo questa curva c'è qualche punto (a) che massimizza la pendenza di una semiretta che parte dall'origine, misurata da e/(w-iB) che di conseguenza soddisfa l'equazione (8.19). Questo punto non essendo sulla curva della funzione di risposta ottima, è ovviamente non ottenibile direttamente: offrire il salario w*-iB* non indurrebbe il lavoratore a fornire l'impegno e*. Il salario è determinato per questo al livello sufficiente ad indurre il lavoratore ad impegnarsi al livello e*. E il livello del pagamento richiesto fissato è quello che implementa il punto a, soddisfacendo il vincolo di partecipazione come un'uguaglianza. Con w,B e e determinate, h* è determinato dall'equazione (8.15b). Il datore di lavoro a questo punto verifica se in equilibrio sarebbe più remunerativo non assumere nessuno e/o se il lavoratore sia soddisfatto. Se non si verifica nessuno dei due casi allora l'ipotesi che il vincolo di partecipazione sia effettivo è positivamente è dimostrata. L'equilibrio in presenza della tassa sul lavoro è sorprendentemente diverso dal caso precedente. Primo, dato che il vincolo di partecipazione è effettivo, il lavoratore è indifferente tra accettare il lavoro o meno. Il mercato del lavoro è così in equilibrio; non ci sono lavoratori involontariamente disoccupati. Questo risultato sottolinea un'importante limitazione dell'equilibrio sul mercato del lavoro come obiettivo della politica economica: se i lavori fossero resi sufficientemente sgradevoli potrebbe non esserci eccesso di domanda. Secondo, mentre le rendite ex ante (prima di accettare il lavoro) sono zero, le rendite ex post sono effettivamente più grandi che in assenza di tassa sul lavoro (per un dato z, il salario ottimale è più alto, come se fosse fissato non solo per indurre l'impegno ma anche per accrescere il valore del pagamento che può essere richiesto al futuro lavoratore). Terzo, la ricchezza del lavoratore è ridotta e i
26 | MICROECONOMIA
profitti del datore sono accresciuti. In equilibrio generale l'effetto sarebbe stato quello di accrescere il numero delle imprese e il livello di occupazione (fino a che z non fosse salito abbastanza da ristabilire la condizione di profitto nullo). Questo modello sembra predire che un pagamento a fronte di un posto di lavoro sarebbe un' istituzione comune (l'ammontare non sarebbe trascurabile) e che la disoccupazione involontaria sarebbe rara. Ma poche imprese chiedono un tale pagamento, mentre surrogati di questo come un salario di prova inizialmente molto basso, raramente sono della grandezza che renderebbe il lavoratore indifferente tra accettare il lavoro o meno7.
Impegno
Salario Figura 8.5. Pagamenti ottimali per il posto di lavoro garantiscono il raggiungimento dell'equilibrio sul mercato del lavoro e implementano un ottimo Paretiano. Il datore di Lavoro identifica il punto a come soluzione che massimizza e/w, l'impegno ottenuto dal lavoratore per unità di costo. Per implementare questo risultato il datore di lavoro offre il salario w* (al quale il lavoratore risponde con e*) con un pagamento pari a B*.
Questo significa che gli imprenditori semplicemente non approfittano di un'opportunità vantaggiosa? Perché questo non accade? Dire che i futuri lavoratori non hanno sufficienti risorse per pagare per un posto di lavoro non è una risposta soddisfacente. La ricchezza limitata del lavoratore semplicemente restringe le somme che possono essere chieste ma non confuta la logica dell'argomento, che ugualmente predirebbe pagamenti ottimali e quindi equilibrio nel mercato del lavoro. Una 7
Negli Stati Uniti, lavori che garantiscono rendite alte, tipicamente sono offerti sia a principianti che a lavoratori esperti, il che fa sorgere dubbi sull'interpretazione dei salari inizialmente bassi come costo del lavoro implicito per il lavoratore. Questi pagamenti possono assumere forme non monetarie, come ad esempio nel caso che un datore di lavoro si assicuri il supporto politico del futuro lavoratore o usi la sua posizione di potere per estorcere favori sessuali.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|27
spiegazione più convincente è che motivazioni positive del lavoratore nei confronti del datore di lavoro sono importanti nell'indurre lavoro di alta qualità e alti livelli di impegno. Queste motivazioni sono indebolite da un imprenditore che mette in atto la più dura negoziazione possibile. Due tipi di evidenza supportano questa interpretazione. Primo, gli imprenditori sono riluttanti a tagliare i salari durante i periodi di alta disoccupazione, apparentemente per ragioni legate alla morale e alle motivazioni del lavoratore. Truman Bewley (1999) cercò di capire la riluttanza dei datori di lavoro ad approfittare attraverso un taglio dei salari del declino della rendita di riserva dei lavoratori durante le recessioni. Le sue numerose interviste hanno mostrato che gli imprenditori temono l'effetto dei tagli dei salari sull'opinione dei lavoratori. La ragione per la quale i datori di lavoro si astengono dall'abbassare i salari durante le recessioni potrebbero valere con almeno altrettanta forza per il fatto che la maggior parte di loro non chiede pagamenti in cambio di posti di lavoro, anche se le rendite associate ad un tale comportamento fossero alte. Secondo, come abbiamo visto nel precedente capitolo, soggetti in mercati del lavoro sperimentali tipicamente esibiscono preferenze fortemente reciproche, fornendo alti livelli di impegno in risposta alle offerte dell'imprenditore che sembrano essere generose (Fehr, Kirchsteiger, and Riedl 1998). Quando posti di lavoro a pagamento erano tra le possibili strategie che sono state adottate dal datore di lavoro, queste sono state abbandonate dai soggetti partecipanti agli esperimenti perché i profitti sono scesi come risultato della risposta negativa dei lavoratori. Un'ulteriore ragione per la quale posti di lavoro a pagamento sono rari può essere che i futuri lavoratori non credano che effetti di reputazione o diritti fondamentali bastino ad evitare che gli imprenditori licenzino i lavoratori senza giusta causa per accrescere il numero di pagamenti riscossi. Il fatto che posti di lavoro a pagamento siano rari è qualche volta preso come indicazione che il modello di disciplina del lavoro sopra esposto sia di poca rilevanza empirica, ma, come sopra argomentato, quando si estende il modello per includere i tipi di preferenze sociali descritti nel terzo capitolo, questo risulta consistente con il fatto che posti di lavoro a pagamento siano effettivamente rari. L'interpretazione più plausibile è che un'offerta di salario che produce una rendita da lavoro ex-post può essere vista dal lavoratore sia come un segnale della generosità del datore di lavoro sia semplicemente come una strategia di massimizzazione del profitto (la prima se non è accompagnata da una richiesta di pagamento a fronte dell'offerta, mentre la secondo se lo è). Di conseguenza, richiedere un pagamento a fronte di un posto di lavoro
28 | MICROECONOMIA
influenza l'opinione del lavoratore circa le intenzioni (o il tipo) dell'imprenditore ed a quest’ultima egli adatta il proprio comportamento. Quest’interpretazione sottolinea l'importanza di considerazioni circa l'onestà e la morale nella fissazione dei salari e identifica l'occupazione come una sorta di scambio di doni (Akerlof 1982).
DISCIPLINA E M P IR IC A
DEL
L AV O R O
ED INCENTIVI:
E V ID E N Z A
Ci sono molti plausibili modelli del mercato del lavoro che hanno migliorato le assunzioni fatte nei classici modelli Walrasiani, dunque perché concentrarsi su questa classe particolare di modelli? La ragione più importante è che il modello della disciplina del lavoro basato su rinnovo condizionale è consistente con diverse evidenze indiscusse del funzionamento dell'economia (mentre il modello convenzionale non lo è). La prima è l'esistenza di sostanziali rendite da occupazione in molti lavori. Non si può pensare di tener conto di tutti gli aspetti connessi con la percezione di reddito semplicemente valutando i livelli di reddito degli occupati e dei non occupati, dato che i due gruppi differiscono per molti altri aspetti e non per il solo status. La misura teoricamente più appropriata è la tipica perdita da parte del lavoratore di benefici e altri proventi derivanti da un periodo di disoccupazione involontaria come nel caso della chiusura di una fabbrica. Henry Farber (2003:2), passando in rassegna l'abbondante letteratura sul tema, ha concluso che "i lavoratori licenziati soffrono di significativi periodi di disoccupazione e che i proventi da lavoro dopo il licenziamento sono sostanzialmente più bassi di quelli prima del licenziamento". Questa conclusione rimane valida anche durante il periodo di forte domanda di lavoro degli anni ‘90. Negli Stati Uniti, il costo della perdita del lavoro (una stima del valore attuale di (v-z) usando un tasso di preferenza intertemporale del 10 percento) può oscillare tra una metà e una volta e mezza l'ammontare annuale dei guadagni, in funzione del periodo durante il quale il lavoro è stato mantenuto prima del licenziamento8. In termini soggettivi, le rendite possono essere considerevolmente più grandi a causa dello stigma sociale e di altri disagi riconducibili all'essere senza lavoro. Numerosi studi hanno documentato la perdita di benessere soggettivo (misurato da una serie di domande) associata con la perdita del lavoro o con l'essere senza lavoro. Uno studio (Winkelmann e Winkelmann 1998), usando dati panel che permettessero un confronto dello stesso individuo in differenti stati di occupazione, ha evidenziato 8
Questa approssimazione è basata su un calcolo che usa le stime di Faber. Vedi anche Burda e Mertens (2001).
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|29
che l'effetto soggettivo dell'assenza di lavoro in sè era molto più grande che il costo oggettivo associato alla perdita di reddito9. Ci possono essere lavori per i quali i lavoratori sono indifferenti tra continuare a lavorare o essere licenziati, come prevede il modello Walrasiano, ma l'evidenza empirica dimostra in modo schiacciante che la maggior parte dei lavoratori ha una forte preferenza per rimanere occupati. Secondo, i salari reali tendono a variare con il livello di occupazione (Bowles 1991, Blanchflower and Oswald 1994), come prevede il modello di regolamentazione dell'impegno. (Nel modello Walrasiano standard, per un dato stock di capitale, più occupazione dovrebbe abbassare il prodotto marginale del lavoro e quindi il salario.) Terzo, i datori di lavoro impiegano molto personale e altre risorse per monitorare il livello di impegno dei loro lavoratori, spese che sarebbero incompatibili con la massimizzazione dei profitti se il livello di impegno fosse invariante o soggetto a contratti enforceable senza costi. Quarto, l'impegno nel lavoro sembra essere abbastanza variabile ed è raramente soggetto a contratto. Mentre pagamenti collettivi sono una pratica comune, quelli al pezzo sono estremamente rari al di fuori dell'industria dell'abbigliamento e calzature (Petersen 1992). Quando, per esempio, un sistema di pagamento per installatori di vetri per auto negli Stati Uniti fu cambiato da salari orari a quote al pezzo, la produzione per lavoratore aumentò di quindici volte (Lazear 1996). Allo stesso modo, piantatori di alberi nella British Columbia assegnati casualmente al pagamento al pezzo hanno avuto una prestazione migliore del 20 percento dei piantatori casualmente assegnati al salario fisso (Shearer 2001). Queste risposte più generose a incentivi più alti suggeriscono che i lavoratori esercitano un controllo sostanziale sul loro impegno lavorativo. Perfino effetti più evidenti dell'incidenza degli incentivi all'impegno sulla produttività sono stati trovati in uno studio rigurdante contadini che lavoravano sotto contratti differenti. Laffont e Matoussi (1995) hanno rilevato che la produttività dei tunisini che lavoravano come dipendenti era la metà di quella che essi avevano quando lavoravano avendo pieno diritto al residuo (lavoro familiare). Gli individui erano il 50 percento più produttivi quando lavoravano sotto contratti a rendita fissa (e quindi avevano pieno diritto residuale sul risultato del prodotto del 9
Blanchflower and Oswald (1994) hanno stimato che il reddito addizionale richiesto per compensare il fatto di essere senza lavoro è di 60000 dollari, ma se questo viene basato su un confronto tra occupati e non rispetto a un grande numero di misure demografiche e non solo, può sovrastimare il costo soggettivo della perdita del lavoro (l'assenza del lavoro può essere una delle tante ragioni che rendono le persone infelici o persone geneticamente infelici possono essere disoccupate con più probabilità.)
30 | MICROECONOMIA
loro impegno) che quando lavoravano nel contesto dei più blandi incentivi all'impegno del contratto di mezzadria. Un inusuale studio longitudinale delle Filippine ha evidenziato che: I lavoratori evidentemente si impegnano maggiormente in presenza di uno schema di pagamento al pezzo o in un lavoro autonomo rispetto ad un lavoro con salario orario come dimostrato dal fatto che essi perdono più del 10 percento di massa corporea al netto del consumo di calorie quando lavorano sotto lo schema di pagamento al pezzo piuttosto che sugli appezzamenti di loro proprietà...Lo stesso lavoratore consuma il 23 percento (16 percento) di calorie in più per giorno quando è impiegato sotto uno schema di pagamento al pezzo (occupazione nella propria fattoria) che quando è impiegato a salario orario. (Foster e Rosenzweig 1994: 214)
Uno studio nel Regno Unito, usando osservazioni su attività di lavoro individuali, ha trovato che l'impegno lavorativo risponde fortemente a condizioni macroeconomiche come ci si aspetterebbe dal modello di regolamentazione dell'impegno e, in particolare, che più alti livelli di disoccupazione inducono più alte intensità di lavoro (Schor 1988). Uno studio di serie storiche negli Stati Uniti ha dimostrato che la produttività del lavoro varia fortemente con la grandezza delle rendite da occupazione, condizionatamente a movimenti del rapporto capitale lavoro, del livello di capacità di utilizzazione e altre variabili usuali nell'econometria della produttività (Bowles, Gordon e Weisskopf 1983). Ulteriore evidenza empirica suggerisce che questi effetti della disciplina del lavoro sono più forti nel mercato del lavoro secondario che nel mercato primario sindacalizzato e più forti nei paesi con sindacati più deboli. La rarità di licenziamenti per giusta causa non è un'evidenza contro i modelli di disciplina del lavoro: un’efficace strategia di disciplina potrebbe risultare in assenza di licenziamenti (come in Shapiro e Stiglitz 1984). Inoltre, anche se il licenziamento per giusta causa non è esplicitamente parte della strategia di displina del lavoro dell'imprenditore - come nei mercati di lavoro primario di molte economie europee i giudizi del datore di lavoro sull'impegno del lavoratore sono generalmente usati nella selezione per la promozione o sospensione, riproducendo efficacemente gli effetti del licenziamento per giusta causa come un incentivo per lavorare sodo. Alcuni di questi fatti possono essere spiegati dalla divisione della rendita, beni specifici rispetto ad una determinata transazione e altri modelli delle relazioni di lavoro introdotti nel capitolo 10. E' plausibile che un'adeguata comprensione dei mercati del lavoro e delle relazioni che in essi avvengono possa richiedere approcci ibridi che includono altri modelli non Walrasiani non sviluppati qui. Molte delle evidenze empiriche appena presentate sono consistenti con più di uno di questi modelli.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|31
C O N C L U S IO N E Lo stimolo per la maggior parte del nuovo lavoro teorico sui mercati del lavoro nasce da una disaffezione verso gli aspetti microeconomici dei modelli macroeconomici di occupazione aggregata e disoccupazione. I macroeconomisti sono stati tra i più prominenti recenti innovatori. Modelli basati sulla contrattazione incompleta dell'impegno o di altri aspetti dello scambio di lavoro hanno spiegato come un equilibrio competitivo potrebbe esibire disoccupazione involontaria, restringendo così il divario tra la teoria standard e l'osservazione empirica. In questo processo le teorie standard del mercato del lavoro e delle imprese sono state sostanzialmente trasformate. Robert Solow (1990) ha sintetizzato la direzione del cambiamento nel titolo del suo libro The Labor Market as a Social Institution e Arthur Okun (1981) ha catturato il nuovo ruolo chiave della fiducia e di altre preferenze sociali nel suo termine “the invisible handshake". L'importanza dei motivi di reciprocità e di altre preferenze sociali nello spiegare perchè le imprese non vendano posti di lavoro sottolinea la futilità del semplice introdurre contrattazione incompleta in uno schema Walrasiano altrimenti invariato. Gli esperimenti a cui abbiamo accennato nella penultima sezione del precedente capitolo suggeriscono che l'imcompletezza contrattuale amplifica il ruolo delle preferenze sociali nel determinare gli esiti di equilibrio. Tre implicazioni delle nuove teorie hanno destato meno attenzione. La prima è stata già menzionata nella discussione sulla scelta da parte dell’impresa dei fattori capitale quando l'impegno lavorativo non è oggetto di contratto. Se le difficoltà della supervisione dell'impegno differiscono rispetto a diverse tecnologie, la scelta della tecnologia sarà influenzata dalla natura del problema di disciplina del lavoro. Di conseguenza, aspetti della disciplina del lavoro come le norme prevalenti, la possibilità di accedere all'assicurazione da disoccupazione e altri fattori che determinano la scelta dell'impegno dei lavoratori, influenzano la profittabilità delle tecnologie alternative. Questo punto di vista contrasta con il modello standard nel quale la scelta delle tecnologie risponde alla scarsità dei fattori indicata dai prezzi corrispondenti. Oltretutto, pensare che istituzioni - l'impresa convenzionale, per esempio - possano essere spiegate da condizioni tecnologiche date esogenamente, è perlomeno dubbio. Una interpretazione più plausibile è che le tecnologie e le istituzioni coevolvano ed ognuna influenzi lo sviluppo dell'altra. Per esempio, quando negli anni 80, negli Stati Uniti, le compagnie di trasporti installarono computer a bordo dei propri camion, esse furono capaci di monitorare i loro autisti molto più efficacemente (Baker e Hubbard 2000). Registratori di percorso
32 | MICROECONOMIA
fornirono alle compagnie informazioni certe circa la velocità, i tempi di sosta e altri dettagli sull'impiego del camion che costituivano una fonte di conflitto di interessi tra l'autista e la compagnia. Succedeva che il costo di funzionamento del mezzo (pagato dalla compagnia) era crescente e convesso rispetto alla velocità di crociera: i camionisti preferivano andare ad una velocità maggiore di quella che minimizzava i consumi per permettersi soste più lunghe. Gli autisti che possedevano il camion, avendo il diritto al residuo ottenuto dai ricavi meno questi ed altri costi, internalizzavano di conseguenza la spesa per il carburante e il deprezzamento del bene, realizzando significativi risparmi. Per questa ragione, prima che fossero introdotti i registratori di percorso, i camionisti che operavano in proprio riuscivano a competere con successo con compagnie di trasporto su quelle tratte per le quali il conflitto di interesse tra autisti e compagnie era particolarmente forte. Usando i registratori di percorso, le compagnie furono in grado di scrivere contratti basati sulla velocità alla quale il camion doveva essere guidato e di dare agli autisti ulteriori incentivi a operare nell'interesse della compagnia. Diversamente da altri computer di bordo (come gli EVMSs, i sistemi di gestione elettronici del veicolo), i registratori di percorso non fornirono nessun miglioramento nel coordinamento tra vettori e mittenti, dato che l'informazione era disponibile solo dopo il completamento del viaggio. La sola funzione dei registratori è stata quella di rendere contrattabili aspetti del comportamento del guidatore che entravano in conflitto con gli interessi dell'imprenditore. Migliorando le opportunità contrattuali delle compagnie i registratori di percorso hanno avuto due effetti. Primo, essi hanno portato ad un significativo decremento della quota di mercato detenuta dai camionisti in proprio. Secondo, i camionisti che avevano a bordo i registratori guidavano più piano. Al contrario, la capacità degli EVMSs di garantire un migliore coordinamento tra vettore e mittente ha fatto abbassare i costi ma non ha avuto effetti particolari sulla distribuzione dei contratti o della proprietà nell'industria dei trasporti. In questo caso, una tecnologia è stata scelta perché ampliava l'insieme dei contratti possibili in modo da aumentare i profitti. Se le tecnologie sono endogene in questo senso, diventa difficile dare una definizione precisa del termine costi di transazione. Nel modello sopra sviluppato è chiaro che i costi di supervisione sono costi di transazione. Comunque l'equazione (8.7d) mostra che la volontà delle imprese di pagare per usare il fattore k è spiegata dal contributo che il fattore dà non solo alla produzione, ma anche alla disciplina del lavoro. I costi per usare il bene k sono costi di transazione? Se così fosse, quale frazione del costo del fattore k dovrebbe essere contata tra i costi di transazione invece che tra quelli di produzione? I costi dei registratori di percorso istallati sui camion erano costi di transazioni quasi
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|33
puri. Ma cosa dire degli EVMSs che come i registratori di percorso permettono contratti con incentivi più forti per i guidatori e migliorano anche enormemente la coordinazione tra cliente e impresa? La stessa ambiguità sorge rispetto il salario. Abbiamo visto che un aumento di salario accompagnato da una diminuzione nella supervisione potrebbe sostenere lo stesso livello di impegno lavorativo. Sembrerebbe strano chiamare la riduzione della supervisione una diminuzione dei costi di transazione e contemporaneamente registrare la crescita della spesa totale per il lavoro. Allora sono anche i salari dei costi di transazione? Queste ambiguità circa il significato del termine sembrano inevitabili e spiegano perché qui non abbiamo fatto uso dell'approccio dei costi di transazione. Una seconda implicazione dei nuovi modelli del lavoro è che, data la durata pluriennale del rapporto lavorativo, l'ambiente di lavoro è un luogo culturale nel quale il lavoratore forma le proprie preferenze e convinzioni. In questo i luoghi di lavoro non sono diversi da scuole e quartieri, visto che determinano chi incontra chi, cosa fare e con quale ricompensa associata a quale comportamento. Un esempio empirico suggerisce l'importanza di questi effetti. Per trenta anni, Melvin Kohn e i suoi collaboratori hanno studiato la relazione tra la posizione di un individuo nella struttura di comando sul posto di lavoro - rispetto al fatto di prendere ordini - e la valutazione individuale dell'autodeterminazione e indipendenza nei loro figli, così come la loro stessa flessibilità intellettuale e personale autodeterminazione. Essi hanno concluso che "l'esperienza di autonomia sul lavoro ha un profondo effetto sui valori, orientamenti e funzionamenti cognitivi di una persona".10 Il suo studio d'equipe di Giappone, Stati Uniti e Polonia (Kohn, Naoi, Schoenbach, Schooler and Slomczynsky 1990) ha portato a risultati che sono consistenti tra paesi: le persone che esercitano autonomia nel lavorare attribuiscono un alto valore all'autodeterminazione anche in altri campi della loro vita (inclusi l'educazione dei figli e il tempo libero) e sono meno propensi a credere nel fatalismo e a mostrarsi sfiduciati o privi di autostima. Kohn e i suoi coautori (1983:142) argomentano che "la struttura della società influenza il funzionamento psicologico individuale prevalentemente influenzando le condizioni della propria vita." Kohn conclude che "la semplice spiegazione che effettivamente rende conto di tutto quello che è conosciuto circa gli effetti del lavoro sulla personalità...è che i processi sono diretti: si apprendere dalle esperienze di lavoro e si estendono queste lezioni al di fuori della realtà lavorativa" (Kohn 1990:59). 10
Vedi Kohn (1969), Kohn, Naoi, Schoenbach, Schooler and Slomczynski (1990), Kohn and Schooler (1983) e Kohn (1990). La citazione è da pag.967 del lavoro coautorato del 1990. Questi studi tengono conto della possibilità che la personalità influenzi l'organizazzione del lavoro, piuttosto che il contrario.
34 | MICROECONOMIA
Dato che le dimensioni della personalità prese in considerazione da Kohn sono parte delle preferenze individuali che spiegano come le persone scelgano di crescere i loro figli, in che modo impieghino il tempo libero e simili decisioni, questa risulta essere una forte evidenza empirica sul fatto che le preferenze siano endogene rispetto all'organizzazione del lavoro. Una terza implicazione è che le norme che stabiliscono un salario giusto, l’etica del lavoro e le altre preferenze sociali non sono esogene, ma piuttosto evolvono in funzione del livello dei salari correnti, dell’impegno sul lavoro, e delle condizioni lavorative esattamente al pari delle influenze fuori dall'ambiente lavorativo. Una sostanziale discrepanza tra la norma sociale che prescrive il giusto salario e il salario di equilibrio, per esempio, può essere il frutto di un'erosione della norma o del buon esito di una azione collettiva dei lavoratori per migliorare la loro situazione. Non sappiamo cosa avesse in mente Henry Ford quando annunciò il giorno dei cinque dollari. Il fatto che, in seguito all'aumento, la produzione per ora lavorata crebbe più del doppio suggerisce che l'impegno dei lavoratori crebbe anch'esso in modo sostanziale. (Ford aumentò il livello di supervisione insieme al salario, così che la probabilità che il lavoro fiacco fosse tollerato scese senza dubbio.) Se l'accresciuto impegno dei lavoratori avesse costituito una risposta alla carota dell'apparente generosità di Ford (per esempio riducendo la disutilità dell'impegno nell'eq. (8.5)) o al bastone di una più stretta sorveglianza e rendite da lavoro più alte (facendo crescere il lato destro dell'eq. (8.5)), non lo possiamo dire.11
11
Raff (1988) pensa che il rafforzamento della sorveglianza è consistente con il modello della disciplina del lavoro, ma sembra che egli ipotizzi (implausibilmente) che la sorveglianza e il salario siano sostituti piuttosto che complementi nella strategia della disciplina del lavoro, contrariamente al ragionamento fin qui condotto.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|35
Riferimenti bibliografici Akerlof, G. A. (1982). "Labor Contracts as Partial Gift Exchange." Quarterly Journal of Economics 97(4): 543-569. Baker, G. and T. Hubbard (2000). Contractibility and Asset Ownership: On-Board Computers and Governance in U. S. Trucking. Cambridge, MA, National Bureau of Economic Research, W7634. Bewley, T. F. (1999). Why wages don't fall during a recession. Cambridge, Harvard University Press. Blanchflower, D. G. and A. J. Oswald (1994). The Wage Curve. Cambridge, MA, MIT Press. Bowles, S. (1991). The Reserve Army Effect on Wages in a Labour Discipline Model: U.S., 1954-1987. Making Economies More Efficient and More Equitable: Factors Determining Income Distribution. T. Mizoguchi. Oxford, Oxford University Press: 385-406. Bowles, S., D. Gordon, et al. (1983). "Hearts and Minds: A Social Model of U.S. Productivity Growth." Brookings Papers on Economic Activity(2): 381-450. Bulow, J. I. and L. H. Summers (1986). "A Theory of Dual Labor Markets with Application to Industrial Policy, Discrimination, and Keynesian Unemployment." Journal of Labor Economics 4(3): 376-414. Burda, M. and A. Mertens (2001). "Estimating Wage Losses of Displaced Workers in Germany." Labour Economics 8(1): 15-41. Carmichael, H. L. (1985). "Can Unemployment be Involuntary? The Supervision Perspective." American Economic Review 75(5): 1213-14. Coase, R. H. (1937). "The Nature of the Firm." Economica 4: 386-405. Coase, R. H. (1992). "The Institutional Structure of Production." American Economic Review 82(4): 713-719. Farber, H. (2001). Job loss in the United States, 1981-1999. Princeton University Industrial Relations Section. Fehr, E., G. Kirchsteiger, et al. (1998). "Gift Exchange and Reciprocity in Competitive Experimental Markets." European Economic Review 42(1): 134. Foster, A. and M. Rosenzweig (1994). "A test for moral hazard in the labor market: contractual arrangements, effort, and health." Review of Economics and Statisitcs LXXVI(2): 213-227. Kohn, M. (1969). Class and Conformity. Homewood, IL, Dorsey Press. Kohn, M. L. (1990). Unresolved Issues in the Relationship Between Work and Personality. The Nature of Work:Sociological Perspectives. K. Erikson and S. P. Vallas. New Haven, Yale University Press: 36-68. Kohn, M. L. and C. S. e. al. (1983). Work and Personality: An inquiry Into the Impact of Social Stratification. New Jersey, Ablex Publishing Corporation. Kohn, M., A. Naoi, et al. (1990). "Position in the Class Structure and Psychological Functioning in the U.S., Japan, and Poland." American Journal of Sociology 95(4): 964-1008. Laffont, J. J. and M. S. Matoussi (1995). "Moral Hazard, Financial Constraints, and Share Cropping in El Oulja." Review of Economic Studies 62(3): 381-399. Lazear, E. (2000). "Performance Pay and Productivity." American Economic Review 90(5): 1346 - 1361. Leibenstein, H. (1957). Economic Backwardness and Economic Growth. New York,
36 | MICROECONOMIA
Wiley. Lundberg, S. and R. Pollak (1994). "Noncooperative Bargaining Models of Marriage." American Economic Review 84(2): 132 - 137. Marx, K. (1973). Grundrisse: Foundations of the Critique of Political Economy. New York, Vintage. Okun, A. (1981). Prices and Quantities: A Macroeconomic Analysis. Washington, DC, The Brookings Institution. Petersen, T. (1992). "Payment Systems and the Structure of Inequality: Conceptual Issues and an Analysis of Salespersons in Department Stores." American Journal of Sociology 98(1): 67-104. Raff, D. M. G. (1988). "Wage Determination Theory and the Five-Dollar Day at Ford." The Journal of Economic History 48(2): 387-399. Schor, J. B. (1988). Does Work Intensity Respond to Macroeconomic Variables? Evidence from British Manufacturing, 1970-1986. Harvard Institute of Economic Research Working Paper. Shapiro, C. and J. Stiglitz (1984). "Unemployment as a Worker Discipline Device." American Economic Review 74(3): 433-444. Shearer, B. (2001). Piece Rates, fixed Wages, and Incentives: Evidence From a Field Experiment. Quebec, Universite Laval. Simon, H. (1951). "A Formal Theory of the Employment Relation." Econometrica 19(3): 293-305. Solow, R. (1990). The Labor Market as a Social Institution. Cambridge, UK, Basil Blackwell. Walras, L. (1954). Elements of Pure Economics. London, George Allen and Unwin (original publication date, 1874). Winkelmann, L. and R. Winkelmann (1998). "Why Are the Unemployed So Unhappy? Evidence From Panel Data." Economica 65(257): 1-15.
IX M ERCATI C REDITIZI , V INCOLI PATRIMONIALI , ED I NEFFICIENZA A LLOCATIVA
Gli Inglesi sono ancora imbevuti di tale dottrina, che è almeno discutibile, secondo la quale le grandi proprietà sono necessarie per il miglioramento dell’agricoltura, e sembrano ancora convinti che l’estrema ineguaglianza della ricchezza sia l’ordine naturale delle cose. Alexis de Tocqueville, Journeys to England and Ireland (1833-1835) Carichi sedici tonnellate e cosa ottieni? Sei di un giorno più vecchio e i debiti sono aumentati. San Pietro non chiamarmi [in cielo] perché non posso andarmene, Devo la mia anima al deposito dell'azienda. Merle Travis, “Sixteen Tons” (1947)
[Prestare denaro] è vantaggioso per coloro che fanno rispettare la propria autorità con il bastone. Harpal, un creditore a Palanpur
Nel sud degli Stati Uniti prima dell’Emancipation Act (1863) si riteneva che il cotone fosse il re. Ma non lo fu davvero fin dopo la Guerra Civile, quando il cotone ascese al trono tra le coltivazioni: in un quarto di secolo, successivo alla fine della schiavitù, la produzione del cotone aumentò del 50 per cento rispetto al grano (la principale coltura alimentare)1. Questa intensificazione della monocoltura del cotone fu sbalorditiva per gli osservatori del tempo poiché essa coincise con un leggero trend discendente del prezzo relativo del cotone rispetto a quello del grano. Inoltre, non ci furono cambiamenti nelle condizioni tecniche di produzione che avrebbero potuto compensare il movimento contrario del prezzo; infatti, durante questo periodo, la crescita dei raccolti di grano sembrava avere superato quella dei raccolti di cotone. Il passaggio dal grano al cotone non può essere nemmeno spiegato dai cambiamenti nell’offerta dei fattori: il Cotton South subì una seria penuria di lavoro a seguito della La prima epigrafe è tratta da Tocqueville (1958:72), la terza da Lanjouw e Stern (1998:552). 1 Questo resoconto è basato su Ransom e Sutch (1977).
2 | MICROECONOMIA
guerra, cosa che avrebbe dovuto spingere alcuni agricoltori ad abbandonare il cotone a favore del grano, una coltivazione a più bassa intensità di lavoro. Che cosa spiega, quindi, la crescente dominanza del cotone? Per dare risposta a questo interrogativo abbiamo bisogno di esaminare la struttura dei mercati creditizi locali. Per finanziare il ciclo di coltivazione, molti agricoltori – poveri mezzadri e locatari, per la maggior parte, molti di loro in precedenza schiavi – acquistavano cibo (incluso il grano), ed altre necessità, a credito, durante la stagione di crescita. Essendoci tipicamente un solo mercante in ogni località, il cibo e gli altri prezzi tramite cui gli agricoltori accumulavano debiti venivano gonfiati dal potere di monopolio del mercante-creditore. I prestiti erano ripagati alla fine della stagione, quando la coltivazione veniva venduta. La maggior parte degli agricoltori era troppo povera per precostituire una garanzia, così i mercanti-creditori assicuravano i loro prestiti per mezzo di una rivendicazione (diritto di ritenzione), in caso d’inadempimento, sulla coltivazione futura dell’agricoltore. Questo sistema di pegno sul raccolto secondo i suoi più importanti studiosi, Roger Ransom e Richard Sutch, favorì il cotone: Dal punto di vista del mercante, il cotone offriva maggiore sicurezza per questi prestiti rispetto alle colture alimentari. Il cotone era una coltivazione commerciale, che poteva essere venduta velocemente in un mercato ben organizzato; esso non era deperibile; era facilmente immagazzinato […] Per queste ragioni il mercante regolarmente esigeva che fosse piantata una certa quantità di cotone […] fu per la protesta globale degli agricoltori che i mercanti rurali proclamarono la loro disponibilità a negoziare il credito con la condizione che fosse piantato sufficiente cotone come garanzia. (Ransom e Sutch, 1977, p.160)
Il sistema di pegno sul raccolto, che divenne importante nel Sud della post emancipazione, fu una soluzione ingegnosa al problema di fornire credito ai soggetti poveri di beni beneficiari del prestito. Esso sostituì la promessa dell’agricoltore, non avente efficacia esecutiva, di ripagare il prestito nel futuro, con un’azione osservabile dal creditore prima della concessione del prestito, vale a dire, il fatto che il mezzadro avrebbe dovuto già piantare il cotone sul quale il mercante avrebbe avuto per primo una rivendicazione. Tenendo conto dei costi e dei prezzi relativi delle risorse delle due coltivazioni, Ransom e Sutch stimano che i produttori di cotone, che acquistavano grano a credito, avrebbero potuto vedere accresciuto il loro reddito del 29 per cento, spostando le risorse dal cotone al grano. Ma questo era impedito dal fatto che, poiché l’agricoltore aveva un piccolo patrimonio, avrebbe avuto bisogno di credito e, per la stessa ragione, il credito era condizionato al piantare cotone. Il risultato fu, secondo Ransom e Sutch che:
MERCATI CREDITIZI
|3
L’affittuario del sud non era né proprietario della sua terra né responsabile dei suoi affari […] le sue decisioni indipendenti erano limitate agli aspetti prosaici e umili dell’attività agricola. Le più grandi decisioni riguardo l’uso della terra, gli investimenti nella produttività dell’azienda agricola, la scelta della tecnologia, e la scala di produzione erano tutte prese da altri. (p.170)
Le peculiarità dei mercati creditizi aiutano anche a spiegare un enigma contemporaneo. La locazione abitativa incorre in inefficienze tipiche della relazione principaleagente studiata nei capitoli 7 e 8. Oltre un terzo delle famiglie statunitensi affitta la propria abitazione invece di acquistarne una (Savage, 1995). La manutenzione della proprietà e le azioni civili per accrescere la qualità dell’ambiente del quartiere, eseguite dal locatario, contribuiscono al valore della proprietà, per il proprietario, ma non possono essere specificate in un contratto esecutivo. Di conseguenza, gli affittuari hanno incentivo ad offrire troppo poca manutenzione ed a partecipare troppo poco al miglioramento dei servizi accessori. Le abitazioni occupate dai proprietari non risentono di questo problema di incentivi poiché la persona che esegue la manutenzione o le azioni civiche e il detentore del diritto sui benefici di queste azioni sono la stessa persona, ovverosia, il proprietario. Come fatto empirico, la proprietà dell’abitazione induce maggior cura della residenza e anche più alti livelli di partecipazione nelle attività di amministrazione locale (Glaeser e Di Pasquale, 1999; Verba, Scholzman, e Brady, 1995). Perché, allora, invece di acquistare la propria abitazione, più comunemente la si affitta, specialmente tra coloro con il reddito più basso2? La risposta è che i locatari non hanno accesso al credito ipotecario: nel 1993, solo il 13 per cento delle famiglie affittuarie potevano assicurarsi un prestito per comprare una casa a basso prezzo (una al decimo percentile, delle case ordinate per prezzo, nel quartiere di famiglia; Savage 1995). Il rimanente 87 per cento di locatari aveva troppo poche risorse, al netto del debito in sospeso, e troppo poco reddito per assicurarsi un mutuo convenzionale. La mancanza di patrimonio può impedire ai poveri di acquisire i beni che permetterebbero loro soluzioni più efficienti in presenza di problemi di incentivo, come nei precedenti casi agrario e locativo. In molti casi, inoltre, anche se fosse dato ai poveri il possesso delle risorse 2
Nel 1990, nella decima area urbana più grande degli Stati Uniti, tra le famiglie con bambini e con reddito annuale minore di $15,000, 82 per cento non era proprietario delle proprie case, mentre oltre 85 per cento delle famiglie con bambini e con reddito superiore a $50,000 erano proprietari (U.S. Census). Complessivamente, il 64 per cento delle famiglie americane nel 1993 risultavano essere proprietari della propria casa (Savage 1995).
4 | MICROECONOMIA
rilevanti, loro potrebbero decidere di non ritenerle. Un esempio ci chiarirà meglio questo punto. La redistribuzione della terra a piccoli conduttori, in Cile durante i primi anni ’70, ebbe l’intento di beneficiare i poveri, assegnando in parte la detenzione del diritto nelle mani dell’agricoltore e, di conseguenza, fornendo incentivi per un maggior investimento e impegno, inducendo livelli più elevati di produttività3. I trasferimenti di terra coincisero con una esplosione nel mercato della frutta esportata. Ma pochi dei beneficiari della riforma sulla terra ebbero il capitale per finanziare il lungo periodo di gestazione degli alberi da frutto, e il credito generalmente non era disponibile per i piccoli conduttori. Come risultato, solo pochi passarono dalla produzione alimentare a quella di frutta. Nello stesso tempo, il valore delle loro terre salì enormemente, come risultato dell’esplosione della frutta. Incapaci di trarre vantaggio dal prezzo favorevole, dai primi anni ’90 il 57 per cento degli originari 48,000 beneficiari vendette la propria terra. Il trasferimento di ricchezza ai poveri era stato compiuto, ma il riallineamento degli incentivi, predisposto dalla riforma sulla terra, era fallito a causa dei limiti di credito a cui erano sottoposti i poveri agricoltori (e molto probabilmente anche a causa della loro avversione al rischio nei confronti dei prezzi della frutta, altamente variabili). I tre esempi contrastano fortemente con l’idea di un mondo di contratti completi ed eseguibili senza costo. Nell’ambientazione Walrasiana, la ricchezza porta vantaggi quantitativi – determina la posizione del proprio vincolo di bilancio – ma tutti i partecipanti nell’economia sono esposti alle stesse opportunità contrattuali (e quindi agli stessi prezzi) indipendentemente dai loro possessi. I poveri sono vincolati a comprare meno dei ricchi, ma contrattano alle stesse condizioni. Al contrario, laddove i contratti nei mercati finanziari sono incompleti e non esecutivi, gli individui con poco reddito spesso non hanno accesso ad una classe di contratti che sono disponibili per i più abbienti oppure stipulano contratti sotto condizioni sfavorevoli. Le differenze di reddito, quindi, hanno effetti qualitativi, escludendo alcuni e rafforzando altri. La ragione più ovvia per cui la ricchezza influenza la forma contrattuale è spiegata dal fatto che solo gli individui con sufficiente reddito possono portare avanti progetti per proprio conto. 3
Questa relazione è basata su Carter, Barham, e Mesbah (1996) e Jarvis (1989).
MERCATI CREDITIZI
|5
Coloro che hanno un reddito sufficiente possono assegnare la detenzione del diritto ed il controllo sulle risorse a loro stessi, eliminano i costosi problemi di incentivo. Una seconda ragione, quindi, risiede nel fatto che la proprietà della ricchezza attenua i problemi di incentivo sollevati dall’incompletezza dei contratti nelle relazioni principale-agente. Gli agenti più ricchi hanno generalmente accesso a contratti superiori poiché la ricchezza dell’agente permette contratti che allineano più strettamente gli obiettivi dell’agente e del principale. L’agente che fornisce una garanzia o il capitale al suo progetto ha incentivi maggiori ad impegnarsi, ad adottare i livelli di rischio preferiti dal principale, a rivelare informazioni al principale, e ad agire in altri modi che accrescono gli interessi del principale ma che non possono essere assicurati in un contratto. Gli individui a basso reddito, per esempio, possono acquisire istruzione e altre forme di capitale umano a condizioni meno favorevoli dei ricchi e, come risultato, possono rinunciare a investimenti nell’acquisizione di conoscenza i cui i rendimenti privati e sociali superano i costi. Allo stesso modo, come abbiamo visto nel mercato immobiliare, chi detiene un patrimonio sufficiente risulta essere più spesso proprietario e quindi direttamente responsabile delle conseguenze delle azioni atte a migliorare la proprietà e il quartiere, mentre i meno abbienti sono, con maggiore probabilità, affittuari. Le differenze nel reddito si riflettono in opportunità contrattuali differenti; quelle disponibili ai più abbienti, con maggiore probabilità, includono incentivi che sostengono risultati efficienti, mentre non è così per i meno abbienti, inducendo di conseguenza svantaggi addizionali ai poveri. Come risultato, agli individui a basso reddito non è consentito portare avanti progetti che sono benefici da un punto di vista dell’efficienza sociale. Essi saranno vincolati a conseguire questi progetti su scala sub-ottimale, oppure saranno coinvolti in accordi contrattuali con strutture di incentivo sub-ottimali come per la locazione, la mezzadria, o il lavoro salariale. Nonostante siano coinvolti altri mercati finanziari, le principali problematiche analitiche sono meglio illustrate mediante il mercato del credito, l’argomento di questo capitolo. Cominceremo illustrando, tramite testimonianze, fino a che punto le persone sono vincolate dal credito. In secondo luogo, introdurremo il problema base degli incentivi sollevato dall’incompletezza del contratto tra il debitore e il creditore. Allora studieremo come la fornitura di capitale o garanzie da parte del debitore oppure la ripetizione dell’interazione su molti periodi può attenuare questi problemi di incentivo. La prossima sezione introduce la relazione debitore-creditore in un
6 | MICROECONOMIA
modello di equilibrio economico generale per mostrare perché potenziali debitori con poco reddito possano fallire nell’assicurarsi il finanziamento (o siano vincolati a finanziare solo piccoli progetti o a pagare alti tassi di interesse). Come i potenziali lavoratori nel mercato del lavoro nel capitolo 8, gli individui con basso reddito saranno limitati quantitativamente. Come risultato, i ricchi saranno capaci di finanziare (e così di eseguire) progetti più grandi e di qualità inferiore rispetto a progetti che i poveri sono capaci di finanziare, e per progetti identici i ricchi pagheranno un tasso di interesse minore. Un’importante conseguenza si basa sul fatto che i vincoli di ricchezza possono impedire l’esecuzione di progetti di qualità elevata, per cui, la distribuzione della ricchezza diventa rilevante per l’efficienza allocativa, contrariamente alla logica del Teorema Fondamentale e del teorema di Coase. Nella penultima sezione, studieremo le condizioni sotto le quali una distribuzione efficiente dei diritti di proprietà avviene attraverso uno scambio privato, e forniremo un esempio in cui una redistribuzione delle risorse “imposta” può generare effetti positivi sulla produttività che (a differenza dei trasferimenti di terra in Cile) sono sostenibili in un equilibrio competitivo.
V IN C O LI
DI
C R E D ITO : E V ID E N Z A E M P IR IC A
I vincoli di credito sono empiricamente importanti. Molta dell’evidenza empirica (esaminata in Jappelli 1990) è basata sulle fluttuazioni cicliche del consumo: l’opinione generale su queste stime afferma che circa un quinto delle famiglie statunitensi ha un vincolo di liquidità. Questo tende ad essere vero per le famiglie più giovani con livelli di ricchezza più bassi. Questi studi non considerano le attività di prestito degli individui e quindi sono in qualche modo indiretti. Testimonianze dirette si basano su storie vere di credito. Jappelli (1990) ha trovato che il 19 per cento delle famiglie statunitensi si è visto rifiutare richieste di credito da parte di istituzioni finanziarie; le risorse finanziarie di queste famiglie con limiti al credito erano il 63 per cento più basse delle famiglie non limitate. “I debitori scoraggiati” (coloro i quali non chiedono un prestito poichè si aspettano che venga rifiutato) hanno anche una minore ricchezza di coloro a cui il prestito viene effettivamente rifiutato. Un altro studio delle famiglie negli Stati Uniti (Gross e Souleles 2002) si basa sul fatto che i limiti della carta di credito sono spesso accresciuti automaticamente. Se il prestito aumenta in risposta a questi cambiamenti esogeni del limite del prestito, possiamo concludere che l’individuo sia
MERCATI CREDITIZI
|7
vincolato nel credito. Gli autori trovano che “l’aumento del limite del credito genera un aumento significativo ed immediato del debito” (p.181). Gross e Souleles valutano i limiti al credito in questo modo: E’ plausibile che la maggior parte del terzo delle famiglie senza carta di credito bancaria abbiano un vincolo di liquidità […]. Dei due terzi possessori di carta, oltre il 56 per cento che sta prendendo a prestito e paga alti tassi di interesse (in media il 16 per cento) può dirsi avere anche un vincolo di liquidità, poiché non ha accesso ad un credito meno costoso. Combinati con le famiglie senza carta di credito, la frazione di famiglie potenzialmente vincolate diventa pari a due terzi. (pp.152-3)
Altri studi sono basati sul modo in cui gli aumenti esogeni di ricchezza influenzano il comportamento economico. Blanchflower e Oswald (1998) scoprirono che un’eredità di $10,000 raddoppia la probabilità che un giovane britannico tipo crei una attività. In un altro studio britannico, Holtz-Eakin, Joulfaian, e Rosen (1994), trovarono che l’elasticità dell’attività professionale autonoma rispetto alle risorse ereditate era pari a 0.52, e che un’eredità induce l’attività autonoma ad accrescere considerevolmente la scala delle sue operazioni. Un altro studio (Black, Meza e Jeffreys (1996)) trovò che un aumento del 10 per cento nel valore del patrimonio immobiliare garantibile nel Regno Unito aumentò del 5 per cento il numero di avviamenti di nuove attività. Evans e Jovanovic (1989) notarono che tra i maschi bianchi negli Stati Uniti, i livelli di reddito sono una barriera al diventare imprenditori e i vincoli al credito limitano coloro che iniziano nuove attività alla capitalizzazione di solo 1.5 volte le loro risorse iniziali: “molti individui che iniziano un’attività autonoma devono fare i conti con un ostacolante vincolo di liquidità e di conseguenza usare un ammontare di capitale sub-ottimale per avviare le loro attività” (p.180). Uno studio sulle famiglie italiane afferma che coloro che non hanno preso a prestito poiché gli è stato negato o credevano gli sarebbe stato negato erano più probabilmente famiglie numerose e più povere con un capo famiglia disoccupato, di sesso femminile, scarsamente istruito e più giovane (Guiso, Jappelli, e Terlizzese 1996). Inoltre, paragonandole alle famiglie con minore probabilità di affrontare un vincolo al credito, le famiglie più povere, più giovani e con maggiore incertezza di fonti di reddito (per esempio, attività autonome piuttosto che pensioni) tendevano ad evitare la detenzione di attività rischiose in modo consistente il che è coerente, quindi, con la visione che gli individui con vincoli al credito godono di rendimenti attesi dagli investimenti più bassi. La gente povera di mezzi negli Stati Uniti ottiene spesso “prestiti giornalieri” a breve termine contro assegni a pagare. In Illinois, il tipico debitore a breve termine è una donna a basso reddito verso la metà dei trent’anni ($24,104 di reddito annuale),
8 | MICROECONOMIA
vive in una casa in affitto, prende a prestito tra i $100 e i $200 pagando un tasso di interesse medio annuale del 486 per cento (Vega 1999). Molti studi hanno mostrato che i produttori meno abbienti, nei paesi in via di sviluppo, posso essere completamente tagliati fuori dai mercati creditizi, dai contratti di lavoro oppure dai contratti di affitto della terra che impongono un impegno elevato. Come abbiamo visto nel capitolo 8, Laffont e Matoussi (1995), per esempio, mostrano che i vincoli finanziari limitano i tipi di contratti che i poveri Tunisini potrebbero intraprendere, riducendo sostanzialmente la loro produttività e quindi i loro redditi. Altri studi nei paesi a basso reddito mostrano che il valore netto influisce fortemente sull’investimento di una azienda agricola, e un basso reddito implica un più basso rendimento per la produzione agricola indipendente (Rosenzweig e Binswanger (1993)). Per esempio, Rosenzweig e Wolpin (1993) mostrano che gli agricoltori indiani poveri e a medio reddito avrebbero potuto accrescere in maniera sostanziale i propri redditi se essi non avessero avuto limiti al credito: non solo essi generalmente “sottoinvestivano” in beni produttivi, ma i beni che detenevano tendevano ad essere quelli che essi potevano vendere in tempi di bisogno (vitelli) invece che verso attrezzature altamente vantaggiose (pompe di irrigazione) che avevano uno scarso valore di rivendita. Allo stesso modo, Rosenzweig e Binswanger (1993) notano che una riduzione della deviazione standard nel rischio meteorologico (il tempo di arrivo della pioggia) aumenta i profitti medi di circa un terzo tra gli agricoltori indiani nel quartile del reddito più basso, cosa che non avviene di fatto per i più abbienti. Questa evidenza ci suggerisce che gli agricoltori più ricchi portano avanti strategie più rischiose con rendimenti attesi più elevati. La mancanza di assicurazione e l’accesso ristretto al credito per i poveri non solo riduce i redditi, ma accresce anche il livello di disuguaglianza tra i redditi associato ad un dato livello di disuguaglianza della ricchezza. Inoltre, la forte relazione inversa tra redditi individuali e tassi di preferenza temporale risulta consistente con l’ipotesi che i poveri sono vincolati al credito. Hausman (1979) stimò i tassi di preferenza temporale (U.S.) usando il trade-off implicito tra una spesa iniziale e i susseguenti costi di gestione in una gamma di modelli di condizionatori riferito ad un gruppo di acquirenti. (Per legge, i costi di funzionamento devono essere elencati assieme al prezzo). Egli trovò che, mentre gli acquirenti con reddito elevato mostravano tassi impliciti di preferenza temporale nell’intorno del tasso di base, gli acquirenti con
MERCATI CREDITIZI
|9
reddito inferiore alla media mostravano tassi cinque volte maggiori di questo (essi compravano i meno costosi ma con il più costoso dispositivo di gestione). Green, Myerson, Lichtman, Rosen e Fry (1996), utilizzando il metodo del questionario, stimarono i tassi di sconto (iperbolici) tramite rilevazioni su soggetti ad alto e basso reddito negli Stati Uniti. I tassi stimati per il gruppo a basso reddito risultavano quattro volte maggiori di quelli del gruppo con reddito superiore. Sia nello studio di Green (e altri) che in quello di Hausman, l’elasticità del tasso di preferenza temporale rispetto al reddito era approssimativamente pari a -1. Quindi, esistono considerevoli testimonianze che ci spingono a ritenere che chi detiene scarsa ricchezza sia vincolato nel credito e affronti opportunità sfavorevoli nei mercati finanziari e altre restrizioni riguardanti il tipo di contratti in cui è coinvolto. Le risultanti inefficienze allocative sembrano essere notevoli.
D E B I TO R I
E
C R E D ITO R I
La promessa di ripagare un prestito non è soggetta ad esecuzione forzata per due ragioni: il debitore può non disporre di fondi sufficienti per restituire quando il pagamento è dovuto, e la scelta del debitore di un livello di rischio per un progetto non è generalmente soggetta a contratti esecutivi. Un problema standard principaleagente sorge nel caso in cui un agente con insufficiente ricchezza abbia un progetto per il quale il livello di rischio viene scelto dall’agente stesso. Tratteremo adesso un esempio. Inizieremo con un caso (Robinson Crusoe) in cui non compare nessun fallimento di coordinamento poiché l’esecutore del progetto è ricco abbastanza per auto-finanziarsi. A questo esempio farà seguito un caso in cui il coordinamento avviene per ragioni differenti: assumiamo contrattazione completa. Questi due casi, come nell’esempio nel capitolo 4 dello sforzo lavorativo di Robinson, stabiliscono la base di riferimento per il raffronto con casi più realistici in cui gli esecutori dei progetti non siano sufficientemente ricchi da finanziarsi da soli e devono quindi chiedere a prestito, oppure casi in cui i contratti di prestito siano incompleti. Si assuma che tutti gli attori siano neutrali al rischio. Un progetto richiede $1 per essere completato e fallisce con probabilità f . Si immagini che il progetto sia una macchina, la quale, se non “fallisce” vive per un periodo (diventa senza valore alla fine del periodo) e produce beni in proporzione alla “velocità” alla quale opera. Per semplicità, assumiamo che la velocità sia pari alla probabilità che la macchina si guasti (cioè fallisca) ossia f .
10 | MICROECONOMIA
I beni prodotti sono disponibili solo alla fine del periodo sotto condizione che la macchina non si danneggi. (La macchina non varrà nulla alla fine del periodo sia che si rompa o meno, ma se si guasta essa distrugge anche ogni bene prodotto). I rendimenti del progetto sono pari a μf se essa funziona e 0 altrimenti ( μ è una costante positiva che misura la qualità del progetto), e i rendimenti attesi al netto di tutti i costi sono r = μ f (1 f )
Mentre l’ammontare prodotto (se la macchina non fallisce) aumenta di f , i rendimenti attesi raggiungono un massimo oltre il quale l’output più elevato, nello stato di funzionamento (non fallimento), è compensato dalla più elevata probabilità di fallimento e rendimenti pari a zero. Quindi, la funzione dei rendimenti netti ha la forma di inversa. La funzione dei rendimenti attesi non considera il costo opportunità dell’investimento, rappresentato da 1 + ( se il proprietario non avesse acquistato la macchina ma avesse investito il dollaro al tasso privo di rischio , egli avrebbe avuto 1 + alla fine del periodo) .
Il caso di Robinson Crusoe . Si assuma che l’unico proprietario del progetto (auto finanziato) vari f per massimizzare i rendimenti attesi. Egli porrà dr / df = μ /1 2 f ) = 0 , la cui soluzione è f * =1/2 . Per essere fattibile, il progetto deve
rendere almeno 1 + , e quindi la qualità del progetto deve essere tale che μ 4(1 + ) ( il rendimento atteso del progetto quando f è ottimizzato è pari a μ(1/2)(1/2) ). Il caso di contrattazione completa. Assumiamo adesso che il progetto debba essere eseguito da un individuo senza ricchezza, e che non possa essere venduto o altrimenti trasferito. Questo individuo, chiamato agente (A), prende a prestito i fondi ($1) da un creditore, il principale (P), al tasso di interesse 1 . Alla fine del periodo, egli restituisce un ammontare pari al “coefficiente di interesse” ($1 più l’interesse) con probabilità (1 f ) e 0 altrimenti. L’assunzione che il debitore non restituisca il prestito, nel caso in cui il progetto fallisce, è decisiva per le ragioni che seguono. Questa evenienza riflette l’istituzione comune della responsabilità limitata; se il progetto fallisce, il creditore non può impossessarsi dell’abitazione del debitore. Il rendimento atteso dell’agente per un periodo è
MERCATI CREDITIZI
y(f,) = μf(1-f) -(1-f) = (μf-)(1-f )
|11
(9.1)
Assumiamo che la prossima migliore alternativa dell’agente è ricevere zero. Se f è conosciuto da P ed è soggetto a contrattazione completa, allora P può offrire ad A un contratto tale che y = 0 così da soddisfare con uguaglianza il vincolo di partecipazione di A. Usando y = 0 come vincolo di partecipazione stringente, il “prezzo di offerta di f ” da parte di A (assumendo che f > 0 ) è appena pari a / μ = f , un tasso di interesse più basso per una probabilità di fallimento ridotta.
Si noti che se fosse offerto questo prezzo (cioè se P contrattasse per un f tale che = fμ ), l’agente sarebbe indifferente ad ogni particolare livello di f , poiché per ognuno di essi i rendimenti attesi sarebbero pari a zero. Il principale varierà allora f per massimizzare i suoi guadagni attesi = (1-f )
(9.2)
Sostituendo nella 9.2 il prezzo di f , diventa = fμ(1-f )
Quando il principale sceglie f per massimizzare la sua funzione di profitto atteso, egli porrà f * =1/2 . La figura 9.1 illustra questo caso. L’inclinazione della funzione delle curve isoprofitto del Principale (una delle quali è raffigurata) è (1 f ) / . Nel punto in cui il problema del Principale è ottimizzato, una curva di isoprofitto sarà tangente al vincolo di partecipazione dell’Agente (la cui inclinazione è 1/ μ ). Una volta determinato il tasso di fallimento ottimo, il principale fa uso del prezzo offerto di f per determinare il tasso di interesse ottimo da offrire all’agente, cioè * = μ /2 . Il principale quindi offrirà ad A il seguente contratto: A accetta f * =1/2 ed accetta di pagare a P un ammontare pari a * = μ /2 ( che si verificherà se la macchina non fallisce con probabilità ) in modo da soddisfare così il vincolo di partecipazione di A e trasferire a P un guadagno atteso di (1 f ) o μ / 4 .
12 | MICROECONOMIA
Figura 9.1. il mercato del credito: il caso Negoziabile Probabilità di Fallimento: f Vincolo di partecipazione di A:
Iso-profitto del Principale Tasso d’interesse:
Si noti che il livello di rischio è esattamente equivalente al caso di Robinson Crusoe. La ragione risiede nel fatto che le funzioni obiettivo del principale, nel caso di contrattazione completa e nel caso di Robinson Crusoe4, sono identiche. Poiché il vincolo di partecipazione è stringente il creditore, di fatto, sta massimizzando la sua funzione, soggetto ad un vincolo dato dal livello di utilità del debitore (il suo vincolo di partecipazione) e quindi ha conseguito un ottimo Paretiano. La contrattazione completa elimina la distinzione tra principale ed agente, e riporta al mondo di Crusoe. Il risultato cambia, una volta che si ritorna al mondo reale dei contratti di credito. Rischio non negoziabile, nessuna garanzia: In questo caso f non è negoziabile. L’agente sceglierà f allo scopo di massimizzare il suo rendimento atteso (che resta come prima rappresentato dall’equazione (9.1)), cioè fissando dy = μ (1 2 f ) + = 0 df
La funzione di risposta ottima dell’agente sarà quindi: f ( ) =
+μ 1 = + 2μ 2 2μ
(9.3)
I profitti attesi del principale sono, come prima, rappresentati dall’equazione (9.2), ma f ora dipenderà da . La funzione di profitto atteso sarà quindi:
4
Avremmo ottenuto lo stesso risultato se avessimo reso esecutiva la promessa di pagare non sottoponendo a contrattazione f .
MERCATI CREDITIZI
= (1 f ( ))
|13
(9.2’)
Massimizzando questa funzione rispetto a otteniamo la condizione di primo ordine del principale: 1 f = f'
(9.4)
Facendo uso dell’equazione (9.3) avremo come soluzione * =
μ 2
(9.5)
Sostituendo poi l’equazione (9.5) nell’equazione (9.3) otteniamo il livello ottimo di f , vale a dire, f * = 3/ 4 . L’agente applica un livello di rischio superiore a quello implementato nella contrattazione completa e nel caso di Robinson Crusoe. La figura (9.2) ne illustra la ragione. Si noti la differenza tra il vincolo di partecipazione di A (VP) e la funzione di risposta ottima di A (BRF) (questo spiega la discrepanza tra i diversi livelli di rischio scelti da A). Come risultato, il reddito atteso del debitore è positivo (poiché la funzione di risposta ottima è al di sopra del vincolo di partecipazione). Questo significa che il debitore sta ricevendo una rendita. Il rendimento di P è ovviamente minore: sostituendo f * e * nell’espressione che rappresenta produce = μ /8 (piuttosto che i profitti attesi pari a μ / 4 nel caso di contrattazione completa). Orizzonte infinito con rinnovo contingente: il fatto che il principale conferisca una rendita all’agente nel caso in cui il contratto venga svolto in un solo periodo fa sorgere un interrogativo. Il principale potrebbe ricavare un profitto da questo fatto, promettendo di continuare a dare a prestito ad A fin quando la macchina non fallisca? I problemi di incentivo verrebbero mitigati se il creditore offrisse all’agente un rinnovo del contratto contingente, in un orizzonte di tempo infinito (come il datore di lavoro nei confronti del dipendente, nel modello sul mercato del lavoro)? Si supponga che il principale usi il fallimento del progetto come (inaccurato) segnale dell’azione dell’agente. Allora P offre un prestito (per un singolo periodo) con la promessa di rinnovarlo se il progetto non fallisce, e nulla altrimenti.
14 | MICROECONOMIA
Probabilità di Fallimento: f BRF di A
PC di A
Tasso d’interesse: Figura 9.2. Livello di rischio non soggetoo a contrattazione. La funzione di iso-reddito del debitore è y = y *
Assumiamo che il valore attuale della posizione di riserva sia z , il tasso di preferenza temporale (il tasso di sconto) sia rappresentato da i . Trattando l’interazione come stazionaria (invariante al tempo), il valore attuale per gli agenti, v , è dato da v=
y ( , f ) + (1 f )v + fz 1+ i
Dopo alcuni passaggi algebrici diventa v=
y iz +z i+ f
(9.6)
Come nel caso del mercato del lavoro, il valore attuale della transazione dell’agente è la somma dell’alternativa e della rendita. La funzione di risposta ottima per questo caso è alquanto complicata: per permettere un raffronto con i casi precedenti semplificheremo assumendo i = 0 in modo da permettere all’espressione di assumere una forma simile (e z = 0 come prima). Il valore attuale atteso della transazione v è uguale al valore atteso del reddito per ciascun periodo valutato come un bene e diviso per la probabilità di cessazione, ossia v=
y μ f (1 f ) (1 f ) = f f
Massimizzando v rispetto ad f otteniamo la funzione di risposta ottima dell’agente vf =
μ f 2 + =0 f2
(9.7)
essa richiede al debitore di selezionare f in modo tale che f = / μ ossia 2
MERCATI CREDITIZI
12
f*= μ
|15
(9.8)
Come possiamo paragonare questa situazione con il caso precedente in un singolo periodo? Per f 0) determina una risposta ottima del debitore preferita dai creditori
Ricordiamo che nel capitolo 8, avendo analizzato la relazione binaria principale-agente tra datore di lavoro e dipendente, abbiamo poi inserito questo modello in uno scenario di equilibrio economico generale introducendo una condizione di profitti nulli per regolare il livello di occupazione. Qui, tratteremo il mercato creditizio allo stesso modo. Poiché ci sono molti creditori in competizione, in equilibrio essi dovranno tutti ricevere un rendimento atteso uguale al tasso di interesse privo di rischio, . La ricchezza attesa alla fine del periodo dovrà essere la stessa per quelli che investono in attività senza rischio e in progetti rischiosi, ossia: = (1 f ) = (1 + )
(9.10)
Questa espressione esprime la condizione di profitti nulli nell’equilibrio competitivo. Essa definisce un luogo dei punti in cui il profitto atteso è lo stesso cioè una curva di “iso-profitto atteso” nello spazio ( f , ) , come rappresentato dalla figura (9.3). Al di sotto di questa curva di iso-profitto atteso (per valori di f più bassi o valori più alti di ), il tasso di interesse atteso supera il tasso competitivo privo di rischio, inducendo coloro che possiedono ricchezza ad investirla nel mercato del
MERCATI CREDITIZI
|19
credito. Al di sopra della curva di iso-profitto, i fondi verranno ritirati. Ciò significa che l’equilibrio competitivo si colloca sul luogo dei punti a profitto nullo. Reddito atteso dal Debitore, y
y( )
y( *)
1 + = ( )
( *)
Profitto atteso dal Creditore, ˆ Figura 9.4. Il problema di contrattazione tra il debitore e il creditore. ab rappresenta la frontiera della contrattazione. I punti a e b rappresentano i risultati a e b nella precedente figura.
Ora, si supponga che esista un debitore la cui ricchezza, k° , sia appena sufficiente perché la sua funzione di risposta ottima sia tangente alla condizione di profitto nullo (il cui risultato è indicato in figura dal punto di tangenza con coordinate ( f °, °) ). Minori livelli di ricchezza producono una funzione di risposta ottima che giace totalmente al di sopra della curva di zero profitto. In questo caso non esiste nessuna offerta da parte del creditore che possa generare un rendimento atteso per il creditore stesso almeno pari a . I debitori con k < k° , quindi, non possono chiedere un credito. Essi sono esclusi dal mercato del credito. Per quanto riguarda i debitori con k > k° , la loro funzione di risposta ottima (con ricchezza k ) è raffigurata nella figura (9.3). Prima di passare al caso competitivo, esploreremo come si determinano il tasso di interesse ed il livello di rischio per uno scambio bilaterale non competitivo quando questo ha luogo tra un banco dei pegni della città e un povero debitore, oppure una banca di una piccola città e i suoi clienti. Se il creditore agisce da first mover, egli massimizzerà i profitti attesi soggetti alla funzione di risposta ottima del debitore, e porrà = * come mostra la figura 9.3. Si noti che, in questo caso, sia il rendimento atteso del creditore sia il valore che massimizza il profitto variano quando varia il livello di ricchezza del debitore. Di
20 | MICROECONOMIA
contro, se fosse il debitore a muovere per primo (improbabile nei casi già menzionati), egli saprebbe che i suoi profitti attesi variano inversamente al tasso di interesse e quindi offrirebbe di pagare semplicemente = , il tasso di interesse che (data la risposta ottima del debitore) darebbe al creditore un tasso di profitto atteso appena uguale al tasso di rendimento privo di rischio.
Naturalmente qualunque risultato con [ , *] è possibile, a seconda delle istituzioni che regolano la contrattazione. Il problema di contrattazione tra debitore e creditore è illustrato nella figura 9.4 dove y( ) rappresenta il reddito atteso del
debitore se il tasso di profitto atteso del creditore è uguale al tasso privo di rischio, e y( *) e ( *) sono, rispettivamente, il reddito atteso del debitore e del creditore
quando il creditore muove per primo. In assenza di un’indicazione specifica della struttura istituzionale del problema di contrattazione non possiamo aggiungere altro sul risultato. Si supponga la presenza di una competizione tra i creditori tale che nell’equilibrio competitivo il profitto atteso di ciascun creditore sia pari a . La transazione di equilibrio dovrà essere sulla curva zero profitto, cioè, = , per un
debitore con capitale pari a k° . Poiché una ricchezza maggiore sposta la funzione di risposta ottima verso il basso, è facile osservare che è decrescente in k per i debitori con k > k° . Come risultato, il tasso di interesse nell’equilibrio competitivo
varia inversamente con la ricchezza del debitore. I debitori più ricchi saranno anche capaci di finanziare progetti più grandi e progetti di qualità inferiore. Per vedere come questo accade, poniamo l’ampiezza del progetto, inizialmente posta uguale a 1, adesso pari a K 1, in modo tale che k / K sia la quota di capitale del debitore. Consideriamo due debitori, uno con ricchezza appena pari a k° e che quindi possa finanziare un progetto di ampiezza 1 al tasso di interesse ° , come prima, e l’altro con ricchezza k > k° . Se il progetto del debitore più ricco fosse di ampiezza k / k° >1 , allora le quote di capitale e così le funzioni di risposta ottima dei due debitori sarebbero identiche. Ad entrambi sarebbe offerto ° e come risultato gli agenti selezionerebbero f ° e la condizione di equilibrio competitivo sarebbe soddisfatta. Con progetti
identici, l’agente più ricco effettua la transazione allo stesso tasso di interesse del debitore meno ricco ma è capace di prendere a prestito di più per finanziare un progetto più grande in modo tale da ottenere un reddito atteso maggiore. I meno ricchi sono in questo caso vincolati al credito, essi possono prendere a prestito ma sono limitati ad un ammontare minore rispetto ai più ricchi.
MERCATI CREDITIZI
|21
Finora abbiamo assunto che tutti i progetti siano della stessa qualità, cioè che μ non vari tra i debitori. Modificando questa assunzione, riveleremo un’altra penalità imposta ai meno ricchi. Si assuma che un agente incapace di fornire capitale ( k = 0 ) abbia un progetto per cui
μ = μ° e un debitore più ricco
(k > 0)
abbia
μ < μ° (l’agente più povero ha un progetto migliore). k
Per permettere un paragone, si supponga che entrambi siano debitori marginali appena capaci di finanziare i loro progetti in un equilibrio competitivo, e quindi entrambi paghino lo stesso tasso di interesse . (Nella figura 9.3, la funzione di risposta ottima per ciascun agente è tangente alla curva di zero-profitto). Cosa sappiamo circa la produttività dei loro progetti? Usando le funzioni di risposta ottima dei due debitori, possiamo riscrivere la condizione di equilibrio di profitti nulli come segue: 1 (1 k ) 1 o k =
= 1+ = o = k 2μ 2 2μ 2
Questa espressione significa che se i due progetti sono entrambi finanziati in un equilibrio competitivo, i loro rendimenti attesi devono essere uguali e congiuntamente uguali al tasso privo di rischio 1 + . Questo ci permette di dedurre qualcosa sulla qualità dei progetti offerti da un agente ricco e uno non ricco che potrebbero essere finanziati in un equilibrio competitivo. Per farlo, sfruttiamo l’assunzione che risulti uguale per entrambi i debitori, ciò permette la seguente semplificazione della precedente espressione: 1 k 1 = 2μ k 2μ o
equivalente a, μk = 1 k μo
(9.11)
Dall’osservazione dell’equazione (9.11) possiamo dedurre che l’agente con una ricchezza inferiore possiede un progetto qualitativamente superiore a quello dell’agente ricco. Se l’agente ricco può offrire metà del costo del suo programma in capitale, il suo progetto sarà qualitativamente buono la metà di quello dell’agente povero (che non può offrire niente). E’ facile notare che se l’agente povero avesse avuto una qualche ricchezza disponibile utilizzabile come capitale, k° < k , la relazione precedente diventerebbe: μ k (1 k ) = μ o (1 k o )
Questo significa che la qualità minima richiesta ad un progetto per assicurarsi
22 | MICROECONOMIA
un finanziamento, espressa come rapporto tra due potenziali debitori, è proporzionale alla frazione del progetto che non può essere auto finanziato. Abbiamo, quindi, tre risultati nel caso di equilibrio competitivo: per i debitori con ricchezza sufficiente ad assicurarsi un prestito per finanziare il progetto con ampiezza minima (K =1) ma non sufficiente per auto finanziare l’intero progetto, i più ricchi saranno capaci di finanziare progetti più ampi e progetti di qualità inferiore; inoltre, per progetti della stessa ampiezza e qualità come per quelli meno ricchi, i debitori ricchi pagheranno tassi di interesse minori.
Figura 9.5. Perdite di efficienza allocativa dovute a differenze di ricchezza.
Questo risultato, naturalmente, può non essere efficiente. Esso implica che ci siano alcuni agenti poveri con progetti buoni che non saranno implementati, mentre alcuni agenti ricchi (e ricchi principali) avranno reddito sufficiente o riceveranno un prestito sufficiente per portare avanti progetti inferiori. Per vedere questo come accade, si supponga che sia disponibile un dato ammontare di finanziamento, normalizzato all’unità, da dividere tra i progetti (tutti della stessa ampiezza, 1) eseguiti da individui ricchi o meno ricchi (ciascuno dei quali ha un insieme di progetti di varietà variabile). Ordiniamo i progetti di ciascuno dal migliore (con il valore più alto di μ ) al peggiore, e assumiamo che i progetti vengano finanziati in ordine di qualità. Si assuma che i due debitori abbiano un’identica distribuzione della qualità dei progetti. Nella figura 9.5 il numero di progetti offerti dal povero e che sono finanziati è pari a n . Il numero di progetti offerti e poi finanziati del ricco sono (1 n) . Definiamo μ°(n) la qualità dell’ennesimo progetto del debitore povero e μ (n) la qualità del peggiore progetto finanziato del debitore ricco quando il debitore povero finanzia n progetti. L’ottimo sociale richiede che nessun progetto escluso sia di qualità inferiore ad alcun progetto incluso. (Se ci fosse un ampio numero di piccoli k
MERCATI CREDITIZI
|23
progetti questo renderebbe (approssimativamente) uguale la qualità dei progetti marginali offerti da ciascuno). Tabella 9.2. Redistribuzione che accresce l’efficienza
Prima Dopo
Surplus totale
Reddito del Proprietario Reddito dell’esecutore
3μ 16 = (1 + )3 2
μ 8 = 1+
μ 16 = (1 + ) 2
μ 8 = 1+
μ 8 = 1+
μ 4 = 2 (1 + )
Nota: La linea del “prima” riproduce la riga della tabella 9.1, con μ = 8(1 + ) .“Dopo” descrive l’effetto del trasferimento dell’attività e dell’imposta descritte nel testo.
Si supponga che l’ottimo si realizzi quando il povero ottiene un finanziamento per n
progetti. Ma l’equilibrio competitivo, precedentemente rappresentato dall’equazione (9.11), mostra che il progetto marginale del debitore più ricco sarà di qualità inferiore del progetto marginale del debitore meno abbiente. Così, il povero otterrà finanziamento solo per n* < n . Si può dire di più: usando il fatto che per i max
max
progetti marginali in equilibrio competitivo μ / μ° =1 k , sappiamo che μ° μ , la differenza nella qualità del progetto dei progetti marginali dei due individui sarà uguale a μ°k . Questa è una misura dell’inefficienza allocativa, ed è ovviamente crescente in k , la differenza di ricchezza fra i due debitori. In questo modello, una k
k
redistribuzione della ricchezza dal ricco al povero (assumendo che l’esecuzione sia priva di costi) accrescerebbe il surplus sociale: n * aumenterebbe, accrescendo così la qualità media dei progetti. Se tale redistribuzione fosse seguita da un pagamento compensativo ai ricchi si otterrebbe un miglioramento Paretiano? È risaputo che una redistribuzione può non passare il test Paretiano per la semplice ragione che anche le ridistribuzioni generano perdenti e vincitori. Per dimostrare che questo non è necessariamente uno di quei casi, facciamo riferimento alla tabella 9.1. Si supponga che μ = 8(1 ) , come nel caso del modello di rischio non soggetto a contrattazione (in un solo periodo), i profitti attesi del creditore ( μ /8) sono pari a uno più il tasso di interesse privo di rischio, mentre il debitore povero ha un reddito atteso ( μ /16) pari a (1 + ) /2 . Si immagini che all’inizio di un qualche periodo il governo confischi la macchina da $1, richiesta per il progetto, dal suo ricco precedente proprietario e la attribuisca all’exdebitore povero che poi la faccia funzionare alla stessa maniera di Robinson Crusoe. (Oppure si immagini che il governo imponga al creditore ricco una tassa di $1 e poi trasferisca questo ammontare al debitore povero). Il governo impone, inoltre, una tassa al beneficiario di questa redistribuzione, esigendo che questi paghi (1 + ) alla fine del periodo (se il progetto fallisce, egli pagherà la tassa mediante i guadagni derivanti dal suo capitale umano). Il guadagno atteso del beneficiario prima del pagamento dell’imposta sarebbe lo stesso di quello di Crusoe, cioè μ / 4 , oppure,
24 | MICROECONOMIA
dato il valore assunto da μ, 2(1 + ) . Se il beneficiario realizza questo ammontare, egli può pagare la tassa cui è sottoposto, che verrà poi utilizzata dal governo per compensare il precedente proprietario, pagandogli il suo rendimento atteso come proprietario (1 + ) . Il beneficiario della redistribuzione trattiene per sé un ammontare pari a (1 + ) , e quindi come risultato sarà più ricco. (Ricordiamo che come debitore aveva ottenuto solo metà di questo ammontare). Tutto ciò che è richiesto è che il surplus totale sia maggiore nel caso del proprietario-esecutore (Crusoe). La tabella 9.2 riassume questi conteggi. Se, quindi, esiste la possibilità di un miglioramento Paretiano, ci si domanda come mai i proprietari delle macchine non le affittino ai poveri in cambio di una promessa di pagamento al proprietario di una rendita pari a 1 + alla fine del periodo. Questa transazione replica semplicemente i problemi di incentivo incontrati nel contratto di affitto poiché la promessa di pagare una rendita non è enforceable. Il governo affronta questo problema estraendo la compensazione dal beneficiario indipendentemente dal risultato del progetto, offrendo essenzialmente un contratto enforceable di affitto al beneficiario al tasso di interesse privo di rischio. Il trasferimento dell’attività più la tassa rende il proprietario-esecutore del progetto il detentore del diritto su tutto il rischio indotto dalle sue scelte (piuttosto che essere protetto dal rischio di fallimento mediante la promessa non enforceable di ripagare il prestito o di pagare una rendita). E’ questo che spiega la superiorità allocativa del caso di Robinson Crusoe e permette la (apparentemente anomala) redistribuzione che genera un miglioramento Paretiano.
AV V E R S IO N E A L R ISC H IO , P R O P R I E T À , A L L O C AT I VA
ED
EFFICIENZA
Per mostrare come sia impossibile implementare una tale redistribuzione o per motivare il fatto che, se questa fosse imposta, ridurrebbe il benessere anche per i suoi beneficiari, dobbiamo rendere più realistico il modello precedente. Abbiamo assunto che tutte le parti fossero neutrali al rischio. Tuttavia, esiste una forte evidenza empirica che mostra la generale avversione al rischio dei poveri e che tale avversione decresce all’aumentare del livello di reddito di un individuo5. Il povero, quindi, potrebbe preferire la mezzadria o un’occupazione salariata, dato che questi contratti lo proteggono dal rischio, pur se il reddito atteso risulterebbe maggiore se egli assumesse rischi e diritti. La riforma della terra in Cile 5
Binswanger (1980), Saha, Shumway, e Talpaz (1994).
MERCATI CREDITIZI
|25
evidenzia questo punto. Questa sezione affronta due problematiche. Primo, quali sono le condizioni per cui il povero preferisce davvero detenere attività produttive esposte al rischio? Secondo, esiste una classe di ridistribuzioni in grado di accrescere l’efficienza allocativa, considerato che questa non sarebbe raggiunta tramite contrattazione volontaria, sostenibile come equilibrio competitivo? Per rispondere a questi interrogativi abbiamo bisogno di nuovi strumenti6. Ricordiamo dal capitolo 3 che, se l’utilità di un individuo come funzione del reddito è rappresentata da U = U( y) , allora la misura dell’avversione al rischio di Arrow-Pratt è pari a a = U'' /U' . Se la funzione di utilità è meno concava per livelli più alti di reddito, ossia se da / dy < 0 , allora si ottiene un’avversione al rischio decrescente7. Ricordiamo anche che
mentre la concavità della funzione di utilità cattura indubbiamente aspetti importanti del comportamento in presenza di rischio, essa certamente non contempla importanti influenze sul comportamento, come l’avversione all’incertezza, l’ambiguità, la paura del non conosciuto, e così via. Introdurremo ora una struttura che tratta la concavità della funzione di utilità come una delle tante ragioni per cui la gente evita il rischio. L’idea di base è rappresentare il reddito atteso come un bene e la variazione del reddito come un male. Si supponga che il reddito di un individuo, y , vari in risposta a shock stocastici secondo questa relazione: y = z + g ( )
(9.12)
Dove g( ) è il reddito atteso e z è una variabile casuale con media zero e deviazione standard pari a uno. La deviazione standard del reddito, una misura del rischio, è rappresentata da . L’individuo sceglie tra diversi stati che differiscono fra loro per il grado di rischio che comportano ( ). Possiamo scrivere la funzione di utilità dell’individuo come v = v {g ( ), } con vg > 0 e v 0
(9.13)
Questa funzione esprime la valutazione positiva dell’individuo per alti livelli di valore atteso del reddito e la valutazione negativa per il reddito più incerto, senza per 6 7
Questa sezione si basa su Bardhan, Bowles, e Gintis (2000). a rappresenta l’ avversione al rischio assoluta e viene distinta dall’avversione al rischio relativa, che è misurata da aR = yU'' /U' = ya . L’avversione al rischio relativa decrescente implica che quando il reddito aumenta, a si riduce più che proporzionalmente all’aumento del reddito.
26 | MICROECONOMIA
questo implicare che l’incertezza nel reddito sia dovuta alla concavità della funzione di utilità U( y) . Per il particolare modo in cui è stato introdotto il rischio, comunque, questa funzione è anche capace di catturare la logica della misura di Arrow-Pratt8. Le curve d’indifferenza che rappresentano un individuo con l’avversione al rischio (ArrowPratt) decrescente sono raffigurate nelle figura 9.6. Queste curve di indifferenza sono crescenti e convesse in , sono piatte nei pressi dell’intercetta verticale ( = 0 ), quando > 0 diventano più piatte all’aumentare di g , e più ripide all’aumentare di .
Reddito atteso
g( )
Deviazione standard del Reddito, Figura 9.6. Curve di indifferenza per un individuo con avversione al rischio decrescente e scelta del livello di rischio. Si noti che * rappresenta la scelta di rischio per un individuo neutrale al rischio.
L’inclinazione di una curva di indifferenza, v / v rappresenta il saggio marginale di sostituzione tra rischio e reddito atteso. Così, (g, ) è una misura del
g
livello di avversione al rischio di un individuo con un dato livello di reddito e rischio attesi. E’ chiaro che questa misura è crescente rispetto al livello di esposizione al rischio. L’intercetta verticale di ciascuna curva rappresenta l’equivalente certo degli altri punti appartenenti alla curva: esso rappresenta il massimo ammontare che un individuo sarebbe disposto a pagare per l’opportunità di estrarre un reddito da una distribuzione con media e dispersione date da ciascun altro punto sulla curva. 8
La funzione di utilità generale U( y) può, in questo caso, essere espressa come una semplice funzione di utilità in due parametri poiché la variazione nel reddito è generata da ciò che è chiamato classe lineare di disturbi. I dettagli analitici sono in Bardhan, Bowles, e Gintis (2000), ispirati al precedente lavoro di Meyer (1987) e Sinn (1990).
MERCATI CREDITIZI
|27
È plausibile assumere che la cosiddetta funzione rischio-rendimento, g( ) , abbia la forma di una U invertita: all’inizio cresce raggiungendo un massimo e poi decresce (come raffigurato in figura 9.6.). La scelta di può riferirsi ad una scelta tecnologica, come la “velocità della macchina” o la scelta di una varietà di semi altamente produttivi ma altamente rischiosi contro altri meno rischiosi ma meno redditizi. Oppure si potrebbe riferire all’investimento in capitale umano o ad una scelta di prodotto mista come ad esempio il grado di specializzazione, l’istruzione più specializzata o il mix di prodotto che produce rendimenti (in un certo intervallo) maggiori ma incorre in molti più rischi. Funzioni di rischio-rendimento di questo genere sono anche state stimate rispetto alla biodiversità, essendo la maggiore diversità una protezione contro variazioni climatiche e altri influssi ambientali. L’agente deciderà di massimizzare v rispetto a soggetto a g = g( ) : g' =
v vg
(9.14)
La (9.14) richiede che il saggio marginale di trasformazione del rischio nel reddito atteso (a sinistra dell’equazione) sia eguagliato al saggio marginale di sostituzione tra il rischio e il reddito atteso. Un individuo neutrale al rischio (uno per cui v = 0 ) porrà semplicemente g' = 0 , massimizzando il reddito atteso in = *. L’individuo avverso al rischio (con v > 0 ) selezionerà un livello di rischio tale che g' > 0 , che implica un livello di rischio ( ) inferiore, con un rendimento atteso corrispondente inferiore.
Ora possiamo rispondere alla prima domanda: Sotto quali condizioni un agente povero di mezzi preferirebbe essere proprietario-esecutore anziché un lavoratore salariato nello stesso progetto? Si assuma un progetto con durata infinita che generi un flusso di reddito come precedentemente descritto e che richieda un ammontare di capitale k per essere eseguito; il costo opportunità per ciascun periodo è rappresentato dal tasso di interesse privo di rischio, . Se il progetto è eseguito da un dipendente che non è anche titolare dei diritti, il proprietario dovrà pagare i costi di supervisione m e pagare un salario w (uguale alla disutilità del lavoro) all’impiegato, producendo un profitto per il proprietario pari a ( ) = z + g ( ) k m w
Si supponga che il datore di lavoro sia neutrale al rischio; egli selezionerà
28 | MICROECONOMIA
= *. Si assuma che la competizione tra molti datori di lavoro simili imponga una
condizione di profitto atteso nullo, in modo tale che il salario di equilibrio w * (imponendo ( *) = 0 ) sia dato da w* = g( *) k m . Ci domandiamo se il dipendente che riceve w * con certezza preferirà essere il titolare del diritto residuale sul reddito incerto, derivante dal progetto, assumendo che egli possa anche scegliere il livello di rischio. Assumiamo (contrariamente a quanto abbiamo fatto nella sezione precedente) che i beni capitali richiesti siano affittati per k per periodo, o che l’ex-dipendente possa prendere a prestito per acquistare del capitale al tasso di interesse , il che è equivalente. Per semplicità assumiamo che, come proprietario-esecutore, l’ex-dipendente impieghi esattamente lo stesso impegno, da dipendente, ma senza incorrere in costi di supervisione. Allora il suo reddito al netto del costo opportunità sarà y ( ) = z + g ( ) k
Definiamo il reddito atteso del proprietario-esecutore come = g( ) k e la sua funzione di utilità sia pari a v = v( ( ), ) . Massimizzando l’utilità rispetto a avremo, ' =
v v
Assumiamo che il livello di rischio scelto sia ° . I due riquadri nella figura 9.7 raffigurano due situazioni possibili. In entrambi i riquadri, la funzione di rischio-rendimento per il proprietarioesecutore, ( ) , è al di sopra della funzione di salario, w *( ) , di un ammontare m poiché nel primo caso il lavoro autonomo elimina i costi di supervisione. Ma il proprietario-esecutore, essendo avverso al rischio, seleziona un livello di rischio minore di quello che massimizza il reddito atteso scelto dal datore di lavoro. Nel riquadro a, l’equivalente certo dell’esito del proprietario esecutore, w° , è inferiore a w *; ciò significa che l’individuo preferirebbe rimanere un dipendente piuttosto che
assumere il rischio associato al possesso dei diritti. Nel riquadro b l’individuo è meno avverso al rischio e quindi il caso è opposto.
MERCATI CREDITIZI
m
w°
|29
( ) w°
( )
m
Figura 9.7. I payoff da lavoro dipendente e come proprietario per un individuo altamente avverso al rischio (a) e per un individuo poco avverso al rischio (b). Si noti che l’individuo molto avverso al rischio preferisce il lavoro salariato piuttosto che essere proprietario.
Nel secondo caso ci aspetteremmo di vedere progetti eseguiti dai proprietari piuttosto che da dipendenti: i dipendenti acquisirebbero attività e diventerebbero proprietari, implementando un trasferimento dei diritti di controllo e della titolarità del diritto di proprietà che implica un miglioramento Paretiano. Questa rappresenta esattamente l’intuizione di Coase: sotto adeguate condizioni, i trasferimenti volontari di diritti di proprietà dovrebbero implementare un’allocazione efficiente, con titolarità del diritto e controllo sul progetto assegnato a coloro che possono portarlo avanti in modo più produttivo. Ciò che rende possibile questo risultato, nel nostro caso, è la fittizia assunzione che il proprietario esecutore possa affittare i beni capitali o contrarre un prestito per acquistarli ad un tasso di interesse privo di rischio. Sappiamo (dalla precedente sezione) che sotto condizioni competitive, il tasso d’interesse varierà inversamente rispetto al rapporto tra il capitale del debitore, k , e l’ampiezza del progetto k . Si supponga, allora, che il costo dell’interesse nel prendere a prestito per acquistare l’attività (e il costo opportunità di devolvere la propria ricchezza al capitale per il progetto) non sia ma piuttosto sia r , dove k r = r k
con r ' < 0 e r (1) =
Il reddito netto atteso per un proprietario esecutore con ricchezza pari a k è adesso k k = g ( ) r k k
La situazione raffigurata nella figura 9.7b con questa nuova funzione rischio-
30 | MICROECONOMIA
rendimento (chiamata ), per un individuo con ricchezza limitata è presentata nella figura 9.8. k
Si noti che, nel caso descritto, l’equivalente certo per la scelta di rischiorendimento dell’individuo è inferiore a w *. È chiaro che il potenziale proprietario esecutore vincolato al credito preferirà rimanere un dipendente, anche se, se fosse stato capace di prendere a prestito al tasso , avrebbe preferito essere proprietario. In questo caso, se i dipendenti avessero ricchezza pari o minore a k , nell’equilibrio competitivo, esisterebbe il lavoro salariato. (Assumiamo che questi non-proprietari investirebbero qualunque ricchezza di cui dispongono in uno strumento il cui rendimento è ).
Reddito atteso
( )
w
+
w
k+
k
Deviazione standard del Reddito, +
Figura 9.8. Accrescendo la ricchezza del dipendente da k a k il costo opportunità del capitale si riduce e sposta il contratto ottimo dal lavoro salariato alla modalità proprietario-esecutore.
Si supponga che abbia luogo una redistribuzione delle attività tale che l’impiegato abbia una ricchezza pari a k maggiore di k . La sua funzione di rischiorendimento (la linea tratteggiata nelle figura 9.8) gli darebbe, come nella figura 9.7, un equivalente certo maggiore di w *. +
In questo caso egli sarebbe capace di prendere a prestito ad un tasso (o sopportare il costo opportunità di per l’uso della propria ricchezza nel progetto) e così diventerebbe (e rimarrebbe) un proprietario-esecutore. Sia il trasferimento preridistributivo del diritto e del controllo sia il trasferimento post-ridistributivo sono quindi sostenibili come equilibri di Nash. Ne consegue che una redistribuzione dei titoli di proprietà, che non avrebbe
MERCATI CREDITIZI
|31
avuto luogo mediante contrattazione privata, può essere implementata in modo forzoso. Si supponga che questa redistribuzione sia conseguita tassando i possessori di ricchezza che prima e dopo la redistribuzione erano neutrali al rischio e ricevevano un rendimento sulle loro attività pari al tasso privo di rischio. Tale redistribuzione (se portata avanti senza costi amministrativi ed altro) accresce il surplus totale in questo senso: il costo opportunità delle attività a cui rinunciano coloro su cui gravano i costi ( ) sarebbe inferiore ai rendimenti goduti dai beneficiari (sappiamo questo perché al tasso di interesse il dipendente avrebbe preferito la proprietà). La fonte del guadagno di efficienza è l’eliminazione dei costi di monitoraggio permessa dalla sostituzione dei lavoratori autonomi ai lavoratori salariati. Questo guadagno è parzialmente pareggiato dal passaggio del controllo della scelta del rischio da un ex-proprietario neutrale al rischio ad un proprietario-esecutore avverso al rischio, in aggiunta all’eliminazione dell’assicurazione contro il rischio efficiente fornita dall’assegnazione dei diritti al proprietario neutrale al rischio. Naturalmente, la redistribuzione non genera un miglioramento Paretiano poiché il ricco subirà una perdita di benessere. Inoltre, nonostante i guadagni di efficienza sostenuti dalla redistribuzione, è difficile immaginare una compensazione effettuabile per i “perdenti”. La redistribuzione delle attività è essenziale per generare guadagni di efficienza, quindi, compensare i perdenti attenuerebbe quei guadagni. Non abbiamo considerato un effetto ovvio della redistribuzione: i beneficiari del trasferimento dell’attività sarebbero, come risultato, meno avversi al rischio, dato che l’avversione al rischio è decrescente. Come proprietari-esecutori essi sceglierebbero quindi livelli di rischio più elevati, e raggiungerebbero redditi attesi maggiori. Per trasferimenti di attività sufficientemente ampi, l’avversione al rischio ridotta potrebbe indurre gli ex-dipendenti a diventare proprietari indipendentemente dall’effetto di riduzione dei vincoli al credito precedentemente visto. La redistribuzione di attività è un veicolo per l’esplorazione dell’interazione fra vincoli al credito, avversione al rischio, e proprietà. Non è un disegno di politica economica. La progettazione di politiche di distribuzione dei beni prevede di affrontare sia gli aspetti amministrativi come quelli di equilibrio generale e gli effetti dinamici di lungo periodo, non considerati qui. Per esempio, si deve considerare il caso in cui il povero adotta strategie di risparmio ed investimento che preservino o accrescano le sue attività.
32 | MICROECONOMIA
L’analisi precedente mostra semplicemente che essi non preferirebbero vendere le attività se le potessero acquistare per un costo pari a o minore. Torneremo su questi interrogativi sulle strutture alternative di proprietà e controllo delle imprese nel capitolo 10. I modelli presentati in questo capitolo non solo prevedono che i meno abbienti pagheranno tassi di interesse maggiori quando prendono a prestito, o verranno interamente esclusi dai mercati del credito, ma anche che i poveri di capitale riceveranno anche rendimenti più bassi sulla loro ricchezza. Adam Smith (1937[1776]:93) intendeva questo quando scrisse: “ I soldi, dice il proverbio, creano soldi. Quando ne hai un po’ è facile averne di più. La più grande difficoltà è ottenere quel po’ ”. Ci sono due ragioni per questo. Primo, coloro esclusi dal prestito dovranno investire qualunque bene essi posseggano al tasso di interesse privo di rischio, , mentre tra coloro che posseggono capitale sufficiente per prendere a prestito, tutti tranne il debitore marginale possono ottenere un rendimento maggiore (assumendo che il mercato dei prestiti sia competitivo). Secondo, i meno ricchi e così gli individui avversi al rischio, selezioneranno progetti con redditi attesi minori (come mostra la figura 9.6). La nostra previsione trova evidenza empirica negli Stati Uniti anche per individui abbastanza ricchi, restringendo il paragone ad un tipo di attività specifico: i titoli aziendali detenuti da individui ad alto reddito crescono di valore più velocemente di quelli detenuti da individui meno ricchi (Yitzhaki 1987).
C O N C L U S IO N I I modelli presentati in questo capitolo comportano chiare conseguenze per la trasmissione di status economico da genitori a figli. Le differenze di ricchezza possono persistere tra generazioni a causa delle opportunità limitate del prestito e delle opportunità di investimento meno redditizie di coloro che non ereditano ricchezza dai loro genitori. Numerosi autori hanno approfondito le implicazioni dinamiche degli aspetti non contrattuali dei mercati finanziari. Un’altra implicazione di questo capitolo è che alcune distribuzioni di ricchezza sono più efficienti di altre. Laddove le disparità di ricchezza sono tali da permettere che una piccola riduzione dei beni dei ricchi non precluderebbe loro la possibilità di portare avanti qualunque contratto tecnicamente effettuabile e, garantendo beni addizionali ai poveri aprirebbe loro opportunità contrattuali, allora una redistribuzione della ricchezza potrebbe essere un mezzo per attenuare i problemi di
MERCATI CREDITIZI
|33
incentivo che si sollevano con le relazioni tra principale ed agente. Questa conclusione sfida la nozione di efficienza-neutralità asserita dal Teorema Fondamentale di Coase. Inoltre, solleva dubbi su uno dei fondamenti della saggezza popolare in economia e cioè sul trade-off tra efficienza ed equità. In circostanze nelle quali le assunzioni dei due famosi teoremi non vengono soddisfatte, così che la distribuzione di diritti di proprietà può avere effetti sull’efficienza allocativa, il tradeoff tra efficienza ed equità asserisce che l’aumento dell’equità ridurrà l’efficienza. (Questa appare come un’espressione della “saggezza popolare” poiché si tratta di qualcosa che “tutti conoscono” e che appare ancora in molti libri universitari, ma che nessuno ha dimostrato formalmente, a differenza del Teorema Fondamentale. Un estratto convincente dell’idea è presentato in Okun (1975)). I precedenti modelli mostrano che la distribuzione della ricchezza è importante per l’efficienza allocativa. Nella misura in cui tale distribuzione risulta essere rilevante in quanto attenua i problemi di incentivo derivanti dall’incompletezza contrattuale, essa lo è in modo asimmetrico9. Le distribuzioni maggiormente egualitarie sono probabilmente più efficienti poiché i poveri, non i ricchi, sono esclusi dai contratti più efficienti. Se una particolare attività fosse più produttiva se il controllo e il titolo fossero nelle mani di un individuo ricco, ci sarebbero pochi impedimenti a che ciò possa essere ottenuto tramite scambio volontario. In questo caso, il processo competitivo tenderà ad assegnare i diritti di proprietà in modo efficiente. La mancanza di un tale processo, nel caso di un individuo povero di beni ma che potrebbe essere il proprietario più efficiente, significa che il rimedio necessario è accrescere le opportunità contrattuali del povero. Non è difficile trovare eccezioni a questa affermazione. Per esempio, la concentrazione della ricchezza può permettere la soluzione di problemi di azione collettiva nella fornitura di beni pubblici (Olson 1965). Pertanto, i problemi di monitoraggio dei manager aziendali, da parte dei proprietari sarebbero attenuati se un gruppo di persone fosse così ricco da acquisire le imprese completamente (o perché essi sono neutrali al rischio, o perché hanno abbastanza reddito da essere gli unici proprietari senza compromettenti diversificazioni di portafoglio)(Demsetz e Lehn 1985). Queste eccezioni sono importanti ma potrebbero esserci ragioni più convincenti per dubitare degli effetti di efficienza di una redistribuzione egualitaria. Il maggior guadagno di efficienza permesso dalla concentrazione di ricchezza è che essa assegna sia il controllo che il diritto agli individui meno avversi al rischio. Questi, allora, offrono contratti fornendo, agli agenti meno ricchi, assicurazioni meno valutabili nella forma di occupazioni a salario fisso, mezzadria, e altri contratti che proteggono gli agenti 9
Ovvero, si applica soltanto nel caso in cui il povero sia più efficiente e non il contrario. N.d.t.
34 | MICROECONOMIA
avversi al rischio dagli shock sul reddito. La principale controindicazione a questo assetto risiede nel fatto che esso richiede che coloro che compiono le azioni non contrattabili (impegno nel lavoro, per esempio) non siano coloro sui quali ricade la conseguenza delle azioni stesse. Come risultato, gli incentivi ad agire sono compromessi. La redistribuzione della ricchezza affronta questo problema di incentivo ma al costo della riduzione della propensione all’assunzione del rischio. Il modello statico qui utilizzato non cattura l’impatto di lungo periodo di un livello di rischio più basso; in un contesto dinamico più appropriato, apparirebbe sotto forma di un livello inferiore di innovazione e, di conseguenza, di un livello di crescita della produttività di lungo periodo ridotta. Anche in circostanze in cui non è coinvolta l’esposizione al rischio, non c’è ragione di credere che il controllo di un’attività, ed i diritti sul flusso di reddito ad essa associati, saranno assegnati a coloro che possono farne un uso migliore. Quando l’allocazione dello sforzo ad uno specifico compito da parte di un agente e l’allocazione delle risorse al monitoraggio dell’impegno da parte di un principale non sono ottimali (come nel modello del capitolo 8), una redistribuzione dei diritti e del controllo all’agente può migliorare l’allocazione complessiva. Ma questa reassegnazione di diritti è a volte impedita dalle restrizioni all’accesso al mercato del credito, come nel caso della riforma della terra cilena. Pertanto, il fallimento di mercato associato alla regolamentazione dell’impegno lavorativo non viene eliminato a causa del fallimento del mercato del credito. Una sfida per la politica economica e il disegno istituzionale consiste nella elaborazione di rimedi al problema della riduzione degli incentivi che si pone in presenza di azioni non soggette a contrattazione, quando la ricchezza è concentrata. Ne sono un esempio, attinente sia al problema degli attributi nascosti, che delle azioni nascoste, le istituzioni del microcredito. Alcune forme di microcredito rendono tutti gli individui appartenenti ad un gruppo (auto-selezionato) di debitori responsabili della restituzione del prestito di ciascuno. Un altro modo in cui vengono accresciute le opportunità contrattuali degli agenti che non dispongono di ricchezza sufficiente è mediante un meccanismo che colleghi il pagamento dei membri del gruppo produttivo al livello osservabile di produzione di output del gruppo stesso (rendendo così i membri del gruppo responsabili del proprio impegno). Un’ulteriore sfida è rappresentata dall’indurre i proprietari meno ricchi ad assumere maggiori rischi. Una proposta promettente è accrescere l’assicurazione contro shock pubblici osservabili che influenzano i rendimenti delle proprie attività (assicurazioni sulle condizioni metereologiche per gli agricoltori, per esempio) o contro shock non
MERCATI CREDITIZI
|35
collegati alla proprietà delle attività produttive (assicurazione sanitaria o assicurazione contro la variazione di prezzo delle case)10. Se approfondissimo adesso questi importanti argomenti ci troveremmo ben presto troppo fuori tema. Esiste, comunque, una importante implicazione dei modelli qui presentati: trasferimenti di proprietà prescritti dal governo possono consentire di realizzare miglioramenti di efficienza che non si verificherebbero tramite scambio volontario. L’abilità, propria unicamente del governo, di costringere i partecipanti è essenziale per i guadagni del miglioramento Paretiano (vedi l’esempio della tabella 9.2). In assenza della capacità del Governo di estrarre la compensazione derivante da una tassa per l’ex proprietario, sarebbe stato impossibile assicurare che il beneficiario della redistribuzione fosse il depositario del diritto e delle conseguenze su tutti i rischi conseguenti alle sue decisioni. L’imposizione del governo gioca anche un indispensabile ruolo di accrescimento dell’efficienza nel trasferimento delle attività che permettono guadagni di efficienza tecnica (progetti migliori, monitoraggio ridotto) studiati nelle sezioni precedenti, perché questi trasferimenti non sarebbero stati raggiungibili mediante scambio volontario. Nel capitolo 14, ritorneremo su questa problematica, e suggeriremo che i governi e i mercati possono agire in modo complementare per accrescere i rendimenti economici.
10Questi
argomenti sono affrontati in dettaglio in Bardhan, Bowles, e Gintid (2000). Sul microcredito, vedi Morduch (1999).
36 | MICROECONOMIA
Riferimenti bibliografici Bardhan, P., S. Bowles, et al. (2000). Wealth Inequality, Credit Constraints, and Economic Performance. Handbook of Income Distribution. A. Atkinson and F. Bourguignon. Dortrecht, North-Holland: 541-603. Binswanger, H. P. (1980). "Attitudes towards risk: experimental measurements in rural india." American Journal of Agricultural Economics 62(August): 395407. Black, J., D. d. Meza, et al. (1996). "House Prices, the Supply of Collateral and the Enterprise Economy." Economic Journal 106(434): 60-75. Blanchflower, D. and A. Oswald (1998). "What Makes a Young Entrepreneur?" Journal of Labor Economics 16(1): 26-60. Carter, M., B. Barham, et al. (1996). "Agricultural Export Booms and the Rural Poor in Chile, Guatemala and Paraguay." Latin American Research Review 31(1): 33-65. Demsetz, H. and K. Lehn (1985). "The Structure of Corporate Control: Causes and Consequences." Journal of Political Economy 93(6): 1155-1177. Evans, D. and B. Jovanovic (1989). "An Estimated Model of Entre-pre-n-eur-ial Choice under Liquidity Constraints." Journal of Political Economy 97(4): 808-827. Glaeser, E. and DiPasquale (1999). "Incentives and Social Capital: Are Homeowners Better Citizens?" Journal of Urban Economics 45(2): 354-384. Green, L., J. Myerson, et al. (1996). "Temporal Discounting in Choice Between Delayed Rewards: The Role of Age and Income." Psychology and Aging 11(1): 79-84. Gross, D. and N. Souleles (2002). "Do Liquidity Constraints and Interest Rates Matter for Consumer Behavior? Evidence From Credit Card Data." Quarterly Journal of Economics 117(1): 149-185. Guiso, L., T. Jappelli, et al. (1996). "Income Risk, Borrowing Constraints, and Portfolio Choice." American Economic Review 86(1): 158-172. Hausman, J. (1979). "Individual Discount Rates and the Purchase and Utilization of Energy-using Durables." Bell Journal of Economics 10(1): 33-54. Holtz-Eakin, D., D. Joulfaian, et al. (1994). "Sticking it Out: Entrepreneurial Survival and Liquidity Constraints." Journal of Political Economy 102(1): 53-75. Jappelli, T. (1990). "Who is credit constrained in the U.S. economy?" Quarterly Journal of Economics 105(1): 219-234. Jarvis, L. (1989). The Unraveling of Chile's Agrarian Reform, 1973-1986. Searching for Agrarian Reform in Latin America. W. Thiesenhusen. Boston, UnwinHyman: 240-265. Laffont, J. J. and M. S. Matoussi (1995). "Moral Hazard, Financial Constraints, and Share Cropping in El Oulja." Review of Economic Studies 62(3): 381-399. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Meyer, J. (1987). "Two-Moment Decision Models and Expected Utility." American Economic Review 77(3): 421-430. Morduch, J. (1999). "The microfinance promise." Journal of Economic Literature XXXVII(December): 1569-1614. Okun, A. (1975). Equality and Efficiency: The Big Trade-Off. Washington,
MERCATI CREDITIZI
|37
Brookings Institution Press. Olson, M. (1965). The Logic of Collective Action: Public Goods and the Theory of Groups. Cambridge, MA, Harvard University Press. Ransom, R. L. and R. Sutch (1977). One Kind of Freedom: The Economic Consequences of Emancipation. Cambridge, Cambridge University Press. Rosenzweig, M. and H. P. Binswanger (1993). "Wealth, Weather Risk and the Composition and Profitability of Agricultural Investments." Economic Journal 103(416): 56-78. Rosenzweig, M. and K. I. Wolpin (1993). "Credit Market Constraints, Consumption Smoothing, and the Accumulation of Durable Production Assets in LowIncome Countries: Investment in Bullocks in India." Journal of Political Economy 101(2): 223-244. Saha, A., R. C. Shumway, et al. (1994). "Joint Estimation of Risk Preference Structure and Technology Using Expo-Power Utility." American Journal of Agricultural Economics 76(2): 173-184. Savage, H. (1995). Who could afford to buy a house in 1995? Washington, D.C, U.S. Census Bureau: 1-6. Sinn, H. W. (1990). "Expected Utility, mu-sigma Preferences, and Linear Distribution Classes: A further Result." Journal of Risk and Uncertainty 3: 277-281. Smith, A. (1937 [1776]). An inquiry into the nature and causes of the wealth of nations. New York, Random House. Tocqueville, A. d. (1958). Journeys to England and Ireland. London, Faber and Faber. Unhappy? Evidence From Panel Data." Economica 65(257): 1-15. Vega, S. (1999). Short term lending final report, Illinois Department of Financial Institutions. Verba, S., K. L. Schlozman, et al. (1995). Voice and Equality: Civic Voluntarism in American Politics. Cambridge, MA, Harvard University Press. Yitzhaki, S. (1987). "On The Relation Between Return and Income." Quarterly Journal of Economics 102(1): 77-95.
X L E I STITUZIONI DI UN ’E CONOMIA C APITALISTA
[Il mercato del lavoro]..è il vero Eden dei diritti innati dell’uomo. Lì...comandano la Libertà, l’Uguaglianza e la Proprietà. Nel lasciare questa sfera [per entrare nella fabbrica] pensiamo di poter percepire un cambio nella fisiologia della nostra dramatis personae. Colui che prima era il detentore di denaro ora ci sta di fronte come capitalista; il possessore di forza-lavoro segue come suo lavoratore. Karl Marx, Il Capitale, I (1867)
Si tenga a mente che in un mercato perfettamente competitivo, in realtà non importa distinguere chi assume da colui che viene assunto; che sia allora il lavoro ad impiegare il capitale. Paul Samuelson, “Salari ed Interessi” (1957)
Nel 1921 un gruppo di taglialegna, carpentieri e meccanici di Olympia, nello stato di Washington negli USA, formarono la cooperativa di falegnameria “Olympia Veneer”. Con un investimento di 1000 dollari, ogni membro conseguiva il diritto a lavorare nell’impianto, nonché il diritto ad una quota proporzionale dei profitti.1 Per lasciare la cooperativa, i membri erano tenuti a vendere le proprie quote azionarie. Per poter diventare membro, dietro approvazione del gruppo, si era obbligati a comprare quote che nel 1923 erano vendute a 2550$ l’una. Nel 1939, 250 lavoratori nella vicina Anacortes investirono 2000$ a testa in una seconda cooperativa di falegnameria. La forte domanda di legno compensato nel periodo della guerra spinse in alto il valore delle quote fino a 28.000$ nel 1951; nello stesso tempo i membri pagavano se stessi un salario pari al doppio del salario sindacale percepito dai lavoratori nei vicini stabilimenti di falegnameria tradizionali. Incoraggiati dal successo di Olympia Veneer e Anacortes, tra il 1949 ed il 1956 altre ventuno cooperative entrarono nel settore del legno nello stato di Washington ed in Oregon, nove delle quali attraverso l’acquisto di aziende convenzionali già esistenti. Alcune cooperative si erano de facto trasformate in aziende convenzionali o ad esse vendute. Per esempio, a 1
La migliore fonte di informazione sulle cooperative di falegnameria è una collana di studi da parte di Craig e Pencavel (Craig e Pencavel 1992, Craig e Pencavel 1995, Pencavel 2002). In generale, sulle cooperative di proprietà dei lavoratori si veda Dow (2002). Quanto segue è basato su tali studi.
2 | MICROECONOMIA
metà secolo i pochi membri-proprietari rimanenti di Olympia Veneer impiegavano un migliaio di lavoratori con contratti salariali ordinari, restando cooperativa solo nel nome. Nel 1954, essi vendettero le proprie quote alla U.S. Plywood Corporation; nella vendita, ventitrè dei membri iniziali realizzarono un rendimento medio sul loro investimento iniziale di 652.000$ (in dollari del 1954). Fino a quando l’intera industria si spostò dal Nord-Est al Sud-Ovest negli 80 e 90, circa la metà delle industrie di falegnameria erano cooperative, il resto erano aziende convenzionali, alcune di esse con lavoratori organizzati in sindacati, altre no. Sebbene le cooperative e le aziende convenzionali usassero in pratica gli stessi macchinari, le cooperative si specializzarono nel legno smerigliato che aveva una più alta intensità di lavoro poiché, come commentò un esperto di cooperative, “dava un premio all’impegno del lavoratore” (Bellas 1972:30). La struttura della tipica cooperativa di falegnami era sia egalitaria che democratica. Con poche eccezioni, i lavoratori-proprietari ricevevano un’uguale paga, e gli incarichi erano spesso ricoperti a rotazione. L’amministrazione era eletta dal consiglio dei membri-lavoratori. Alcuni dei non-membri erano assunti con contratti salariali convenzionali; in media essi rappresentavano un quarto della forza lavoro totale. Una forte etica lavorativa tra i membri permetteva di ottenere alti livelli di produttività, mantenuti attraverso controlli e stimoli reciproci. Di conseguenza, il risparmio sui costi di supervisione era sostanziale: quando un’azienda ordinaria si convertiva in una cooperativa, il numero dei supervisori veniva ridotto ad un quarto del livello precedente. Le quote in vendita dai membri che abbandonavano o andavano in pensione erano pubblicizzate nei giornali locali. I prezzi medi delle quote oscillavano tra un ammontare pari al reddito annuale dei singoli individui fino a tre volte tanto. Anche se ragguardevoli, questi prezzi erano di molto inferiori rispetto al valore attuale della differenza tra i guadagni nelle cooperative e nelle fabbriche sindacali: un individuo che avesse comprato una quota ed avesse lavorato nella cooperativa per qualche anno, avrebbe ottenuto un reddito il cui valore attuale era di molto superiore rispetto ad un individuo che avesse depositato la somma corrispondente in una banca di Portland ed avesse lavorato al salario sindacale in un’impresa ordinaria. La coesistenza di cooperative ed imprese tradizionali nella produzione di prodotti analoghi, con l’utilizzo di tecnologie praticamente identiche e per un periodo pari a tre-quarti di secolo, fornisce un’ottima opportunità per un’analisi comparata delle istituzioni. Durante questo periodo, le imprese convenzionali e le cooperative erano capaci di attrarre sia lavoro che capitale nello stesso modo. La produttività
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|3
totale dei fattori delle cooperative era sostanzialmente superiore – le migliori stime, da parte di Craig e Pencavel (1995), indicano percentuali tra il 6 e il 45 per cento superiori, a seconda del metodo di stima. Inoltre, le cooperative rispondevano alle fasi d’insufficiente domanda del prodotto a modo loro: piuttosto che licenziare i membri, esse riducevano la paga di tutti i lavoratori, distribuendo così l’impatto degli shock negativi tra tutti i membri del gruppo. In questo caso particolare, al contrario di quanto detto da Samuelson, era molto rilevante distinguere tra “chi assumeva e chi veniva assunto.” Uno dei compiti di ogni teoria delle istituzioni economiche è quello di spiegare fenomeni come la coesistenza nell’industria del legno di cooperative ed imprese convenzionali e le particolari forme assunte da queste ultime. Per esempio, data la superiore produttività totale dei fattori delle cooperative, ed i più alti guadagni di cui i loro membri beneficiavano, perché le cooperative non soppiantarono le imprese convenzionali? Per rispondere a domande di questo tipo, è necessario spiegare in genere sia la nascita che la cessazione dei vari tipi d’attività d’impresa, così come è necessario esplorare come le imprese si espandono, si fondono e si dividono. Ciò richiede, ovviamente, un’analisi di come i fornitori di capitale, i lavoratori ed i clienti scelgono tra vari tipi di impresa, basandosi sulle loro previsioni dei costi e dei benefici associati ad ognuna di esse. In questo capitolo userò le idee dei modelli sui mercati del lavoro e del credito sviluppate nei capitoli 8 e 9 per studiare la distribuzione dei contratti in un’economia capitalista. Con l’espressione distribuzione dei contratti, intendo riferirmi al modo in cui vengono assegnati a particolari individui i diritti di controllo sulle risorse e le rivendicazioni sul reddito residuo derivante dalle stesse risorse. Nell’industria del legno, le imprese convenzionali e le cooperative esemplificano due modi diversi di attribuzione dei diritti rilevanti: nelle seconde sia il diritto al residuo sia i diritti di controllo sono assegnati ai membri-proprietari che forniscono sia il capitale che il lavoro. Nelle prime, coloro che forniscono capitale e lavoro sono individui distinti, e il diritto al residuo (residual claimancy) e i diritti di controllo sono assegnati ai fornitori di capitale. Uso i termini diritto al residuo e diritti di controllo invece che il più generico termine proprietà per permettere la descrizione di situazioni in cui i diritti di controllo (la facoltà di utilizzo di una risorsa, inclusi la vendita ed il diritto di impedirne l’utilizzo ad altri) e la rivendicazione del reddito residuo generato dalla risorsa sono assegnati a soggetti distinti.
L’idea chiave del capitolo può essere sintetizzata brevemente. Dati i benefici
4 | MICROECONOMIA
della specializzazione e delle economie di scala, l’attività economica è necessariamente sociale anziché individuale, ed i tipi di accordi istituzionali che governano la produzione e lo scambio riflettono il fatto che i conflitti di interesse tra le parti interessate sono regolati da contratti incompleti. L’effetto congiunto di contratti incompleti e conflitti d’interesse è quello di far sì che l’esito finale dipenda da chi esercita il potere nella transazione. Il potere è generalmente esercitato da coloro che hanno i diritti residuali di controllo, cioè il diritto di determinare ciò che non è specificato nel contratto.2 Un primo compito, quindi, è quello di capire come questi diritti residuali di controllo vengano assegnati alle varie parti in causa in una transazione. Nella prima sezione che segue, si esaminerà uno dei possibili modi per affrontare questa questione – l’ipotesi di design efficiente – e si spiegherà perché essa è erronea. Sebbene l’assegnazione dei diritti di controllo sia presente in ogni transazione, essa è esaminabile con più chiarezza nello studio dell’impresa, cosa di cui ci si occuperà nella sezione successiva. Le teorie dell’impresa pongono la domanda: come si può esercitare potere negli scambi competitivi? Si offrirà una risposta (insieme ad una definizione di potere) nella sezione seguente. Si esplorerà quindi il modo in cui la ricchezza individuale determina il modo in cui gli individui si trovano ad occupare posizioni strutturali differenti a seconda dei contratti a disposizione e come questo processo determina a sua volta la distribuzione dei contratti in un’economia. Emergeranno tre risultati importanti. Primo, le differenze di ricchezza si riflettono nelle differenze tra le categorie di contratti fattibili e nelle scelta contrattuale effettuata dagli individui tra quelli possibili. Secondo, alcuni tra gli accordi contrattuali prevedono una struttura di autorità tale che i partecipanti ad un lato della transazione avranno potere (in un senso ben definito) sugli altri partecipanti, anche quando lo scenario è competitivo nel senso consueto di assenza di barriere all’entrata ed all’uscita. Pertanto, il fatto che la partecipazione sia volontaria non impedisce che venga esercitato potere. Terzo, i soggetti che esercitano potere saranno coloro con maggiore ricchezza. Nella penultima sezione, userò questa analisi per esplorare la struttura di classe di un’economia capitalista.
C A P ITA L IS M O
E
DESIGN EFFICIENTE
Perchè le cooperative, le associazioni e le altre alternative alle convenzionali imprese capitaliste hanno un’importanza così limitata nelle economie moderne? Cosa
2
L’attribuzione dei diritti di controllo non è condizione sufficiente né necessaria per l’esercizio del potere, dal momento che i primi danno ad un individuo l’autorità legittima di decretare un’azione, mentre il secondo presume che l’azione sia efficace, cosa per la quale l’autorità legittima non è né richiesta né adeguata. Sarà più semplice proseguire su questo punto dopo che il concetto di potere sarà stato introdotto con più precisione.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|5
spiega la straordinaria crescita economica delle economie le cui unità di produzione di base sono proprio le imprese capitaliste? Sarà istruttivo notare come i modelli introdotti fino ad ora offrano, quanto meno, riposte parziali a queste domande (e così facendo si avrà anche una prospettiva dei fallimenti del mercato endemici ad un’economia capitalista che sono stati individuati nelle pagine precedenti). Per economia capitalista, intendo un’economia nella quale la forma di organizzazione economica predominante è un’impresa nella quale i proprietari privati dei mezzi di capitale esercitano i diritti di rivendicazione del residuo e i diritti di controllo sui propri mezzi, impiegando altri input, compreso il lavoro salariato, per produrre beni e servizi da vendere allo scopo di realizzare profitti. Il capitalismo è un sistema economico di origine recente, che ha le sue radici nelle economie urbane di metà millennio fa nell’Italia settentrionale, in Inghilterra e nei Paesi Bassi. Un sistema che si espanse rapidamente prima in Europa, quindi nei luoghi dove gli emigranti Europei si stabilirono, ed infine nella maggior parte delle economie nel mondo. Altri aspetti della vita economica a volte usati per definire il capitalismo—la ricerca individuale del guadagno negli affari economici, lo scambio di mercato e l’uso del denaro—sono stati così presenti nella storia dell’umanità e sono apparsi in sistemi economici così tanto differenti l’uno dall’altro che una definizione più precisa come quella appena offerta sembra importante. Il capitalismo ha inaugurato una nuova era economica così diversa da quella che la precedette come lo fu l’emergere dell’agricoltura e la diffusione delle nuove istituzioni associate ad essa circa undici millenni prima. L’aspetto più evidente della “rivoluzione capitalista” fu la rapida crescita della produttività del lavoro, che rese possibile uno straordinario e prolungato innalzamento degli standard di vita materiale. Questo risultato produttivo non è materia di controversia neppure tra i più severi critici del capitalismo—Marx ed Engels lo sottolinearono nel Manifesto Comunista. Il fatto che non tutte le economie capitaliste abbiano prosperato in tutti i secoli, e che altri sistemi economici siano riusciti anch’essi a favorire una rapida e sostenuta crescita nella produttività del lavoro (per esempio, la Cina nell’ultimo terzo del ventesimo secolo) non sminuisce l’entità dei risultati ottenuti dal capitalismo nel corso dei secoli come sistema di straordinaria produttività. Ciò che il capitalismo ha ottenuto, e ciò che spiega gran parte del suo successo produttivo, è la circostanza che alcuni individui avevano la possibilità di innovare ed assumersi rischi su progetti di grande scala con la ragionevole aspettativa di trarne benefici in caso di successo ed allo stesso tempo di sopportarne i costi in caso di fallimento. Le disuguaglianze nella ricchezza, l’esistenza del credito e degli altri
6 | MICROECONOMIA
mercati finanziari (con l’ausilio dell’introduzione della responsabilità limitata) permisero a singoli individui o a piccoli gruppi di raccogliere sotto un’unica direzione importanti risorse. Il mercato del lavoro consentì che queste risorse materiali fossero utilizzate impiegando un ampio numero di lavoratori, così da poter trarre beneficio dai rendimenti crescenti sia tecnologici sia organizzativi. La ricchezza (e la garanzia del credito) dei dirigenti di questi progetti imprenditoriali rese tollerabile il rischio associato all’innovazione. Questa gli permise anche di offrire una quota d’assicurazione de facto a coloro che essi ingaggiavano, nella forma del contratto salariale. Il risultato fu che coloro che non avevano nulla da offrire salvo che il proprio lavoro potessero essere coinvolti in progetti i cui rischi essi non avrebbero mai voluto assumersi personalmente. Per la prima volta nella storia, la competizione tra i membri dell’elite economica dipendeva dal successo di ognuno nell’introduzione di modi inediti di organizzazione della produzione e delle vendite, di nuove tecnologie e di nuovi prodotti. Il successo di queste organizzazioni dipese in modo decisivo dalla relativa sicurezza del possesso data dalle regole del diritto, ottenute in larga parte dai sempre più potenti stati nazionali che crebbero in simbiosi con le istituzioni economiche capitaliste. Il capitalismo non si avvalse di contratti completi per il suo successo. È vero piuttosto il contrario: il capitalismo stimolò la rapida diffusione di nuove tecniche attraverso un processo competitivo nel quale una buona parte del surplus generato dagli innovatori poteva essere carpito da coloro che replicavano le innovazioni. Questo processo di innovazione ed emulazione rese possibili delle allocazioni che erano largamente diverse da quelle implicate dalle condizioni statiche di efficienza caratteristiche di un equilibrio competitivo in un’economia Walrasiana idealizzata. Inoltre il capitalismo accrebbe la produttività espandendo significativamente la portata sia del mercato del lavoro sia di quello finanziario. Entrambi i mercati erano noti allora come lo sono adesso per la natura tipicamente incompleta dei contratti rilevanti, non per la loro conformità con i principi Walrasiani. (Allo stesso modo, la rapida crescita dell’economia Cinese nel tardo ventesimo secolo fu guidata da una nuova forma organizzativa—l’impresa delle “piccole città e dei villaggi”— caratterizzata da contratti incompleti e da un insieme di diritti di proprietà non ben definiti.) Gli economisti tuttavia usano spesso ciò che io chiamo l’ipotesi di design efficiente come comoda scorciatoia analitica ispirata dalla biologia evoluzionista. I biologi a volte suppongono che poiché le creature viventi sono soggette alla selezione naturale, esse si adatteranno col tempo in maniera ottimale al loro ambiente circostante. Questa ipotesi di design efficiente riduce l’onere di studiare, caso per caso, i particolari del processo di eredità genetica, l’espressione del genotipo nel
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|7
fenotipo, la natura del processo selettivo, e così via. Gli economisti spesso invocano un ragionamento simile. Sappiamo dal Teorema Fondamentale che se tutte le azioni che hanno un effetto sul benessere altrui sono regolate da contratti il cui enforcement può essere assicurato a costo zero, gli equilibri competitivi saranno Pareto efficienti, a prescindere dalla distribuzione della ricchezza. Ma anche quando la completezza contrattuale ipotizzata dal Teorema Fondamentale viene meno, il presupposto di design efficiente è spesso mantenuto. L’economia dei costi di transazione di Oliver Williamson (1985, p.22) si basa, come egli spiega, “sull’efficacia della competizione nel […] distinguere tra modelli di organizzazione più o meno efficienti e di smistare risorse in favore dei primi.” Holmstrom e Tirole (1989, p.63) descrivono il pensiero dominante in economia in questo modo: “I design contrattuali sono creati per minimizzare i costi di transazione…. Ciò segue dall’ipotesi originale di Coase che vede le istituzioni come adattamenti ottimali ai vincoli contrattuali.” Ma essi notano “che raramente o quasi mai si conosceranno i dettagli di come un assetto efficiente venga trovato” (p.64). Nonostante il caveat individuato da Holmstrom e Tirole, in economia è prassi assumere che laddove la proprietà delle risorse può essere prontamente scambiata e dove non ci siano impedimenti ad una contrattazione efficiente, l’assegnazione inefficiente del controllo e del diritto al residuo sulle risorse sarà eliminata dallo scambio volontario dei diritti. Questa intuizione di Coase motiva l’aspettativa che in economie di mercato competitive e con pochi impedimenti alla contrattazione privata, le risorse saranno possedute da coloro che possono usarle nella maniera più efficiente, a prescindere dalla loro ricchezza. Se un inquilino può fare un uso migliore della casa come proprietario, la casa varrà di più per l’inquilino che per il proprietario, e quindi ci si può aspettare che l’inquilino compri il bene immobile. L’ipotesi di design efficiente permette quindi una notevole semplificazione: senza sapere in ogni caso particolare se l’assegnazione dei diritti di proprietà sia efficiente o meno, possiamo presupporre o che lo sia, o che sia approssimativamente tale, oppure ancora che tenda in quella direzione. La presunzione di efficienza può allora guidarci nell’individuare quali particolari caratteristiche istituzionali siano di interesse analitico, e quali siano invece marginali o rare. Il diffuso (spesso implicito) utilizzo dell’ipotesi di design efficiente è in parte spiegato dal fatto che è virtualmente impossibile determinare dal punto di vista empirico se un particolare assetto istituzionale sia efficiente oppure no. Esistono pochi tentativi in tal senso, e ne esistono ancora meno che possano vantare un consenso da parte degli studiosi delle rispettive aree di ricerca. Alcune delle ragioni per le quali processi evolutivi plausibili possono portare ad
8 | MICROECONOMIA
istituzioni inefficienti sono state delineate alla fine del capitolo 2. Ora invece è possibile spiegare un ulteriore problema con l’ipotesi di design efficiente. Le stesse asimmetrie informative che fanno sì che alcune attribuzioni dei diritti di proprietà siano più efficienti di altre, impediscono sistematicamente il processo di redistribuzione negoziata dei diritti di proprietà ipotizzato da Coase che determinerebbe un aumento della produttività. L’errore nel ragionamento di base dell’economia delle transazioni e di approcci simili sta nel fatto che laddove i contratti sono incompleti, non c’è alcuna ragione di pensare che la competizione (o qualsiasi altro processo) possa determinare risultati ottimali (eccetto nel senso tautologico che essi sono il risultato di un’ottimizzazione individuale). In particolare, gli agenti che non hanno abbastanza ricchezza potrebbero essere razionati nel credito e quindi non avere la possibilità di acquistare quei mezzi sui quali l’esercizio dei diritti di controllo e del diritto al residuo permetterebbe i miglioramenti in efficienza. Inoltre, come abbiamo visto nel capitolo 5, è improbabile che si ottenga una negoziazione efficiente in condizioni anche solo minimamente realistiche. Contrariamente ad una comune errata interpretazione del pensiero di Coase, in tali casi la distribuzione dei diritti di proprietà ha un effetto sull’efficienza allocativa. (Il “teorema” non è sbagliato. Il malinteso nasce dal fatto che in questo caso risulta violata l’ipotesi che non ci siano impedimenti alla contrattazione efficiente.) Il fallimento dell’ipotesi di design efficiente pone una sfida interessante: se la struttura dei contratti e le altre istituzioni non sono il risultato di un algoritmo non meglio definito che implementa soluzioni efficienti ai problemi allocativi, quali strumenti analitici possiamo adoperare per spiegare le istituzioni osservate empiricamente e la loro evoluzione? Questa domanda occuperà il resto del libro, a cominciare dall’analisi delle istituzioni di un’economia capitalista in questo capitolo per occuparci dopo della questione riguardante la nascita, l’evoluzione e l’estinzione delle istituzioni nei prossimi tre capitoli, per concludere quindi con un’analisi delle nuove configurazioni istituzionali e di quelle contemporanee. Nella struttura analitica che sarà sviluppata, sarà importante “chi viene assunto e chi assume” poiché in un mondo di contratti incompleti, l’assegnazione dei diritti di controllo dà ad una delle parti il potere di determinare tutto ciò che non è specificato contrattualmente. L’affermazione di Samuelson è vera nel modello Walrasiano perché in quell’impianto “assumere” significa semplicemente “comprare”. “Cosa significa,” chiese Oliver Hart (1995, p.62), “dare a qualcuno l’incarico di un’azione o di una decisione se tutte le azioni possono essere specificate in un contratto?” Questo semplice punto spiega anche perché, nelle parole di Marx, le transazioni contrattuali
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|9
sui mercati competitivi appaiano come un libero scambio tra eguali (“un vero Eden dei diritti innati dell’uomo”), mentre nel posto di lavoro le parti di un contratto di lavoro assumono un’apparenza diversa: il datore di lavoro è il capo, e l’impiegato il “suo lavoratore.”
IMPRESE: PERCHÉ
IL
C A P ITA L E A S S U M E
IL
L AV O R O
Come per rispondere a Samuelson, John Kenneth Galbraith (1967, p.47) criticava gli economisti per non essersi chiesti “perché il potere sia associato con alcuni fattori [di produzione] e non con altri.” Un buon punto di partenza per poter dare una risposta è quello che ho chiamato in precedenza (capitolo 8) la teoria di Marx-Coase-Simon sul rapporto di impiego. La caratteristica fondamentale di questa teoria è quella di rappresentare l’impresa come un gruppo di fornitori di input per un processo produttivo comune le cui attività sono coordinate da una struttura autoritativa piuttosto che da scambi di mercato regolati da contratti completi.3 Tra le versioni moderne di questa teoria ci sono gli approcci basati sull’informazione asimmetrica (o non verificabile) ed i contratti incompleti ed incentivi non allineati che a questa conseguono nei mercati del lavoro e del credito analizzati nei capitoli 8 e 9. Altri studi hanno osservato che coloro che forniscono fattori di produzione all’impresa non possono impegnarsi in maniera credibile a non sfruttare la riduzione nella posizione di riserva di quei membri dell’impresa che hanno effettuano investimenti in mezzi produttivi specifici alla transazione. (Gli investimenti specifici alla transazione sono stati introdotti come un ostacolo alla contrattazione efficiente nel capitolo 5.) Il problema analitico chiave è quello di capire come la struttura dell’impresa affronti i problemi di conflitto e di incentivi che derivano dal fatto che l’incompletezza dei contratti di lavoro, di credito e di altri tipi di contratto, permette a coloro che godono dell’autorità di prendere decisioni nell’impresa di avere potere sul denaro, sulle risorse e sul lavoro di altre persone. Una domanda importante da porsi, allora, è come mai nelle economie capitaliste i diritti di controllo non sono generalmente assegnati a coloro che lavorano nell’impresa ma a coloro che forniscono capitale alla stessa, o ai loro rappresentanti. Per rispondere a questa domanda, quattro diversi approcci evidenziano (rispettivamente) l’impiego salariato come una forma di assicurazione per i lavoratori avversi al rischio, il problema del monitoraggio dell’impegno lavorativo, il problema di holdup dovuto alle risorse
3
Tra i più importanti contributi in materia ci sono Alchian e Demsetz (1972), Williamson (1985), Milgrom (1988), Grossman e Hart (1986), e Hart (1995). Esistono differenze tra questi autori, ma essi condividono quella che io ho chiamato la concezione di Marx-Coase-Simon dell’impresa.
10 | MICROECONOMIA
specifiche alla transazione, ed i vincoli al credito fronteggiati dai fornitori di lavoro.4 Il primo approccio, che può essere ricondotto a Frank Knight (1921), spiega la struttura dell’impresa mediante due elementi: il primo è che il reddito derivante da un processo di produzione congiunto varia in maniera stocastica, il secondo elemento è che il costo del rischio è maggiore per i fornitori di lavoro che per fornitori di capitale. Il contratto a salario fisso offre un’assicurazione contro le variazioni nel reddito, e questa copertura ha un valore per i fornitori di lavoro maggiore rispetto al costo che incorrono i fornitori di capitale nell’offrirla.5 La logica sottostante a questo approccio è stata presentata nella penultima sezione del capitolo 9, dove l’avversione al rischio spiegava come i fornitori possano non avere la possibilità di diventare i titolari del diritto al reddito residuale che essi generano anche quando ciò permetta aumenti tecnici di efficienza. Il contratto a salario fisso rende i fornitori di capitale necessariamente i titolari del diritto al residuo sul flusso di reddito del processo produttivo. In questo caso, un assetto in cui i fornitori di capitale esercitano anche il controllo sulle risorse rilevanti riduce il costo di attrarre capitale sul progetto. (Essere titolari del diritto al residuo del flusso di reddito di una risorsa di cui non si ha il controllo non è una prospettiva attraente per gli investitori se, come è generalmente il caso, il modo di utilizzo di una risorsa non è soggetto a contrattazione completa.) Questo approccio è facilmente esteso ai casi in cui i fornitori di lavoro sopportano parte del rischio sia come titolari del diritto al reddito residuale dell’impresa (suddivisione dei profitti) sia perché parte della loro paga è basata su una misura imperfetta della loro stessa performance lavorativa. L’idea di base è che la struttura dell’impresa rappresenti un adattamento ai diversi livelli di avversione al rischio tra i fornitori di input. Seguendo un secondo approccio, quello di Armen Alchian e Harold Demsetz (1972), l’assegnazione del controllo e del diritto al residuo è spiegata dalla natura collettiva della produzione e dai vantaggi derivanti dal porre il titolare del diritto al residuo come supervisore dell’impegno lavorativo. Se i benefici della specializzazione e delle economie di scala impediscono la produzione individuale, è nell’interesse di tutte le parti trovare un metodo per prevenire il free riding da parte dei membri del team di produzione. Lo shirking da parte dei membri del gruppo può essere arginato 4
La lista non è esaustiva. Una trattazione più completa è fornita da Putterman e Dow (2000). Il fatto che i fornitori di lavoro siano più avversi al rischio rispetto ai fornitori di capitale non richiede che l’avversione al rischio sia decrescente nel reddito né che i primi siano più poveri dei secondi. La maggiore avversione al rischio dei fornitori di lavoro (misurata, come nel capitolo 9, per mezzo del loro tasso marginale di sostituzione tra reddito atteso e rischio) potrebbe essere ugualmente spiegata dalla loro maggiore esposizione al rischio dovuta al fatto che i fornitori di capitale hanno la possibilità di ridurre la variabilità del loro reddito per mezzo della differenziazione della loro proprietà, ed alle difficoltà che hanno i lavoratori nel diversificare le loro fonti di reddito. 5
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|11
da un controllore, ma i livelli d’impegno del controllore sono anch’essi variabili e non soggetti a contratto: “chi controlla il controllore?” si chiedono Alchian e Demsetz (p. 781). Una possibile soluzione è quella di pagare ai membri un salario fisso e lasciare che il controllore sia il titolare del diritto al reddito residuale del team. Per essere efficace, il controllore deve avere l’autorità di modificare i termini del contratto dei singoli membri, compresa l’autorità di porre fine alla loro appartenenza al gruppo. L’assegnazione dei diritti che Alchian e Demsetz chiamano “l’impresa capitalistica classica” controllata da un proprietario-controllore risolve quindi il problema dello shirking. Si noti che il ragionamento non richiede che il controllore abbia la proprietà del capitale fornito all’impresa. In ogni caso, è facilmente dimostrabile che fin quando i contratti riguardanti l’uso e la manutenzione dei mezzi di produzione sono incompleti, vi sarà divergenza di incentivi ogni qualvolta che il proprietario dei mezzi ed il detentore dei diritti di controllo e del diritto al residuo siano soggetti distinti. Il problema verrebbe eliminato se la parte che detiene il diritto al residuo e i diritti di controllo fosse la stessa che ha la proprietà dei mezzi. Si possono notare due problemi posti dall’impresa di Alchian e Demsetz intesa come espediente contro lo shirking. Primo, l’impresa “classica” spiegata da questo approccio ricopre un ruolo soltanto marginale nelle economie moderne, dove il monitoraggio dell’impegno lavorativo è raramente eseguito dai proprietari, ed è eseguito piuttosto da un ampio numero di soggetti per la maggior parte dei quali le paghe sono debolmente, se non per nulla, correlate alla performance di coloro che essi supervisionano. Secondo, come è stato suggerito nel capitolo 4, il monitoraggio reciproco tra colleghi può essere efficace quando il gruppo è il titolare del reddito residuale che genera. L’evidenza sperimentale sui giochi con beni pubblici e punizione (capitolo 3) supporta questo modello alternativo di monitoraggio, così come lo corrobora il successo delle cooperative del legno sopra menzionate. Lo stesso problema di monitoraggio posto da Alchian e Demsetz potrebbe essere meglio risolto rendendo titolari del reddito residuale i membri del team, assumendo eventualmente un manager cui poter riferire infrazioni delle regole lavorative da parte dei colleghi di lavoro (se i metodi diretti di supervisione reciproca non bastassero), ed offrendo una rendita sostanziale al manager, il quale rimarrebbe assunto fin quando la performance dell’impresa (che è osservabile) sia soddisfacente.6 Il terzo approccio prevede che i diritti di controllo siano assegnati alla parte che 6 Alchian e Demsetz assumono che un tale arrangiamento sarebbe peggiore rispetto al loro contolloreproprietario specializzato, ma il loro ragionamento—che esistano forti incentivi allo shirking in grandi gruppi di titolari del diritto al residuo—non è suffragato né dagli esperimenti con gruppi numerosi (Isaac, Walker e Williams 1994) né dall’efficacia della paga collettiva in gruppi di lavoro di notevole dimensione (Hansen 1997, Prendergast 1999).
12 | MICROECONOMIA
ha maggior interesse a proteggere il valore degli investimenti specifici alla transazione. Si ricordi (dal capitolo 5) che i mezzi specifici alla transazione sono quelli il cui valore in una particolare transazione è maggiore rispetto alla loro prossima migliore alternativa. La conoscenza da parte di un impiegato del software utilizzato dal proprio datore di lavoro è un esempio, così come l’investimento che un’impresa fa nel reclutare e addestrare un particolare impiegato, oppure la collocazione di un’azienda in una particolare area geografica al fine di sfruttare le competenze specifiche dei lavoratori che vi risiedono. Gli investimenti specifici ad una determinata transazione hanno l’effetto di diminuire la posizione di riserva dell’investitore rispetto alla posizione di riserva che avrebbe avuto se l’investimento fosse stato generale invece che specifico. Di conseguenza, se una transazione soddisfa ex ante tutti i relativi vincoli di partecipazione come eguaglianza, il progetto genererà rendite positive ex post, cioè dopo che gli investimenti specifici siano stati effettuati. Se le parti non possono impegnarsi ex ante al rispetto di una determinata ripartizione di queste rendite, su di esse avverrà una negoziazione ex post. Coloro che effettuano investimenti specifici, e che quindi subiscono una riduzione della loro posizione di riserva, saranno soggetti al cosiddetto hold-up della controparte, cioè alla rinegoziazione dei termini della transazione sulla base delle posizioni di riserva ex post. Il risultato (come mostrato nel capitolo 5) sarà che gli investimenti generici verranno favoriti e ci sarà una tendenza ad investire in misura sub-ottimale in risorse specifiche alla transazione. Supponiamo ora che per uno dei fornitori di input le opportunità di compiere investimenti specifici siano molto limitate o nulle, mentre supponiamo che gli investimenti specifici della controparte contribuiscano in maniera sostanziale al prodotto congiunto dell’impresa. Se l’impresa è strutturata in maniera tale che il fornitore con l’opportunità di realizzare investimenti specifici detiene anche tutto il potere contrattuale, egli carpirà tutto il surplus ex-post, a prescindere dalla sua decisione di investimento, e non avrà quindi nessun incentivo ex ante a compiere investimenti specifici in modo sub-ottimale. Se entrambi i fornitori possono contribuire in modo sostanziale al progetto attraverso investimenti specifici, l’attribuzione del potere contrattuale ad una sola delle parti risulterebbe in un investimento nullo della controparte; per cui l’allocazione dei diritti di controllo ad una sola parte difficilmente massimizzerà il surplus congiunto. Se, come comunemente ipotizzato, i fornitori di capitale hanno l’opportunità di effettuare investimenti specifici più importanti rispetto ai fornitori di lavoro, allora i fornitori di capitale devono avere tutto il potere contrattuale e, di conseguenza, i diritti di controllo nell’impresa.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|13
Secondo questo approccio la distribuzione dei diritti di controllo nell’impresa deriva quindi dalla misura in cui gli investimenti specifici sono capaci di aumentare il valore produttivo del lavoro, dei beni capitali e degli input forniti dagli altri partecipanti all’impresa. Questo potrebbe sembrare uno di quei casi in cui la tecnologia (che si esplicita negli input che traggono più vantaggio dagli investimenti specifici) determina la struttura istituzionale (che si riflette nella distribuzione dei diritti di controllo nell’impresa). Ma, come è stato sottolineato da Ugo Pagano (1993), la relazione causale potrebbe anche operare in direzione opposta, dalla struttura istituzionale alla tecnologia. Qualora i lavoratori avessero forti garanzie di non licenziamento, essi sarebbero più disponibili ad investire nell’acquisizione di competenze specifiche alla transazione e quindi le imprese avrebbero un incentivo ad adottare tecnologie che usino tali competenze. Pagano dimostra che sono possibili molti di questi “equilibri tecnologico-istituzionali”; in alcuni di essi i fornitori di capitale avranno i diritti di controllo ed il capitale sarà il fattore più specifico, in altri il lavoro sarà invece il fattore più specifico alla transazione ed i lavoratori deterranno i diritti di controllo. L’approccio basato sulla specificità dei mezzi di produzione fu sviluppato inizialmente per spiegare le dimensioni delle imprese e i rapporti tra di esse piuttosto che le relazioni tra capitale e lavoro all’interno delle stesse. Per molti aspetti, questo approccio risulta più efficace nello spiegare il suo argomento originale. Una componente della teoria è inconfutabile: vi è una sostanziale perdita di valore associata all’installazione di macchinari, anche ad uso generico – tipicamente più della metà del costo iniziale (Asplund, 2000). Ma non è chiaro come questi investimenti siano suscettibili all’hold-up da parte degli impiegati di un’impresa. Se uno di essi o anche tutti abbandonassero, la scelta dell’impresa non sarebbe quella di distruggere i propri macchinari o di venderli sul mercato dell’usato, sarebbe invece quella di pagare i costi di sostituzione per rimpiazzare la forza lavoro. Questi costi sono tipicamente molto minori rispetto alle perdite derivanti dalla distruzione dei macchinari, probabilmente nell’ordine del 5–10 per cento della paga di un impiegato durante il primo anno (Malcomson 1999). Un secondo problema dell’approccio basato sulla specificità dei mezzi è l’incongruenza tra l’ipotesi che i membri dell’impresa non possano impegnarsi ex ante ad una divisione delle rendite ex post ma che essi possano invece impegnarsi ad uno schema di negoziazione che assicuri lo stesso risultato. L’ultimo approccio alla teoria dell’impresa prevede che l’assegnazione ai fornitori di capitale del diritto al residuo e dei diritti di controllo dipende dal fatto che il costo del capitale fornito ad un impresa controllata dai suoi impiegati sarebbe maggiore rispetto al costo del capitale per un’impresa, per altri aspetti identica, ma
14 | MICROECONOMIA
controllata dai suoi fornitori di capitale. Questo risultato deriva dal fatto che i lavoratori non hanno abbastanza ricchezza, insieme al fatto (approfondito nel capitolo 9) che gli interessi da pagare su un prestito, determinati da un mercato competitivo, sono inversamente proporzionali alla ricchezza del debitore, per un progetto di date dimensioni e qualità. Il basso valore delle quote delle cooperative del legno menzionate all’inizio del capitolo suggerisce un alto prezzo implicito del capitale per i fornitori di lavoro. Ma le cooperative del legno mostrano anche un aspetto più sottile della questione. Le banche che davano prestiti alle cooperative spesso sentivano la necessità di concludere accordi direttamente con i membri della cooperativa invece che solo con l’amministrazione, dal momento che i singoli membri potevano prontamente terminare il contratto dell’amministratore. La maggiore difficoltà di questi assetti organizzativi ha sicuramente aumentato il costo dei prestiti (Gintis, 1989a). Sebbene anche le amministrazioni delle imprese convenzionali possano essere liquidate dai proprietari, l’eterogeneità di interessi (e quindi la possibilità di processi decisionali incoerenti nel tempo) è considerevolmente maggiore tra i lavoratori che tra i fornitori di capitale. In parte ciò è vero perchè i secondi hanno una relazione a distanza (arms-length) con il progetto e possono facilmente accordarsi sull’obiettivo di massimizzare i rendimenti sui loro mezzi, mentre le risorse dei lavoratori sono concentrate nel progetto, ed essi possono fornire lavoro solo essendo presenti nell’impresa.7 Sia separatamente che (con più probabilità) congiuntamente, queste quattro teorie sembrano fornire una spiegazione convincente della tendenza ad attribuire i diritti residuali di controllo nelle imprese ai fornitori di capitale piuttosto che ai lavoratori.8 Ciò che non è stato spiegato, però, è perchè i diritti di controllo conferiscano potere. Dal punto di vista empirico l’impresa sembra essere un’istituzione politica, nel senso che alcuni dei suoi membri impartiscono regolarmente degli ordini aspettandosi che questi vengano eseguiti, quando altri membri sono soggetti ad obbedire. Dire che il manager ha il diritto di decidere cosa fa il lavoratore significa solo che ha l’autorità legittima di farlo, non il potere di garantire che il lavoratore effettivamente obbedisca. Dal momento che il manager ed il controllore sono chiaramente limitati quanto ai tipi di punizione che essi possono infliggere, e poiché il lavoratore è libero di lasciare, il fatto che gli ordini sono
7 Le preferenze eterogenee dei lavoratori possono rendere l’esercizio dei diritti di controllo più costoso o portare ad un’incoerenza nel processo decisionale, il che offre un’ulteriore motivo per il quale i diritti di controllo sono assegnati ai fornitori di capitale. 8 Dico “sembrano” perchè questi modelli sono stati usati raramente per spiegare le variazioni nella struttura delle imprese dal punto di vista empirico; e nei pochi casi esistenti, i risultati sono misti (Prendergast 1999).
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|15
tipicamente eseguiti rappresenta un rebus. Perchè, usando la formulazione iniziale di Coase, il comando di un manager (di trasferirsi “dalla divisione Y alla divisione X”) viene obbedito? Notando la mancanza di una buona risposta, Alchian e Demsetz sfidarono l’idea di Coase che l’impresa sia una “mini-economia di comando,” e suggerirono che il contratto di impiego non differisce assolutamente da altri contratti: L’impresa [...] non ha potere di fiat, né alcuna autorità o azione disciplinare minimamente diversa da una normale contrattazione di mercato tra due persone qualunque.... In che cosa allora differisce la relazione tra un droghiere ed un suo impiegato dalla relazione tra un droghiere ed un suo cliente? (1972, p.777)
Hart offre la seguente risposta ad Alchian e Demsetz: [I]l motivo per cui un impiegato è più suscettibile alla volontà del suo datore di lavoro rispetto a quanto lo sia un droghiere [...] alla volontà del suo cliente [...] è che il datore di lavoro [...] può negare all’impiegato l’utilizzo dei mezzi con cui egli lavora ed assumere un altro lavoratore per lavorare con gli stessi mezzi, mentre il cliente può solo negare al droghiere solo se stesso e fin tanto che il cliente è piccolo, presumibilmente non è troppo difficile per il droghiere trovare un altro cliente (1989, p.1771).
Hart individua la differenza tra il droghiere ed il datore di lavoro assumendo che l’impiegato non ha bisogno di avere un qualsiasi lavoro (e quindi dei mezzi qualunque) ma necessita dei mezzi di quel particolare datore di lavoro. Ciò può essere dovuto ad una complementarietà tra i due (per esempio, l’impiegato potrebbe aver effettuato un investimento nell’acquisizione di competenze specifiche che hanno valore solo quando utilizzate con quei particolari mezzi). Si pensi anche ad altri esempi meno ovvi (e forse più importanti). Un lavoratore a cui viene negato l’utilizzo di una particolare risorsa potrebbe essere costretto a trasferirsi altrove, con conseguenze negative sulla famiglia e le amicizie. La perdita di un lavoro potrebbe anche danneggiare la reputazione del lavoratore. Sebbene investimenti specifici di questo tipo spieghino indubbiamente alcune delle relazioni di autorità – in città nelle quali esiste una sola compagnia o per certi professionisti e manager – l’approccio non sembra sufficientemente generale da fornire un’adeguata spiegazione dell’intera struttura d’autorità di un’impresa, specialmente nei grandi mercati del lavoro urbani e per gli impiegati non professionisti. Nella sezione che segue si svilupperà una spiegazione complementare basata sul fatto che l’impiegato al quale viene negato l’accesso ad un particolare mezzo produttivo possa non avere accesso ad un qualsiasi altro mezzo anche in un’economia competitiva in cui gli investimenti specifici siano assenti. Ciò richiederà un chiarimento su cosa intendiamo per potere. Persino l’autore della più famosa definizione di potere, Robert Dahl, espresse le sue perplessità sulla vaghezza del termine.9 Tuttavia sembra difficile astrarre dal concetto di “potere” ed 9
La definizione di Dahl (1957:202–203) è: “A ha potere su B se riesce a far fare a B qualcosa che B
16 | MICROECONOMIA
infatti esso è sempre più utilizzato, anche in economia.
P O T E R E “S H O RT -S ID E ”
IN U N O
S C A M B IO C O M P E T I T I V O
L’uso comune del termine suggerisce una serie di caratteristiche che devono essere presenti in ogni plausibile rappresentazione del potere. Primo, il potere è interpersonale, un aspetto di una relazione tra persone, non una caratteristica di un singolo individuo. Secondo, l’esercizio del potere implica la minaccia e l’uso di sanzioni.10 Terzo, il concetto di potere dovrebbe essere normativamente indeterminato, in modo da permettere miglioramenti Paretiani (come è stato sottolineato dagli studiosi di potere da Hobbes a Parsons) ma anche suscettibile di uso arbitrario a danno di altri ed in violazione di principi etici. Infine, per essere rilevante all’analisi economica, il potere deve essere sostenibile come equilibrio di Nash di un gioco propriamente definito. Il potere può ovviamente essere esercitato anche in situazioni di disequilibrio, ma come aspetto duraturo di una struttura sociale deve riflettere comportamenti che siano ottimali. Il fatto che le sanzioni siano essenziali al suo esercizio rende il potere distinto da altri strumenti per l’ottenimento di benefici, compresi strumenti come la ricchezza che possono operare persino in assenza di interazioni strategiche, come nel contesto di un mercato Walrasiano. La condizione sufficiente per l’esercizio del potere che segue include queste quattro caratteristiche: Affinché B abbia potere su A, è sufficiente che, attraverso l’imposizione di sanzioni o la minaccia delle stesse su A, B sia capace di influenzare le azioni di A in maniera tale che B ne benefici, ed allo stesso tempo A non abbia questa capacità su B (Bowles e Gintis 1992). La definizione chiarisce la differenza tra datore di lavoro e droghiere nella risposta di Hart ad Alchian e Demsetz: le sanzioni imposte ad un impiegato privandolo dell’accesso al bene capitale sono severe, mentre quelle imposte al droghiere dal cliente perso sono trascurabili o nulle. La ragione per cui il consumatore non impone una sanzione al droghiere è che il droghiere (in un equilibrio competitivo) sta massimizzando i profitti scegliendo un livello di vendite che eguaglia il costo marginale ad un dato prezzo dato esogenamente così che una piccola variazione nelle vendite ha solo un effetto di secondo ordine sui profitti. Verifichiamo ora come questa concezione di potere possa applicarsi al rapporto d’impiego in assenza di specificità della transazione. altrimenti non farebbe.” 10 Infatti, molti teorici politici considerano le sanzioni come la caratteristica che definisce il potere. Lasswell e Kaplan (1950:75) fanno dell’uso di “severe sanzioni…per sostenere una politica contro l’opposizione” una caratteristica che definisce una relazione di potere, e Parsons (1967:308) osserva che “la presupposizione dell’enforcement per mezzo di sanzioni negative in risposta ad una situazione di rivolta” sia una condizione necessaria per l’esercizio del potere.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|17
Se ritorniamo al modello del capitolo 8, sappiamo che e* > e: in equilibrio il lavoratore si impegna di più di quanto avrebbe fatto in assenza di una strategia di incentivi da parte del datore di lavoro. Per cui sappiamo che in equilibrio il lavoratore riceve una rendita (v* > z) e che lavorando con un impegno maggiore di e permette al datore di lavoro di ottenere un tasso di profitto più alto, * > (e ,w) . Questi risultati, considerati congiuntamente, implicano che il datore di lavoro induca il lavoratore ad agire nell’interesse del datore di lavoro per mezzo di una credibile minaccia di sanzione. Il lavoratore non ha questa capacità, poiché se egli minacciasse di sanzionare il datore di lavoro in caso di mancato aumento salariale (danneggiando i macchinari o picchiandolo o semplicemente lavorando meno sodo) la minaccia non sarebbe credibile. Il datore di lavoro semplicemente rifiuterebbe di rispondere, consapevole del fatto che l’esecuzione della minaccia non è nell’interesse del lavoratore.
Si noti che l’esercizio del potere permette un miglioramento Paretiano rispetto ad una situazione controfattuale in cui il potere non possa essere esercitato, cioè quella in cui il lavoratore è assunto al suo salario di riserva w e lavora al livello di impegno di riserva e. Come sappiamo ciò deriva direttamente da v* > v(e, w) = z e * > (e,w) , cioè dal fatto che sia l’utilità attesa permanente del lavoratore che i profitti dell’impresa sono maggiori in equilibrio (nel caso in cui venga esercitato il potere) rispetto alla posizione di riserva (in assenza di potere). Questo è un ulteriore esempio di una situazione nella quale l’esercizio del potere aiuta ad affrontare i fallimenti del coordinamento, sebbene con conseguenze a volte discutibili sulla distribuzione dei benefici. Un esempio segue. Consideriamo nuovamente l’analisi delle amenità sul posto di lavoro del capitolo 8. Supponiamo che a non rappresenti un’amenità innocua, come la qualità della musica del sistema audio in ufficio, ma invece pratiche manageriali che incidono sulla dignità del lavoratore, come ad esempio il non essere soggetto ad insulti razziali, ad abusi sessuali, o ad altri soprusi sul posto di lavoro. Sappiamo che in equilibrio p = 0 e n > 0 . Ne segue che il datore di lavoro può infliggere costi di primo ordine a
a
sul lavoratore (riducendo di poco a) ed un costo di secondo ordine a se stesso (i costi sono di secondo ordine perchè p = 0 ). Quindi, l’equilibrio competitivo in un a
rapporto d’impiego offre al datore di lavoro non solo la capacità di esercitare potere per attenuare i problemi di coordinamento, ma anche di esercitare potere arbitrariamente, cioè di infliggere costi ad altri con un costo nullo per se stesso. Per cui l’interazione strategica tra datore di lavoro e lavoratore permette l’esercizio del potere in maniera conforme alle quattro condizioni delineate sopra: le
18 | MICROECONOMIA
sanzioni sono minacciate (ed usate) in modo credibile in un’interazione strategica che descrive un equilibrio di Nash ed il risultante esercizio del potere rappresenta un miglioramento Paretiano rispetto ad una plausibile situazione alternativa, ma può anche essere usato arbitrariamente. È facile verificare che il potere, nel senso che abbiamo definito, può essere esercitato anche nel modello con rinnovo condizionato (contingent renewal) del mercato del credito studiato nel capitolo 9. Il creditore offre al debitore termini contrattuali migliori rispetto alla posizione di riserva, e di conseguenza il debitore segue una strategia meno rischiosa di quella che avrebbe seguito se il creditore non avesse offerto una rendita oppure in caso di interazione non ripetuta (un solo periodo). Laddove il vincolo di partecipazione del debitore è soddisfatto come uguaglianza, il potere nel senso sopra definito non può essere esercitato, per la semplice ragione che il debitore è indifferente tra la transazione corrente e la sua prossima migliore alternativa, così che l’unica sanzione permessa in un’economia liberale – la revisione o la terminazione del contratto – non ha alcuna forza. Un caso meno ovvio riguarda il potere del consumatore, a volte sintetizzato con l’espressione “sovranità del consumatore.” Riconsideriamo il modello principaleagente nel quale la qualità del prodotto non è facilmente misurabile (capitolo 7). In equilibrio, l’acquirente paga al venditore un prezzo che eccede la migliore alternativa del venditore. La possibilità di perdere la relativa rendita conferita dal compratore al venditore induce quest’ultimo a fornire una qualità maggiore di quella che avrebbe fornito in assenza di una minaccia di sanzione. In questo caso il compratore ha esercitato potere sul venditore.11 Come l’esempio suggerisce, il compratore può esercitare potere sul venditore in ogni situazione nella quale la minaccia del compratore di rivolgersi ad un altro venditore sia credibile ed infligga un costo al venditore. Si considerino due venditori in concorrenza monopolistica (ovvero imprese che fronteggiano una funzione di domanda decrescente) ed un consumatore che sia indifferente tra acquistare da un venditore o dall’altro. Entrambi i venditori hanno scelto un livello di output che massimizza i profitti, eguagliando il costo marginale al ricavo marginale (che è minore rispetto al prezzo poiché la domanda è inclinata negativamente). Per entrambi i venditori, quindi, il prezzo eccede il costo marginale (p > mc), per cui la scelta del consumatore conferisce una rendita ad uno di essi sottraendola all’altro. Il lettore potrebbe chiedersi come possa sorgere una rendita se le imprese hanno scelto il 11
Gintis (1989b) sviluppa questo caso.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|19
livello di output che massimizza i profitti, ognuna ponendo p = 0 . Si osservi che lo spostamento del compratore da un venditore all’altro non è un movimento sulla funzione di domanda (su cui si basa la scelta di output dell’impresa) ma invece un movimento orizzontale della funzione di domanda (verso l’interno per l’impresa che il consumatore abbandona, e verso l’esterno per l’impresa alla quale si rivolge). Il risultato è che l’impresa fortunata è capace di vendere un’unità in più al prezzo corrente, carpendo la rendita p – mc. a
Ironicamente, le condizioni Walrasiane ideali sotto le quali si dice che valga la sovranità del consumatore non danno al consumatore nessun potere nel senso qui definito, mentre deviazioni dall’ipotesi concorrenziale canonica che il prezzo eguaglia il costo marginale creano una situazione in cui il consumatore può esercitare potere. Ovviamente la posizione strategica del consumatore in qualità di principale tra i molteplici principali di fronte ad un singolo agente è abbastanza diversa da quella del datore di lavoro di fronte a numerosi lavoratori potenziali oppure da quella del creditore di fronte a molteplici potenziali debitori. Un singolo consumatore non sarà generalmente nella posizione di imporre al venditore un miglioramento della qualità del prodotto e di attendersi che egli obbedisca. Il potere dei consumatori è quindi circoscritto dai limiti all’abilità dei vari principali di agire in modo coordinato. Tornerò su questo punto quando considererò il termine potere di mercato. I tre casi per i quali ho analizzato l’esercizio del potere – compratore su venditore, creditore su debitore, e datore di lavoro su lavoratore – appartengono alla classe generica di relazioni di potere sostenibili in equilibrio in un sistema di scambi competitivi e volontari. In tutti e tre i casi, coloro che hanno potere stanno effettuando una transazione con degli agenti che ricevono delle rendite e che quindi non sono indifferenti tra la transazione corrente e la loro migliore alternativa. In questo caso, devono esistere altri agenti identici che sono razionati nella quantità, vale a dire i disoccupati, gli esclusi dal mercato del credito o limitati nell’ammontare del prestito, ed i venditori che non riescono a vendere. Affinché questa situazione sia di equilibrio è necessario che i mercati non siano in bilancio, il che, come abbiamo già visto, è generalmente vero. In questi casi, coloro che hanno potere sono quelli sul lato del mercato che in equilibrio produce il minor numero di transazioni desiderate, in altri termini quelli sul lato corto del mercato. Si noti che il lato corto può essere sia la domanda (il datore di lavoro, il compratore) che l’offerta (il creditore). Coloro che sono sul lato lungo del mercato saranno di due tipi: quelli che scambiano l’ammontare desiderato, e quelli che sono razionati nella quantità (gli esclusi dalla transazione o coloro che scambiano meno dell’ammontare desiderato).
20 | MICROECONOMIA
Per sottolineare la relazione tra mercati non in bilancio e l’esercizio del potere io e Gintis ci riferiamo al potere del compratore, del creditore e del datore di lavoro come potere “del lato corto”, sulla base dei modelli di rinnovo condizionato esaminati nei capitoli precedenti. Il potere, come lo definiamo noi, può essere esercitato in altri modi, anche quando i mercati sono in pareggio. Un primo esempio è fornito dal caso delle tasse sul lavoro (capitolo 8), nel quale la tassa elimina la rendita ex ante del lavoro (quindi il mercato è in pareggio, ed il lavoratore è indifferente tra accettare il lavoro oppure no), ma una rendita ex post esiste comunque, dando al datore di lavoro la possibilità di sanzionare il lavoratore. Una tassa sul lavoro di questo tipo è un puro caso di investimento specifico alla transazione da parte del lavoratore; in questo caso il fondamento del potere del datore di lavoro rappresenta un esempio del ragionamento di Hart riportato in precedenza. Negli esempi appena riportati, in tutti e tre i casi coloro che hanno il potere – il compratore, il creditore, il datore di lavoro – hanno come aspetto comune quello di contribuire con del denaro alla transazione – il prezzo pagato dal compratore, il prestito concesso dal creditore, il salario offerto dal datore di lavoro. In ognuno dei tre casi, il denaro è concesso in cambio di una promessa, rispettivamente, di restituzione e di impegno lavorativo. Questo potrebbe apparire come un fondamento analitico dell’adagio popolare che “il denaro parla”, ma la conclusione sarebbe erronea. Si tenga a mente che nelle economie Comuniste e centralmente pianificate i beni di consumo durevoli (e molti altri beni di consumo) erano venduti al di sotto del prezzo di pareggio del mercato. Il conseguente eccesso di domanda veniva allocato mediante code o altri mezzi (Kornai, 1980). In questo caso i produttori (venditori) erano sul lato corto del mercato, e coloro che apportavano denaro alla transazione, i compratori, alcuni dei quali non riuscivano a completare lo scambio, erano sul lato lungo. La notoria inferiorità della qualità dei beni di consumo nelle economie pianificate centralmente in confronto alle economie capitaliste può essere in parte spiegata dal fatto che i consumatori erano sul lato lungo del mercato nelle prime e su quello corto nelle seconde. Oppure, in modo più figurato, una delle ragioni che rendeva le auto Ford migliori rispetto alle loro controparti Russe durante la guerra fredda era che in Russia i clienti aspettavano in fila per comprare le Volga mentre negli Stati Uniti, i rappresentanti della Ford si mettevano in coda per vendere le auto ai clienti. Un’altra ragione è che negli Stati Uniti i lavoratori aspettavano in fila per avere un lavoro alla Ford. Altri utilizzi del termine potere sono comuni in economia. Il potere d’acquisto è semplicemente un’altra parola per esprimere il vincolo di bilancio di un individuo (o
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|21
la sua ricchezza), e non implica l’esercizio di sanzioni e ancor meno alcuna interazione strategica.12 Il potere di mercato sorge in mercati ad alta concentrazione dove un agente può variare il prezzo e trarne beneficio. Nel caso standard della concorrenza monopolistica si dice che il venditore dispone di potere di mercato. Il venditore è meno vincolato nel senso che egli ha di fronte una domanda inclinata negativamente piuttosto che una funzione di domanda orizzontale, mentre il consumatore ha più vincoli nel senso che ha a disposizione un minor numero di venditori di beni sostituti tra i quali scegliere. Ma abbiamo appena visto che in questo caso il consumatore che preferisce un venditore ad un altro conferisce una rendita all’azienda prescelta. (Questo é il motivo per il quale i rappresentanti di vendita della Ford si mettono in fila per vendere le auto.) Quindi, se il compratore può minacciare in maniera credibile di sottrarre rendite al venditore, egli potrà esercitare potere del lato corto su di esso. Per cui non è chiaro come si possano riconciliare le nozioni usuali di potere – l’uso di sanzioni per ottenere un beneficio – con l’affermazione che il monopolista esercita potere sul consumatore. Infine, esiste l’opaca nozione di potere contrattuale, che tipicamente si riferisce alla quota di surplus guadagnata in una contrattazione. Seguendo questo utilizzo del termine, gli esponenti usati nel “prodotto di Nash” nella soluzione del modello esteso di contrattazione del capitolo 5 indicano il potere contrattuale delle due parti. Usato in questo modo, il potere contrattuale si riferisce agli esiti – a quanto vantaggio una parte può guadagnare – piuttosto che ad un particolare modo di ottenerlo (per esempio, minacciando una sanzione). Se il problema di negoziazione è parte di una interazione prolungata, allora il potere contrattuale ed il potere del lato corto non solo appaiono distinti ma anche contrari. Nell’equilibrio competitivo del modello standard principale-agente, per esempio, il datore di lavoro riceve una rendita (v* – z). Perciò, secondo la prospettiva del potere contrattuale il lavoratore avrebbe tutto il potere contrattuale. Ma secondo la prospettiva del potere del lato corto potremmo concludere che lungi dall’essere un segno di potenza del lavoratore, la rendita conferitagli dal datore di lavoro, che risulta dalla massimizzazione dei profitti, è la ragione stessa per la quale il datore di lavoro ha potere sul lavoratore. Ho menzionato in precedenza i dubbi di Robert Dahl sulla possibilità di definire in modo univoco il termine potere. Questo è ciò che egli disse (Dahl 1957, p.201) “[Una] Cosa a cui molte persone danno diverse etichette con significati 12
Un problema con la definizione di potere di Dahl (cfr. nota 9) è che include il potere d’acquisto: se compro un prodotto, ci saranno una serie di effetti sull’economia che porteranno altri a fare delle cose che altrimenti non avrebbero fatto. Ma dire che acquistare il pane sia un esercizio di potere su un qualsiasi agricoltore che produce grano con il quale non interagisco strategicamente espanderebbe il concetto di potere oltre il dovuto.
22 | MICROECONOMIA
leggermente o notevolmente differenti [...] probabilmente non è proprio una Cosa ma molte Cose.” Le differenze di significato fra le espressioni potere contrattuale, potere di mercato e potere del lato corto suggeriscono che Dahl potrebbe aver ragione.
LA DISTRIBUZIONE D E I C O N T R AT T I
DELLA
RICCHEZZA
E LA
DISTRIBUZIONE
Finora ho semplicemente parlato di datori di lavoro e lavoratori, creditori e debitori, senza spiegare come particolari individui si trovino ad occupare tali posizioni. Nella spiegazione che segue l’idea chiave è che l’allocazione degli individui a queste o ad altre posizioni economiche sia il risultato di un’ottimizzazione individuale vincolata dai contratti a disposizione e dalle risorse di ognuno. Queste risorse includono non solo la ricchezza convenzionalmente definita ma anche altri attributi della persona che sono correlati al reddito come le abilità (competenze) e la salute di ciascuno. In ogni modo, per semplificare l’analisi, mi limiterò alla ricchezza. L’analisi che presento è un adattamento ad un’economia capitalista moderna di un modello di Mukesh Eswaran e Ashok Kotwal (1986). Il loro studio fu stimolato dall’osservazione che nelle economie agrarie, gli individui ripartiscono in genere il proprio tempo tra vari tipi di contratti, ad esempio lavorando la propria terra ed allo stesso tempo lavorando come mezzadro/lavoratore a giornata quella di altri, o anche pagando lavoratori esterni per la coltivare la propria terra. (Gli studi econometrici citati nei capitoli 8 e 9 sull’effetto dei vari tipi di contratto sulla produttività si basano su questo rilievo.) L’insieme dei contratti ai quali un individuo partecipa è correlato alla quantità di terra che egli possiede, come è suggerito dai dati nella tabella 10.1, che provengono dallo stesso villaggio indiano che abbiamo incontrato nei capitoli precedenti. Nel Palanpur, coloro che possedevano più terra raramente svolgevano lavoro salariato (“hire out”) e tipicamente assumevano lavoro esterno, in aggiunta al loro, per lavorare le terre di loro proprietà (“hire in”). Nessuno possedeva larghi appezzamenti; più della metà degli intervistati possedevano meno di metà acro (Lanjouw e Stern, 1998, p.46).
Tabella 10.1. Proprietà terriera e lavoro salariato nel Palanpur.
Terra posseduta (acri) Nessuna
“Hires in” 0.25
“Hires in” e “Hires out” 0.21
“Hires out” 0.54
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
0.47
0.81
0.15
0.04
|23
Le celle riportano le frazioni di ogni classe terriera che assume lavoro esterno (hires in), che lavora la terra altrui (hires out), e che fa entrambe le cose.
Il modello che mi accingo a presentare dimostrerà che l’allocazione del tempo tra i contratti disponibili che massimizza l’utilità degli individui dipende dal livello di ricchezza degli stessi individui. Le persone si divideranno in sei classi che io definisco come lavoratori salariati puri, produttori indipendenti e lavoratori salariati misti, produttori indipendenti, piccoli capitalisti, capitalisti puri, e capitalisti di rendita. Per mantenere contatto con la realtà empirica, assumo contratti incompleti in due aspetti. Primo, quando si assume lavoro, il lavoratore deve essere monitorato, e (prendendo a prestito una pagina di Alchian e Demsetz, sopra) assumo che solo il titolare del diritto al residuo (il datore di lavoro) può esercitare attività di monitoraggio (l’introduzione di supervisori esterni non aggiungerebbe nulla al modello). Per distinguere tra lavoro non di monitoraggio e lavoro di monitoraggio uso il termine lavoro produttivo per indicare il lavoro che appare tra gli argomenti di una funzione di produzione. Secondo, tutti gli individui possono prendere e dare a prestito allo stesso tasso d’interesse, r, ma il livello massimo del prestito concesso è determinato dalla ricchezza totale dell’individuo (a prescindere dal suo utilizzo). All’inizio di ogni periodo, ognuno può richiedere un prestito per assumere lavoro esterno o per prendere in affitto beni capitali di proprietà altrui, pagando i salari e l’affitto all’inizio del periodo e restituendo il prestito con certezza alla fine del periodo di produzione. Ogni individuo può anche dare in affitto i propri fattori di produzione ad altri o lavorare in cambio di un salario (ed essere pagato all’inizio del periodo). La relazione tra i vari input ed il singolo output è descritta dalla funzione di produzione lineare ed omogenea q = f(k, n), dove n è il lavoro produttivo totale (proprio ed assunto), k è l’ammontare di beni capitali omogenei dedicati alla produzione, e l’output q è crescente e concavo nei suoi argomenti. Il prezzo dell’output è normalizzato ad uno. Per poter produrre è necessario pagare un costo iniziale, K (coloro che non esercitano attività diretta di produzione, vendendo ad altri il proprio lavoro ed eventualmente dando in affitto i capitali di loro proprietà, non devono sostenere il costo K). Il tempo totale di ognuno (normalizzato ad uno) può essere diviso in frazioni relative al tempo speso come lavoratore autonomo, l, come lavoratore per conto altrui, t, come supervisore di altri impiegati, s, o riposando, R.
24 | MICROECONOMIA
L’ammontare di monitoraggio eseguito varia con la quantità di lavoro impiegato, L; cioè s = s(L) con s’ > 0 e s” > 0, s(0) = 0 e s’(0) < 1. Il livello di monitoraggio richiesto è appena sufficiente ad indurre i lavoratori assunti esternamente ad esercitare lo stesso livello di impegno di coloro che sono residual claimant del loro stesso lavoro. Per cui il lavoro produttivo totale è n = l + L. L’accesso di ogni individuo al credito, B, dipende dalla sua ricchezza, misurata in unità di bene capitale possedute, k, per cui B = B(k) con B’ > 0 e B(0) = 0 (coloro che non dispongono di risorse non possono prendere a prestito, ed il limite massimo di credito è crescente nella quantità di risorse). Poiché ogni individuo inizia il periodo solo con le risorse k, la scelta dei contratti è vincolata dal limite al credito. Siano w e v i prezzi del lavoro e dei beni capitali determinati esogenamente. Ne consegue che se l’individuo decide di produrre (cioè, di pagare il costo iniziale K e di dedicare parte del suo tempo lavorativo al proprio progetto) il vincolo di credito è: B(k) > w(L – t) + v(k – k) + K
(10.1)
Il primo termine del lato destro rappresenta il costo per il salario dei lavoratori assunti (al netto del lavoro retribuito che un individuo fa per conto di altri), mentre il secondo termine è il costo d’affitto per l’utilizzo dei beni capitali aggiuntivi rispetto a quelli propri. Ovviamente, questi due termini possono avere qualsiasi segno. La funzione di utilità (neutrale al rischio) è additiva nel reddito e nell’utilità del riposo: U = Y + u(R), con u’ > 0 e u” < 0. (Per essere sicuri che R > 0, si assuma anche che u’(0) sia pari ad infinito.) Se l’individuo decide di produrre, alla fine del periodo di produzione la sua utilità sarà: w1 = f(k,(l + L)) – (1 + r ){w(L – t) + v(k – k) + K }+ u(R)
(10.2)
dove il secondo termine sul lato destro rappresenta il costo sostenuto al termine del periodo per ripagare il prestito preso all’inizio del ciclo produttivo (il prodotto è disponibile solo alla fine del periodo, e per semplicità si assume che anche il consumo e il riposo avvengano alla fine del ciclo produttivo). Se invece l’individuo lavora per conto di altri e dà in affitto i suoi beni capitali, l’utilità di fine periodo sarà: w0 = (1 + r)(wt + vk) + u(R) (10.3) dove il tasso di interesse appare perché i salari e gli affitti sono pagati all’inizio del periodo, e possono quindi generare un guadagno durante il ciclo produttivo. Se consideriamo il primo caso descritto dall’equazione (10.2), il problema di
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|25
massimizzazione dell’utilità per ogni individuo è quello di scegliere k, R, t, L e l in modo da massimizzare l’eq. (10.2) tenendo conto del vincolo di credito (10.1) e di un vincolo di bilancio temporale. Usando la relazione di bilancio l 1 – s(L ) – t – R (10.4) per definire l (che non è un vincolo), possiamo esprimere il vincolo di bilancio temporale come un vincolo non-negativo sul lavoro autonomo, l: 1 – s(L) – t – R > 0 così come, ovviamente, gli altri vincoli k > 0, L > 0 e t > 0.
(10.5)
L’individuo massimizzerà quindi l’eq. (10.2) sotto i vincoli (10.1) e (10.5). Siano m e l i moltiplicatori di Lagrange associati rispettivamente ai vincoli (10.1) e (10.5).
Usando l’eq. (10.5) per eliminare l (sostituendo l con il lato destro dell eq. (10.4) nella funzione di produzione) e definendo L come la derivata della relativa espressione i
Lagrangiana rispetto alla variabile i, otteniamo le condizioni di primo ordine: Lk = fk – (1+ r + l)v = 0 LL = fn{1 – s’(L)} – (1 + r + l)w – ms’(L) < 0 (soddisfatta come eguaglianza se L > 0) LR = – fn + u’(R) – m = 0
(10.6) (10.7)
(10.8)
Lt = – fn + w(1+ r +l) – m < 0 (soddisfatta come eguaglianza se t > 0) Le equazioni (10.6) e (10.8) sono soddisfatte come eguaglianze perché assumiamo che k > 0 e 0 < R < 1. La suddivisione degli individui nelle varie classi dipenderà da quali tra questi vincoli sono stringenti e da quali equazioni sono invece soddisfatte come disuguaglianze. Prima di procedere con l’analisi, però, consideriamo un’interpretazione economica di queste condizioni di primo ordine. L’eq. (10.6) richiede che il prodotto marginale del bene capitale sia uguale al suo prezzo moltiplicato per uno più il costo del prestito, che è uguale al tasso di interesse più il prezzo ombra del capitale (l). Possiamo interpretare l in questo modo perché—come nel caso del moltiplicatore di Lagrange per il vincolo di credito—esso indica l’incremento marginale nell’utilità associato ad un allentamento marginale del vincolo di credito. Si noti che nel caso in cui il lavoro proprio sia dedicato alla produzione con beni capitali propri (l > 0), il vincolo non-negativo su l non è stringente e m = 0. Allora l’eq. (10.7), che è soddisfatta come uguaglianza quando si utilizza lavoro esterno, richiede che il prodotto marginale del lavoro (al netto dei costi di
26 | MICROECONOMIA
supervisione del lavoro procurato) eguagli il tasso di salario moltiplicato per uno più il costo del credito. Nel caso in cui m = 0, l’eq. (10.8) rappresenta la nota condizione che il prodotto marginale del lavoro eguagli l’utilità marginale dello svago. L’eq. (10.9) richiede che nei casi in cui si assume lavoro esterno ed allo stesso tempo si lavora per se stessi, il prodotto marginale del lavoro deve essere uguale al tasso di salario moltiplicato per uno più il costo del credito. (Si ricordi che i salari sono pagati all’inizio del periodo mentre il prodotto marginale si concretizza alla fine del ciclo.) Questo è un classico problema di Kuhn-Tucker; per dati valori delle variabili esogene v, w, r e k, si ha un’unica soluzione. Ciò significa che variando il livello di ricchezza possiamo determinare i contratti ai quali gli individui parteciperanno. Ci sono cinque regioni distinte, ognuna definita da un intervallo di valori di ricchezza, come illustrato in figura 10.1. Ore Salario Salario lavoratore lavoratore/produttore indipendente
Produttore indipendente
Piccolo capitalista
Capitalista puro
Figura 10.1. Le differenze di ricchezza spiegano le diverse scelte contrattuali. Il grafico in alto mostra il totale delle ore lavorate, e la distribuzione di queste ore tra lavoro per conto altrui, lavoro per se stessi, e lavoro di monitoraggio a seconda dei livelli di ricchezza. Il grafico in basso a sinistra mostra come diversi livelli di ricchezza influenzano l’allocazione del tempo tra lavoro per conto altrui (lavoro salariato) e per conto proprio (produzione indipendente). Il grafico in basso al centro mostra la scelta di ore lavorative del produttore indipendente. Il grafico in basso a destra mostra l’allocazione del tempo del capitalista tra lavoro produttivo e supervisione.
Per gli individui con poca ricchezza, il costo iniziale di produzione in proprio potrebbe essere tale che l’uso più proficuo delle proprie risorse sia quello di lavorare per conto d’altri come lavoratore salariato ed affittare a terzi i propri beni capitali. In altre parole, il valore massimo nell’eq. (10.3) potrebbe essere superiore al massimo dell’equazione (10.2). Questi individui sono lavoratori salariati puri. Se K è
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|27
sufficientemente piccolo rispetto a k da giustificare la produzione in proprio, e se k è minore del valore critico k1, l’individuo è un misto tra produttore indipendente e lavoratore salariato. I soggetti in questa classe lavoreranno sia per conto d’altri sia per se stessi usando i propri beni capitali, e la divisione del tempo tra queste due attività sarà determinata dalle condizioni (10.8) e (10.9) con m = 0. Ciò richiede che il lavoro di un individuo sia allocato in maniera tale che i guadagni marginali da entrambi i tipi di lavoro si eguaglino, e siano anche uguali all’utilità marginale del riposo: w(1 + r + l) = fn = u’.
Si noti che per i livelli di ricchezza detenuti in questa regione, il fatto che la funzione di produzione sia omogenea, e che i prezzi dei fattori siano esogeni, determina il rapporto tra capitale e lavoro produttivo usato, a prescindere dal livello di ricchezza.13 Per cui, tanto maggiore la ricchezza di un individuo quanto maggiore il tempo che egli lavorerà con i suoi beni capitali e minore il tempo che egli dedicherà al lavoro salariato. Quindi, per k che tende verso k1, t tende verso zero. Il valore critico di k è definito da fn = w(1 + r + l) = u’(R), dove il prodotto marginale del lavoro è valutato a (t = 0 e k = k1), vale a dire il valore di k per il quale il prodotto marginale del lavoro è uguale al tasso di salario (moltiplicato per uno più il costo del credito) di un individuo che dedica tutto il proprio tempo lavorativo al lavoro autonomo. Livelli maggiori di ricchezza definiscono una nuova regione. Le regioni rilevanti ed i loro confini sono sintetizzate nella tabella 10.2. Tabella 10.2. La relazione contratti-ricchezza Posizione
Contratti
Ricchezza
Lavoratore salariato puro
t > 0, l = k = s(L) = 0, m > 0, l = 0
[0, k1]
Lavoratore salariato/produttore indipendente Produttore indipendente
t > 0, l > 0, k > 0, s(L) = 0, m = 0, l > 0
[0, k1]
t = 0, l > 0, k > 0, s(L) = 0, m = 0, l > 0
(k1, k2]
Piccolo capitalista
t = 0, l > 0, k > 0, s(L) > 0, m = 0, l > 0
(k2, k3]
Capitalista puro
t = l = 0, k > 0, s(L) = 1 – R, m > 0, l > 0
(k3, k4]
Capitalista di rendita
t = l = 0, k > 0, s(L) = 1 – R, k < k, m > 0, l =0
> k4
Per k k < k l’individuo è un produttore indipendente, che non assume lavoro né lo vende, con una quantità di tempo lavorativo dedicato alla produzione che deriva da f = u' (perché l > 0 , m = 0). Quando k aumenta, l’agente lavora di più (il prodotto marginale della funzione di lavoro trasla verso l’esterno ed u’ è anche in aumento dal 1
2
n
13
L’omogeneità (la più debole ipotesi di omoteticità sarebbe sufficiente) assicura che il rapporto tra i prodotti marginali dei due input dipenda solo dal rapporto capitale-lavoro.
28 | MICROECONOMIA
momento che R diventa più scarso). Raggiunto il valore k2 il maggior prodotto marginale del lavoro è sufficiente a giustificare i costi di supervisione derivanti dall’assunzione di lavoro esterno. Il costo di assunzione per un’unità di lavoro è w(1 + r + l) + s’ fn (il secondo termine tiene conto del fatto che assumere lavoro richiede
che il datore di lavoro trasferisca parte del suo tempo da lavoro produttivo a supervisione s’, il cui costo opportunità è fn). Per cui il valore critico di k è definito da fn = w(1 + r + l) + s’(0) fn oppure w(1 + r + l) =fn(1 – s’(0)). Valori di k più alti
rendono il prodotto marginale dei lavoratori assunti maggiore del costo di assumere, così che l’impiego di quantità positive di lavoro esterno introduce una nuova regione. Per k k < k l’agente è un piccolo capitalista che effettua lavoro produttivo ed allo stesso tempo assume lavoro esterno, dividendo le sue giornate tra supervisione, lavoro autonomo e riposo. I rispettivi valori di s, l e R sono determinati da 2
3
u' = f = w(+r + l) /(1 s') , dove la prima disuguaglianza determina il livello ottimale n
del lavoro produttivo e la seconda disuguaglianza determina il livello ottimale del lavoro da assumere. Si noti che la seconda uguaglianza può essere riscritta in modo tale da esprimere la condizione che il costo opportunità di monitorare un incremento marginale nel lavoro impiegato, diminuendo il lavoro produttivo, (cioè s' f ) deve n
essere uguale al prodotto marginale del lavoro meno il costo di assunzione. s' f = f w(1 + r + l) n
n
Per k che aumenta, il prodotto marginale del lavoro aumenta, incrementando entrambi i lati di questa equazione. Ma un incremento di f ha un effetto proporzionale maggiore sul lato destro dell’espressione (come mostrato dalle linee tratteggiate nel riquadro inferiore destro della figura 10.1). Quindi per valori di k n
maggiori, è ottimale assumere più lavoro, il che causerà un aumento di s’ (poiché s’’ > 0) e quindi anche di u’. Una conseguenza di ciò sarà che l’agente dedicherà meno
tempo alla produzione diretta e più tempo al monitoraggio. Ad un certo punto (quando k raggiunge k ), u'( R) = f per R =1 s , così che il proprietario non ha alcun incentivo ad eseguire lavoro produttivo. Per k k l’agente è un puro capitalista, 3
n
3
il quale adempie solo a compiti di supervisione. Ci saranno alcuni livelli di ricchezza detenuta tali che i vincoli al credito non saranno più stringenti. Incrementi addizionali di ricchezza saranno quindi associati ad un bisogno di credito sempre inferiore fino al punto in cui si inizierà a concedere prestiti. Si assuma che il livello di ricchezza in corrispondenza del quale un individuo diventa creditore, indicato da k , sia maggiore di k . Coloro per cui k > k saranno 4
3
4
capitalisti finanziari, e dedicheranno tutto il loro tempo lavorativo al monitoraggio dei lavoratori che utilizzano parte dei loro beni capitali e daranno in affitto i beni
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|29
restanti. La Tabella 10.2 schematizza la correlazione tra ricchezza e posizione contrattuale. L’analisi appena presentata, sebbene altamente semplificata, mostra per ogni livello di ricchezza i tipi di contratto ai quali un individuo sceglierà di partecipare. La stessa analisi indica allora una corrispondenza tra la distribuzione della ricchezza e la distribuzione dei ruoli contrattuali nella popolazione. Una società con pochi grandi detentori di ricchezza e molti detentori medi di ricchezza porterebbe ad una distribuzione dei contratti con molti lavoratori autonomi, mentre una società con una alta concentrazione della ricchezza e molti individui con ricchezza nulla sarebbe una società di lavoratori salariati e con pochi capitalisti puri o capitalisti finanziari. Ovviamente, cambiamenti importanti nella distribuzione della ricchezza (e quindi cambiamenti nella domanda di partecipazione a particolari tipi di contratto) altererebbero il saggio di salario, il canone di affitto dei beni capitali ed il tasso d’interesse, che si assume siano tutti dati esogenamente nel modello appena presentato. Le persone non si suddividono tra le varie posizioni contrattuali solo sulla base della ricchezza. Esse differiscono per il grado di avversione al rischio, per il livello di istruzione, il tasso di preferenza temporale ed altre caratteristiche individuali che influenzano questo processo. Tali caratteristiche sono tutte influenzate dal livello di ricchezza di ognuno (o dal livello di ricchezza dei propri genitori) ma variano anche indipendentemente dalla ricchezza. Per cui, questo modello è lungi dall’essere completo.
C L A S S E : R I S O R S E I N E G U A L I , C O N T R AT T I I N C O M P L E T I POTERE
E
La distribuzione dei contratti schematizzata nella tabella 10.2 offre la ripartizione degli individui in classi discrete risultante da differenze continue nella ricchezza. Mentre gli storici ed altri scienziati sociali fanno regolarmente uso di termini come “classe operaia” e “colletti bianchi,” gli economisti generalmente cercano di evitare tali rappresentazioni categoriche. Raggruppamenti discreti spesso convogliano meno informazioni rispetto a variabili continue come il reddito e la ricchezza, per esempio l’uso del termine “classe media” per indicare niente più che il reddito medio. In parte questo è il motivo per il quale il concetto di classe degli economisti classici—che era un fondamento non solo dell’economia Marxista ma anche dell’economia di Ricardo e Smith— cadde in disuso con l’avvento del paradigma Walrasiano.14
14
Knut Wicksell (1851–1926), contemporaneo di Walras, fu il primo a dimostrare che se la funzione di produzione è omogenea di primo grado (rendimenti costanti) non c’è nessuna differenza analitica
30 | MICROECONOMIA
La teoria contemporanea dei contratti incompleti presentata nei capitoli 7, 8 e 9 insieme al concetto di potere introdotto in questo capitolo suggerisce una teoria della struttura di classe in cui le categorie discrete sottintendono informazioni non catturate dalla ricchezza o da altre misure continue. Due aspetti della struttura di classe schematizzata nella tabella 10.2 forniscono esempi in tal senso. Primo, i membri di una classe hanno più cose in comune che semplicemente un simile livello di ricchezza: la loro relazione con le altre classi è la stessa. Per cui tutti i lavoratori salariati interagiscono quotidianamente con un datore di lavoro e ricevono un reddito nella forma di un salario. I produttori indipendenti, al contrario, si rapportano agli altri solo nell’acquisto degli input e nella vendita degli output, ed il loro reddito prende la forma di ricavi dalle vendite. Secondo, un aspetto delle relazioni di classe è che alcune classi hanno potere sulle altre. Quindi, essere un capitalista puro significa essere il capo di un gruppo di lavoratori, ed essere un capitalista di rendita può significare avere potere del lato corto nei confronti di coloro ai quali si concedono prestiti (a seconda della natura del contratto). Senza l’analisi della ricchezza e dei contratti di cui sopra, sapere che un individuo ha una ricchezza pari a k (k ,k ) , per esempio, non darebbe alcuna indicazione riguardo la natura delle relazioni sociali in cui quell’individuo è tipicamente coinvolto nel corso delle sue attività di sostentamento. Ciò che la classe aggiunge all’analisi sono le relazioni sociali caratteristiche di particolari posizioni in termini di ricchezza, ed in particolare l’aspetto politico di queste relazioni, cioè, l’esercizio asimmetrico del potere. L’importanza analitica di tutti questi aspetti che i membri di una classe hanno in comune (anche quando il reddito ed i patrimoni siano diversi) dipende dalla domanda cui si vuole dar risposta. La centralità dell’esercizio del potere nella teoria moderna dell’impresa suggerisce che il concetto di classe può dare spiegazioni non solo ai soliti quesiti degli storici e dei sociologi ma anche a quelli degli economisti. 3
4
Il modello della struttura di classe di un’economia capitalista con contratti incompleti è sintetizzato nella figura 10.2, che introduce il mercato dei manager come un tipo distinto di contratto con rinnovo condizionato. Nella figura 10.2, i soggetti sul lato corto (B) esercitano potere ( ) sui soggetti sul lato lungo con cui effettuano una transazione (A) mentre i soggetti sul lato lungo esclusi (C) sono razionati nella quantità. nell’approccio neoclassico tra il rappresentare il datore di lavoro come il residual claimant che paga ai lavoratori il loro prodotto marginale, oppure al contrario avere il lavoratore come il residual claimant che paga al capitale il suo prodotto marginale. Egli concluse: “Avremmo potuto in ugual modo iniziare considerando gli operai stessi come imprenditori” (Wicksell 1961[1893]:24–25). In tal senso, egli fu un precursore della considerazione di Samuelson sulla non rilevanza della distinzione tra “chi assume chi viene assunto.”
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|31
Gli individui che appaiono come creditori e debitori nel mercato dei capitali ( ) appaiono come proprietari nel mercato dei manager, mentre i proprietari e coloro che riescono ad ottenere una posizione nel mercato dei manager appaiono come datori di lavoro nel mercato del lavoro. La dimensione politica della struttura di classe rappresentata nella figura è un processo “a cascata” di potere del lato corto a partire da creditori ricchi che esercitano potere sui debitori abbastanza ricchi da ottenere una transazione. A loro volta i ricchi e coloro che riescono ad ottenere un prestito esercitano potere sui manager (coloro che riescono a procurarsi degli impiegati), che a loro volta, insieme ai proprietari (nell’impresa classica di Alchian e Demsetz) esercitano potere del lato corto sui lavoratori. Mercato dei Creditori
Creditori Debitori (B)
Mercato dei Managers
Razionati nel Credito
(A)
Proprietari Managers (B)
Mercato del Lavoro
|
(C)
|
Razionati nel Lavoro
(A)
Datori di Lavoro (C)
(C)
Occupato | Disoccupato (A)
(B)
Figura 10.2. Il modello con contratti incompleti della struttura di classe. I tipi B sono i principali sul lato corto che esercitano potere sui tipi A (gli agenti sul lato lungo con cui compiono transazioni); i tipi C sono i soggetti sul lato lungo vincolati nella quantità.
Ovviamente, i datori di lavoro possono esercitare potere sui lavoratori anche attraverso altri mezzi (per esempio se il lavoratore sta guadagnando una rendita associata ad una risorsa specifica alla transazione). Si noti che sebbene ci sia un’evidente corrispondenza tra ricchezza ed esercizio del potere, la ricchezza non è condizione necessaria né sufficiente per l’esercizio del potere del lato corto. I manager non devono essere ricchi per poter esercitare potere sugli impiegati. Allo stesso modo, i produttori indipendenti nella tabella 10.2 hanno un patrimonio significativo ma non esercitano alcun potere (assumendo che i mercati dei beni siano competitivi ed in equilibrio). Si noti anche che contrariamente a quanto previsto dal modello Walrasiano (nel capitolo 6), la distribuzione del reddito non è più determinata unicamente dalla distribuzione della ricchezza; gli occupati ed i disoccupati sono identici eppure hanno redditi molto diversi. Lo stesso vale per i longsider di successo rispetto a quelli vincolati nella quantità nel mercato dei manager.
32 | MICROECONOMIA
Nell’estendere la teoria dei contratti incompleti fino a fornire una fondazione microeconomica al concetto di classe si afferma quindi la natura a volte gerarchica delle relazioni di scambio competitivo cui Marx alludeva nell’epigrafe. D’altra parte, l’approccio dei contratti incompleti non riproduce semplicemente i vecchi concetti di classe. Il modello qui sviluppato è in forte contrasto con quella che può essere chiamata una visione organica delle classi, secondo la quale le persone “nascono” in una classe ed adottano schemi comportamentali caratteristici della propria classe (compresa l’azione collettiva in difesa degli interessi di classe) senza fornire una spiegazione del perchè i singoli membri di una classe agiscano in modi che rendono vere queste affermazioni. L’approccio può anche essere paragonato con l’approccio di Oliver Williamson ai mercati e alle gerarchie. Piuttosto che vedere le imprese semplicemente, come le definiva Robertson, come “delle isole di potere consapevole in questo oceano di cooperazione inconsapevole,” l’approccio dei contratti incompleti fa risalire l’esercizio del potere alla struttura dei mercati invece che alla struttura delle imprese. L’impresa è un luogo importante nel quale viene esercitato potere, ma come il modello sul mercato del credito rende chiaro, il potere può essere esercitato in assenza di imprese o addirittura in assenza di qualunque forma organizzativa. Il potere del lato corto è esercitato nei mercati, non semplicemente fuori dai mercati o nonostante i mercati.
C O N C L U S IO N E Il modello Walrasiano di equilibrio generale competitivo presentato nel capitolo 6 fu pensato per spiegare come gli scambi tra agenti con dotazioni iniziali eterogenee possano sostenere un vettore di prezzi di equilibrio ed un’allocazione finale di beni ed utilità. I modelli qui sviluppati sono stati pensati per spiegare i modi in cui un’economia competitiva ripartisce individui con dotazioni iniziali eterogenee tra diversi contratti, e quindi tra diverse posizioni di classe che differiscono sia nel reddito sia nel grado di potere che può essere esercitato sugli altri. Nel modello di equilibrio competitivo, c’è un solo contratto che governa lo scambio dei beni ed i prezzi sono endogeni. Questo capitolo modella la coesistenza di diversi contratti, molti dei quali sono incompleti, assumendo che i prezzi siano esogeni. Piuttosto che modelli alternativi dello stesso fenomeno, questi approcci sono meglio visti come rappresentazioni dell’economia capitalista da punti di vista distinti, uno che enfatizza lo scambio di mercato di beni contrattabili e l’altro che evidenzia le interazioni sociali non contrattuali tra membri di classi diverse. Una delle sfide più importanti sarà quella di modellare la formazione dei prezzi e dello scambio in economie con vari contratti possibili cosi come la ripartizione endogena degli individui nelle varie
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|33
posizioni contrattuali. Un tale modello individuerebbe l’equilibrio competitivo che sostiene simultaneamente un vettore di prezzi, una struttura politica del processo di scambio ed una distribuzione del benessere individuale. L’idea apparentemente nuova che la struttura politica dei mercati e delle imprese gioca un ruolo centrale nell’analisi economica è lungi dall’essere nuova. La Corte Suprema degli Stati Uniti nel caso Holden vs. Hardy (1898) affermò la logica di ciò che quasi un secolo dopo sarebbe stato chiamato il modello di disciplina del lavoro: [I] proprietari degli [...] stabilimenti ed i loro operai non sono allo stesso livello, [...] i rispettivi interessi sono alquanto in conflitto. I primi ovviamente desiderano ottenere il maggior impegno lavorativo possibile dai loro impiegati, mentre i secondi sono spesso indotti per paura di essere licenziati a conformarsi ai regolamenti che a loro giudizio, se considerati imparzialmente, sarebbero da dichiarare nocivi alla salute o alla loro forma fisica. In altre parole, i proprietari decidono le regole ed i lavoratori sono praticamente obbligati ad obbedirle.
Tuttavia molti economisti considerano l’esercizio del potere da parte dei datori di lavoro come un fenomeno illusorio. Joseph Schumpeter si spese molto nel sostenere che: “Ciò che distingue il lavoro dirigente da quello dipendente sembra essere a prima vista fondamentale,” ma in realtà la differenza, egli scrisse, “non costituisce una distinzione economica essenziale [...][L]a condotta dei primi è soggetta alle stesse regole dei secondi [...] e stabilire questa regolarità è il compito essenziale della teoria economica” (Schumpeter, 1934, p.20–21). Un importante testo di microeconomia (Alchian e Allen, 1969, p.320) potrebbe aver stupito alcuni studiosi con ciò che segue: Chiamare il datore di lavoro capo è un’usanza derivante dal fatto che il “capo” stabilisce i compiti particolari. Si potrebbe ugualmente chiamare capo il lavoratore perchè egli ordina al datore di lavoro di essere pagato con una somma specifica se vuole che i servizi siano eseguiti. Ma le parole sono parole.
Non penso proprio che gli autori appena citati sarebbero in disaccordo, dal punto di vista empirico, con la valutazione della Corte Suprema. Come Samuelson (nell’epigrafe), essi stavano descrivendo la logica di un modello, non un aspetto empirico dell’economia. Nell’approccio post-Walrasiano qui modellato, l’esempio di Alchian e Allen avrebbe un significato diverso. É chiaro che il datore di lavoro si rifiuterebbe di pagare ogni domanda di salario da parte dell’operaio a meno che essa non sia w*, vale a dire il salario che massimizza i profitti. Una qualità degli approcci post-Walrasiani sembra essere quella di poter prontamente descrivere (piuttosto che oscurare) un aspetto del rapporto di impiego che sembra così incontestabile. Ma il modello del potere qui sviluppato è troppo semplice per poter fornire una base per qualcosa di più che una comprensione superficiale delle relazioni sociali che definiscono il posto di lavoro o le transazioni nel mercato del credito. Un difetto
34 | MICROECONOMIA
chiave è che nel tentativo di catturare la natura essenzialmente gerarchica delle relazioni di classe—il potere “a cascata” nella figura 10.2—non include casi in cui il potere non è asimmetrico, ma è esercitato invece in modo bilaterale. Ciononostante, esso fornisce una ragione convincente per dubitare del vecchio adagio, “I ricchi sono diversi da tutti gli altri; essi hanno più denaro.” La ricchezza in effetti determina la posizione del vincolo di bilancio di un individuo e quindi porta a più beni e servizi. Ma coloro che sono ricchi abbastanza da poter realizzare i propri progetti o da poter prendere a prestito grosse somme di denaro al tasso di interesse corrente, godono di qualcosa di più che un maggior potere d’acquisto. Essi possono avere il comando sulle persone oltre che sui beni. L’accesso al capitale permette loro, ma non ad altri, di diventare datori di lavoro e come tali di occupare posizioni di potere del lato corto in mercati non in pareggio. Thomas Hobbes aveva ragione nel dire “La ricchezza insieme alla liberalità [generosità] è Potere; perchè procura amici, e servi” (1968[1651], p.150). In effetti, ai tempi di Hobbes il termine “servo” si riferiva ad ogni lavoratore.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|35
Riferimenti bibliografici Alchian, A. A. and H. Demsetz (1972). "Production, Information Costs, and Economic Organization." American Economic Review 62(5): 777-795. Alchian, A. A. and W. Allen (1969). Exchange and Production: Theory in Use. Belmont, Wadsworth, 1969. Asplund, M. (2000). "What fraction of a capital investment is sunk costs?" Journal of Industrial Economics XLVIII(3): 287-303. Bellas, C. (1972). Industrial Democracy and the Worker-Owned Firm: A Study of Twenty-one Plywood Companies in the Pacific Northwest. New York, Praeger. Bowles, S. and H. Gintis (1992). "Power and Wealth in a Competitive Capitalist Economy." Philosophy and Public Affairs 21(4): 324-353. Craig, B. and J. Pencavel (1992). "The Behavior of Worker Cooperatives: The Plywood Companies of the Pacific Northwest." American Economic Review 82(5): 1083-1105. Craig, B. and J. Pencavel (1995). "Participation and Productivity: A Comparison of Worker Cooperatives and Conventional Firms in the Plywood Industry." Brookings Papers on Economic Activity: Microeconomics: 121-160. Dahl, R. (1957). "The Concept of Power." Behavioral Science 2: 201-215. Dow, G. (2002). Governing the firm: Workers' control in theory and practice. Cambridge, Cambridge University Press. Eswaran, M. and A. Kotwal (1986). "Access to Capital and Agrarian Production Organization." Economic Journal 96(382): 482-498. Galbraith, J. K. (1967). The New Industrial State. Boston, Houghton Mifflin. Gintis, H. (1989a). Financial Markets and the Democratic Enterprise. Microeconomic Issues in Labour Economics: New Approaches. R. D. a. R. Perlman. New York, Wheatsheaf: 155-176. Gintis, H. (1989b). The Power to Switch: On the Political Economy of Consumer Sovereignty. Unconventional Wisdom: Essays in Honor of John Kenneth Galbraith. S. Bowles, R. Edwards and W. G. Shepherd. New York, Houghton-Mifflin: 65-80. Grossman, S. and O. Hart (1986). "The Costs and Benefits of Ownership: A Theory of Vertical and Lateral Integration." Journal of Political Economy 94(4): 691-719. Hansen, D. G. (1997). "Individual Responses to a Group Incentive." Industrial and Labor Relations Review 51(1): 37-49. Hart, O. (1989). "An Economist's Perspective on the Theory of the Firm." Columbia Law Review 89(7): 1757-1774. Hart, O. (1995). Firms, Contracts, and Financial Structure. Oxford, Clarendon Press. Holmstrom, B. and J. Tirole (1989). The Theory of the Firm. Handbook of Industrial Organization, Volume I. R. S. a. R. Willig. Amsterdam, NorthHolland: 61-133. Isaac, R. M., J. M. Walker, et al. (1994). "Group Size and Voluntary Provision of Public Goods: Experimental Evidence Utilizing Large Groups." Journal of Public Economics 54(1): 1-36. Kornai, J. (1980). Economics of Shortage. Amsterdam, North-Holland. Lasswell, H. and A. Kaplan (1950). Power and Society: A Framework for Political Enquiry. New Haven, Yale University Press.
36 | MICROECONOMIA
Malcomson, J. (1999). Individual employment contracts. Handbook of Labor Economics. O. Ashenfelter and D. Card. Amsterdam, Elsevier. 3B: 22922372. Marx, K. (1967). Capital: A critique of political economy, I The process of capitalist production. New York, International Publishers (original publication, 1867). Milgrom, P. (1988). "Employment Contracts, Influence Activities, and Efficient Organization Design." Journal of Political Economy 96(1): 42-60. Pagano, U. (1993). Organizational Equilibria and Institutional Stability. Markets and Democracy: Participation, Accountability and Efficiency. S. Bowles, H. Gintis and B. Gustafsson. Cambridge, Cambridge University Press. Parsons, T. (1967). On the Concept of Political Power. Sociological Theory and Modern Society. T. Parsons. New York, Free Press: 297-354. Pencavel, J. (2002). Worker Participation: Lessons from the Worker Co-ops of the Pacific North-West. New York, Russell Sage Foundation. Prendergast, C. (1999). "The Provision of Incentives in Firms." Journal of Economic Literature 37(1): 7-63. Putterman, L. and G. Dow (2000). "Why Capital Suppliers (usually) Hire Workers: What We Know and What We Need to Know." Journal of Economic Behavior and Organization 43(3): 319-336. Samuelson, P. (1957). "Wages and Interest: A Modern Dissection of Marxian Economics." American Economic Review 47(6): 884-921. Schumpeter, J. (1934). The Theory of Economic Development: An Inquiry into Profits, Capital, Credit, Interest and the Business Cycle. Oxford, Oxford University Press. Wicksell, K. (1961). Lectures on Political Economy. London, Routledge & Kegan Paul Ltd (first published as Uber Wert Kapital und Rente, in 1893). Williamson, O. E. (1985). The Economic Institutions of Capitalism. New York, Free Press.
XI
E VOLUZIONE I STITUZIONALE ED I NDIVIDUALE
Ad un certo stadio del loro sviluppo, le forze materiali di produzione (le tecnologie) … entrano in conflitto con … le relazioni di proprietà con le quali hanno funzionato in passato. Da loro forme di sviluppo, queste relazioni diventano le catene delle forze di produzione. E’ allora che inizia il periodo di rivoluzione sociale. Karl Marx, Preface to the Critique of Political Economy, 1859
… Le persone egoiste e litigiose non collaborano, e senza collaborazione, niente può succedere. Una tribù che possiede … un maggior numero di membri coraggiosi, solidali e fedeli, sempre pronti a proteggersi dal pericolo, ad aiutarsi e a difendersi gli uni con gli altri … si espanderà e sconfiggerà le altre tribù…A quel punto le qualità sociali e morali tenderanno lentamente a progredire e diffondersi in tutto il resto del mondo. Charles Darwin, The Descent of Man, 1873
I N T R O D U Z IO N E Nell’ottobre 1898 il Segretario Generale del Partito Comunista della Germania dell’Est, Erich Honecker, durante il quarantesimo anniversario della fondazione della Repubblica Democratica Tedesca, celebrò quell’avvenimento come una “necessità storica” e un “punto di svolta nella storia del popolo tedesco”. Parate e manifestazioni commemorarono l’evento1. Gli oppositori del regime avevano messo su qualcosa come una dozzina di manifestazioni nei mesi estivi, racimolando meno di 10000 partecipanti in tutto. Ma dodici giorni dopo il suo discorso, Honecker si dimise, perché altre manifestazioni anti-regime scoppiarono prima in Leipzig e poi in tutto il Paese, con un La prima citazione è tratta da Marx (1904: 11-12), la seconda da Darwin (1998:134). 1 Il racconto è basato su Lohmann (1994).
2 | MICROECONOMIA
milione e mezzo di partecipanti ad ottobre e il doppio a novembre. Nel giro di un mese, le Germanie dell’Est e dell’Ovest avrebbero danzato sul Muro di Berlino, prima di buttarlo giù. Dopo meno di un anno, la commemorazione della Repubblica Democratica Tedesca di Honecker fu cancellata, in seguito alla riunificazione con la Repubblica Federale Tedesca. In conseguenza di ciò, i cittadini della nazione precedentemente comunista passarono da un sistema di governo ad un altro, il quale includeva un insieme di diritti di proprietà e processi politici del tutto nuovi. Pochi avrebbero predetto l’immediatezza e l’estensione di questi e degli altri radicali cambiamenti che interessarono gran parte dell’ex mondo comunista in quel periodo. Un processo di cambiamento istituzionale meno discusso, ma ugualmente profondo, riguarda le dolorose e pericolose pratiche di circoncisione femminile e le altre forme di amputazione genitale femminile (FGC2) in molte aree dell’Africa3. Proprio come la fasciatura del piede, una volta molto praticata in Cina, la FGC è una convenzione cui le famiglie si adeguano per far sì che le figlie possano maritarsi. La promozione dell’istruzione e altre influenze modernizzanti sul continente durante il XX secolo, non intaccarono la FGC; anzi, in alcune regioni questa si diffuse ulteriormente. All’inizio del ventunesimo secolo, si stimava che due milioni di ragazze africane venivano sottoposte alla pratica ogni anno. Pur tuttavia, nel 1997, ad una assemblea nel piccolo villaggio Bambara di Malicounda in Senegal, i residenti decisero di rifiutare all’unanimità la FGC. Una simile posizione a Malicounda non era il risultato di una campagna anti-FGC, quanto piuttosto merito di una organizzazione non governativa che si era rivolta alle donne promuovendo l’istruzione e affrontando lo sviluppo della comunità e i problemi sanitari. Nel vicino Keur Simbara, gli abitanti del villaggio decisero prudentemente di consultare tutti gli altri villaggi tra i cui membri si combinavano i matrimoni; ad un certo punto tutti questi 13 villaggi insieme decisero di abbandonare la pratica. In seguito ad altre simili assemblee, i rappresentanti di un altro gruppo di 18 villaggi del gruppo etnico Fulani fecero lo stesso. Il rifiuto si diffuse da villaggio a villaggio. Nel giro di un anno a partire dalla dichiarazione dei Fulani, il Governo del Senegal dichiarò la FGC una pratica illegale. Un ultimo esempio di cambiamento istituzionale viene dalle Filippine, dove il tipico contratto che regola la raccolta del riso si chiamo hunusan (“condivisione” in Tagalog). In base al sistema hunusan, ogni membro della comunità può prender parte alla 2 3
Acronimo per l’inglese “female genital cutting”. Nota del traduttore. Questo riferimento è basato su Mackie (1996) e Mackie (1999)
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|3
raccolta dei campi di un proprietario terriero, ricevendo un sesto dell’ammontare che raccoglie4. Il proprietario non può legittimamente rifiutare questo diritto a nessuno, e la consuetudine stabilisce che i membri della sua famiglia non possono prendere parte al raccolto e che né questi o lui stesso possono supervisionare il lavoro. Negli anni ’60, la quota di un sesto per un ora di lavoro di raccolto forniva un compenso equo rispetto alle altre opportunità di guadagno nelle aree rurali, sostenendo così una sorta di equilibrio tra contratti tradizionali e moderni. Tuttavia, il maggiore utilizzo di varietà di riso più produttive negli anni ‘70 e ‘80 (la Rivoluzione Verde) quasi duplicò la produzione, in tal modo incrementando di molto il valore di un sesto del raccolto stabilito dal sistema hunusan. Il risultato fu che, alla fine degli anni ‘70, il raccolto regolato dal sistema hunusan era ricompensato con un guadagno molto al di sopra della prossima migliore alternativa per il lavoratore (in termini di lavoro salariato). Qualche grosso latifondista provò a trarre vantaggio dal cambiamento riducendo la quota di raccolto ad un nono, ma questa violazione della consuetudine provocò una forte indignazione tra i lavoratori, il che forse spiega i sospetti incendi notturni delle coltivazioni. Le fattorie maggiori quindi, iniziarono ad investire molto sia in raccoglitori meccanici che nel monitoraggio del lavoro di raccolta. Le fattorie più piccole, invece, continuarono ad offrire la quota di un sesto, ma aggiunsero un’antica obbligazione che era stata a lungo tipica in alcune regioni adiacenti. Si trattava della restrizione del lavoro a coloro che avevano fornito servizi di raccolto senza essere remunerati nella precedente stagione. In contrasto con la strategia adottata dai grossi proprietari, la nuova obbligazione imposta dai piccoli proprietari non violava la reciprocità sulla quale si basava il sistema hunusan. Hayami (1998):45 riporta che “nella mente degli abitanti del villaggio raccogliere senza essere direttamente pagati è considerato … una espressione di gratitudine dei lavoratori nei confronti delle buone intenzioni del proprietario che riconosce loro un salario stabile e garantito … per un certo periodo”. Amalgamando due contratti tradizionali, il sistema hunusan modificato ridusse la remunerazione de facto del lavoro di raccolta quasi allo stesso livello di un equivalente lavoro salariato, eliminando così le rendite introdotte dalla Rivoluzione Verde. Nei capitoli precedenti ho cercato di chiarire come funzionano le istituzioni: in che modo queste forniscono incentivi e limiti, tenendo in considerazione i comportamenti individuali e le conseguenze che ne derivano nell’aggregato, ed anche in che modo le istituzioni influenzano le preferenze e le credenze individuali. In questo e nei prossimi 4
Come riportato da Hayami (1998) e Hayami e Kikuchi (1999).
4 | MICROECONOMIA
due capitoli affronto la domanda più difficile: Come cambiano le istituzioni? Ed in che modo le preferenze e le credenze degli individui evolvono insieme ai loro ambienti istituzionali? Queste questioni sono tra le più importanti e intellettualmente stimolanti nelle scienze sociali e comportamentali, e hanno attratto alcune delle maggiori menti negli ultimi tre secoli, tra cui Adam Smith, David Hume, Karl Marx, Karl Menger, Joseph Schumpeter e Frederich Hayek. Eppure, a partire dal concepimento del paradigma economico Walrasiano alla fine del 19° secolo, i processi di cambiamento istituzionale e di sviluppo individuale hanno occupato una posizione periferica nelle scienze sociali, e soprattutto in economia. In parte come conseguenza di ciò, il cambiamento istituzionale e l’evoluzione individuale sono stati modellati formalmente solo negli ultimi anni grazie allo sviluppo di nuovi strumenti analitici che lo hanno reso possibile. In questo e nei prossimi tre capitoli, farò uso di questi progressi analitici per applicare alcune delle intuizioni evoluzioniste di Darwin e di Marx al processo di cambiamento istituzionale, e per identificare nel processo qualche difetto delle loro prospettive.
U N I N Q U A D R A M E N TO D E L L A Q U E S T IO N E Per istituzioni si intendono le leggi, le regole non formali e le usanze che conferiscono una struttura durevole alle interazioni sociali, determinando chi incontra chi, per fare cosa, con quali azioni, e con quali conseguenze comunemente subite. In qualche contesto analitico ha senso prendere l’ambiente istituzionale come un dato, spesso descrivendone le regole principali attraverso la specifica struttura di un gioco. Nel modello del mercato del lavoro presentato nel capitolo 8, questo approccio era semplificato trattando il datore di lavoro come first mover con un insieme di strategie dato (il tasso di salario, il livello di monitoraggio, la funzione di chiusura), e il lavoratore come il giocatore che si muove per secondo, con un diverso insieme di strategie, pur sempre dato. In questo caso, il gioco descrive le istituzioni rilevanti. Tuttavia, se siamo interessati al processo di evoluzione istituzionale, dobbiamo raffigurare le istituzioni non come vincoli esogenamente dati, ma piuttosto come il risultato delle interazioni individuali. In altri termini, vogliamo andare “dietro” il gioco che descrive l’istituzione per scoprire l’interazione dalla quale questa si è evoluta. Per far questo specifichiamo un gioco sottostante che ha come possibili risultati alcuni modi differenti in cui i partecipanti possono interagire. I risultati del gioco sottostante sono quindi
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|5
le istituzioni; il processo di cambiamento istituzionale sarà dunque studiato come il passaggio dall’uno all’altro di questi risultati. Un modo molto efficace di descrivere i risultati del gioco sottostante è dire che ci sono convenzioni, cioè equilibri di Nash di un gioco con n giocatori, in cui la coerenza individuale al comportamento convenzionale è una risposta ottimale, se l’individuo crede che un numero sufficiente degli altri giocatori agirà coerentemente alla convenzione. Il cambiamento istituzionale avviene quando una convenzione è sostituita da un’altra. Quindi l’innovazione e il cambiamento istituzionale diventano un problema di selezione degli equilibri. Si consideri un caso specifico. Gli aspetti del mercato del lavoro nell’apartheid sudafricano erano una convenzione (o un insieme di convenzioni) che regolavano uno schema di discriminazione razziale, la quale era esistita per gran parte della storia del Sud-Africa di cui si ha memoria scritta, ed era stata formalizzata all’inizio del 20° secolo e soprattutto nel periodo successivo alla Seconda Guerra Mondiale. Dal punto di vista dei bianchi, la convenzione può essere espressa nel modo seguente: Offri solo salari bassi per lavori di basso livello ai neri. Per i neri, la convenzione era: Offri il tuo lavoro ad un salario basso, e non chiedere di più. Queste azioni rappresentano risposte ottimali reciproche: fino a quando (quasi) tutti i datori di lavoro bianchi aderivano dal canto loro alla convenzione, la risposta ottimale dei lavoratori neri era di aderire a loro volta alla convenzione, e vice versa (presentare questo sistema come una risposta ottimale reciproca è coerente con il fatto che l’apartheid era anche un sistema altamente coercitivo, che utilizzava la repressione brutale contro i suoi oppositori). L’apartheid può essere descritto come una convenzione perché altre risposte ottimali reciproche, non basate sulla razza e più egualitarie, erano in teoria possibili anche se di difficile attuazione. Il potere delle convenzioni nel mercato del lavoro dell’apartheid è suggerito dal fatto che i salari reali dei minatori di oro neri non crebbero tra il 1910 e il 1970, nonostante le periodiche carenze di manodopera nelle miniere e una esponenziale crescita della produttività5. Tuttavia, una serie di scioperi che ebbe inizio nei primi anni ‘70 e accelerò nella seconda metà degli anni ‘80, ebbe il risultato di segnalare il rigetto della convenzione aumentando il numero dei lavoratori neri. In questo modo, ovviamente, i lavoratori e i datori di lavoro non si stavano conformando alle risposte 5
Come riportato in Wilson (1972) e Wood (2000).
6 | MICROECONOMIA
ottimali previste dallo status quo della convezione dell’apartheid. Il loro allontanarsi dalla convenzione provocò ulteriori defezioni; molti datori di lavoro stabilirono che la vecchia convenzione non rappresentava più la risposta ottimale, e questo li portò a modificare le loro relazioni di lavoro, aumentando i salari reali e promuovendo i lavoratori neri. Le azioni di riposta non ottimale dei lavoratori neri avevano alterato le risposte ottimali dei datori di lavoro; il risultato fu che la convenzione si sgretolò. Nel giro di un decennio l’intero sistema di apartheid fu abbandonato. Il caso sud-africano rappresenta uno dei due processi attraverso i quali le istituzioni cambiano: l’emergere all’interno di una società di un gran numero di individui che si comportano in modo da violare la convenzione, arrivando a scardinarla. Questo processo spesso assume la forma (come nel materialismo storico di Marx) di un conflitto tra attori indipendenti che beneficiano in modo diverso dell’una o dell’altra forma istituzionale. Un processo di cambiamento istituzionale all’interno del gruppo può rappresentare una rottura radicale con il passato, come nel caso dell’abbandono del Comunismo nella Germania dell’Est e della FGC in Senegal. Ma non deve essere necessariamente così. Il cambiamento istituzionale può avvenire attraverso un graduale adattamento delle istituzioni a nuove esigenze ed opportunità (come nella modifica del sistema hunusan nelle Filippine). Nel prossimo capitolo presenterò un modello di dinamiche all’interno del gruppo che portano la società a passare da una convenzione all’altra. Il secondo processo che conduce al cambiamento istituzionale è la competizione tra i gruppi governati da diverse istituzioni. Secondo questa prospettiva, le istituzioni di successo sono quelle che contribuiscono alla sopravvivenza di nazioni, imprese, gruppi musicali, unità etnico-linguistiche e altri gruppi in competizione tra loro. Hayek, per esempio, utilizza un argomento di questo tipo per spiegare perché il sistema di mercato – il suo “ordine esteso” – si è diffuso in tutto il mondo. Darwin (nella citazione iniziale) pensava che la competizione tra gruppi porta alla diffusione di caratteristiche come il coraggio, che vanno a beneficio del gruppo stesso. Nel capitolo 13 mi concentrerò sull’evoluzione delle preferenze etero-interessate come risultato di conflitti tra gruppi, usando un modello di selezione del gruppo (o selezione multi-livello). La trasformazione istituzionale affrontata in questo capitolo – la prima rivoluzione dei diritti di proprietà – si basa sulla combinazione di processi di competizione tra gruppi e all’interno del gruppo, che determinano il passaggio da una convenzione all’altra. È spesso utile – per disciplinare il processo di costruzione teorica – avere una idea
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|7
chiara di quali fenomeni empirici si vogliono comprendere. Cinque osservazioni che emergono dagli esempi del Sud-Africa, della Germania, del Senegal e delle Filippine, illustrano alcune caratteristiche abbastanza generali del processo di cambiamento istituzionale, e giocheranno un ruolo prominente nella descrizione del processo di innovazione istituzionale che segue. La prima è che molte istituzioni importanti – quelle che regolano le relazioni tra le classi economiche, per esempio – sono ben descritte da un gioco sottostante che è asimmetrico sia nelle strategie che nei payoffs, e in cui i diversi gruppi della popolazione giocano ruoli diversi. Gli esempi includono le istituzioni che regolano la ripartizione del raccolto, i salari e le condizioni di lavoro dei lavoratori, e il pagamento dei debiti. Dato che in questi casi i risultati distributivi cambiano a seconda delle convenzioni, molti equlibri saranno Pareto-ottimali. Per questo motivo, i raggruppamenti nella popolazione possono avere interessi conflittuali riguardo alla convenzione da selezionare. In secondo luogo, gli sviluppi fortuiti o esogeni – letteralmente eventi esterni al modello – giocano un ruolo importante nell’evoluzione istituzionale (per esempio, la fine della guerra fredda o il ruolo peculiare dei presidenti de Klerk e Mandela nella transizione del Sud-Africa). Laddove gli sviluppi esogeni rappresentano dei processi secolari ben compresi come il cambiamento tecnico (il caso delle Filippine), il compito analitico è di anticipare il modo in cui un cambiamento può eliminare l’equilibrio che rappresenta la convenzione dello status quo, e di stabilire quale nuovo equilibrio potrà allora farsi strada. Il locus classicus di questo modo di pensare è l’idea di Marx, espressa nella citazione iniziale, per cui l’avanzamento tecnologico produce un cambiamento istituzionale quando le convenzioni regnanti inibiscono (“incatenano”) la realizzazione del progresso tecnico che sarebbe possibile sotto altre istituzioni. In altri casi è esplicativo presentare questi elementi fortuiti come “rumore comportamentale”, cioè come simili alle mutazioni nel contesto Darwiniano, tranne per il fatto che non sono ereditabili. Qui di seguito combinerò cambiamento tecnologico esogeno e rumore comportamentale nel modellare la trasformazione dei diritti di proprietà associata alla crescita dell’agricoltura. Nel capitolo 13 introdurrò il caso come una mutazione genetica ereditabile. Terzo, il processo di cambiamento da una convenzione istituzionale all’altra è spesso promosso dall’azione collettiva dei membri di un gruppo svantaggiato dalla convenzione dello status quo, che cercano di rimuoverla a favore di un insieme di istituzioni più favorevole. Questo è stato il caso del Senegal, del Sud-Africa e della
8 | MICROECONOMIA
Germania. Quindi giocare una risposta non ottimale è spesso una scelta piuttosto che un fatto accidentale, e l’assimilazione in un modello al rumore comportamentale o alle mutazioni non è molto rappresentativa. Il ruolo dell’azione collettiva sarà modellato nel capitolo seguente. Quarto, anche se (come Marx suggerisce) il cambiamento istituzionale può essere rappresentato come un adattamento al processo di cambiamento tecnologico, si osserva spesso il persistere per lunghi periodi di convenzioni inefficienti (il che significa che ci sono quelli che piantano in ritardo a Palanpur, per cui quasi tutti sono danneggiati rispetto all’applicazione di convenzioni alternative). Il quinto dato, suggerito dagli esempi sud-africano, senegalese e tedesco, è testimoniato in un vasto numero di studi storiografici e antropologici, ed è il fatto che le convenzioni spesso presentano una stabilità di lungo periodo seguita da un repentino sconvolgimento, per poi favorire l’emergere rapido e l’assestamento di convenzioni nuove. I processi dinamici sottostanti producono quelli che i biologi chiamano equilibri punteggiati. Alcuni esempi sono stati forniti nel capitolo 2; altri esempi includono la rapida diffusione dell’uso generalizzato dei pronomi personali informali al posto di quelli formali in molte lingue europee in meno di una generazione (Paulston, 1976), e il passaggio radicale dalla metà ai tre quarti nell’antica modalità di ripartizione dei raccolti dei proprietari terrieri nel Bengal occidentale durante gli anni ‘80, descritto nel prologo. Di un esempio molto interessante nel Burma (attuale Myanmar) dà testimonianza Edmund Leach (1954:198). Due strutture sociali completamente diverse si sono succedute nel tempo come sistemi di governo: …i gumsa si vedono governati da capi che sono membri di una aristocrazia ereditaria; i gumlao ripudiano ogni nozione di differenziazione di classe…Ma mentre i due termini rappresentano …due modalità organizzative fondamentalmente opposte…le comunità gumsa si sono trasformate in comunità gumlao e vice versa.
Infine, gli ambienti istituzionali influenzano la distribuzione delle preferenze nella popolazione, mentre le preferenze degli attori influenzano il processo di cambiamento istituzionale. Per esempio, la caduta delle istituzioni di apartheid è in parte spiegata dal ripudio e dalla rabbia provocate dal razzismo, e allo stesso tempo l’abbandono stesso dell’apartheid ha contribuito alla proliferazione di preferenze non basate sulla razza e all’identità della popolazione del Sud-Africa. Un modello adeguato dovrebbe pertanto catturare i processi co-evolutivi per cui le istituzioni a livello del gruppo e le preferenze individuali sono parte di un unico sistema dinamico.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|9
Un modello formale, ovviamente, può fornire una rappresentazione solo parziale dei casi empirici che ho presentato. Inizierò dalle preferenze endogene, fornendo un’interpretazione di come le istituzioni, economiche e non, disegnano l’evoluzione delle nostre motivazioni. Introdurrò a quel punto un modello per cui le preferenze cambiano nel corso del processo di eredità culturale, per dimostrare come il processo di cambiamento istituzionale può a sua volta indurre cambiamenti nelle preferenze. Infine, richiamerò il problema dell’evoluzione dei diritti di proprietà introdotto nel capitolo 2, e presenterò un modello dinamico che riproduce le azioni all’interno del gruppo, insieme ad un processo di selezione tra i gruppi. Utilizzerò questo modello per raffigurare l’emergere e il proliferare dei diritti di proprietà privata, come la conseguenza del processo di cambiamento tecnologico associato alla diffusione dell’agricoltura.
L’E V O L U Z I O N E C U LT U R A L E
DELLE
PREFERENZE
Noi acquisiamo le preferenze tramite l’eredità genetica e l’apprendimento culturale. Dato che entrambi sono influenzati da istituzioni economiche e non, le preferenze sono endogene. I modelli che presento evidenziano il modo in cui le strutture di interazione sociale determinano la direzione e la velocità dell’evoluzione delle preferenze. Le preferenze possono essere endogene per altri motivi. Per esempio, l’indottrinamento religioso o politico e la pubblicità sono senza dubbio importanti. Ma gli studi empirici a disposizione sulle preferenze per marchi celebri di generi alimentari, saponi, film, e altri oggetti di consumo, per i quali ci si aspetterebbe un effetto condizionante chiaro e rilevante, dimostrano che la pubblicità sembra essere meno importante dei contatti personali e di altre influenze. Le preferenze sono come gli accenti; possiamo provare ad acquisirli – imparando ad amare Prokoviev e le lumache, o assumendo un “accento da upper class” – ma per lo più siamo solo vagamente consci di come li abbiamo acquisiti. Per questo motivo, i modelli seguenti ricalcano le impronte degli studi di cambiamento di linguaggio. Sulla base dell’intenso studio empirico sul cambiamento linguistico a Filadelfia, per esempio, William Labov concluse che: …i tratti linguistici non sono trasmessi al di là dei limiti del gruppo semplicemente per esposizione ai mass media o alla scuola…Il nostro sistema di linguaggio basilare non si acquisisce dagli insegnanti di scuola o dagli annunciatori alla radio, ma da amici e concorrenti; coloro che ammiriamo, e coloro per battere i quali dobbiamo impegnarci (Labov 1983:23).
Ciò non significa che le istituzioni come la scuola e le chiese non siano importanti, ma la comprensione della loro importanza evolutiva può essere migliorata dal vederli come schemi distinti di interazione sociale che - insieme con mercati, imprese, famiglie, e governi – influenzano il replicarsi differenziato dei tratti comportamentali.
10 | MICROECONOMIA
Nei processi di eredità culturale, i comportamenti sono appresi dai genitori (trasmissione verticale), da altri appartenenti alla generazione precedente (trasmissione obliqua), o da un pari (trasmissione orizzontale). Per ogni tipo di trasmissione l’apprendimento è rappresentato dal copiare: si adotta la stessa religione dei propri genitori o si passa ad un’altra religione grazie al contatto con un insegnante, per esempio. Perché i comportamenti di alcune persone sono copiati e altri no? Fino ad ora (capitoli 2 e 7), ho modellato l’apprendimento basato sui payoff, in cui i comportamenti di quelli che hanno successo materiale tendono ad essere imitati. Ma anche altri fattori sono importanti. Il processo di riproduzione culturale può favorire coloro che sono numerosi piuttosto che coloro che sono in numero scarso, indipendentemente dal loro successo economico: le pressioni sociali all’uniformità sono tra le propensioni umane più largamente documentate6. Per trasmissione conformista, intendo la circostanza che la probabilità che un individuo adotti un particolare comportamento varia con la prevalenza di quel comportamento nella popolazione (indipendentemente da altre influenze sull’apprendimento come i payoff relativi). L’importanza della frequenza nella popolazione di un tratto comportamentale potrebbe emergere se gli individui semplicemente desiderassero adottare quello che considerano il comportamento più comune. Ma allo stesso modo dei payoff relativi, il conformismo potrebbe comparire perché le istituzioni sociali privilegiano i comportamenti più comuni nel processo di trasmissione. Questo sarebbe il caso se i modelli culturali con la maggiore esposizione fossero quelli che aderiscono alle norme comportamentali più comuni, come succede in gran parte dei sistemi scolastici contemporanei, dove gli insegnanti tendono a far parte della razza e dei gruppi etnici numericamente predominanti. I processi di trasmissione culturale appena descritti sono essi stessi il risultato di una evoluzione, presumibilmente sotto l’influenza della selezione naturale, della selezione dei gruppi culturali, e di altre pressioni evolutive. Considerando la natura endogena del processo di apprendimento, un modello plausibile deve includere un processo di trasmissione che sia capace di riprodurre se stesso. È facile capire perché imitare colui che ha successo potrebbe essere una regola di apprendimento di facile diffusione. Anche l’apprendimento conformista si ricollega a questa regola, dato che ci sono forti ragioni teoriche per ritenere che, sotto condizioni abbastanza generali in cui l’apprendimento è costoso, la trasmissione conformista dei tratti contribuirà al successo materiale e riproduttivo degli individui, e dunque può essersi evoluta sotto l’influenza di eredità 6
Si considerino Boyd e Richerson (1985:223 e ss.) Ross e Nisbett (1991:30 e ss.), Bowles (1998) e i lavori citati in quella sede.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|11
genetiche o culturali7. Il modello della sezione seguente fornisce l’intuizione alla base di questi risultati: Finché il conformismo non è troppo comune, è un modo efficace di ridurre i costi di apprendimento. Per spiegare l’influenza delle istituzioni economiche e non economiche sulle preferenze, estenderò il modello di riproduzione dinamica presentato nel capitolo 2. Per catturare le influenze del conformismo e dei payoff sul cambiamento delle preferenze, si consideri una popolazione in cui gli individui possono avere una o due leggi apprese, x e y , con una frequenza nella popolazione p e 1 p con p [0,1] . I membri della popolazione sono accoppiati in modo da interagire per un periodo, in un gioco di coppia simmetrico, i cui payoff sono individuati da ( x, y) , ovvero dal payoff per la strategia dettata dalla norma x contro il partner che gioca seguendo l’altra regola (in alcuni casi mi riferisco a “regola” per indicare la strategia dettata dalla regola). Come in precedenza, b ( p) ) e b ( p) sono i payoff attesi per il comportamento in base alle regole x e y in una popolazione dove il p percento è del tipo x . y
x
Il processo di aggiornamento è formalmente lo stesso che nei modelli di riproduzione dinamica dei capitoli 2 e 7, fatta eccezione per il fatto che per ridurre la confusione nelle notazioni, assumo che tutti i membri della popolazione siano in fase di aggiornamento in ogni periodo ( =1). Ad ogni modo, al posto del processo di aggiornamento monotonico dei payoff modellato in precedenza, gli individui aggiorneranno alla luce di due informazioni, il proprio payoff relativo a quello degli altri, e la frequenza dei due tratti nella popolazione, per cui il grado di conformità misura l’importanza del secondo fattore rispetto al primo. Si definisca dunque il grado di conformismo (0,1] , come l’importanza dell’aspetto conformista del processo di apprendimento rispetto alle influenze basate sui payoff nell’aggiornamento, dove 1 rappresenta l’importanza relativa dei payoff, e k la frequenza nella popolazione della regola sulla quale l’apprendimento conformista non ha nessun effetto (presumibilmente una metà), mentre per p > k la prevalenza della regola x nella popolazione la favorisce nel processo di aggiornamento, indipendentemente dai payoff attesi dalle regole (anche questi dipendenti dalla frequenza)8. Si definisce la propensione alla riproduzione di una regola r and r . x
y
7Si 8
vedano Feldman, Aoki e Kumm (1996), Boyd e Richerson (1985) e Henrich and Boyd (1998).
L’effetto conformista non deve essere necessariamente lineare in p, ovviamente, ma non si guadagnerebbe nulla da una formulazione più generale.
12 | MICROECONOMIA
[ ] r =1/2[ (k p) + (1 )(b b )] r =1/2 ( p k) + (1 )(b b ) x
x
y
y
y
x
(11.1)
(Dato che le dinamiche dipendono solo dalla grandezza relativa delle due propensioni alla riproduzione, porre è un’ipotesi arbitraria ma conveniente perché consente una semplificazione nell’espressione seguente). Con probabilità (r r ) un tipo x diventerà un tipo y se accoppiato con un tipo y se r < r ; viceversa, se r r , l’individuo non cambia. Quelli che sono accoppiati con il loro stesso tipo non cambiano. y
x
y
x
x
y
Utilizzando la derivazione della riproduzione dinamica nel capitolo 2, abbiamo dp = p' p = p(1 p) (r r ) = p (r r) dt x
y
x
(11.2)
dove r è la propensità media del gruppo alla riproduzione, e come in precedenza, il coefficiente di adozione è una costante positiva che riflette il maggiore effetto sul cambiamento di differenze nella propensità alla riproduzione relativamente più grandi (propriamente dimensionate in modo che la probabilità del cambiamento vari all’interno di un intervallo unitario.) Dalla (11.2) è chiaro che dp / dt = 0 if r r = 0 , il che richiede che x
y
( p k) = b ( p) b ( p) 1 y
x
(11.3)
oppure che p sia 0 o 1 (dato che quando p =1 , r = r ). Se la (11.3) è soddisfatta, p è stazionario perché gli effetti della trasmisisone conformista (la parte a sinistra della (11.3)) spiazzano gli effetti del differenziale dei payoff (il lato destro). Dunque, in presenza di trasmissione conformista, e per p (0,1) , i payoff di equilibrio relativi alla x
regola favorita dal conformismo saranno sempre minori dei payoff associati alla regola prevalente. La figura 11.1 rappresenta tale regola. Per p (0,1) , dp / dt prende il segno di r r . Un equilibrio è asintoticamente stabile (si auto-corregge) se la derivata di (11.2) rispetto a p è negativa, il che richiede: x
y
db db < (1 ) dp dp y
oppure
x
(11.4a)
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
< ( y, x) ( y, y) ( x, x) + ( x, y) 1
|13
(11.4b)
che è soddisfatta se il vantaggio conformista conferito su x da un piccolo incremento di p, ovvero , è più che compensato dal vantaggio nel payoff conferito su y dallo stesso incremento di p (parte destra). Nella Figura11.1, p * rappresenta la soluzione di (11.3) che soddisfa (11.4) ed è quindi un equilibrio stabile di distribuzione delle regole.
Effetto Payoff
Effetto Conformismo
Figura 11.1 L’equilibrio culturale. La stazionarietà di p richiede che nel punto p=p* i vantaggi del conformismo del tratto prevalente (x) siano spiazzati dai vantaggi in termini di payoff di y.
Dalla (11.3) e dalla (11.4) si osserva che il conformismo ha due effetti. Innanzi tutto, (11.3) dimostra che le strategie che conducono a payoff bassi posso persistere. Per esempio, x è una strategia evolutiva stabile (SES) nella sua dinamica di riproduzione culturale se i payoff attesi per una piccola parte di popolazione, che gioca secondo la regola y , introdotta in una popolazione omogenea di individui che giocano secondo la regola x , superano i payoff degli individui che giocano secondo la regola x per meno di (1 k) /(1 ) . Questa condizione è chiaramente meno stringente di quella convenzionale rappresentata dalla SES, che richiede che i payoff degli individui mutantiy siano minori dei payoff degli individui dominanti x . Dunque, comportamenti che non sono delle risposte ottimali definiti sui payoff del gioco, possono persistere nella popolazione. Secondo, livelli sufficientemente elevati di conformismo devono violare (11.4), e
14 | MICROECONOMIA
rendere p * un equilibrio instabile e dunque renderlo il confine tra il bacino di attrazione degli equilibri con p = 0 e p =1 . In assenza di conformismo la stabilità richiede solo che la parte destra della (11.4) sia positiva, ovviamente una condizione più debole. Controintuitivamente, il conformismo può dunque aiutare a spiegare sia gli equilibri punteggiati che caratterizzano il cambiamento culturale rapido, sia la sopravvivenza nel lungo periodo di regole individualmente costose, siano esse benefiche al gruppo o no. Il conformismo si aggiunge dunque alla complementarità strategica (con risultati positivi) del tipo considerato nei giochi di assicurazione, essendo motivo della persistenza di comportamenti e convenzioni socialmente disfunzionali. I cambiamenti nelle strutture dei payoff, o altri dettagli degli individui accoppiati per giocare, o il grado il conformismo, sposteranno la distribuzione di equilibrio delle norme comportamentali in una popolazione se p * è interno e stabile. Se p * non è stabile, questi cambiamenti cambieranno la dimensione relativa dei bacini di attrazione dei due equilibri estremi, mutando la probabilità che l’uno o l’altro persistano in un ambiente stocastico. Questa osservazione suggerisce un modo di studiare l’endogeneità delle preferenze: si utilizzi l’equazione (11.3) per studiare lo spostamento di p * causato da quei cambiamenti istituzionali come le riforme scolastiche e i payoff dei comportamenti alternativi. Nella Figura 11.1, se una riforma scolastica che volesse aumentare il numero degli insegnanti appartenenti a gruppi di minoranza, riducesse la dimensione della trasmissione conformista, p * sarebbe trascinato verso sinistra. Ugualmente, cambiamenti dei parametri che riflettono la struttura delle interazioni sociali nel capitolo 7 – ripetizione di interazioni, accoppiamento non casuale, e costi di informazione sul proprio partner – sposterebbero la distribuzione di equilibrio delle regole. Come si può utilizzare questo modello per analizzare gli effetti delle istituzioni economiche sull’evoluzione delle preferenze?
PREFERENZE ENDOGENE Ecco un esempio dell’utilizzo del modello precedente nell’esplorazione dell’effetto delle istituzioni su una particolare preferenza, quella evidenziata da Joseph Schumpeter nella sua teoria dell’imprenditorialità, innovazione e crescita economica, ovvero la predisposizione ad innovare e comandare opposta a quella ad imitare e a seguire. Si consideri un ambiente in mutamento, in cui i membri di una popolazione sono accoppiati per interagire in un gioco simmetrico con due strategie. Gli accoppiamenti
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|15
non sono casuali: se la frazione della popolazione dei tipi x è p , allora i tipi x saranno accoppiati in media con il loro stesso tipo non il p per cento delle volte, ma il μ = s + (1 s) p > p per cento delle volte. Allo stesso modo, i tipi y saranno accoppiati con i tipi y il μ = (1 s) p < p per cento delle volte. La differenza tra queste due probabilità condizionali, s , è il grado di segmentazione, introdotto nel capitolo 7. xx
yx
La strategia di apprendimento (L) prevede di studiare l’ambiente ad un costo di 1 e, sulla base della conoscenza che si ottiene, di selezionare un’azione che porta benefici pari a 2. La strategia di imitazione (I) non costa nulla, e comporta un beneficio di 2 se l’imitatore è accoppiato con un apprendista, e di 2 se due imitatori sono accoppiati, dove >1 è una misura normalizzata della variabilità dell’ambiente. La struttura dei payoff riflette il fatto che gli apprendisti si adeguano sempre all’ambiente esistente (ma ad un costo), mentre gli imitatori lo fanno solo se sono accoppiati con un apprendista e sono dunque capaci di sfruttare senza costi la sua conoscenza aggiornata. Quando un imitatore è accoppiato con un altro imitatore, entrambi copiano un comportamento che non è aggiornato alla luce della situazione corrente. Quanto il loro comportamento sia inappropriato dipende dalla misura del cambiamento ambientale, . Sia p la frazione della popolazione degli apprendisti. Se l’aggiornamento è monotonico rispetto al payoff (ignorando il conformismo e ponendo = 0 nell’equazione 11.1), la condizione stazionaria per p è b = b , L
I
p* = ( 1) /(1 s)
Si noti che dp * / d > 0 , quindi un aumento nella stocasticità dell’ambiente aumenta la frequenza degli apprendisti nella popolazione. Si mostra facilmente che p* < p è la frequenza della popolazione che massimizza i payoff medi con un accoppiamento casuale. L’intuizione dietro questo risultato è che gli apprendisti generano dei benefici sociali che eccedono i loro benefici privati (raccolgono informazione per gli imitatori quando sono copiati). Quindi, il livello di equilibrio degli apprendisti è più basso del livello socialmente ottimale. Molto presumibilmente dp * / ds > 0 , quindi una segmentazione maggiore aumenta la frazione di equilibrio degli apprendisti. Un assortimento (o segmentazione) positivo sottrae agli imitatori parte di questi benefici, diminuendo i loro payoff e riducendo la frequenza di equilibrio nella popolazione. Come un copyright o un brevetto, un assortimento positivo aumenta la ricerca. Ma ha anche lo stesso effetto di ridurre l’efficienza della protezione mediante copyright dell’informazione ottenuta dagli apprendisti; riduce il flusso di informazione aggiornata che va dagli apprendisti agli imitatori. L’effetto di ciò è una riduzione dei max
16 | MICROECONOMIA
payoff medi, perché fornire informazione agli imitatori è senza costi, sebbene sia vantaggioso per l’apprendista. Al contrario delle preferenze dipendenti dal contesto (situation-specific), le preferenze sono endogene quando le proprie esperienze comportano cambiamenti duraturi nel proprio comportamento, in una certa situazione. I modelli presentati si riferiscono a questo, dal momento che mostrano come il processo di aggiornamento comportamentale sia influenzato dalle interazioni dell’individuo con il suo ambiente sociale e materiale. Dato che il cambiamento delle preferenze riguarda un processo di apprendimento di lungo periodo – che spesso avviene durante l’infanzia o l’adolescenza – e i cambiamenti significativi nelle istituzioni economiche sono inusuali, anche gli studi empirici rilevanti sull’impatto delle istituzioni economiche sulle preferenze sono rari. Alcuni degli studi più illuminanti riguardano l’impatto delle nuove istituzioni economiche durante un processo di crescita economica, o l’impatto di istituzioni di una società sulle persone di un’altra società. Tra gli esempi più esotici vi è il seguente. La penetrazione del commercio nelle ex società non di mercato, per esempio, è spesso accompagnata dal proliferare della stregoneria e di comportamenti simili. Ciò avvenne nella Costa d’Oro (ora Ghana) durante l’espansione della prima attività di raccolto finalizzata alla vendita (cacao): i diritti di proprietà comuni preesistenti non erano più adeguati nel momento in cui la terra acquistò molto valore, e dunque vennero fuori i cosiddetti dottori stregoni, per decidere delle dispute sui confini dei campi. Episodi simili avvennero in Bolivia con l’arrivo dell’estrazione dello stagno, in Colombia con la diffusione delle coltivazioni di zucchero, e nel diciassettesimo secolo nel Salem Villane (Massachusetts) con la crescita del commercio lungo la strada che va da Boston verso nord. La stregoneria, sembra, fu almeno in parte una risposta ai conflitti sociali e all’esposizione al rischio, dovuta alla inadeguatezza dei sistemi tradizionali di diritti e obbligazioni nel coordinare la moderna attività economica basata sullo scambio di mercato. Anche gli esperimenti suggeriscono che le preferenze sono endogene. Si ricordi che negli esperimenti che io e i miei collaboratori abbiamo effettuato su 15 società semplici, il gioco sperimentale sembrava riflettere gli schemi comportamentali derivati dalla vita quotidiana, e soprattutto dal tipo di sostentamento del gruppo in questione. In particolare, quelli che per usanza condividevano grosse quantità di cibo, tendevano a dividere la torta dell’ultimatum game equamente, o persino ad offrire la parte più grande all’altro. Lì dove la fornitura di beni pubblici era chiaramente una tradizione (il sistema
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|17
Harambee, tra gli Orma, in Kenia), i contributi nel gioco sperimentale dei beni pubblici corrispondevano ai contributi effettivi previsti dal sistema Harambee. I nostri esperimenti hanno rivelato delle ampie variazioni nel comportamento all’interno dei diversi gruppi culturali, e tra i gruppi stessi. All’inizio abbiamo provato a spiegare il comportamento negli esperimenti sulla base di informazioni su sesso, età, ricchezza relativa ed istruzione degli individui. Sorprendentemente, nessuna di queste misure a livello individuale sembrava sistematicamente legata al gioco sperimentale. Anche le ampie differenze tra i gruppi rappresentavano un enigma. Ci siamo chiesti se questo avvenisse perché le preferenze erano influenzate da condizioni specifiche del gruppo, come istituzioni sociali o norme di equità. La grande varianza nelle istituzioni e nelle norme nel nostro campione, ci ha permesso di affrontare questa questione in modo sistematico. Abbiamo ordinato le società secondo due aspetti delle interazioni sociali coinvolte nel condurre un’attività di sostentamento, e poi abbiamo provato ad usare queste misure per predire il comportamento nell’ultimatum game. La prima, i payoff potenziali della cooperazione, era una misura del modo in cui l’ecologia locale consente rendimenti crescenti di scala, del tipo che potrebbe essere sfruttato produttivamente dalle misure cooperative. I cacciatori di balena Lamelara sono risultati al primo posto, e i coltivatori delle foreste Machiguenga all’ultimo. Abbiamo pensato che in quei gruppi dove il beneficio per la produzione cooperativa era minimo, ci sarebbero state poche norme comuni riguardo alla condivisione. Al contrario, quelli in cui il sostentamento dipendeva da una cooperazione di larga scala, come i Lamelara, avrebbero sviluppato dei modi di condividere il surplus congiunto. La seconda dimensione, l’integrazione del mercato, misurava la frazione delle attività di un popolo che avveniva attraverso uno scambio di mercato. L’idea per questa misura era che più frequentemente si effettuano delle transazioni di mercato, più si ricorre anche alla condivisione del surplus congiunto (i guadagni del commercio), persino con una persona sconosciuta. L’esperienza del commercio poteva essere associata a principi di condivisione astratti. Abbiamo provato a spiegare l’offerta media del gruppo nell’ultimatum game e la misura della propensità a rigettare offerte basse, sulla base di queste due dimensioni della struttura economica. Entrambi questi aspetti del gioco dell’ultimatum game sono risultati positivamente (e sensibilmente) correlati con le nostre due misure, alle quali si poteva ricondurre più della metà della varianza in entrambi i casi. L’impatto di queste misure del sistema economico è rimasto ampio e robusto nelle equazioni attese del gioco sperimentale individuale (piuttosto che della media del gruppo).
18 | MICROECONOMIA
Il fatto che misure ordinali, persino rudimentali, del sistema economico rappresentino dei forti strumenti di predizione del gioco sperimentale, suggerisce un notevole impatto delle istituzioni sulle preferenze9 (l’obiezione che la relazione causale si muove al contrario – le persone ragionevoli si stabiliscono in posti dove le attività cooperative sono benefiche e l’integrazione di mercato è possibile - non è convincente). Il suddetto processo di trasmissione culturale rappresenta una descrizione di come la struttura economica può impattare sulle preferenze. Negli ambienti che offrono ampie opportunità di produzione cooperativa, le persone ragionevoli guadagnerebbero payoff più alti di quelle che seguono solo le proprie preferenze. Di conseguenza, il processo di aggiornamento culturale favorisce la ragionevolezza in quelle società, più che in altri posti, in cui gli esclusi dalla cooperazione non sopporterebbero nessun costo materiale. Il processo di aggiornamento spesso riguarda istituzioni di socializzazione, e soprattutto metodi per allevare bambini. Dunque ci aspetteremmo che le modalità con le quali sono allevati i bambini varino con le esperienze economiche. L’impatto della attività principale di sostentamento sull’allevamento del bambino nelle società industriali avanzate è stato menzionato alla fine del Capitolo 8. Si tratta di un esempio rilevante del processo di cambiamento delle preferenze nella transizione dal foraggio all’allevamento. Herbert Barry, Margaret Child e Irvin Bacon (1959) hanno categorizzato 70 società, per lo più non letterate, in base alla forma prevalente di attività (allevamento, agricoltura, caccia e pesca) e la relativa facilità di conservazione del cibo, o altre forme di accumulazione della ricchezza, dato che questo rappresenta un fattore notevolmente legato alla struttura e alla stratificazione sociali. La conservazione del cibo è diffusa nelle società agricole ma non tra i foraggieri. Gli autori hanno anche raggruppato l’evidenza sulle forme di allevamento del bambino, tra cui l’educazione all’obbedienza, l’autonomia, l’indipendenza e la responsabilità. Hanno trovato grosse differenze nelle pratiche di allevamento. Queste variavano molto con la struttura economica, influenzando altre misure della struttura sociale come l’unilateralità della prole, la misura della poligamia, i livelli di partecipazione delle donne dall’attività predominante di sussistenza, la dimensione delle unità di popolazione. Gli autori conclusero “la conoscenza dell’economia in sé consentirebbe di predire con molta accuratezza se le pressioni di socializzazione di una società siano principalmente verso l’obbedienza o l’affermazione” p.59). La relazione causale difficilmente va dall’allevamento del bambino alla struttura economica, dato che questa ultima, nel 9
Una presentazione più completa di metodi, risultati ed interpretazioni di questi esperimenti si trova in Henrich, Boyd, Bowles, Fehr e Gintis (2004) e Henrich, Bowles, Boyd, Fehr, Camerer, Gintis e McElreath (2001).
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|19
campione di società semplici studiate, è determinata principalmente dalla geografia. I modelli introdotti fino ad ora suggeriscono il seguente nesso causale. La produzione e la distribuzione di beni e servizi, in ogni società, è organizzata da un insieme di regole, tra cui l’allocazione di proprietà, imprese e altre organizzazioni, allocazioni patriarcali e altre usanze basate sul genere, età e affinità (che per esempio, si riscontrano all’interno delle famiglie), dono, furto, contrattazione e, naturalmente, i mercati. Queste regole di allocazione, insieme ad altre regole, determinano cosa si debba o non si debba fare per acquisire il proprio sostentamento. Queste regole influenzano anche lo stesso processo di trasmissione culturale, per cui, per esempio, una complessa divisione del lavoro rappresenta un notevole impulso all’introduzione dell’istruzione moderna (e obbligatoria). Le istituzioni economiche quindi impongono precisi schemi di interazione sulle persone che compongono una società, influenzando chi incontra chi, a quali condizioni, per fare cosa, e con quali aspettative di guadagno. Queste allocazioni e regole di trasmissione culturale influenzano il processo con cui le persone aggiornano il loro comportamento, che ha a che fare con personalità, abitudini, gusti, identità, valori e credenze. Fino ad ora ho modellato il modo in cui le preferenze possono evolversi in risposta a differenze istituzionali; ma le istituzioni stesse si evolvono. Il modello e la simulazione che seguono esplorano questo processo co-evolutivo. In pratica, intendo fare chiarezza su una transizione storica di piccole dimensioni e poco compresa: l’eclissarsi delle strutture sociali collettiviste tipiche dei gruppi foraggieri, in favore dei sistemi agricoli basati sui diritti di proprietà individuali.
G L I E Q U IL IB R I
DI
HOBBES
E DI
ROUSSEAU
Per gran parte della storia dell’umanità – più o meno dai 90000 ai 110000 anni fa – le interazioni sociali erano organizzate senza l’aiuto di nessuna istituzione che potesse anche solo lontanamente somigliare agli Stati contemporanei o alla proprietà privata. I gruppi mobili dediti al foraggio, che costituivano allora la tipica forma di organizzazione sociale umana, non sembravano soffrire il caos dello stato di natura Hobbesiano. Piuttosto, molto probabilmente, erano organizzati in una maniera simile ai contemporanei cacciatori-raccoglitori mobili, con vite regolate da regole sociali (spesso includendo monogamia e condivisione delle risorse), il cui enforcement era garantito dalla punizione collettiva di quelli che non le rispettavano. Christopher Boehm (1982:421) scrive:
20 | MICROECONOMIA
In queste …comunità, la sanzione di gruppo è emersa come lo strumento più potente per la regolazione dei comportamenti legati alla soddisfazione personale, in particolare, quelli che disturbavano la cooperazione e l’equilibrio sociale necessari alla stabilità.
Con l’avvento dell’agricoltura, all’incirca undici millenni fa, la richiesta del rispetto dei diritti di proprietà individuali diventò più comune soprattutto sulla terra e sul bestiame. Questi nuovi diritti di proprietà emersero e si diffusero senza l’assistenza di Stati o di altre agenzie centralizzate di controllo. Solo alla fine (diversi millenni dopo l’avvento dell’agricoltura), le forme centralizzate di punizione e di controllo sui diritti di proprietà cominciarono ad emergere come una nuova forma di organizzazione. Questo è senz’altro uno dei più importanti casi testimoniati di evoluzione istituzionale. Il modello che segue riguarda quella che io chiamo la prima rivoluzione dei diritti di proprietà (considererò la nascita dello stato moderno nel capitolo 13). Si supponga che n membri di un gruppo dedito al foraggio siano accoppiati a caso per dividere un bene il cui valore è v . Possono adottare tre strategie: Usurpare, Condividere, e Punire10. Il tipo di un individuo non è direttamente osservabile, e dunque è sconosciuto prima che avvenga l’interazione. Quando i Condivisori si incontrano, dividono equamente il bene. Quando gli Usurpatori incontrano i Condivisori, si impossessano del bene; quando si incontrano tra di loro litigano, guadagnando il bene o sopportano il costo della sconfitta, c > v , con uguale probabilità. Quando i Punitori incontrano i Condivisori, o altri Punitori, dividono il bene equamente. Tuttavia, quando un Punitore è in coppia con un Usurpatore, tutti i Punitori cercano di punire l’Usurpatore. Se hanno successo, il bene è distribuito il parti uguali tra tutti i Punitori, mentre se non hanno successo, il Punitore sopporta il costo della sconfitta c . La strategia della punizione è collettiva, nel senso che gli altri Punitori aiutano ogni Punitore accoppiato con un Usurpatore, e il risultato è che la probabilità di punire con successo un Usurpatore dipende dalla frazione di Punitori nella popolazione. Per semplificare la presentazione seguente, assumo che la probabilità di punire con successo un Usurpatore corrisponde alla frequenza nella popolazione dei Punitori, . Nella simulazione adotto un’ipotesi molto meno semplificativa. Dato che il Punitore ottiene v / n se ha successo, il che avviene con probabilità , il payoff atteso di un Punitore accoppiato con un Usurpatore è: ( p,g) = 10
v (1 )c n
Questo gioco sarà riconosciuto come una modifica del gioco Falco-Colomba, dove l’innovazione è rappresentata dalla strategia della punizione.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|21
Tabella 11.1. I Payoff nel Gioco della Punizione (Con il payoff del giocatore nella riga)
Usurpare
Condividere
v
Punire
Usurpare
(v-c)
(1-)v – c
Condividere
0
v
v
Punire
v/n-(1-)c
v
v
(al momento considero la distribuzione dei guadagni dagli altri Punitori di successo). Dunque, i payoff sono rappresentati dalla Tabella 11.1. Se è la frequenza nella popolazione dei Condivisori, i (n 1) altri Punitori di successo in una interazione con un Usurpatore saranno (n 1)(1 ) . Ogni Punitore riceverà v / n da ognuno di questi, quindi i Punitori riceveranno un ammontare atteso (n 1)(1 )
v 1 = (1 )v
n n
dalla redistribuzione dei compagni Punitori. I payoff attesi di queste tre strategie quindi sono: v 2 v = ( + ) + (1 )(v (1 )c) 2 v c = v + {(1 )v c} + (1 ) 2 = ( + ) c
(11.5)
p
(11.6)
u
(11.7)
Una buona rappresentazione dello spazio per questo sistema è la Figura 11.2.
Si supponga che le tre strategie siano dei tratti culturali, appresi da altri, e che la trasmissione culturale sia basata su questi payoff con un processo monotonico di aggiornamento. Si assuma che n sia sufficientemente grande in modo che i payoff realizzati siano approssimati dai payoff attesi. Dunque abbiamo d = ( ) dt d = ( ) dt c
(11.8)
p
(11.9)
22 | MICROECONOMIA
Dove il payoff medio, , è + + (1 ) c
p
u
Cosa possiamo dire sui risultati che probabilmente verranno prodotti da questo sistema dinamico? Le dinamiche rappresentate dalle equazioni precedenti sono rappresentate nella Figura 11.4. I vettori indicano la direzione del movimento per una popolazione composta dalle frequenze date dal punto alla base delle frecce. Dunque, per esempio, nella regione IV e sono entrambe crescenti (le frecce sono dirette verso l’esterno dei vertici Tutti Condivisori e Tutti Punitori) mentre , la frazione degli Usurpatori, è decrescente. La figura rappresenta anche i luoghi lungo i quali le quote della popolazione sono stazionarie. Tutti Punitori
Tutti Condivisori
Tutti Usurpatori
Figura 11.2 La distribuzione delle strategie in un gruppo. All’altezza d, la lunghezza del segmento perpendicolare ad ogni estremo rappresenta la frequenza della strategia indicata al vertice opposto all’estremo; questi segmenti hanno somma unitaria. Dunque ai vertici la popolazione è omogenea.
Due tipi di risultati stazionari sono di particolare interesse. Nel primo, = 0 , =1 v /c (e = v /c ). Questo risultato, il punto b nella figura, è analogo al familiare equilibrio del gioco Falco-Colomba, ed è asintoticamente stabile. I Punitori non possono invadere questa popolazione. I Punitori non fanno meglio dei Condivisori quando interagiscono con questi, e fanno molto peggio degli Usurpatori quando interagiscono con questi (litigano sempre e quasi sempre perdono). Chiamerò questo un equilibrio Hobbesiano, perché è caratterizzato da frequenti litigi sulla proprietà, e come Hobbes concluse nella citazione iniziale al capitolo 4, da un conseguente basso livello di payoff medi.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|23
Tutti Punitori
Nota: la regione V è la piccola area al di sotto di = 0
Tutti Condivisori
Tutti Usurpatori
Figura 11.3 Dinamiche all’interno del gruppo. I vettori indicano la direzione del movimento nelle regioni definite dai luoghi in cui , e sono stazionari.
Il secondo risultato stazionario nell’insieme dei risultati in cui + =1 e < (0,1) , è indicato dal punto a nella Figura 11.3. Dato che questo equilibrio combina la condivisione incondizionata e il sostegno collettivo alle norme sociali ammirato da Jean-Jacques Rousseau, lo chiamerò Rousseauviano. Di particolare interesse sono gli stati nella parte superiore di questo bordo, ovvero quelli per i quali < max , il punto indicato da a nella figura 11.3. Ognuno di questi punti è un equilibrio di Lyapunov (neutralmente) stabile, cioè, è stazionario ma le perturbazioni non sono auto-correttive. Ogni risultato in questo insieme non può essere invaso dagli Usurpatori (o da ogni strategia mista sostenuta dall’Usurpazione). Questo perché, per < e + =1, < = . Ma se non si ha nessun comportamento di reazione non ottimale, questi equilibri tendono ad essere trascinati verso il basso lungo la frontiera del simplex. Il trascinamento si presenta perché i Condivisori e i Punitori sono da un punto di vista comportamentale non distinguibili in assenza degli Usurpatori. max
max
u
c
p
L A S E L E Z I O N E D E L L ’ E Q U IL IB R IO ( D E L T I P O C A C C IATO R E -R A C C O G L ITO R E ) Quali di questi equilibri ci aspetteremo di ottenere? Tutto ciò che si può dire in assenza di un gioco di risposte non ottimali è che il risultato dipende dalle condizioni iniziali. Per rispondere alla domanda in un contesto più realistico, dobbiamo estendere il modello e prendere in considerazione gli eventi fortuiti. Questi potrebbero essere
24 | MICROECONOMIA
mutazioni (se consideriamo i tratti comportamentali come espressione dell’eredità genetica) o qualche altro tipo di risposta non ottimale, cioè, azioni intraprese per ragioni non considerate nel modello, tra le quali sperimentazione ed errori. Dato che le tre strategie nel modello rappresentano tratti comportamentali, le azioni di risposta non ottimale prendono la forma di cambiamenti della propria strategia per ragioni non specificate nel modello. Formalizzerò questo processo nel prossimo capitolo, ma anche senza l’aiuto di un modello del processo stocastico, è chiaro che gli eventi fortuiti possono introdurre uno spostamento dall’area di un equilibrio verso il bacino di attrazione dell’altro. Se si considerano gli eventi fortuiti, nel modello fino ad ora sviluppato l’equilibrio Rousseauviano non persisterà a lungo. Si supponga che =1, e quindi che ci siano solo i Punitori. Dato il gioco di risposta non ottimale, sia gli Usurpatori che i Condivisori saranno introdotti nella popolazione. Gli Usurpatori perderanno in teoria tutte le loro battaglie, dato che i Punitori sono numericamente superiori, e verranno dunque eliminati. Ma in una popolazione composta di soli Condivisori e Punitori, tutti condivideranno e, fatta eccezione per la possibilità di presenza fortuita di un Usurpatore, riceveranno lo stesso profitto. In base al saggio al quale gli eventi accadono, ci vorrà più o meno tempo per accumulare un numero sufficiente di Condivisori, in modo che gli Usurpatori possano invadere, dal momento che i Punitori sono troppo pochi per imporre abbastanza punizioni su di loro. In altre parole, la popolazione si sposterà lungo l’estremo a sinistra del simplex nella Figura 11.3, dopo il punto a, cioè nel bacino di attrazione dell’equilibrio Hobbesiano. Diversamente dall’equilibrio Rousseauviano, l’equilibrio Hobbesiano è asintoticamente stabile, e dunque non sarà soggetto allo spostamento indotto dal caso fortuito cui è soggetto il precedente. Ovviamente, anche l’equilibrio Hobbesiano si sposterà: prima o poi, un insieme di eventi fortuiti porteranno la popolazione verso il bacino di attrazione dell’equilibrio Rousseauviano. Ma il fatto che l’equilibrio Hobbesiano non è soggetto a trascinamenti significa che il suo spostamento sarà improbabile in ogni periodo, dunque sarà non frequente. La popolazione spenderà gran parte della storia dell’umanità nell’area dell’equilibrio Hobbesiano. Allora perché gran parte della storia dell’uomo ha dimostrato soluzioni sociali più vicine all’equilibrio Rousseauìvano? Cosa manca nel modello? Tre fattori possono contribuire al suo successo evolutivo. Primo, se i gruppi sono soggetti a periodiche avversità, sia in termini ambientali che di conflitti con altri gruppi, i gruppi con i rendimenti medi più alti sopravviveranno
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|25
con più probabilità. I rendimenti medi nell’equilibrio Rousseauviano sono v /2 , e nell’equilibrio Hobbesiano v(1 v /c) /2 , dunque i gruppi senza gli Usurpatori saranno favoriti (e quelli con gli Usurpatori saranno svantaggiati in proporzione alla frazione degli Usurpatori ( v c ) nella popolazione). Assumendo v = 2 e c = 3 , la Figura 11.4 rappresenta il payoff atteso medio di ogni composizione del gruppo nel simplex, dove i contorni indicano i luoghi di iso-payoff-medio. Se i gruppi con un payoff più alto si espandono alle spese dei gruppi con un payoff più basso, la direzione del cambiamento sarà quella indicata dalle frecce, cioè non verso lo stato di Tutti Punitori, ma piuttosto verso l’estremo sinistro, dove non ci sono Usurpatori e i payoff medi sono massimizzati. Secondo, la trasmissione culturale conformista andrà in senso contrario al trascinamento, rendendo l’esito Tutti Punitori asintoticamente stabile. In teoria, se tutti i membri sono Punitori, anche un debole conformismo sarà sufficiente ai Condivisori per essere eliminati, perché i payoff per la condivisione e la Punizione sono uguali in assenza degli Usurpatori. Infine, in prossimità dell’equilibrio Rousseauviano, i Condivisori e i Punitori sono distinguibili perché l’Usurpatore che capita per caso, fornirà ai Punitori una opportunità di punizione collettiva. Il Condivisore (anche questo raro) si asterrà dalla punizione collettiva, approfittando dell’attitudine civica dei Punitori. Ma date le capacità umane di costruire e mettere in pratica codici di condotta morale (già praticati dai Punitori contro gli Usurpatori), è chiaro che i Condivisori che non puniscono saranno anch’essi puniti. Quando si aggiunge questa cosiddetta punizione di secondo ordine, l’equilibrio Rousseauviano diventa asintoticamente stabile, anche se il costo imposto sui Condivisori che approfittano è limitato, per esempio, ad un breve allontanamento o ad una porzione più limitata di cibo. Il motivo, come nel caso del conformismo, è che la punizione di secondo ordine non ha bisogno di innescare la selezione contro i Punitori; deve solo prevenire la deriva11.
11
Ci sono altre ragioni per cui l’equilibrio Rousseauviano potrebbe persistere. Non è realistico ipotizzare che la grandezza o altre caratteristiche del premio siano lineari, piuttosto che concavi, rispetto all’ammontare acquisito. Ciò non è vero in particolare per la caccia di un grosso animale, dato che il premio singolo – per esempio un antilope - può rappresentare abbastanza cibo per tutti i membri del gruppo in una forma che non è facilmente conservabile. Questa è la base dell’interpretazione del “furto tollerato” di Blurton-Jones (1987) sulla condivisione di grosse quantità di cibo nelle società semplici. Considerare la concavità dei rendimenti, ridurrebbe i rendimenti degli Usurpatori, e promuoverebbe i rendimenti dovuti alla condivisione dell’animale (Condividere o Punire).
26 | MICROECONOMIA
Tutti Punitori
Tutti Condivisori
Tutti Usurpatori
Figura 11.4 Payoff medi e dinamiche tra i gruppi. I contorni indicano le distribuzioni delle tre strategie nella popolazione per cui il livello del payoff medio di gruppo è lo stesso. Le frecce indicano la direzione della crescita. Il payoff medio di gruppo più alto v /2 =1 si presenta quando non ci sono Usurpatori (estremo a sinistra). Quindi un gruppo di composizione a (molti condivisori, pochi usurpatori e punitori) avrà payoff più alti del gruppo b con molti punitori, pochi usurpatori e pochi condivisori. Si noti i) che un gruppo con una maggioranza di punitori come c avrà payoff più bassi di un gruppo in equilibrio usurpatore-condivisore d; ii) la superficie è virtualmente piatta nei dintorni della distribuzione tutti condivisori. Le coordinate dei punti indicati sono (1 , , ) : [a=(0.15, 0.70, 0.15), b=(0.16, 0.29, 0.55), c=(0.33, 0.12, 0.55), d=(0.66, 0.34, 0)]
La punizione di secondo ordine, il destino condiviso dai membri del gruppo di fronte alle avversità, e la trasmissione culturale conformista rendono plausibile che gli equilibri Rousseauviani possano persistere per lunghi periodi di tempo, anche millenni, ovvero, fino all’arrivo dell’agricoltura. Richerson, Boyd e Bettinger (2001) dimostrano che un notevole miglioramento della variabilità climatica circa 12 millenni fa, ha trasformato la coltura delle piante e l’allevamento degli animali, da attività in precedenza “impossibili”, ad attività che nel lungo periodo divennero “necessarie”. Ma la nuova tecnologia non ha potuto essere utilizzata nell’ambiente istituzionale dei tipici gruppi foraggieri. Un ostacolo significativo fu la mancanza di diritti di proprietà individuale sulla carne, le altre risorse commestibili di grande dimensione e la terra, e il principio della divisione egualitaria. Un esempio dal passato recente di un gruppo di foraggieri in Malesia mostra il problema:
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|27
Le nozioni tradizionali Batek per cui tutte le risorse naturali non sono possedute fino al momento in cui sono messe insieme e per cui tutto il cibo ottenuto in eccesso rispetto ai bisogni della famiglia di chi l’ha procurato deve essere condiviso con le altre famiglie sembra molto adatta ad una vita foraggiera nomade, ma completamente inadatta a …l’allevamento stanziale… abbandonare quell’insieme di idee e pratiche sarebbe psicologicamente una cosa molto difficile da fare per loro dato che l’obbligazione di condividere il cibo è uno dei componente principali dell’identità Batek e uno dei vincoli principali che legano le famiglie Batek insieme in una società. (Endicott, 1988:126127)
Endicott riporta che alcuni Batek piantavano il riso e altri (sempre foraggieri) semplicemente lo raccoglievano (ovviamente, sentendosi obbligati a condividere il raccolto con quei foraggieri che arrivavano troppo tardi), costringendo alcuni degli allevatori Batek ad abbandonare l’area. Dato che l’agricoltura si sviluppa da una intensificazione del raccolto piuttosto che dalla caccia, la sua emergenza ha avuto un impatto sulla divisione del lavoro tra i sessi. Nell’America Sud-Ovest, i gruppi il cui ordine sociale rimaneva orientato esclusivamente alle attività maschili come la caccia, furono sostituiti da gruppi che adattarono le loro istituzioni in modo da essere meglio in grado di sfruttare il maggiore potenziale produttivo di quello che storicamente era stato il “lavoro delle donne” (Bettinger e Baumhauf, 1982). Il caso Batek suggerisce che lo sviluppo dell’agricoltura dipende dall’emergere dei diritti di proprietà individuale sui raccolti, gli animali addomesticati e la terra. I diritti di proprietà ora sono riconosciuti dagli Stati: ma la proprietà individuale si è affermata e si è diffusa prima che si affermasse il riconoscimento centralizzato dei diritti. Come è stato possibile? Sembra plausibile che, se l’esempio Batek si riproponesse in molti casi, una nuova strategia potrebbe emergere e diffondersi: comportati come un Usurpatore se possiedi qualcosa, e come un Condivisore se non possiedi nulla. Questa è chiaramente la strategia Borghese nel gioco Falco-Colomba presentato nel capitolo 3. Si ricordi che la strategia Borghese è evolutivamente stabile e può invadere l’equilibrio Hobbesiano, creando un nuovo equilibrio asintoticamente stabile (con nessun Punitore, Usurpatore e Condivisore presente) che chiamerò Borghese. Nella misura in cui il possesso non è ambiguo, in questo equilibrio non ci sono litigi, quindi i payoff medi sono v /2 . Come si è visto nel capitolo 2, se la proprietà è contestata la strategia Borghese diventa indistinguibile dall’Usurpazione. Se qualcosa di simile alla strategia Borghese non fosse emerso, sembra difficile pensare che l’agricoltura si sarebbe diffusa così velocemente come è stato. Ma se l’equilibrio Borghese è così positivo, il lettore può chiedersi, perché non si è
28 | MICROECONOMIA
affermato prima dell’avvento dell’agricoltura? Una risposta possibile è che l’agricoltura ha reso il possesso non ambiguo: è molto più facile determinare se questo insieme di terre coltivate è di mia proprietà o no, che sapere chi possiede la preda che si sta inseguendo. La proprietà di un territorio foraggiero vasto, con popolazione umana sparsa, sarebbe ugualmente difficile da definire e sostenere. Abbiamo visto (nel capitolo 2) che se i diritti di proprietà sono sufficientemente non ambigui, la strategia borghese non è più un SES. Sembra plausibile che una economia di cacciatori e raccoglitori abbia combattuto molto contro il successo della strategia Borghese, mentre l’agricoltura ha creato le condizioni per il suo successo. Inoltre, l’agricoltura ha favorito l’equilibrio Borghese in altri due modi. Primo, diversamente dalla carne e da molti dei cibi raccolti, il grano ed altri cereali potevano essere conservati ad un costo relativamente contenuto. Ciò rese la relazione tra ricchezza o altri valori dei payoff e l’ammontare del premio ottenuto più lineare. Non solo la conservazione, ma anche l’accumulazione divenne possibile. Questa linearizzazione dei benefici ha ridotto i vantaggi intrinseci del condividere. Fu possibile auto-assicurarsi contro gli eventi futuri avversi attraverso la conservazione, piuttosto che confidare nella condivisione reciproca per attenuare i capricci dell’economia foraggiera. Secondo, con l’equilibrio Borghese, anche se i vantaggi in termini di produttività dell’agricoltura possono non essere stati riconosciuti inizialmente, i successivi progressi nella produttività dell’agricoltura permisero a quelle comunità che la avevano adottata, di crescere e sopravvivere alle avversità dovute all’ambiente e al gruppo stesso, con una probabilità più elevata rispetto ai gruppi foraggieri. La diffusione dei diritti di proprietà borghesi ha gradualmente eclissato gli ordini sociali di tutti i gruppi foraggieri tranne poche eccezioni, che arrivarono ad occupare delle nicchie ambientali protette e molto più confinate. La grande precisione con cui la proprietà poteva essere definita nelle società agricole, insieme alla riduzione dell’abilità dei membri delle comunità semplicemente di muoversi per evitare la punizione, ha permesso una codificazione più efficace e l’enforcement da parte di terzi dei diritti di proprietà. Allo stesso tempo, l’incremento delle disuguaglianze tra i membri della comunità (favorito dall’abilità di accumulare ricchezza) ha prodotto interessi economici più differenziati tra le famiglie e può aver reso le forme multilaterali di applicazione della norma più difficili. La risultante crescita delle istituzioni centralizzate di enforcement (proto-Stati) alla fine ha ridotto il ruolo del monitoraggio reciproco e dell’enforcement tra pari.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
U N M O D E L L O A D A G E N T I ( A G E N T- B A S E D ) R IV O L U Z IO N E D E I D I R I T T I D I P R O P R I E T À
DELLA
|29
P R IM A
Le argomentazioni fornite fino ad ora, sebbene coerenti con le informazioni sui fatti rilevanti, sono incomplete da un punto di vista importante: non ho dimostrato che il modello della struttura sociale delle bande foraggiere potrebbe aver persistito nel lunghissimo termine, sotto condizioni ambientali e non, che assomiglino a quelle degli albori dell’esistenza umana. Non ho neppure dimostrato che le influenze causali che si applicano, avrebbero portato una rivoluzione nei diritti di proprietà sotto queste condizioni empiriche. Questo è un compito difficile, non solo a causa della scarsità dei dati, ma anche perché il processo è troppo complicato per essere modellato analiticamente, soprattutto se si considera il ruolo degli eventi fortuiti. Anche limitando la nostra attenzione ad un singolo gruppo, non possiamo dire molto altro se non che ci sono tre equilibri (considerando il continuo di Condivisori e Punitori come un solo equilibrio), uno dei quali è instabile, uno che è asintoticamente stabile (l’equilibrio Borghese) e l’altro (il Rousseauviano) che è solo neutralmente (Lyapunov) stabile, e dunque soggetto a scostamenti. Ci piacerebbe poter rispondere a domande del tipo: se osservassimo dieci gruppi del genere, per un periodo lungo, in quale momento la popolazione sarà in prossimità di un equilibrio Borghese o piuttosto di un equilibrio Rousseauviano? Se un gruppo si trova in equilibrio Rousseauviano, quanto ci vorrà prima che eventi casuali introducano abbastanza Condivisori nella popolazione, in modo da renderla vulnerabile alla predominanza di un Usurpatore o di un Borghese? Allo stesso modo, quanto ci vorrà in media prima che una popolazione in equilibrio Borghese si sposti verso il bacino di attrazione dell’equilibrio Rousseauviano? Perché, come penso sia in effetti successo nei primi anni della nostra specie, l’equilibrio Rousseauviano prevalse per un lungo periodo, fino ad essere sostituito quasi ovunque da un equilibrio Borghese? Sappiamo che se i diritti di proprietà sono in qualche modo ambigui, l’equilibrio Rousseauviano consente payoff medi più alti, ma è più suscettibile a spostamenti dovuti ad eventi fortuiti (trascinamenti) dell’equilibrio rispetto al meno efficiente ma più robusto (perché asintoticamente stabile) equilibrio Borghese. Se i gruppi interagiscono, e i gruppi più potenti sostituiscono i gruppi più deboli, in che modo il processo di selezione al livello del gruppo condiziona la distribuzione dei comportamenti nella popolazione? I vantaggi in termini di payoff dell’equilibrio Rousseauviano risulteranno in sufficienti vittorie dei gruppi Rousseauviani sui gruppi Usurpatori-Condivisori, così che i vantaggi in termini di robustezza dell’equilibrio Usurpatore-Condivisore saranno
30 | MICROECONOMIA
più che compensati, e i gruppi Rousseauviani potranno predominare? In che modo la migrazione tra i gruppi condizionerà il risultato? E il perfezionamento dei diritti di proprietà basati sul possesso associato all’affermazione dell’agricoltura, alla fine, distruggerà le comunità Rousseauviane? La complessità matematica del modello è portata all’estremo soprattutto dal fatto che sono all’opera sia eventi stocastici che processi di selezione tra i gruppi e all’interno del gruppo. Nel prossimo capitolo, svilupperò il concetto di uno stato stocasticamente stazionario, per studiare i processi evolutivi sotto l’influenza di variazioni stocastiche nel comportamento. Nel capitolo 13, presenterò un utile strumento analitico – l’equazione di Price (dal nome del biologo teorico Gorge Price; niente a che fare con i prezzi) – per studiare il processo di selezione multi-livello. Ma nessuno di questi strumenti analitici è del tutto adeguato. L’unico modo pratico di rispondere alle suddette domande è di simulare una società artificiale, con caratteristiche che si avvicinano ai gruppi e alle ecologie degli albori della storia umana. La simulazione fornisce dei suggerimenti su processi evolutivi, che sono talmente complicati, che i modelli matematici non conducono a soluzioni analitiche illuminanti (o nella maggior parte dei casi, non conducono a nessuna soluzione). I due obiettivi principali della simulazione sono vedere se qualcosa di simile all’equilibrio Rousseauviano avrebbe potuto persistere per molti millenni prima di 11000 anni fa, ed esplorare gli effetti dell’aumento della certezza della proprietà in questo ordine sociale. Per perseguire il primo obiettivo, studierò una popolazione di Condivisori, Usurpatori e Punitori e successivamente introdurrò l’alternativa Borghese. La nostra società artificiale è composta di individui – Condivisori, Usurpatori e Punitori – che vivono in gruppi12 (I Borghesi saranno introdotti successivamente). Tra i gruppi, gli individui interagiscono seguendo il gioco precedentemente descritto (con piccole modifiche che vanno descritte); e interagiscono anche con i membri degli altri gruppi, quando i gruppi arrivano al conflitto sulle risorse o per qualche altra ragione. L’interazione è la seguente. Durante ogni periodo (una generazione), ognuno dei 20 membri di un gruppo è accoppiato a caso con un altro membro per giocare il gioco Usurpatore-Condivisore-Punitore. Ogni membro gioca il gioco (ogni volta con un partner diverso) un certo numero di volte in una generazione (nella maggior parte delle simulazioni, cinque). Se un Punitore e un Usurpatore si incontrano, la probabilità di 12
Le simulazioni sono state effettuate da Bowles e Jung-Kyoo Choi (2002). Il codice è disponibile presso http://www.santafe.edu/bowles (nella sezione “artificial histories”).
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|31
vittoria del Punitore dipende da n , il numero dei Punitori nel gruppo (chi si associa nel punire l’usurpatore) e dal numero degli usurpatori, u , con la probabilità di vittoria dei Punitori pari a n /(n + u) dove [0,1/2] è il vantaggio che il singolo Usurpatore ha nel resistere alla punizione collettiva (si noti che se = 0 , un solo Punitore che combatte con un singolo Usurpatore avrebbe una possibilità di vittoria uniforme. Questa e altre piccole modifiche del modello teorico sono state introdotte perché qualcuna delle assunzioni adottate per mantenere il modello teorico analiticamente trattabile sono irrealistiche. Assunzioni più plausibili sono introdotte facilmente nel modello di simulazione). Come nel caso precedente, se i Punitori vincono, si dividono il premio, v . Il modello ad agenti può consentire una descrizione molto più dettagliata del processo di trasmissione culturale: Assumiamo che i membri del gruppo vivano per sempre, ma che di tanto in tanto affrontino un periodo (lo si chiami adolescenza) durante il quale possono adottare dei comportamenti nuovi. Una volta per ogni generazione – dopo che tutti i giochi sono stati giocati – ogni membro è accoppiato ad un modello culturale, per esempio un insegnate, un capo religioso, o un concorrente. Questo processo di accoppiamento riflette il modo in cui il gruppo socializza i suoi membri. Se il modello e il membro sono dello stesso tipo, il membro semplicemente mantiene i suoi tratti. Se questi hanno tratti diversi, allora il membro confronta il suo payoff totale di questo periodo con il payoff del modello, e assume il tratto del modello se il payoff del modello è più alto. La regola di accoppiamento introdurrà il conformismo nel processo di trasmissione, se ogni membro dei gruppi più numerosi ha più probabilità di altri di essere trascinato da un modello culturale. Per permettere ciò, fissiamo la probabilità che un Condivisore sia trascinato da un modello culturale come + +
dove > 0 è una misura della trasmissione culturale distorta (biased). La probabilità che un Usurpatore o un Punitore sia trascinato per l’insieme del modello culturale è calcolata in modo simile. Come si può vedere dalla figura 11.5, per >1, l’influenza è conformista con i gruppi più ampi che contribuiscono più che proporzionalmente all’insieme dei modelli culturali. Per =1 l’accoppiamento dei membri e dei modelli culturali è casuale (per 0 .) 11
00
00
Le proprietà del sistema dinamico sono significativamente alterate quando le giocate idiosincratiche sono modellate come azioni collettive intenzionali. Si noti che se (a a ) a < 0 , l’azione collettiva non avverrà (indipendentemente dal numero 11
00
00
di potenziali innovatori casualmente estratti), e quindi la convenzione {0,0} , che è sfavorevole agli A, sarà uno stato assorbente. Quindi un sistema dinamico di azione collettiva con questo tipo di giocata di risposta idiosincratica è non ergodico, e lock-in istituzionali sono possibili, con le condizioni iniziali che determinano quale delle due convenzioni emergerà e quindi persisterà per sempre. Per vedere che questo può succedere per un valore finito del parametro “piacere di agire” , si consideri una convenzione iniqua con a a ; Quando diviene arbitrariamente piccolo dovrà accadere che (a a ) a < 0 , e quindi l’azione collettiva degli A non sarà intrapresa, e si concretizzerà e persisterà per sempre. Allora, deve esistere un 11
11
14
00
00
00
La scelta di è convenzionale ma arbitraria; gli individui potrebbero avere convinzioni precedenti della frazione che è probabile che partecipi basate su situazioni simili precedenti e cose simili. Allora, se gli individui applicano il loro ragionamento per ciascuno degli altri (ciascuno, supponendo che metà partecipino, parteciperà), predirà correttamente che s =1 . Mentre questo secondo turno di ragionamento può determinare se l’individuo si aspetta che l’azione collettiva abbia successo nel sostituire la convenzione, questa convinzione sulla possibilità del successo non è rilevante per il comportamento dell’individuo, visto che i payoffs relativi di partecipare o no sono indipendenti dal successo dell’azione.
30 | MICROECONOMIA
insieme di convenzioni meno egualitarie e non più efficienti di assorbenti.
che sono stati
Figura 12.9. La selezione di equilibri dovuta al caso e all’azione collettiva.
La figura 12.9. riproduce lo spazio dei contratti per il contratto Alternativo nel caso in cui = 2 (dove è il Benchmark, e e sono i luoghi dei contratti alternativi nei quali la stabilità stocastica è uguale al Benchmark). Contratti Alternativi molto efficienti o molto egualitari sono assorbenti poiché essi o sono Pareto superiori al Benchmark (vedi figura 12.3) o forniscono a quelli che preferirebbero i payoff del Benchmark benefici sufficienti da precludere loro di intraprendere l’azione collettiva. Si può vedere che può essere assorbente anche se non sarebbe stato stocasticamente stabile nel modello evolutivo stocastico convenzionale. Per la regione nella quale nessuno dei due contratti è assorbente, si applica il comportamento medio di lungo periodo indicato nelle figure 12.6 e 12.7. Come devono essere interpretati gli stati assorbenti? Su ampie scale temporali, i parametri del modello possono spostarsi a causa di cambiamenti culturali e politici che influenzano o cambiamenti tecnici o di altro tipo che influenzano i payoffs dei contratti rilevanti. Supponiamo che certi contratti Alternativi iniqui definiscano la convenzione in essere , ed essa rappresenti uno stato assorbente. Se il
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 1
cambiamento tecnico rendesse il contratto progressivamente più efficiente in confronto a , allora (a a ) potrebbe alla fine superare . Di conseguenza, si otterrebbero le condizioni per l’azione collettiva, e ad un certo punto avverrebbe a . Le transizioni inverse diventerebbero nel tempo più una transizione da improbabili poiché l’aumento di aumenta il minimo numero dei B che giocano la 11
00
risposta idiosincratica richiesta per sciogliere . Allora, le domande istituzionali di nuova tecnologia possono spiegare l’emergere di nuove convenzioni contrattuali. Un cambiamento culturale che aumenta il “piacere di agire” un ruolo giocato per esempio dalla teologia della liberazione in alcune parti dell’America Latina e dalla diffusione dell’ideologia democratica in Sud Africa e nei paesi ex-comunisti – avrebbe lo stesso effetto. Questa è a grandi linee la spiegazione di Marx (nell’epigrafe del capitolo 11), che presenta la storia come una successione progressiva dei “mezzi di produzione”, ciascuno dei quali contribuisce allo “sviluppo delle forze produttive” per un periodo, poi comincia a “incatenarsi” a futuri avanzamenti tecnologici ed è rimpiazzato attraverso l’azione collettiva della classe che trarrebbe beneficio dal lo spostamento verso una nuova convenzione più adatta alle nuove tecnologie.
C O N C L U S IO N E : L’E C O L O G IA I S T I T U Z I O N A L E
D E L L ’I N E G U A G L IA N Z A
L’integrazione di caso e azione collettiva sviluppata qui è lontana dal matrimonio prima proposto tra Darwin e Marx. Scrivendo a Engels nel 1860, Marx vedeva il parallelismo tra Le origini della specie e la loro analisi dell’evoluzione umana all’interno del materialismo storico: “Per quanto sia scritto nel crudo stile inglese, questo è il libro che contiene le basi della storia naturale vista nella nostra ottica”. (Padover 1979:139). Quattordici anni dopo accanto alla tomba di Marx, Engels avrebbe detto: “Così come Darwin ha scoperto la legge dello sviluppo della natura organica, Marx ha scoperto la legge dello sviluppo della storia umana” (Tucker 1978:681). La teoria dei giochi evolutivi stocastici ha recentemente reso disponibili alcuni strumenti analitici potenti di derivazione Darwiniana, fornendo un quadro illuminante per lo studio del cambiamento istituzionale e degli “universali evolutivi”. Un contributo di particolare importanza è consistito nel mostrare che il raggrupparsi di giocate di risposta idiosincratica lavora come un congegno per la selezione degli equilibri e allora offre un meccanismo causale – che manca agli approcci parsoniano e neo-istituzionalista – che incide sul successo evolutivo delle istituzioni efficienti e egualitarie.
32 | MICROECONOMIA
Il fatto di tenere in considerazione le differenze nell’ampiezza dei gruppi e la natura intenzionale dell’azione collettiva, suggerisce comunque che il modello teorico dei giochi evolutivi stocastici standard può aver bisogno di ulteriori sviluppi per essere rilevante nella comprensione dell’evoluzione storica delle istituzioni. Le estensioni che ho introdotto sono quattro. Primo, la giocata di risposta idiosincratica è intenzionale invece che accidentale. Secondo, il tasso al quale avvengono le risposte idiosincrtiche è significativo (invece che essere infinitamente piccolo). Terzo, la giocata di risposta idiosincratica prende la forma dell’azione collettiva invece di comportamenti individuali non correlati e deviati. Quarto, i sottogruppi della popolazione hanno dimensioni diverse, dove quello più numeroso è quello con un benessere inferiore. Ho suggerito tre ragioni perché le istituzioni durevoli possono non essere né efficienti né egualitarie. Primo, indipendentemente dalla dimensione del gruppo, moderati livelli di disuguaglianza possono dissuadere dall’azione collettiva gli individui con benessere inferiore poiché il grado di disuguaglianza non è sufficiente a motivare la partecipazione. Quindi, le convenzioni inique possono persistere indefinitamente. Secondo, indipendentemente dal problema delle motivazioni dell’azione collettiva, il sistema spenderà la maggior parte del tempo nelle convenzioni con distribuzioni inique poiché i B, che preferiscono questa convenzione, sono in numero relativamente minore, cosicché la probabilità che un’estrazione casuale ottenga un numero di B sufficiente a sostituire la convenzione che essi non preferiscono, è più grande di quella necessaria agli A. Questo vantaggio dei piccoli numeri non è collegato al ragionamento convenzionale proposto da Olson (1965) e da altri e cioè che l’azione collettiva in gruppi ampi è difficile da sostenere. Terzo, convenzioni egualitarie sono inaccessibili da convenzioni Alternative altamente inique poiché il numero degli A che giocano una risposta idiosincratica richiesto per indurre i B a cambiare contratto è più grande, più iniqua è l’Alternativa. La conclusione è che la disuguaglianza sociale può essere sostenuta da convenzioni inique e inefficienti per lunghi periodi poiché livelli moderati di ineguaglianza possono essere insufficienti a motivare l’azione collettiva di ognuno dei poveri, mentre convenzioni caratterizzate da livelli estremamente alti di ineguaglianza possono essere sostituiti soltanto attraverso azioni collettive appoggiate da frazioni molto ampie di poveri. Un problema della struttura dei giochi evolutivi stocastici è che si applica soltanto al lunghissimo periodo. Per processi di aggiornamento ragionevoli, dimensione dei gruppi, e tassi di giocate idiosincratiche, i tempi di attesa medi per una transizione da un bacino di attrazione ad un altro sono particolarmente lunghi, certamente sorpassano gli intervalli di tempo storicamente rilevanti, e in alcuni casi
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 3
non irrealistici eccedono il tempo trascorso dal raggiungimento dell’evoluzione anatomica dell’uomo moderno. La figura 12.10 mostra il numero atteso di periodi prima che vi sia una transizione da un contratto alternativo iniquo al benchmark quando quest’ultimo è uno stato stocasticamente stabile per il caso = 0.1 . La dinamica assunta è il caso degenerato di azione collettiva (ogni volta che c’è un numero di A convocati all’assemblea maggiore di quello critico, essi rifiutano il contratto convenzionale e quindi la transizione si verifica). Si noti che, come ci si potrebbe aspettare, più grande è il numero degli A più lungo è il tempo di attesa. Inoltre, quando l’Alternativa (iniqua) è efficiente quanto il Benchmark (la barra destra), essa è molto persistente anche quando ci sono solo 12 degli A. Se vi sono 32 A, la convenzione iniqua che è efficiente soltanto la metà dello stato stocasticamente stabile ha una persistenza attesa di un milione di periodi.
Figura 12.10. Aspettative dei tempi d’attesa per una transizione dalla convenzione Alternativa alla Benchmark quando il Benchmark è uno stato stocasticamente stabile. Le barre di sinistra sono per un’Alternativa con = 0,3 e =1 , mentre le quelle di destra sono per = 0,3 e =1 .
Mentre il processo biologico sottostante la dinamica a cui si riferisce l’epigrafe di questo capitolo di Sewall Wright può funzionare su centinaia di migliaia di generazioni, un approccio analogo nelle scienze sociali deve essere rilevante su scale temporali molto più brevi. Se il “periodo” fosse molto breve – diciamo un giorno – il lungo periodo di attesa nella figura sarebbe poco preoccupante, ma il periodo
34 | MICROECONOMIA
appropriato qui è un’opportunità per l’azione collettiva di cambiare una convenzione, e per questo, un anno o una decade sembrano essere più appropriate. Inoltre, molti gruppi umani sono più grandi di quelli indicati nella figura, e quindi i periodi d’attesa saranno in relazione più lunghi. La conclusione è che le condizioni iniziali persistono per periodi molto lunghi anche se la convenzione in essere è altamente iniqua e inefficiente in confronto ad una convenzione alternativa. Questo significa che il risultato che la popolazione spenderà “la maggior parte del tempo” nell’alternativa più efficiente e più egualitaria è irrilevante per l’evoluzione storica reale? Non penso sia così. Un numero di plausibili modifiche nel processo di aggiornamento può accelerare clamorosamente il processo dinamico, producendo transizioni su scale temporali storiche rilevanti. Tra queste modifiche ci sono le seguenti. Primo, molte popolazioni (nazioni, unità linguistiche, etc.) sono composte da piccoli gruppi che interagiscono frequentemente tra loro. L’appartenenza a piccoli gruppi aumenta l’importanza relativa di eventi casuali improbabili e quindi la possibilità che le giocate di risposta idiosincratica (idiosyncratic non-best response) portino a transizioni tra convenzioni a livello di gruppo e quindi in tempi più brevi. Poiché le transizioni verso gli stati stocasticamente stabili sono di solito sostenute per lunghi periodi, è possibile che l’intera popolazione transiti verso lo stato stocasticamente stabile (tutti i gruppi alla fine effettuano il cambiamento in un periodo relativamente breve). Le migrazioni o le emulazioni tra i gruppi possono indurre anche tempi di transizione più rapidi per la popolazione nel suo insieme. Hobsbawm e Rude (1968) hanno descritto l’espansione della distruzione luddista delle macchine tra la fine del XVIII e l’inizio del XIX secolo in Inghilterra come un processo di propagazione in piccoli gruppi e di contagio tra gruppi adiacenti. Poiché i gruppi sono di dimensioni abbastanza variabili, il processo può essere considerevolmente accelerato poiché i tempi di transizione dipendono non solo dalla dimensione media del gruppo ma anche da quella del gruppo più piccolo. Secondo, eventi casuali influenzano le strutture dei payoff così come i comportamenti dei membri della popolazione. Si ricordi che nella figura 12.2 la posizione dell’equilibrio instabile interno (la sella z) e il confine tra i due bacini di attrazione sono determinati dalla matrice dei payoff (equazione 12.1). Variazioni degli effetti ambientali sui payoff sposteranno allora il confine tra i due bacini di attrazione, riducendo a volte estremamente il bacino di attrazione della convenzione in essere. Questi effetti insieme alle giocate di risposta non ottima (sia stocastica che intenzionale) accelereranno il processo di transizione. Terzo, ci sono generalmente molte più di due convenzioni realizzabili, e alcune
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 5
di queste possono essere adiacenti (cioè, le resistenze ridotte tra queste convenzioni sono piccole). Sewall Wright (1935:263), introducendo il passaggio dell’epigrafe, ha osservato che su un fitness landscape, “c’è in generale un numero molto grande di picchi separati da ‘selle’ ombrose”. Una popolazione può velocemente attraversare una larga porzione di spazio degli stati grazie ad una serie di transizioni tra convenzioni adiacenti. Quarto, il conformismo riduce l’ammontare aggregato di giocate idiosincratiche. Ma esso aumenta anche i comportamenti devianti positivamente correlati – per ciascun membro della popolazione la probabilità dell’adozione di una risposta idiosincratica è tanto più elevata quanto più altri stanno facendo lo stesso. Questo produce un raggruppamento più grande di giocate idiosincratiche e quindi, sotto condizioni plausibili, accelera il processo di transizione. Quinto, rendere il processo nel quale avviene l’azione collettiva più realistico può drasticamente ridurre i tempi di attesa per una transizione. Si supponga che una volta “convocati”, gli individui rimangano attivi nel periodo seguente e in quelli successivi finché non sono “disattivati”, e che questo succeda con una certa probabilità in ciascun periodo. Come i rivoluzionari clandestini, questi innovatori latenti continuano “a presenziare l’assemblea” ma non si impegnano nell’azione collettiva a meno che non siano in numero sufficiente per rovesciare la convenzione in essere. Finché questo non avviene essi guadagnano gli stessi payoff degli altri membri della loro sotto-popolazione. Visto che non accusano nessuna riduzione nei payoff finché rimangono latenti, il loro numero può accrescere di periodo in periodo attraverso un processo di accumulazione (drift-like process), capace quindi di abbreviare significativamente il tempo di attesa finché coloro che “presenziano l’assemblea” non superano il valore critico.15 Noi non sappiamo, ovviamente, se le modifiche della dinamica modellate nel contesto di questo capitolo possano fornire una plausibile spiegazione dei processi di cambiamento istituzionale osservati storicamente. Questa è una questione empirica che deve ancora essere esplorata sistematicamente. Per gettare luce su cambiamenti istituzionali tali come la fine dell’apartheid, del Comunismo, o dell’infibulazione in 15
Questo processo è analogo al ruolo delle mutazioni neutrali per l’emergere di caratteristiche complesse nell’evoluzione biologica: mutazioni singole potrebbero non avere effetti fenotipici e quindi i loro portatori non soffrono alcuna pressione di selezione avversa e potrebbero allora proliferare in una popolazione. Comunque l’effetto non additivo di accumulazione di molte mutazioni diverse che singolarmente sono neutrali potrebbero incidere sull’emergere di caratteristiche nuove e complesse. (si veda Stadler, Stadler, Wagner e Fontana (2001), e Rimura (1968).) Timur Kuran (1995) ha analizzato il ruolo delle “preferenze falsificate” in un simile contesto: coloro con l’intenzione di deviare non devono esprimere il loro vero obiettivo poiché facendolo sarebbero svantaggiati.
36 | MICROECONOMIA
Senegal; o la riduzione delle quote di raccolto dei latifondisti in Bengala Occidentale (descritta nel Prologo), sono richieste senza dubbio modifiche addizionali al modello. Tra queste andrebbe modellato il ruolo della leadership e della organizzazione nel coordinamento di giocate di risposta idiosincratica, e il modo in cui la repressione governativa o le riforme alterano le matrici dei payoff e le convinzioni degli agenti. Inoltre, chiaramente le istituzioni si differenziano in modi che non sono catturati dall’efficienza, dalle quote distributive e dalla dimensione dei gruppi. Certe istituzioni possono facilitare l’azione collettiva degli svantaggiati, mentre altre rendono più difficile il coordinamento. In molte situazioni la dimensione effettiva della sotto-popolazione può essere ridotta significativamente se è composta da piccoli gruppi (famiglie, sindacati locali, persone giuridiche) che quasi sempre agiscono all’unisono. Marx, e molti dopo di lui, hanno creduto che le condizioni sociali del capitalismo industriale costituissero una palestra per la rivoluzione, al contrario di precedenti istituzioni come, per esempio, la mezzadria, l’appalto dell’esazione delle imposte in società di contadini indipendenti, e la schiavitù. Barrington Moore (1966) e altri, con forse maggior accuratezza, hanno visto i rapporti clientelari delle società agrarie e i sistemi altamente iniqui di latifondo come esempi particolarmente vulnerabili al rovesciamento rivoluzionario. Invece di proseguire su queste estensioni del modello che descrive i processi di cambiamento istituzionale all’interno di un gruppo, nel prossimo capitolo ci occuperemo del modo in cui le interazioni tra i gruppi possono indurre l’evoluzione istituzionale. Al contrario dei modelli che analizzano le dinamiche all’interno del gruppo, l’approccio della selezione a più livelli, che combina le dinamiche all’interno e tra i gruppi, offre previsioni piuttosto forti sul successo evolutivo delle istituzioni che sono sia egualitarie che efficienti. Le ragioni per questo risultato, come vedremo, sono significativamente diverse da quelle avanzate per simili conclusioni dall’approccio ibrido darwiniano-marxiano o dalla teoria dei giochi evolutivi stocastici.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 7
Riferimenti bibliografici
Axelrod, R. and W. D. Hamilton (1981). "The Evolution of Cooperation." Science 211: 1390-1396. Bergin, J. and B. L. Lipman (1996). "Evolution With State-Dependent Mutations." Econometrica 64(4): 943-956. Boehm, C. (1993). "Egalitarian Behavior and Reverse Dominance Hierarchy." Current Anthropology 34(3): 227-254. Cortes, H., translated and edited by Anthony Pagden (1986). Letters From Mexico. New Haven, Yale University Press. Greenberg, J. B. (1989). Blood Ties: Life and Violence in Rural Mexico. Tucson, The University of Arizona Press. Hayek, F. A. (1988). The Fatal Conceit: The Errors of Socialism. Chicago, University of Chicago Press. Hobsbawm, E. and G. Rude (1968). Captain Swing. New York, Pantheon. Kimura, M. (1968). "Evolutionary Rate at the Molecular Level." Nature 217: 624-626. Knauft, B. M. (1991). "Violence and Sociality in Human Evolution." Current Anthropology 32(4): 391-428. Kuran, T. (1995). Private Truths, Public Lies: the Social Consequences of Preference Falsification. Cambridge, Harvard University Press. Marx, K. (1963). The Eighteenth Brumaire of Louis Bonaparte. New York, International Publishers (original publication date, 1852). Moore, B. J. (1966). Social Origins of Dictatorship and Democracy; Lord and Peasant in the Making of the Modern World. Boston, Beacon Press. Moore, B. J. (1978). Injustice: The Social Bases of Obedience and Revolt. White Plains, M. E. Sharpe. Olson, M. (1965). The Logic of Collective Action: Public Goods and the Theory of Groups. Cambridge, MA, Harvard University Press. Paddock, J. (1975). "Studies on Anti-Violent and 'Normal' Communities." Aggressive Behavior 1: 217233. Paddock, J. (1991). "Violence and Sociality in Human Evolution." Current Anthropology 32(4): 391428. Padover, S. K., transl., Ed. (1979). The Letters of Karl Marx. Englewood Cliffs, Prentice-Hall. Parsons, T. (1964). "Evolutionary Universals in Society." American Sociological Review 29(3): 339357. Smith, J. M. and G. R. Price (1973). "The Logic of Animal Conflict." Nature 246: 15-18. Stadler, B. M. R., W. Fontana, et al. (2001). "The Topology of the Possible: Formal Spaces Underlying Patterns of Evolutionary Change." Journal of Theoretical Biology 213: 241-274. Tucker, R. C. (1978). The Marx-Engels Reader. New York, W. W. Norton and Company. van Damme, E. and J. W. Weibull (2001). "Evoution in games with endogenous mistake probabilities." Journal of Economic theory 106(2): 296-315. Wright, S. (1935). "Evolution in Populations in Approximate Equilibrium." Journal of Genetics 30: 257-266. Young, H. P. (1998). Individual Strategy and Social Structure: An Evolutionary Theory of Institutions. Princeton, NJ, Princeton University Press.
XIII L A C OEVOLUZIONE DI I STITUZIONI E P REFERENZE
Gli Americani sono soliti spiegare gran parte delle azioni della loro vita con il principio dell’interesse personale, compreso nel modo giusto;…..A riguardo penso che essi continuamente si contraddicano; negli Stati Uniti così come altrove, le persone dimostrano impulsi disinteressati e spontanei che sono naturali al genere umano; ma gli Americani raramente ammettono di provare emozioni di tal tipo. Alexis de Tocqueville, Democracy in America (1830)
Sia che la lotta tra gruppi prenda la forma di una guerra o quella di una più intensa competizione per l’offerta di commercio e di cibo, il gruppo in cui la competizione interna non controllata ha prodotto un ampio proletariato senza alcun interesse concreto nello Stato, sarà il primo a collassare. Karl Pearson, Socialism and Natural Selection (1894)
Quando quattro giovani facinorosi, in una pizzeria aperta durante la notte nella città italiana di Rimini, iniziarono a gettare cibo e ad insultare il fornaio, un uomo senegalese di nome Sarr Gaye Diouf intervenne per difenderlo (Meletti 2001). Uno dei teppisti afferrò Diouf per le braccia e gli altri tre lo pugnalarono una quindicina di volte con i coltelli per la pizza. Diouf morì immediatamente e i colpevoli vennero arrestati. Diouf lavorava temporaneamente come uomo delle consegne, sperando di diventare presto un tassista. Egli non conosceva il fornaio se non come cliente occasionale e i suoi aggressori, in visita a Rimini da Napoli, non avevano mai visto Diouf prima. Eppure Diouf diede la sua vita per difendere il fornaio e i giovani malviventi uccisero lo straniero – Diouf – per nulla scoraggiati dalla certezza dell'arresto. Una tale tragedia evoca orrore, ma non sorpresa. Di continuo si assiste a persone sacrificarsi per degli sconosciuti, né é raro vedere persone ucciderne altre, anche per piccole provocazioni, specialmente quando l'obiettivo é un “outsider”. Questi due aspetti
2 | MICROECONOMIA
del comportamento umano sono pensati, genericamente, come antitetici, ma come vedremo, possono avere un'origine comune: la competizione tra gruppi può avere favorito quelle nazioni, tribù, bande ed altri gruppi che hanno promosso preferenze altruistiche nei confronti di alcuni stranieri e ostilità nei confronti di altri. Un altro esempio empirico – la coevoluzione di cittadinanza moderna e guerra – può suggerire alcuni dei processi sottostanti.
Figura 13.1. Citta’ autonome nel Sud della Germania (Fonte: T.A. Brady (1985),p. xvi)
Otto secoli fa, l'area intorno a Rimini, dove Diouf è stato ucciso, era governata da piú di una dozzina di corpi sovrani. Nell'attuale Italia vi erano dalle due alle trecento città-stato diverse. Nella Germania del Sud, mezzo millennio fa, vi erano sessantanove città libere, oltre a numerosi episcopati, principati, ducati ed altre entità simili allo Stato (Brady 1985). Le figure 13.1 e 13.2 illustrano questa proliferazione di sovranità nel quindicesimo secolo. L'intera Europa, a quel tempo, era governata all'incirca da cinquecento corpi sovrani. Ma con la Prima Guerra Mondiale, rimasero poco più di una trentina di Stati. Questa riduzione degli Stati non solo abbassò il numero dei corpi sovrani, ma ridusse anche l'eterogeneità delle forme di governo. Emerse una singolare forma politica – lo Stato nazionale – dove una volta regnavano, secondo Charles Tilly (1990:5), “imperi, città-stato, federazioni di città, gruppi di proprietari, ordini religiosi, leghe di pirati, bande guerriere e molte altre forme di governo”. A differenza delle varie forme di governo concorrenti che esso ha cancellato, lo Stato nazione esibiva una struttura burocratica centralizzata e manteneva l'ordine su un territorio definito, con la capacità di incrementare sostanzialmente il reddito attraverso la tassazione e di spiegare
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|3
forze armate permanenti1.
Figura 13.2. Entità politiche nel quindicesimo secolo in Italia. La grande maggioranza delle entità sovrane più piccole (come San Gimignano) non sono mostrate; da notare le molte entità, una volta autonome (come Verona, Bergamo, Padova, Vicenza) tutte assorbite da Venezia agli inizi del secolo. Fonte: Matthew (1992:212).
Cosa spiega il successo di questa nuova forma di organizzazione della società? Una semplice risposta é che quando gli Stati-nazione erano in guerra con le altre forme di governo, essi tendevano a vincere. Ma Tilly scrive: “Nessun monarca poteva condurre una guerra senza assicurasi prima l'acquiescenza di tutta la popolazione e la cooperazione attiva di alcuni notabili” (Tilly 1990:75). Un sistema di tassazione pagato in moneta, insieme con la capacità di prendere a prestito somme elevate di denaro, permise agli Stati-nazione di condurre guerre senza dover ricorrere a misure impopolari, come la confisca diretta di cibo, armi e animali. Inoltre, l'introduzione di diritti di proprietà ben definiti e dei mercati facilitava questa tassazione – e l'approccio, basato sul debito, alla mobilizzazione delle risorse necessarie a vincere la guerra. L'istituzione dei mercati 1
In aggiunta a Tilly (1990), sono state utilizzate anche le seguenti referenze: Gellner (1983), Bright e Harding (1984), Tilly (1975), Mack Smith (1959), Anderson (1974). Wallerstein (1974), e Bowles e Gintis (1984).
4 | MICROECONOMIA
favoriva, invece, la formazione dello Stato in un modo meno ovvio, introducendo l'osservanza alla legge. Tilly continua nel suo commento: Coloro che partecipavano ai mercati contribuivano significativamente alla necessaria sorveglianza registrando prezzi e cessioni. I cittadini propriamente civilizzati, inoltre, finirono per attribuire valore morale al pagamento delle tasse; essi si controllavano a vicenda, accusando gli evasori delle tasse di free-riding.
Gli stati europei esibivano una particolare struttura spaziale con entità politiche grandi ma difficilmente controllabili nelle zone periferiche (per esempio, la Russia e l'Impero Ottomano), con raggruppamenti di cittá-stato e di federazioni (le cittá-stato italiane ed i cantoni svizzeri), e Stati più centralizzati, alla fine vittoriosi, come la Francia e il Brandeburgo, una via di mezzo tra i due. Gli stati-nazione di successo assimilavano i popoli che assoggettavano e con il tempo promuovevano e, a volte, imponevano un processo di integrazione delle nuove generazioni attraverso l'istruzione scolastica2. A causa del loro successo, forme politiche simili agli stati nazionali furono esportate si svilupparono in tutto il mondo, soppiantando forme di organizzazione differenti. Con lo stato-nazione e con l’emergere dell'economia capitalistica, la popolazione Europea crebbe notevolmente – si moltiplicò di quindici volte in Gran Bretagna nei quattro secoli successivi al 1500 - superando largamente i tassi di crescita della popolazione in tutto il mondo (eccetto, forse, per il diciottesimo secolo in Cina). Come risultato, la diffusione globale dello stato-nazione venne promossa non solo dalla competizione tra stati della periferia europea, ma anche dalla massiccia emigrazione di persone che non solo esportarono i tratti culturali europei, ma anche le capacità militari che favorirono la costruzione dello Stato in Europa. In breve, lo Stato nazionale si sviluppò perché sconfisse con le guerre differenti forme di organizzazione politica. L'abilità di vincere le guerre dipendeva dalla capacità di mobilizzare soldati e le altre risorse militari. Tale capacità dipendeva dall’ampiezza degli scambi commerciali, dalla disponibilità del credito, dall'osservanza della normativa fiscale e dalla volontà di servire il sovrano in guerra. Queste caratteristiche erano rafforzate dalla diffusione delle norme riguardanti i comportamenti individuali, che, anche se all'inizio non vantaggiose per i singoli individui, contribuivano al successo del gruppo. Tra le ragioni vi erano la volontaria osservanza della normativa fiscale, la volontà di incorrere in 2
Weber (1976) descrive l'assimilazione di popolazioni distinte dallo Stato della Francia. Gellner (1983) sviluppa la connessione tra la nascita del commercio, lo Stato nazionale e il sorgere di ciò che ha chiamato “exo-education”, ovvero, la socializzazione dell'infanzia portata avanti da specialisti che non siano membri della famiglia o parenti stretti del bambino.
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|5
rischi durante una guerra per il sovrano o per la nazione, ed il rispetto dei diritti di proprietà. La norma della monogamia può aver giocato un ruolo simile anche se meno ovvio nel salvaguardare la cooperazione popolare alla realizzazione dei progetti della elite3. Ognuna di queste norme contribuisce, direttamente o indirettamente, alla capacità di uno Stato di fare guerra ma richiede a coloro che rispettano le norme di rinunciare a possibili guadagni e di tollerare eventuali perdite (incluso il minore successo riproduttivo). Ovviamente, gli Stati nazionali crearono anche un ambiente legale e culturale in cui coloro che aderivano alle norme avrebbero potuto migliorare le loro capacità di fare guerra soffrendo una perdita piccola o nulla rispetto coloro che non aderivano a queste norme. Ma l'emergenza e la diffusione rapida degli Stati nazionali si é tipicamente basata sulle norme vantaggiose per il gruppo e costose per il singolo individuo. Altri casi empirici e ben documentati di conflitti ed assimilazioni tra gruppi sono quelli della conquista della Dinka ad opera di Nuer (Kelly 1985) ed il processo dell'evoluzione culturale nella Nuova Guinea (Soltis, Boyd, e Richerson 1995). Un altro esempio é dato dall’ampia diffusione dell'Islam nel secolo seguente la morte di Maometto – nel 750 esso si estendeva su un'ampia zona che andava dal fiume Indo ad est sino al fiume Duro, in Spagna, ad ovest. Ciò fu possibile (secondo Levy 1957:3) perchè la fede in Allah forniva “un legame ben più forte, anche se più sottile di quello di una semplice somiglianza culturale” e facilitava un sistema inclusivo di tasse, arruolamento militare ed alleanza”4. Quindi, il processo del conflitto di gruppo, seguito dall'assimilazione culturale o dall'estinzione fisica, sembra essere un fenomeno molto generale. In questo capitolo, esploreremo il ruolo della competizione tra gruppi nell'evoluzione delle norme altruistiche, e analizzeremo perché alcuni individui sono disposti a rischiare la propria vita per difendere uno sconosciuto assalito da giovani criminali, o ad andare in guerra per la gloria della nazione. 3
4
Herlihy e Klapische-Zuber (1985-157) scrive: “La grande conquista sociale del primo Medioevo fu l'imposizione delle stesse regole di condotta sessuale e domestica sia per i ricchi che per i poveri.” Si veda anche MacDonald (1995). Mentre riduceva i vantaggi delle persone di potere e di successo, la norma della monogamia (così come la successiva estensione del suffragio ai lavoratori) può essere stata strumentale, come Alexander (1979) ed altri suggeriscono, nel permettere ai potenti di reclutare gli altri nei loro progetti, incluso quello della guerra. Un altro caso ben documentato di selezione di gruppo spiega la pratica della condivisione dell'Ilama tra individui non legati da rapporti di parentela nell'altopiano peruviano (Flannery, Marcus e Reynold 1989 e Weinstein, Shugart e Brandt 1983).
6 | MICROECONOMIA
A LT R U IS M O
R E C IP R O C O E R E C IP R O C ITA ’ F O RT E
I modelli nel capitolo 7 hanno mostrato come le strutture delle interazioni sociali possano rendere comportamenti cooperativi come le strategie “occhio per occhio benevolo” (“nice tit-for-tat”) una miglior risposta reciproca, anche quando gli individui posseggono le convenzionali preferenze egoistiche sui risultati delle loro azioni. La cooperazione convenzionale é una forma di ciò che il biologo R. Trivers (1971) ha chiamato altruismo reciproco, ovvero, azioni che conferiscono un beneficio agli altri attraverso un costo a se stessi nei casi in cui ci si aspetta un beneficio successivo reciproco tale da controbilanciare il costo affrontato. L'altruismo reciproco e l’altruismo famigliare (kin altruism) – l'azione, costosa per chi la compie, a beneficio dei membri della famiglia o di altri parenti stretti – sono spiegazioni comuni di atti apparentemente generosi tra individui ed altri animali. Le interazioni ripetute e sfaccettate, permettendo la ritorsione contro le azioni anti-sociali, contribuiscono senza dubbio al successo evoluzionistico degli atti apparentemente generosi. Allo stesso tempo l'altruismo reciproco non costituisce una spiegazione adeguata di quelle forme di cooperazione e mutua assistenza così diffuse tra gli essere umani. Anzitutto, la gran parte dell'evidenza sperimentale riguardo le preferenze altruistiche (capitolo 3) é basata su giochi con interazioni non ripetute, o sulla fase finale di giochi ad interazione ripetuta. E' molto improbabile che in questi esperimenti i soggetti non siano consapevoli di tale struttura basata su un’interazione non ripetuta. Vi é un'evidenza molto forte del fatto che le persone distinguono tra interazioni ripetute e non, e adattano i loro comportamenti di conseguenza. L'evidenza non sperimentale é ugualmente importante: molti atteggiamenti comuni in guerra così come nella vita di tutti i giorni non sono facilmente spiegabili dall'aspettativa di un successivo comportamento reciproco. In secondo luogo, le condizioni degli uomini primitivi possono aver reso il meccanismo ripetizione-punizione uno strumento inefficace per diffondere comportamenti altruistici. I membri delle bande nomadi potevano evitare facilmente la punizione semplicemente spostandosi. Inoltre, in molte situazioni critiche all'evoluzione umana, la ripetizione delle interazioni é abbastanza probabile, come nel caso di gruppi che rischiavano l'estinzione a causa di conflitti o condizioni climatiche sfavorevoli. In terzo luogo, il celebrato “Folk Theorem” mostra che se le interazioni ripetute sono sufficientemente probabili ed i tassi di sconto sufficientemente bassi, l'equivalente
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|7
gioco ad n persone della strategia “occhio per occhio benevolo” (“nice tit-for-tat”) ed altre strategie più complesse, possono sostenere un equilibrio di Nash con alti livelli di cooperazione (Fudenberg e Maskin 1986). Ma il “Folk Theorem” mostra anche che quando il meccanismo di ripetizione-punizione in effetti funziona, funziona troppo bene nel senso che sostiene un vasto numero di risultati – alcuni di essi appena più cooperativi della mutua defezione – mentre non fornisce spiegazioni sul perchè gli equilibri più cooperativi e più efficienti possano essere favoriti ai risultati meno cooperativi. Alcuni modelli recenti (Fudenberg e Maskin 1990) sono stati in grado di restringere l'insieme degli equilibri sostenuti dalla ripetizione. Ma essi richiedono che gli attori vivano all'infinito o (equivalentemente) che abbiano dei tassi di preferenza intertemporale pari a zero, o altre assunzioni non realistiche. Infine, come Boyd e Lorberbaum (1987), Joshi (1987), ed altri hanno puntualizzato, é difficile sostenere una cooperazione attraverso la ripetizione e la ritorsione quando le interazioni non sono diadiche – come nei mercati di cambio studiati nel capitolo 7 – ma invece coinvolgono un gran numero di persone. Eppure, le interazioni tra gruppi con un vasto numero di persone sono abbastanza comuni, ad esempio la difesa o il rischio in comune o la costruzione della reputazione di un gruppo. Per capire il problema, consideriamo un gioco del bene pubblico con individui in cui ogni membro contribuisce se ognuno degli altri membri contribuisce e defeziona in caso contrario. Se i membri a volte adottano un comportamento idiosincratico (non una miglior risposta) o l'osservazione del comportamento altrui é soggetta ad errore, eventi casuali scoraggeranno la cooperazione, in quanto vi sarà sempre qualcuno che crederà che qualcun altro non contribuirà. La stessa fragilità affligge anche strategie che apparentemente sono non così stringenti. Consideriamo una strategia di cooperazione condizionale: si coopera (contribuisce) se almeno n m tra gli altri membri cooperano nella fase finale, dove m < n . Chiamiamo tale strategia m -Cooperare. La sola altra strategia possibile é il Defezionare incondizionatamente. Consideriamo tale popolazione nell'equilibrio di Nash in cui n +1 m stanno giocando la strategia m -Cooperare e adottano Defezionare (vi devono essere m persone che defezionano in equilibrio poiché altrimenti cambiare strategia da m -Cooperare a Defezionare costituirebbe una miglior risposta). Supponiamo che con una ridotta probabilità , coloro che adottano la strategia m -Cooperare cambiano la loro strategia (o per lo meno ciò è quanto osservato dagli altri membri). Abbiamo visto sopra come la popolazione adotterà Defezionare se
8 | MICROECONOMIA
un singolo membro tra coloro che adottavano m -Cooperare defeziona (o viene percepito tale). Quindi, un tale equilibrio di Nash sarà sostenuto in un dato periodo solo se tutti i n +1 m continueranno a giocare la strategia m -Cooperare e questo avviene con probabilità (1 ) che diventa molto piccola per un n grande. Quindi, nei gruppi larghi, gli equilibri cooperativi sostenuti da strategie tipo m -Cooperare sono molto vulnerabili a causa eventi casuali. n+1m
Parte del problema delle strategie tipo m -Cooperare deriva dal fatto che nei gruppi grandi, non sempre ci si può basare sulla punizione inflitta a coloro che defezionano attraverso la mancata cooperazione degli membri del gruppo. Supponiamo che m = 0 , così che tutti gli n +1 membri adottano la strategia m Cooperare e continuano a cooperare se gli altri membri non defezionano. Se un singolo membro defeziona in qualsiasi periodo, allora tutti gli altri membri defezionano per sempre. Supponiamo che, come forma di punizione dell'unica persona che defeziona, la strategia m -Cooperare produca un “male pubblico”: tutti i membri – gli n che m Cooperano e l'unico che defeziona – si accollano la perdita del beneficio della cooperazione. Si può notare che un tale problema esiste, anche se in una forma molto più attenuata nel caso diadico con la semplice strategia tit-for-tat: colui che defeziona si accolla metà (anziché l' del costo totale derivante dalla mancata cooperazione. Ovviamente vi é un vasto numero di strategie possibili e la dimostrazione che una di esse – -Cooperare – non funzioni non significa che nessuna possa funzionare. Allo stesso tempo, i problemi con la strategia -Cooperare, come modo attraverso il quale l’egoismo può promuovere la cooperazione, sono abbastanza generali e possono interessare la maggior parte delle strategie possibili in un tale contesto, se non tutte. Quindi, mentre la punizione egoistica può indurre la cooperazione nelle relazioni diadiche o di piccola scala, essa é costosa da implementare nel caso di gruppi più grandi. Come risultato, ed anche per le ragioni descritte sopra, il tentativo di spiegare – sia in economia che in biologia evoluzionistica – tutti o la maggior parte degli atteggiamenti altruistici come “egoistici nel lungo periodo” non sembra persuasivo. Tocqueville aveva ragione. A volte un atto apparentemente generoso é semplicemente tale – un comportamento costoso che beneficia un altro membro del gruppo senza nessun probabile comportamento reciproco verso l'individuo altruista. Di solito, una tale forma di altruismo incondizionato é rivolta ai propri famigliari, ma vi sono anche frequenti episodi in cui essa é rivolta a sconosciuti, come mostra l'aneddoto raccontato all'inizio del capitolo 3. Come abbiamo visto, la reciprocitá forte – la
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|9
predisposizione a cooperare, punire o premiare gli altri, condizionata al loro comportamento persino in una situazione one shot o in altre situazioni in cui non vi é alcuna aspettativa di un eventuale ritorno – é anch'essa una forma comune di comportamento osservata negli esperimenti. “Forte” sta a sottolineare che si tratta di un comportamento altruistico da non confondere con l'altruismo reciproco di Trivers, che alla fine non é affatto altruismo, e potrebbe essere chiamato reciprocità debole. Al contrario dell'altruismo incondizionato, il comportamento dell'altruista forte dipende dal tipo di persona con cui esso sta interagendo. Usando le parole del poema epico Norse del tredicesimo secolo The Edda (Clarke 1923:55), un reciprocatore forte sarà “amico dei suoi amici” e “sorriderà ai sorrisi e mentirà con i traditori”. Una forma importante di reciprocità forte é la punizione altruistica, ovvero, l'affrontare un costo per infliggere costi a coloro che violano le norme benefiche per il gruppo. Il comportamento é altruistico se induce una maggiore aderenza alle norme, incrementando il beneficio medio del gruppo. L'evidenza sperimentale della punizione altruistica deriva dai giochi dei beni pubblici, passati in rassegna nel capitolo 3, ed é parte della strategia del Punitore, descritta nel capitolo 11. La punizione altruistica permette di avere come obiettivo coloro che violano le norme e non si basa sull'aspettativa di guadagni futuri, evitando, quindi, alcuni degli svantaggi delle strategie come la strategia -Cooperare nei gruppi grandi. Ma, come ogni altra forma di altruismo, essa crea un enigma a livello di evoluzione. Né l'altruismo incondizionato né la reciprocità forte sono facilmente spiegabili come miglior risposte definite sull'insieme dei guadagni materiali del gioco. Ma se gli altruisti incondizionati e i reciprocatori forti sopportano il costo di conferire dei benefici agli altri, essi saranno sempre svantaggiati in qualsiasi processo evolutivo che favorisce coloro che hanno un guadagno maggiore. Il fatto che le persone esibiscano comunemente certi comportamenti necessita una spiegazione. Parte della risposta riguarda gli effetti della competizione tra gruppi.
LA
C O E V O L U Z IO N E D E I T R AT T I IN D IV ID U A L IS T IC I E D I G R U P P O
Le pratiche umane individuali altruistiche possono essere sorte ed avere persistito perchè gli individui dei gruppi nei quali tali pratiche erano prevalenti ne hanno tratto beneficio, anche se coloro che di fatto le mettevano in atto beneficiavano meno dei propri compagni di gruppo. Sappiamo che i tratti del comportamento individuale
10 | MICROECONOMIA
possono proliferare in una popolazione dove gli individui copiano i vicini che sembrano avere successo. Così pure le norme distributive, le convenzioni linguistiche o i comportamenti individuali che sostengono le forme di governo o i sistemi di diritti di proprietà, si diffondono o scompaiono attraverso l'emulazione delle caratteristiche dei gruppi di successo ad opera dei membri con meno successo. Questo processo spesso ha luogo come risultato di forme di competizione militare, economica o di altro tipo. Charles Darwin (1873:156), nell'epigrafe del capitolo 11, si riferisce al coraggio, alla simpatia o all'altruismo come possibili esempi: questi tratti proliferarono perchè “una tribù che possedeva tali qualità si sarebbe diffusa e sarebbe stato vittorioso sulle altre tribù”. Quindi, i tratti formalmente altruistici (costosi per l'individuo che li compie ma benefici per il gruppo), che possono proliferare sotto l'influenza della selezione del gruppo, includono i comportamenti dannosi ai membri degli altri gruppi. In effetti, il processo che modelliamo qui di seguito può esser meglio descritto dimostrando il successo evolutivo dei gruppi egoistici piuttosto che degli individui generosi5. Anche se la definizione convenzionale di altruismo si riferisce solo alle relazioni all'interno del gruppo. Gli individui dei nostri modelli interagiscono anche con i membri di altri gruppi. Nel modello, gli individui altruistici conferiscono benefici ai compagni del gruppo mentre arrecano costi o perdite materiali agli estranei. I termini “benefico al gruppo” o “egoista” si riferiscono dunque ai soli rapporti con gli altri membri dello stesso gruppo. Come é stato da lungo tempo riconosciuto, nelle popolazioni composte da gruppi caratterizzati da un maggior livello di cooperazione tra i membri stessi piuttosto che con gli estranei, i processi evolutivi possono essere distinti in effetti della selezione tra gruppi e all'interno del gruppo. Dove il grado di riproduzione dei tratti di successo dipende dalla composizione del gruppo e dove le differenze nella composizione tra i gruppi persistono attraverso il tempo, la selezione dei gruppi (a volte chiamata selezione a più livelli) contribuisce a determinare la rapidità e la direzione del cambiamento evolutivo. Il modello della prima rivoluzione dei diritti di proprietà nel capitolo 11 é un esempio di tale processo. Il classico problema della selezione dei gruppi sorge quando gli effetti tra i gruppi favoriscono la proliferazione di tratti altruistici, come, ad esempio, l'altruismo che sarebbe penalizzato dalla pura selezione individuale. La selezione di gruppo costituisce uno sbocco per l'evoluzione dell'altruismo.
5
Stiamo parafrasando Laland, Pdling-Smee e Feldman (2000:224).
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|11
Pochi studiosi delle popolazioni umane hanno messo in dubbio che le istituzioni, le nazioni, le imprese, le bande e gli altri gruppi possano essere soggetti alla pressione selettiva che opera a livello di gruppo piuttosto che a livello individuale. Ma, fino poco tempo fa, la maggior parte dei modelli formali dei processi evolutivi era stata fornita da biologi e la maggior parte di essi concluse che gli effetti a livello di gruppo non potevano essere controbilanciati dagli effetti della selezione individuale all'interno del gruppo, eccezion fatta per i casi in cui vi fossero delle circostanze particolari che incrementavano le differenze tra gruppi rispetto a quelle all'interno del gruppo. La valutazione negativa della rilevanza empirica della selezione di gruppo deriva, in primo luogo, dalla presunzione che il tasso di selezione all'interno del gruppo sia più rapido rispetto a quello della selezione tra i gruppi. Ciò deriva in parte dal fatto che le differenze tra gruppi sono soprattutto dovute al caso e quindi sono insignificanti rispetto alle differenze all'interno del gruppo. Quindi, i modelli della selezione di gruppo furono considerati come un fallimento rispetto al loro obiettivo, ovvero, quello di spiegare il successo evolutivo dei comportamenti altruistici. Come risultato, mentre la spiegazione dei comportamenti benefici per il gruppo si é focalizzata su meccanismi basati su rapporti di parentela o similarità, il notevole livello di altruismo non basato su tali rapporti era stato interpretato come altruismo reciproco o rimaneva, per la maggior parte, non spiegato6. Ma gli studi successivi (vedi le letture consigliate) suggeriscono che gli impedimenti alla selezione di gruppo possano essere meno generali di quanto affermi la critica. Inoltre, la selezione di gruppo può essere di importanza considerevolmente maggiore tra gli umani che non tra gli animali. Tra le caratteristiche della natura umana, che possono favorire la selezione tra i gruppi, vi é la nostra capacità di sopprimere le differenze fenotipiche all'interno dei gruppi attraverso la condivisione delle risorse, la mutua assicurazione, il consenso sulle decisioni da prendere, la trasmissione culturale conformista, le forme di differenziazione sociale che supportano alti livelli di interazioni distribuite in gruppi, il mantenimento della frontiere dei gruppi, ed i frequenti conflitti tra gruppi diversi. Altri animali si comportano, in parte, allo stesso modo, ma non completamente. La selezione di gruppo può funzionare sui tratti del comportamento che
6
Ovviamente, quelle descritte non esauriscono tutte le spiegazioni offerte. Simon (1990), Caporael et al. (1989), ed altri hanno proposto un meccanismo per mezzo del quale comportamenti costosi ma benefici per il gruppo esercitano free riding sui comportamenti che beneficiano l'individuo (la “docilità” per esempio) con cui essi sono pleitoricamente associati. Gintis, Smith e Bowles (2002) mostrano come un comportamento costoso per l'individuo che lo mette in atto ma benefico per il gruppo possa proliferare se esso costituisce un segnale veritiero del valore di uno come compagno o partner di coalizione.
12 | MICROECONOMIA
sono trasmessi sia geneticamente che culturalmente. Il modello dell'evoluzione dei diritti di proprietà del capitolo 11 considerava gli effetti della selezione di gruppo sui tratti trasmessi culturalmente, In questo capitolo consideriamo un modello di selezione di gruppo dei tratti trasmessi geneticamente. Affronteremo due questioni. In primo luogo, cosa contribuisce all'evoluzione delle forme, individualmente costose e benefiche al gruppo, di altruismo nei confronti delle persone non legate da rapporti di parentela? E, in secondo luogo, cosa contribuisce al successo delle strutture istituzionali comuni a livello di gruppo, che Parson (1964) ha definito “universali evolutivi” come gli Stati, la condivisione delle risorse e la monogamia, che sono emersi ed hanno proliferato ripetutamente in un'ampia varietà di circostanze durante il corso della storia umana? Il processo di coevoluzione che andremo a studiare e simulare é basato sull'idea che le due questioni di cui sopra possano essere meglio risolte congiuntamente piuttosto che singolarmente. Un esempio di certe caratteristiche strutturali a livello di gruppo é costituito dal livellamento delle istituzioni, come la monogamia e la condivisione del cibo tra i non parenti, ovvero quelle istituzioni che riducono le differenze all'interno del gruppo nella capacità riproduttiva o nel benessere materiale. Riducendo le differenze nel successo individuale all'interno del gruppo (in benessere, guadagni materiali o altre misure), certe strutture possono aver attenuato le pressioni selettive all'interno del gruppo, le quali operano contro le pratiche costose per l'individuo ma benefiche per il gruppo, dando, quindi, ai gruppi che le mettono in atto, vantaggi in termini di competizione verso gli altri gruppi7. In questo caso, la presenza diffusa di caratteristiche strutturali del gruppo, come il livellamento delle istituzioni viene spiegato dal loro contributo alla proliferazione dei tratti individuali benefici per il gruppo di appartenenza e dal contributo di questi tratti alla sopravvivenza del gruppo. L'idea secondo la quale la soppressione della competizione all'interno del gruppo può influenzare, in maniera rilevante, la dinamica evolutiva é stata ampiamente riconosciuta in alcuni insetti ed altre specie. In un articolo che esamina il caso del fungo Dictyostelium discoideum, Steven Frank (1995:520) scrive: “La teoria dell'evoluzione non ha spiegato come la competizione tra le unità di livello più basso sia soppressa nella formazione di unità evolutive di livello più alto,” aggiungendo che “il mutuo vigilare e il 7
Nel modello consideriamo la “condivisione delle risorse”. Da notare che mentre essa può essere motivata da egualitarismo, sicurezza, o altri motivi, i suoi effetti attenuano le differenze all'interno del gruppo.
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|13
rafforzamento dell’equità (fairness) evolutiva sono anche richiesti per l'evoluzione della crescente complessità sociale”. Christopher Boehm (1999:211) si é riferito al processo della sanzione irrogata dal gruppo agli agenti anti-sociali modellati nel capitolo 11 come “una 'rivoluzione politica' vissuta dagli umani del Paleolitico che crearono le condizioni sociali sotto le quali la selezione di gruppo poteva efficacemente supportare i geni altruistici”. Similmente, Irenaus Eibl-Eibesfeldt (1982:177) si riferiva all'importanza della “indottrinamento per rafforzare i valori, per obbedire all'autorità, e ... per condividere principi etici” e pensava che “attraverso tali strategie, i gruppi diventano talmente compatti da agire come unità di selezione.” Nelle pagine che seguono, presenteremo un modello del processo di selezione di gruppo basato su una semplificazione notevole dei processi evolutivi – l'equazione di Price – interpretata e corretta per affrontare le peculiarità dell'evoluzione nelle popolazioni umane. Gli effetti tra i gruppi sono basati su guerre periodiche tra i gruppi in cui i “vincitori” sostituiscono i “perdenti” occupando i loro luoghi. Le estinzioni dei gruppi quindi giocano un ruolo importante nel processo evolutivo. Anzitutto spiegheremo come l'analisi dei conflitti tra i gruppi possa illuminare l'evoluzione dei comportamenti individuali formalmente altruistici. Successivamente svilupperemo un modello di riproduzione differenziale dei tratti individuali soggetti alla selezione a più livelli attraverso i conflitti di gruppo, le estinzioni e le nascite. Questo modello degli effetti della selezione di gruppo sui tratti trasmessi geneticamente può essere usato per studiare l'evoluzione culturale8. Useremo poi una simulazione ad agenti (agent-based) per determinare le condizioni secondo le quali un tratto costoso per l'individuo portatore e benefico per il gruppo possa proliferare nella popolazione (i valori dei parametri chiave riguardano la frequenza dei conflitti nel gruppo, gli aggiornamenti degli individui, la grandezza del gruppo e la migrazione tra gruppi). La popolazione simulata viene calibrata così da riprodurre le condizioni sociali ed ecologiche dei 50.000 anni precedenti l’avvento dell'agricoltura, un periodo abbastanza lungo da modellare i processi di selezione a livello individuale e di gruppo in modo da avere i maggiori effetti sull’evoluzione genetica. Le simulazioni mostrano che in assenza di istituzioni a livello di gruppo che proteggono l'individuo altruistico dai non altruisti, le pressioni della selezione all’interno del gruppo supportano l'evoluzione dei tratti altruistici solo quando i conflitti tra i gruppi sono molto frequenti, i gruppi sono piccoli, ed i tassi di migrazione bassi. Tuttavia, quando le istituzioni a livello di gruppo vengono introdotte ed 8
Vedi Bowles (2001).
14 | MICROECONOMIA
assoggettate alle pressioni della competizione insieme ai tratti individuali, l'altruismo prolifera per un ampio insieme di parametri, che includono approssimazioni plausibili degli ambienti dei nostri antenati.
LA
L O G I C A D E L L A S E L E Z I O N E M U LT I - L I V E L L O
Molte delle organizzazioni che rivestono un ruolo importante nello studio della società umana sono aggregati di organizzazioni a livelli più bassi: le nazioni sono composte da imprese, famiglie, classi sociali che, a loro volta, sono composte da persone che a loro volta sono composte da cellule e così via. La nostra rappresentazione della struttura sociale é semplicemente la distribuzione di queste organizzazioni ai livelli più alti o più bassi e dei modi con cui esse interagiscono. Il processo di cambiamento può quindi essere considerato attraverso l’evoluzione di tali entità, con alcune di esse che si diffonderanno e diventeranno comuni, altre subiranno un declino e scompariranno con conseguenti cambiamenti nelle interrelazioni tra le varie organizzazioni. La selezione a più livelli rappresenta il processo tramite il quale l'evoluzione di una caratteristica a livello individuale viene influenzata dalle pressioni competitive che operano sia a livello individuale che ai livelli più alti. La selezione a più livelli a volte appare come un gioco di prestigio tramite il quale una caratteristica benefica per il gruppo ma apparentemente destinata a fallire dal punto di vista evolutivo potrebbe non di meno proliferare nonostante abbia tassi di riproduzione più bassi, violando le regole fondamentali dell'evoluzione. Ma, se appropriatamente modellata, la selezione di gruppo non rappresenta un'alternativa alla teoria evolutiva standard che tiene conto del cambiamento e della stabilità nella distribuzione dei tratti in una popolazione con differenti caratteristiche. Piuttosto essa rappresenta un'estensione del metodo standard che tiene conto degli effetti del gruppo sulla riproduzione. Non vi sono conigli da tirar fuori da un cappello: la selezione di gruppo é semplicemente una forma di interazione non casuale già introdotta nel capitolo 7 come segmentazione sociale. I tratti benefici per il gruppo evolvono sotto le pressioni della selezione di gruppo poiché essi beneficiano di una più alta probabilità di interazione con gli altri tratti evolutivi. Consideriamo un tratto singolo che può essere assente o presente in ciascun individuo di una popolazione sufficientemente ampia i cui membri appartengono ciascuno ad uno dei numerosi gruppi. Per concretezza, consideriamo un comportamento altruistico (A) – per esempio il coraggio nella difesa del gruppo come nell'esempio di Darwin – che comporta per l'individuo un costo e conferisce un
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
beneficio
|15
ad un qualsiasi membro del gruppo Tabella 13.1. Il gioco dell'altruismo
A N
A
N
b-c b
-c 0
Nota: i payoff appartengono ai giocatori per riga.
Indichiamo con il fatto che l'individuo del gruppo possegga il tratto, la situazione opposta (i soggetti senza il tratto sono gli N). Supponiamo che i costi e i benefici dell'altruismo vengano misurati in termini di benessere, attraverso il numero di riproduzioni (nel periodo successivo) dell'individuo portatore del tratto, cosicché un membro in un gruppo composto esclusivamente da altruisti produce b c riproduzioni in più rispetto ad un membro in un gruppo senza altruisti. Nel momento in cui assumiamo che b c > 0 , l'altruismo é benefico per il gruppo. Allo stesso tempo, se messo a confronto con gli altri membri dello stesso gruppo, il benessere dell'altruista risulterà più basso rispetto a quello dei non altruisti, cosicché la selezione all'interno del gruppo lavorerà a sfavore degli altruisti. Il punto di Darwin era che se la competizione tra gruppi influenza anche il benessere, il tratto altruista potrebbe, non di meno, proliferare. La selezione di gruppo funziona nel modo seguente. Lavorando nel tempo discreto, supponiamo che p e p' rappresentino, rispettivamente, la frazione della popolazione che possiede il tratto in un dato periodo di tempo e nel periodo successivo, e p = p' p . George Price (1970) Ha dimostrato che p può essere suddiviso tra gli effetti di gruppo e quelli individuali. Definiamo il numero delle riproduzioni nel periodo successivo di un individuo di tipo nel gruppo . Il processo di riproduzione può avvenire tramite copia culturale, eredità genetica o qualsiasi altra causa conforme con l'equazione sotto. Il modello che segue é basato sulla riproduzione differenziale dei tratti trasmessi geneticamente. ij
Supponiamo che dipenda, additivamente, dal tratto del tipo frequenza di quel tratto nel gruppo, , nel modo seguente
e dalla
(13.1) dove e rappresentano, rispettivamente, gli effetti parziali della frequenza del tratto nel gruppo su e la presenza del tratto nell'individuo (gli indici si riferiscono agli effetti di gruppo e dell'individuo), e denota il benessere di riferimento. Definiamo
16 | MICROECONOMIA
come l'effetto della frequenza del tratto nel gruppo sul numero medio delle riproduzioni (la differenza nel numero delle riproduzioni ad opera di un individuo in un gruppo composto interamente da coloro che posseggono il tratto ed un gruppo che ne é del tutto privo é data da ). Quindi, usando le definizioni sopra, e . Segue che, seguendo Price (1970) (13.2) o
dove rappresenta il numero medio di riproduzione della popolazione (normalizzate all'unità) e l'operatore indicate il valore attesa sta a significare una somma pesata tra i gruppi (i pesi sono in relazione alla grandezza del gruppo). Il primo termine cattura l'effetto di selezione di gruppo (positivo), mentre il secondo rappresenta l'effetto della selezione individuale (negativo). Tralasciando casi particolari come quello di una varianza pari a zero, ne segue che la frequenza interna di un tratto é stazionaria nel momento in cui i due termini si uguagliano in termini di grandezza assoluta (assumendo che sia i che le varianze non siano fonte di instabilità). Dato che il secondo termine é negativo, la frequenza del tratto all'interno di tutti i gruppi sopravissuti tenderà a diminuire col tempo. Ma, poiché é positivo, tale tendenza verrà controbilanciata dal benessere medio più alto per il gruppo con una maggiore frequenza degli A. Dunque, la condizione di stazionarietà per
(eq. 13.2) mostra che
quando (13.3) con
Il termine a sinistra rappresenta il rapporto costi-benefici del tratto altruistico. Il termine al lato destro descrive invece il rapporto della varianza del tratto tra i gruppi sulla somma di quella all'interno del gruppo e di quella tra i gruppi. Si può facilmente
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|17
mostrare (vedi Bowles 2001 e l'esempio illustrato sotto) che tale rapporto misura la differenza tra la probabilità che un altruista venga accoppiato con un altro altruista P(A|A) e quella secondo cui un non altruista venga a contatto con un altruista P(A|N). Quindi
Il rapporto tra le varianze rappresenta, conseguentemente, una misura del grado di segmentazione derivante non dall'accoppiamento non casuale, ma dal fatto che la popolazione é strutturata a gruppi. L'eq. 13.3 mostra che affinché un tratto altruista proliferi, maggiore é il costo del tratto (in relazione al beneficio), maggiore deve essere la varianza tra i gruppi (rispetto alla varianza all'interno del gruppo). Quando la varianza tra i valori medi del gruppo é zero, la probabilità di incontrare un altruista diventa indipendente dal tipo di ciascun individuo. La selezione di gruppo sarebbe, dunque, non operativa e solo forme non costose di benefici per il gruppo prolifererebbero. Similmente, quando
, tutti i gruppi sono omogenei e un individuo incontra solo persone del suo stesso tipo, indipendentemente dalla composizione della popolazione totale. In tal caso, la selezione all'interno del gruppo é assente e la selezione tra gruppi é l'unica forza al lavoro. In questo caso (estremo), si può dire che il gruppo rappresenti la sola unità di selezione. Quindi, la forza della selezione di gruppo dipende dalla grandezza del beneficio (per il gruppo) rispetto al costo individuale ( b e c nell'esempio) e dalla misura in cui i gruppi differiscono nella frequenza media del tratto rispetto la varianza all'interno del tratto nel gruppo. Coloro che hanno familiarità con la biologia della popolazione riconosceranno l'eq. 13.3, espressa come , come una versione della regola di Hamilton, che spiega come un tratto altruistico, anche se raro, possa proliferare. Da questo punto di vista, la selezione a più livelli non é distinguibile dai processi evolutivi basati su altre forme di distribuzione (ad esempio, selezione sulla base dei rapporti di parentela, o altre forme di segmentazione all'interno del gruppo o raggruppamenti). Un esempio chiarirà il processo. Supponiamo che una popolazione sia composta da due gruppi di uguali dimensioni, con le frazioni di individui altruistici in ciascuno pari a e , cosicché . Dalla matrice utilizzata precedentemente sappiamo che il payoff degli altruisti é minore del payoff dei non altruisti. Quindi, gli
18 | MICROECONOMIA
altruisti sono svantaggiati nel processo di riproduzione. Ciò può esser visto dalle funzioni dei payoff rappresentate nella figura 13.3: per tutti i valori di , i payoff dei non altruisti eccedono quelli degli altruisti (ignoriamo per il momento la linea tratteggiata). Ma gli effetti a livello di gruppo fanno sì che i payoff siano più alti per tutti coloro che appartengono ad un gruppo con una frazione di altruisti maggiore e che, quindi, il tratto altruistico non venga eliminato. Per trovare i valori di e tali per cui sia stazionario, dobbiamo uguagliare il benessere medio dei due tipi. Scrivendo per la frazione del gruppo di altruisti ( ), per il benessere del tipo nel gruppo ( )e per il benessere medio del tipo , usando l'equazione 13.1, ponendo e notando che e che i gruppi sono di uguali dimensioni, l'uguaglianza delle utilità dei due tipi richiede che
o, usando i dati sopra,
Probabilità di essere accoppiati con A
Figura 13.3. L'evoluzione di un tratto altruistico. Se la struttura della popolazione é tale per cui la differenza nelle probabilità condizionali di essere accoppiati con un A, P(A|A)-P(A|N), é come mostrata nella figura, é stazionario.
Risolvendo, troviamo i valori di e per i quali , ovvero, Supponendo anche che la dimensione totale della popolazione sia costante ( otteniamo e . Un
metodo
equivalente
consiste
nell'usare
semplicemente
l'eq.
. )
13.2,
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
considerando
che cosicché, usando l'eq.13.1 abbiamo
per
e
|19
che
da cui, per otteniamo come condizione per , riproducendo i risultati di cui sopra. Inoltre, riutilizzando l'eq. 13.3 ed usando i valori empirici dell'esempio abbiamo
come ci si poteva aspettare. Quindi, per i valori , la frequenza del tratto altruistico crescerà, eccedendo un mezzo nel periodo successivo. Ciò avviene perché la grandezza relativa del gruppo più altruistico cresce, controbilanciando il declino della frazione degli altruisti in ogni gruppo. La proliferazione del tratto costoso per il singolo individuo ma benefico per il gruppo viene spiegata attraverso la struttura a gruppi della popolazione, che tiene conto del fatto che gli altruisti tendono ad accoppiarsi con altri altruisti più di frequente rispetto alla media della popolazione (nonostante l'accoppiamento casuale all'interno dei gruppi). Quindi, la probabilità di incontrare un altro altruista, condizionata al fatto di essere altruisti, é data da
mentre un non altruista incontra un altruista con probabilità
La differenza tra le due probabilità condizionali - – é data dal vantaggio atteso a beneficio del tratto altruista attraverso la distribuzione favorevole tra i gruppi, risultando in un modo equivalente di rappresentare l'eq. 13.3
La figura 13.3 mostra come la struttura di gruppo della popolazione superi gli svantaggi dell'affrontare i costi derivanti dal comportamento altruistico. Mentre i payoff dei non altruisti eccedono sempre quelli degli altruisti, data una certa probabilità di incontrare
20 | MICROECONOMIA
gli altruisti, la differenza della probabilità di incontrare un altruista, dato un certo tipo, ( ) controbilancia tale svantaggio. L'esempio mostra come la selezione di gruppo possa permettere la proliferazione di un tratto altrimenti non possibile. L'analisi é comunque incompleta. L'equazione di Price fornisce una descrizione sommaria dell'equilibrio piuttosto che una descrizione completa del sistema dinamico. Da essa possiamo derivare la condizione di stazionarietà per p , ma non tiene conto dei movimenti delle varianze su cui é basato il movimento di p . Nella maggior parte dei modelli biologici, i meccanismi che incrementano la varianza tra i gruppi (ad esempio la mutazione genetica) sono deboli e tendono ad essere sommersi dagli effetti omogeneizzanti della selezione stessa, insieme alla migrazione tra i gruppi. Questa é la ragione per cui le pressioni della selezione di gruppo tra gli animali non umani vengono considerate deboli. Ma, tra gli umani, dove la dimensione effettiva del gruppo é piccola (ad esempio i membri di un gruppo nomade) e dove i gruppi di frequente si dividono sia in risposta ad un aumento di dimensione, che a causa di tensioni interpersonali all'interno del gruppo, gli errori di accoppiamento aumenteranno la varianza tra i gruppi. Per ogni modello minimamente fedele alle circostanze empiriche della natura umana, l'unico modo pratico per determinare se gli effetti che incrementano la varianza sono forti abbastanza da rendere la selezione di gruppo un'influenza importante sull'evoluzione, é quello di simulare la popolazione strutturata a gruppi con valori dei parametri ragionevoli.
UN
MODELLO DI SIMULAZIONE AD AGENTI DELLA SELEZIONE A
PIU’ LIVELLI
In assenza delle due istituzioni – distribuzione delle risorse e segmentazione all'interno del gruppo – introdotte a breve, il processo di selezione all'interno del gruppo é modellato (per l'individuo ) attraverso l'equazione dinamica di riproduzione standard (13.4) Ora, immaginiamo che il gruppo abbia adottato la pratica, comune tra i selvaggi in cerca di pascoli ed altre comunità, della condivisione delle risorse all'interno del gruppo. Una certa frazione della risorse che acquisisce un individuo – magari un tipo specifico di bene come avviene tra gli Achè (Kaplan e Hill 1985) – viene depositata in una pentola comune che viene suddivisa equamente tra tutti i membri del gruppo. Una tale istituzione di condivisione può essere modellata come una tassa lineare, t [0,1) , j
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|21
raccolta tra i payoff dei membri del gruppo dove l'ammontare totale raccolto viene poi redistribuito, in maniera uguale, a tutti i membri. L'effetto é quello di ridurre le differenze tra i payoff tra gli A e gli N, ovvero = (1 t )c . La figura 13.4 mostra i payoff attesi e l'effetto della condivisione della risorse sulle differenze dei payoff tra i due tipi, assumendo che tutti i gruppi adottino la stessa tassa, t . La differenza nella probabilità di incontrare un A (condizionata ad un particolare tipo) che uguaglia il payoff atteso non é più P( A | A) P( A | N) = r * come mostrato nella figura 13.3, ma ora diventa P ( A A ) P ( A N ) = r con r < r * . Mettendo a confronto le due figure ci si accorge che r* = c / b mentre r = c (1 t ) / b . Come risultato, se la struttura della popolazione fosse come mostrato in figura 13.3 ( r *) e se l'istituzione della condivisione delle risorse fosse presente ( t > 0), allora > e p aumenterebbe. Aj
T
T
Nj
j
T
T
T
A
N
Probabilità di essere accoppiati con A
Figura 13.4. La condivisione delle risorse indebolisce la selezione di gruppo. Le funzioni dei payoff tratteggiate indicano l'effetto dell'istituzione della condivisione delle risorse: il tratto altruistico può proliferare con condizioni meno stringenti rispetto a quelle descritte dalla figura 13.3.
Supponiamo che, in aggiunta all'istituzione della condivisione delle risorse, i gruppi siano anche segmentati, cosicché nel processo di accoppiamento all'interno dei gruppi, diviene più probabile che un A interagisca con un A e un N con un N rispetto al
22 | MICROECONOMIA
caso dell'accoppiamento casuale. Supponiamo che la probabilità che un membro A del gruppo venga accoppiato con un altro A non sia ma e che la probabilità che un membro N del gruppo sia accoppiato con un A sia . Come nel capitolo 7, definiamo il grado di segmentazione del gruppo j, o la differenza nelle probabilità condizionali che un A incontri un A e un N un A negli accoppiamenti all'interno del gruppo. Astraendo per il momento dalla tassa ( t = 0 ): = s b c . La segmentazione riduce lo svantaggio, in termini di payoff atteso, dell'altruista poiché, all'interno di un dato gruppo, diviene molto più probabile incontrare un altruista, così come diviene molto più probabile per un N incontrare un N. Se s > c / b, j gli A, nella media, avranno un payoff più alto degli N all'interno di ogni gruppo, e gli A prolifereranno come risultato della selezione sia tra i gruppi che all'interno dei gruppi. Quindi, entrambi i membri nell'equazione di Price saranno positivi. Per affrontare il classico problema di selezione di gruppo assumiamo che j
Aj
Nj
j
j
s < c / b cosicché gli A proliferano se le pressioni della selezione di gruppo sono
abbastanza forti. Come la condivisione delle risorse, la segmentazione é una convenzione e viene diffusa culturalmente. Tenendo conto sia della segmentazione che della condivisione delle risorse, le differenze tra i payoff attesi ricevuti dagli N e dagli A all'interno di un gruppo diventano (1 t )( s b c ) cosí che si ha j
j
p = p (1 p )(1 t )(s b c) j
j
j
j
(13.5)
j
da cui (mettendo a confronto le eq. 13.4 e 13.5) risulta chiaro che entrambe le istituzioni ritardano la selezione all'interno dei gruppi contro gli A. Ciò può esser visto notando che p = p (1 p )(s b c) t p = p (1 p )(1 t )b s j
j
j
j
(13.6)
j
j
j
j
Per p (0,1) entrambe le espressioni sono positive, il che implica che sia la segmentazione che la condivisione delle risorse attenuano la selezione negativa contro gli A. Da notare come l'effetto di ciascuna istituzione sia maggiore quando p é prossimo ad un mezzo e quando l'altra istituzione è ad un livello basso. Quindi, in termini dei benefici nel ritardare la selezione contro gli A, le istituzioni sono sostitute, non complementi: i loro effetti benefici sono tanto maggiori quanto minore é la presenza j
j
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|23
dell'altra istituzione. La struttura del processo di aggiornamento é descritta nella figura 13.4. La riproduzione individuale é soggetta a mutazioni cosicché, con una piccola probabilità, e , i discendenti possono essere sia A che N con uguale probabilità. Le istituzioni rappresentate da s e t differiscono tra i gruppi e anch'esse evolvono. Quando vi sono dei conflitti tra i gruppi, vince il gruppo con il payoff più alto. I membri del gruppo che perde muoiono e il gruppo vincente va a popolare il sito occupato dai perdenti insieme ai loro discendenti. I nuovi abitanti del sito adottano le istituzioni del gruppo vincente da cui discendono. Anche le istituzioni sono soggette a una variazione stocastica, che aumenta o diminuisce s e t casualmente in ogni periodo. Sia la condivisione delle risorse che la segmentazione impongono dei costi al gruppo che le adotta. I gruppi più segmentati potrebbero catturare con più difficoltà i benefici della diversità o delle economie di scala mentre la condivisione delle risorse potrebbe ridurre gli incentivi ad acquisire le risorse da condividere. Questi costi non vengono modellati formalmente, ma, per catturare il loro impatto, i benefici medi del gruppo vengono ridotti di un ammontare crescente e convesso rispetto ad e .
Tabella 13.1. Parametri chiave per la Simulazione
Valori di riferimento Intervalli considerati Dimensione media del gruppo(n/g) 20
da 7 a 47
Tasso di Migrazione (m)
0.2
da 0.1 a 0.3
Probabilitá di conflitto (k)
0.25
da 0.18 a 0.4
Tasso di Mutazione (e)
0.001
da 0.01 a 0.000001
Nota: La dimensione totale della popolazione é n e vi sono g gruppi; m, k ed e sono indicati per ogni generazione. Gli altri parametri: beneficio, b:2, costo, c:1; payoff di riferimento: 10. Abbiamo variato la dimensione del gruppo variando n. Per le ragioni spiegate nel testo, restringiamo s in modo che non ecceda mentre t [0,1] . Il costo imposto al gruppo dalle due istituzioni é pari a 1/2(s 2 + t 2 ) .
Insieme con Jung-Kyoo Choi e Astrid Hopfensitz ho simulato una popolazione artificiale strutturata in venti gruppi. I valori di riferimento dei parametri esplorati della popolazione sono descritti nella tabella 13.1. I valori chiave riguardano il tasso di migrazione tra i gruppi, la dimensione dei gruppi e la frequenza dei conflitti tra i gruppi. Dato che ogni conflitto é letale per i perdenti abbiamo deciso di utilizzare, come
24 | MICROECONOMIA
riferimento, una singola guerra ogni quattro anni. I valori di riferimento sono stati scelti sulla base di una plausibilità empirica, la cui evidenza verrà discussa nella penultima sezione. Ogni simulazione viene iniziata senza altruisti né istituzioni presenti al tempo zero, per vedere come essi possano proliferare se inizialmente rari (il processo di mutazione individuale e di gruppo introduce una certa variabilità nella popolazione). Il benessere di riferimento é posto pari a 10 e i discendenti vengono prodotti in proporzione alla quota del benessere individuale su quello totale del gruppo, cosicché, in assenza di segmentazione e condivisione delle risorse, la differenza attesa nei payoff é pari a c =1 per cui gli N producono il dieci per cento in più di discendenti rispetto agli A. Abbiamo considerato 10 simulazioni di 50.000 generazioni utilizzando diversi valori dei parametri. o
Una simulazione tipica appare nella figura 13.6. L'aumento di p viene sostenuto dall'aumento casuale sia di s che di t (tra il periodo 100 e 150). Quando p raggiunge livelli alti (dal periodo 532 a 588 per esempio) sia s che t diminuiscono, causando tipicamente una diminuzione forte in p. I successivi aumenti di t ed s avvengono casualmente. La dinamica che ne risulta emerge per le seguenti ragioni: quando la popolazione é divisa equamente tra gli A e gli N, molti gruppi sono approssimativamente suddivisi equamente. Come risultato (dall'eq. 13.6) gli effetti benefici della ritardata selezione all'interno dei gruppi, che derivano dagli alti livelli di s e t , vengono massimizzati in questa regione. Ma, se é ben superiore a 0.5, i benefici della protezione degli A offerta dalle istituzioni diventano meno importanti. Allo stesso tempo le istituzioni sono costose, per cui, quando é alto, é probabile che i gruppi con un sostanziale livello di segmentazione o di condivisione delle risorse perdano i conflitti con gli altri gruppi e i siti da loro occupati vengano popolati dai discendenti dei vincitori, che tipicamente posseggono un livello di variabili istituzionali minore. Come risultato, quando le istituzioni dei vincitori vengono imposte nei siti ripopolati, sia che diminuiscono. Tabella 13.3. Le istituzioni ritardano la selezione all'interno del gruppo contro gli altruisti.
Istituzione Nessuna
i
-0.102
t Test
8.5
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
Condivisione delle risorse
-0.08
16.6
Segmentazione
-0.063
13.4
Entrambe
-0.055
11.2
|25
Nota: La colonna i fornisce la stima dei minimi quadrati del coefficiente
(
del valore medio del gruppo di pj 1 p j
)
come valore per predire
(l'altro regressore é la varianza tra i gruppi, var ( fornisce il test t della stima.
)). L'ultima colonna
Per esplorare ulteriormente l'impatto delle istituzioni sui processi di aggiornamento, stimiamo l'equazione di Price, esplorando l'effetto di ciascuna istituzione separatamente (ovvero, restringendo s,t ad essere entrambe o nessuna pari a zero). Usando i dati da 10.000 generazioni, regrediamo i valori osservati di p sui valori del periodo precedente relativi a var( p )e a E var( p ) , dove il secondo termine rappresenta la media tra i gruppi delle varianze all'interno degli stessi. I coefficienti di queste variabili rappresentano delle stime di e tratte dall'equazione 13.2. Come mostra la tabella 13.3, l'effetto combinato della condivisione delle risorse e della segmentazione é quello di ridurre della metà l'effetto della selezione all'interno dei gruppi contro gli altruisti. Da notare come, in assenza di istituzioni, la stima di (0.102) sia molto vicina al valore
{
j
G
j
}
i
i
26 | MICROECONOMIA
gruppo i
Agenti che giocano N
1) Accoppiare e Interagire
Agenti che giocano A Agenti che cambiano per caso
gruppo i
2) I Payoff determinano il numero di figli per ogni giocatore (fra parentesi) gruppo i
3) Nuova generazione e mutazione
gruppo i Emigrazione verso il gruppo x
4) Migrazione Immigrazione dal gruppo y gruppo perdente j
gruppo vincente i
5) Competizione tra gruppi gruppo vincente i
Allargamento temporaneo
6) Il gruppo vincente ripopola il sito del gruppo perdente e si divide in due nuovi gruppi gruppo i
gruppo j
7) Nuovi gruppi
Torna al Passo (1)
Torna al Passo (1)
Figura 13.5. Le interazioni individuali e di gruppo. Assegniamo n individui ai g gruppi. Al tempo t=0 tutti sono N. (1) Accoppiamento. In ogni periodo, ogni membro del gruppo é accoppiato casualmente con un altro membro i cui payoff sono dati nel testo (in alcune simulazioni vengono modificati dalla regola di condivisione delle risorse). Con l'introduzione della segmentazione, i membri interagiscono con un tipo simile con probabilità s e vengono accoppiati casualmente con probabilità 1-s. (2) Riproduzione. Le riproduzioni delle generazioni correnti costituiscono la generazione successiva. Esse vengono prodotte estraendo (con sostituzione) alcuni individui dal gruppo di appartenenza dove la probabilità che si venga estratti é uguale alla quota del payoff dell'individuo rispetto a quella totale del gruppo. (3) Mutazione. Con probabilità e, un membro della generazione successiva non é la riproduzione dei suoi genitori, ma può essere A o N con uguale probabilità. (4) Migrazione. Con probabilità m ogni membro della nuova generazione si stabilisce in un
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|27
gruppo, scelto a caso tra gli altri. (5) Competizione di gruppo. Con probabilità k un gruppo viene selezionato e la competizione tra gruppi casualmente selezionati ha luogo. Il gruppo vincente é quello con il payoff più alto (al netto dei costi della segmentazione e della condivisione se presenti). (6) Ripopolazione e scissione. I membri del gruppo perdente vengono sostituiti dai discendenti dei membri del gruppo vincente, e il gruppo vincente che ne risulta (temporaneamente allargato) si divide tra i membri assegnati casualmente a due nuovi gruppi. (Nelle simulazioni con la condivisione delle risorse e la segmentazione, i due nuovi gruppi adottano le istituzioni del gruppo vincente).
atteso, dato che il valore di riferimento del benessere é 10 (quindi gli N hanno un dieci per cento di vantaggio in termini di benessere). La stima dell'effetto tra i gruppi, , (non mostrata) varia poco in risposta a quali sono le istituzioni che possono evolvere, e, in ogni caso, risulta di quattro volte maggiore di quella dell'effetto all'interno dei gruppi. La varianza media all'interno dei gruppi é molto maggiore della varianza tra i gruppi. G
Frazione
p medio
s medio
t medio Generazione Figura 13.6 L'interazione dinamica tra le istituzioni di gruppo e i comportamenti individuali. La figura presenta la storia di 1.000 periodi di una simulazione usando i parametri di riferimento dalla tabella 13.1. La frequenza media della popolazione degli altruisti é , mentre ed denotano la media del livello di condivisione delle risorse e segmentazione tra venti gruppi. L'altruismo ed entrambe le istituzioni a livello di gruppo sono inizialmente rari. L'intervallo di tempo é stato selezionato così da rilevare chiaramente tale dinamica, osservata su lunghi periodi di tempo in molte simulazioni.
Da notare che possiamo riscrivere l'eq. 13.2, la condizione per p = 0 , come
var( p ) = E{var( p )} i
G
j
ij
(13.2’)
28 | MICROECONOMIA
con p < 0 se il rapporto tra le varianze eccede il rapporto tra gli effetti all'interno dei gruppi e quelli tra i gruppi, e viceversa. Nella nostra simulazione osserviamo una tale relazione teorica? Usando le stime econometriche degli effetti tra i gruppi e all'interno dei gruppi descritti nella tabella 13.2, così come i rapporti tra le varianze medie osservate nelle stesse simulazioni, otteniamo i risultati della tabella 13.3. In assenza delle due istituzioni, il rapporto tra l'effetto di selezione all'interno dei gruppi e quello della selezione tra i gruppi, / , é quasi il doppio del rapporto delle varianze tra e all'interno dei gruppi. Quindi, nel caso di una popolazione con certi valori medi e stimati, p sarebbe negativo. Non ci sorprende, infatti, trovare che il valore medio di p é 0.06 nelle simulazioni su cui sono basate tali stime. Nel caso in cui entrambe le istituzioni siano presenti, invece, il rapporto delle varianze uguaglia il rapporto tra gli effetti, il che implica che gli effetti all'interno del gruppo che operano contro gli A sono esattamente controbilanciati dagli effetti tra i gruppi che ne sostengono, invece, la proliferazione. Nella simulazione su cui sono basate tali stime, il valore medio di p é 0.51. i
G
I conflitti tra i gruppi giocano un ruolo chiave nel sostenere sia le istituzioni a livello di gruppo che l'altruismo a livello individuale. Nelle simulazioni riportate, la frequenza attesa del conflitto é data da 1/ k dove k rappresenta la probabilità che un gruppo venga estratto per un conflitto in ogni generazione. Sembra probabile che, in un lungo periodo storico, la frequenza dei conflitti vari considerevolmente, forse in risposta al bisogno di emigrare in tempi di variabilità climatica. Per esplorare la sensitività della simulazione al variare della frequenza dei conflitti, abbiamo variato stocasticamente utilizzando il sistema autoregressivo descritto nelle note della figura 13.7. Durante i periodi in cui il conflitto era frequente (intorno alla 21.000-esima generazione) venivano sostenuti alti livelli di altruismo, ma gli intervalli periodici di pace relativa tra i gruppi (intorno alla 25.300-esima, 27.000-esima e 29.600-esima generazione) causavano delle riduzioni drastiche della frazione degli A nella popolazione. Abbiamo cercato di rispondere anche ad altre due domande. Nel caso in cui le istituzioni a livello di gruppo non siano coevolute con l'altruismo a livello individuale, quest'ultimo avrebbe potuto proliferare? E ancora, quanto sono sensibili le nostre simulazioni alle variazioni dei parametri chiave? Per rispondere ad entrambe le domande, abbiamo variato la dimensione del gruppo da 7 a 47, e, per ciascun valore della dimensione, sono state simulate 50.000 generazioni, lasciando gli altri parametri ai loro valori di riferimento. Lo studio é stato fatto lasciando prima coevolvere entrambe le
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|29
istituzioni, poi ciascuna singolarmente, ed infine nessuna delle due. Abbiamo seguito lo stesso procedimento variando il tasso di migrazione da 0.1 a 0.3 e la probabilità del conflitto ( ) da 0.18 a 0.51. I risultati appaiono nella figura 13.8. Tabella 13.3. Una stima dell'equazione di Price
Istituzioni Rapporto tra gli effetti Rapporto tra le varianze Nessuna
0.25
0.13
0.06
Entrambe
0.13
0.13
0.51
Nota:
Il
rapporto
tra le varianze rappresenta la media di su 10.000 generazioni simulate, mentre il rapporto tra
gli effetti é dato da i / G , stimato come descritto nella tabella 13.2. La frazione degli A nella popolazione é .
Il riquadro superiore mostra che, quando entrambe le istituzioni non vengono fatte evolvere, un gruppo di dimensione 7 sostiene alti livelli di altruismo, ma nei gruppi con dimensione maggiore di 8, la frequenza degli altruisti diviene minore di 0.3. Considerando come riferimento la dimensione del gruppo nel quale , vediamo come, in assenza di istituzioni la dimensione critica sia 8, mentre quando entrambe sono considerate, p > 0.5 si manifesta nei gruppi di dimensioni minori di 22. I risultati per il tasso di migrazione sono simili. In assenza delle istituzioni, sostenere un p > 0.5 richiede un tasso di migrazione (per generazione) di 0.13, ma se entrambe le istituzioni sono libere di evolvere, il tasso di migrazione critico é pari a 0.21. Il riquadro in fondo mostra come le istituzioni permettano anche l'evoluzione di elevati livelli di altruismo con un numero molto minore di conflitti. Anche una lettura “verticale” della figura può essere illuminante: per esempio, il riquadro in fondo mostra che per , é minore di 0.2 senza istituzioni, ma maggiore di 0.8 se entrambe le istituzioni sono libere di evolvere9.
9
Le figura 13.8 e la tabella 13.2 suggeriscono che la segregazione ha un'influenza maggiore rispetto alla condivisione delle risorse: la segmentazione, se considerata isolatamente, ha un effetto maggiore della condivisione quando anch'essa viene considerata da sola sia in ritardare la selezione all'interno del gruppo contro gli A sia in ampliare lo spazio dei parametri per i quali gli A costituiscono una notevole frazione della popolazione. Ciò é un artefatto delle nostre scelte del modello. Le funzioni di costo per e sono identiche, ma s ha un impatto maggiore nell'aggiornamento all'interno del gruppo, come può esser visto dall'eq. 13.6. Usando queste equazioni per mettere a confronto l'effetto di quando con quello di quando , vediamo come il primo sia volte il secondo, dove poiché l'azione altruistica é di beneficio al gruppo (Nella nostra simulazione e , cosicché che l'effetto di s è il doppio di quello di ). Inoltre, dall'eq.13.5 possiamo notare come, se ,
30 | MICROECONOMIA
frazione
p medio
k
generazione Figura 13.7. Elevate frequenze dei conflitti tra gruppi favoriscono l'altruismo. La figura mostra il periodo di 1.000 generazioni in una simulazione in cui entrambe le istituzioni evolvono endogenamente e in cui , la frequenza dei conflitti tra i gruppi, varia nel tempo secondo la seguente relazione kt = k0 + kt1 + t , dove = 0.99, t viene estratta casualmente da una distribuzione uniforme [-0.02,0.02] e viene scelto in modo che la media di uguagli il valore di riferimento di , ovvero 0.25.
2
5
Gli esperimenti con tassi di mutazione da 10 a 10 forniscono risultati analoghi a quelli mostrati. In assenza di istituzioni, rimane basso, mentre con entrambe le istituzioni il valore medio di in 5 simulazioni di 100.000 generazioni ciascuna (per tassi di mutazione di 10 , 10 , 10 e 10 ) eccede un mezzo. Il valore medio di per le cinque simulazioni con un tasso di mutazione pari a va da 0.75 a 0.83; in ogni caso un aumento drastico di si verifica tra la 17.150-esima e la 25.855esima generazione e per il resto della simulazione si mantiene ad alti livelli. Il tempo di attesa prima della forte crescita dipende dal tempo necessario ad un gruppo piccolo ad accumulare un numero significativo di altruisti. Tale tempo di attesa si riduce considerevolmente nel caso vi siano più di venti gruppi. Dato che abbiamo fissato 2
3
4
5
nella generazione iniziale, tassi di migrazione molto bassi (meno di bassi livelli di per periodi molto lunghi.
) determinano
, ma il valore di t richiesto per frenare la selezione all'interno del gruppo contro gli A é 1. (Nella funzione di costo quadratica che abbiamo usato, i costi a livello di sono quattro volte quello di s=1/2). gruppo di
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
Frequenza di altruisti nella popolazione
Dimensione di gruppo Entrambe le istituzioni
seg Nessun istituzione tassa
Dimensione di gruppo (n/g)
Frequenza di altruisti nella popolazione
Tasso di migrazione
seg Nessun istituzione
Entrambe le istituzioni
tassa
Tasso di migrazione (m)
Frequenza di altruisti nella popolazione
Frequenza del conflitto di gruppo Entrambe le istituzioni seg
tassa
Nessun istituzione
Probabilità del conflitto di gruppo (k) Figura 13.8. Le istituzioni a livello di gruppo aumentano la dimensione dello spazio dei parametri per i quali i comportamenti altruistici risultano prevalenti. Ogni punto rappresenta la frequenza media degli altruisti nell'intera popolazione su 10 simulazioni di 50.000 periodi, ciascuna per il valore del parametro indicato sull'asse orizzontale. In ogni riquadro gli altri parametri sono fissati ai rispettivi valori di riferimento, mostrati nella tabella 13.2. Ciascuna simulazione inizia con p,t e s fissati pari a zero. La curva 'nessuna istituzione' fornisce i risultati delle simulazioni in cui s e t sono fissati pari a zero; le altre curve indicano simulazioni in cui una o entrambe le istituzioni sono lasciate libere di evolvere. (“Tassa” si riferisce alla condivisione delle risorse). La distanza orizzontale tra le curve indica l'ampliamento dello spazio dei parametri reso possibile dalle istituzioni a livello di gruppo. La distanza verticale tra le curve mostra l'impatto delle istituzioni sul valore medio di p.
|31
32 | MICROECONOMIA
AMBIENTI EVOLUTIVI Abbiamo descritto un processo secondo cui le istituzioni come la condivisione e la segmentazione forniscono un ambiente all'interno del quale i tratti altruistici evolvono e nel quale tali istituzioni proliferano nella popolazione grazie al loro contributo al processo di evoluzione dei tratti benefici al gruppo. Questo modello fornisce anche indicazioni sul processo di evoluzione dei comportamenti altruistici e delle istituzioni a livello di gruppo? Dipende se lo spazio dei parametri in cui avviene tale processo coevolutivo approssima l’ambiente rilevante nelle nostre simulazioni, ovvero i primi 50.000 o 100.000 anni dell’esistenza umana moderna, precedente alla drammatica trasformazione della struttura sociale avvenuta con l’avvento dell’agricoltura intorno ad 11.000 anni fa. Non si sa molto del tardo Pleistocene, ed è ben conosciuta la difficoltà di fare inferenze riguardo all’organizzazione sociale dei gruppi umani durante tale periodo sulla base delle semplici società contemporanee (Foley 1987, Kelly 1995). Con una certa sicurezza possiamo dire, comunque, che le condizioni climatiche erano estremamente variabili (Richerson, Boyd e Bettinger 2001), e che bande nomadi composte da soggetti sia legati che non legati da vincoli di parentela e la mancanza di organizzazioni politiche complesse costituivano forme comuni di organizzazione sociale. La nostra dimensione di riferimento del gruppo, 20, è basata su un’approssimazione della mediana dei 235 gruppi di cacciatori descritti da Binford (2001), ovvero 19. La nostra scelta della grandezza del gruppo non è, comunque, del tutto realistica. Occorre ricordare che le piccole dimensioni contribuiscono alle pressioni della selezione aumentando la varianza tra i gruppi che aumenta quando quelli di successo raddoppiano la loro dimensione e si dividono. In realtà, la scissione del gruppo non è semplicemente l’esito di un’estrazione casuale ma piuttosto appare come un processo di risoluzione dei conflitti politici in cui è probabile che soggetti legati da vincoli di parentela e coalizioni rimangano insieme. Di conseguenza, è probabile che la scissione abbia contributo alla varianza tra i gruppi in modi che il nostro modello non può catturare. Uno studio sulla scissione tra le popolazioni amazzoni (Neves 1995:198) riporta che: La dimensione massima del villaggio è limitata dall’ammontare di relazioni di parentela e dalla solidarietà tra gli individui che deriva da tre fonti: relazioni di parentela, legami coniugali e influenza dei leader politici…La scissione nel villaggio è favorita, quindi, dall’indebolimento delle relazioni di parentela che deriva dalla crescita della popolazione; e quando avviene mantiene uniti i parenti stretti ma tende a separare quelli meno vicini…La linea potenziale della scissione è data dalla
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|33
divisione nella patrilinearitá10.
Dato che è probabile che i portatori dei tratti benefici al gruppo siano numericamente e socialmente dominanti nei gruppi vincitori, essi possono aver messo in atto ció che Hamilton (1975:137) ha chiamato assortative division, segregando i portatori degli altri tratti, fintanto che il riconoscimento dei tratti o delle caratteristiche correlate con i tratti lo permetta. In tal caso, i gruppi di dimensioni molto maggiori sosterrebbero i processi evolutivi sopra descritti. Si sa poco del conflitto di gruppo nel corso della storia umana primitiva. Sappiamo però che le morti a causa di guerre costituiscono una frazione sostanziale delle morti avvenute in molte delle societá antecedenti la nascita dello Stato delle quali si ha traccia nei registri etnografici ed archeologici. La media riportata da Keeley (1996) per gli studi etnografici delle societá pre-statali è 0.19 e per quelli archeologici è 0.16. Tali dati possono essere messi a confronto con le stime molto più basse per l’Europa e per gli Stati Uniti nel ventesimo secolo (molto inferiori a 0.1), con lo 0.03 per la Francia del diciannovesimo secolo e con lo 0.02 per l’Europa Occidentale del diciassettesimo secolo. Un registro di 200 guerre in 50 anni nel Mae-Enga nella Nuova Guinea, per esempio, ha considerato 800 persone da una popolazione di 5000 e ne è risultato un tasso di mortalitá annuale da guerre (0.0032 morti procapite per anno) che costituisce quasi il doppio di quello della Germania e della Russia nel ventesimo secolo, ma che è molto inferiore a quello medio delle società pre-statali di cui si ha testimonianza (Keeley 1996:195). È difficile dire se tali episodi straordinariamente letali fossero comuni durante il tardo Pleistocene. Ma possiamo avvalerci di alcune speculazioni basate su quanto sappiamo riguardo al cambiamento climatico e ai probabili tassi di crescita della popolazione. Christopher Boehm (2000a:19) scrive: Sembra sensato supporre che, in ambienti prosperi e stabili, la densità della popolazione cresca e che le bande inizino a competere per le risorse, e che, alla fine, questo abbia creato problemi politici letali anche se, inizialmente, le risorse erano più che adeguate….Le varie vicende dei conflitti potrebbero aver aumentato la forza della selezione naturale che operava a livello di gruppi, in quanto alcune bande vennero decimate mentre altre si riprodussero e alla fine si scissero. [In risposta alle drammatiche oscillazioni climatiche nel periodo interglaciale del tardo Pleistocene], le bande nomadi erano costrette a cambiamenti molto frequenti, che consistevano sia nell’adattamento alle caratteristiche dei gruppi limitrofi che nei cambiamenti dell’ambiente naturale.
La sua conclusione è la seguente: Verso la fine del Pleistocene, quando l’essere umano moderno cominciò ad affermarsi, il tasso di 10
Chagnon (1983:141-3) ha studiato il villaggio di Yanomamo che si suddivise e scoprí che la parentela genetica media nel villaggioprima della scissione era piú bassa di ciascuna delle nuove unitá formatisi a seguito della divisione.
34 | MICROECONOMIA
estinzione dei gruppi avrebbe potuto crescere drammaticamente in quanto bande bisognose di cacciatori ben armati, stranieri privi di interazioni politiche ben consolidate si scontrarono di frequente, sia localmente che nel corso di lunghe migrazioni.
Carol Ember (1978) ha raccolto dati sulla frequenza dei conflitti tra una cinquantina di bande nomadi nel presente o nel recente passato. Escludendo i pastori e coloro che praticavano agricoltura sedentaria, il 64% dei gruppi affrontava dei conflitti ogni due anni o piú frequentemente. Persino escludendo coloro che allevavano cavalli o pescavano (tra i quali i conflitti erano più comuni), le guerre venivano considerate “rare” solo nel 12% dei gruppi. Mentre il movimento tra le unità etno-linguistiche era probabilmente poco comune, sembra probabile che notevoli tassi di migrazione si verificavano, invece, tra le bande che componevano tali unità. Il valore medio dei tassi di migrazione per le tredici società studiate da Rogers (1990) è del 22 percento per generazione con il massimo (i !Kung) minore di un mezzo. Dato che i dati di Rogers si riferiscono a gruppi di dimensioni più ampie rispetto alle bande, essi potrebbero sottostimare in qualche modo i tassi di migrazione. Nonostante la natura di queste inferenze sia fortemente speculativa, sembra possibile che gli ambienti sociali e fisici del tardo Pleistocene possano ricadere tra lo spazio dei parametri delle traiettorie coevoluzionistiche illustrate nella figura 13.7. In tal caso, il modello della selezione a più livelli con le istituzioni endogene può fornire per lo meno una parziale descrizione di questo periodo cruciale dell’evoluzione umana.
C O N C L U S IO N E Sembra dunque probabile che la predisposizione umana verso le attività benefiche per il gruppo possa essere coevoluta con le comuni istituzioni che implementano la condivisione delle risorse e la segmentazione sociale. In tal caso, questo approccio può aiutare a capire perché gli umani siano stati portati a condividere e cooperare per il raggiungimento di obiettivi comuni e allo stesso tempo siano stati pronti ad uccidere o essere uccisi in nome di entità astratte come la nazione o la razza. Il modello fornisce anche alcuni suggerimenti per capire perché certi atteggiamenti siano meno comuni tra gli animali: la maggior parte degli animali sono incapaci di creare gli ambienti che facilitano certi atteggiamenti, ovvero quelli costituiti da gruppi ben definiti composti soggetti non legati da relazioni di parentela ma in cui vi siano dei codici di comportamento comunemente compresi. E, come abbiamo visto, senza queste peculiari
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|35
strutture umane di interazione, l’evoluzione dei comportamenti umani altruistici sarebbe stata molto improbabile. Un’implicazione ulteriore, sottolineata dalla figura 13.6, consiste nel fatto che anche l’altruismo e la guerra possano essere coevolute. I comportamenti di gruppo che rendono la cooperazione per i mutui benefici possibile tra gli umani, rendono possibili anche le guerre su larga scala. E frequenti conflitti, come abbiamo visto, possono aver costituito un contributo essenziale all’evoluzione dei tratti altruistici che li facilitano. Per esplorare tale dinamica, abbiamo considerato endogena la probabilità dei conflitti letali tra i gruppi; abbiamo assunto che k vari congiuntamente alla frequenza degli A nella popolazione. In queste simulazioni (non mostrate), la popolazione spende virtualmente tutto il tempo in uno dei due stati: alte frequenze di altruismo e conflitti molto frequenti o pochi altruisti e conflitti infrequenti (Bowles e Choi 2003). I modelli di selezione a piú livelli, simili a quello simulato in questo capitolo, hanno anche dimostrato che la punizione altruistica dei violatori delle norme può proliferare anche se rara e rimanere comune anche in gruppi abbastanza numerosi. In uno di questi modelli (Boyd, Gintis e Richerson 2003) è stato sfruttato il fatto che il costo della punizione dei violatori delle norme è piccolo quando coloro che aderiscono costituiscono la maggioranza del gruppo. (Ciò é simile alla dinamica del modello del Punitore-l’Usurpatore-Condivisore, nelle vicinanze dell’equilibrio di Rousseau). In questo caso, le pressioni relativamente deboli della selezione di gruppo che derivano dai conflitti tra i gruppi (come nel modello sopra) sono sufficienti per mantenere alte frequenze dei punitori altruistici e per sostenere alti livelli di cooperazione. Un secondo modello, che riguarda la reciprocitá forte (Bowles e Gintis 2003), considera una forma di punizione dei violatori delle norme comune tra le bande nomadi di cacciatori: l’esercizio dell’ostracismo da parte del gruppo. I conflitti di gruppo o le estinzioni di un gruppo non giocano alcun ruolo in questo modello: coloro che vengono puniti soffrono una perdita di benessere durante il periodo in cui essi non fanno parte del gruppo. I free rider che aderiscono alla norma ma non puniscono non cacciano i reciprocatori (contraccambisti) forti perché se i free rider divengono comuni in un gruppo, i violatori della norme proliferano, riducendo il benessere medio dei gruppi cui appartengono. Nell’introdurre i capitoli dal 10 al 13, ci siamo chiesti come le istituzioni possano cambiare e come le persone e le regole che governano la loro vita possano coevolvere. Abbiamo modellato tre fonti principali di cambiamento: trend secolari esogeni (soprattutto, cambiamenti tecnologici e ambientali, come nel capitolo 11), gli effetti
36 | MICROECONOMIA
congiunti del caso e dell’azione collettiva (capitolo 12) e gli effetti congiunti del caso e dei conflitti tra i gruppi (in questo capitolo). I modelli introdotti suggeriscono due modi in cui il cambiamento può essere avvenuto endogenamente, rispettivamente, con l’azione collettiva o con la competizione di gruppo. Considerati congiuntamente, i modelli catturano almeno parte dei desiderata descritti all’inizio del capitolo 11, ovvero, l’importante ruolo giocato da conflitti di interesse, caso, azione collettiva, persistenza delle istituzioni inefficienti e traiettorie altamente irregolari del cambiamento sintetizzate dal termine “equilibri punteggiati”. I modelli forniscono anche delle buone ragioni per aspettarsi che le istituzioni inefficienti, pur se persistenti per periodi lunghi, nel lungo periodo non se la passino bene quanto le altre istituzioni, identiche ma più efficienti. Abbiamo anche visto come, per ben due ragioni differenti (fornite nel capitolo 12 e 13), le istituzioni egualitarie possano essere favorite nel processo di evoluzione. Nei modelli basati sulla teoria dei giochi stocastici evolutivi, il bacino di attrazione delle istituzioni egualitarie è più ampio e, nei modelli di selezione a più livelli, le istituzioni egualitarie ritardano la selezione all’interno del gruppo contro gli altruisti e ciò aumenta la capacità del gruppo di sopravvivere nei conflitti con gli altri gruppi. Siamo stati in grado, dunque, di spiegare, in parte, non solo i meccanismi causali dell’evoluzione delle istituzioni e individuale, ma anche il concetto di Parson degli “universali evolutivi”, ovvero, le istituzioni che ci si può aspettare siano molto diffuse in ambienti differenti, emergenti in numerose occasioni e proliferanti anche se inizialmente rare. La strategia concettuale alla base di tutti i modelli presentati è stata quella di estendere un numero di approcci astratti, ispirati alla biologia – la teoria dei giochi stocastici evolutivi e la decomposizione dei processi di selezione all’interno dei-tra i gruppi dell’equazione di Price –modellando i processi distintivi delle interazioni sociali umane. Quindi, l’approccio stocastico evolutivo è stato esteso tenendo conto del perseguimento intenzionale degli interessi attraverso l’azione collettiva e il modello della selezione a più livelli è stato corretto per dare una spiegazione della condivisione delle risorse e della segmentazione sociale all’interno dei gruppi, così come delle guerre e delle altre forme di conflitto tra i gruppi. I risultati delle simulazioni suggeriscono l’utilità dell’approccio. L’orizzonte temporale in cui la storia si spiega nei più semplici dei modelli stocastici evolutivi è troppo lungo per risultare rilevante per spiegare l’evoluzione sociale, ma l’introduzione delle interazioni locali e la correlazione delle azioni idiosincratiche, attraverso le tendenze conformistiche, aumentano molto il passo del cambiamento. Similmente, in assenza di
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|37
istituzioni all’interno del gruppo quali la condivisione delle risorse e la segmentazione, le condizioni per l’evoluzione dei tratti individuali benefici al gruppo sono molto stringenti. Ma quando si permette a questi due importanti aspetti dell’interazione umana di coevolvere con i tratti individuali, il processo di coevoluzione che ne risulta appare una possibile spiegazione alla storia umana.
38 | MICROECONOMIA
Riferimenti bibliografici Alexander, R. D. (1979). Darwinism and Human Affairs. Seattle, University of Washington Press. Anderson, P. (1974). Passages from Antiquity to Feudalism. London, NLB. Boehm, C. (1999). "The Natural Selection of Altruistic Traits." Human Nature 10(3): 205-252. Boehm, C. (2000). Hierachy in the Forest. Cambridge, Harvard University Press. Bowles, S. (2001). Individual Interactions, Group Conflicts, and the Evolution of Preferences. Social Dynamics. S. Durlauf and P. Young. Cambridge, MA, MIT Press: 155-190. Bowles, S. and H. Gintis (1984). State and Class in European Feudalism. Statemaking and Social Movements: Essays in History and Theory. C. B. a. S. Harding. Ann Arbor, University of Michigan Press. Bowles, S. and H. Gintis (2003). Strong reciprocity: The origin of hunman cooperation. The Cultural and Genetic Evolution of Cooperation. P. Hammerstein. Cambrige, MIT Press. Bowles, S., J.-K. Choi, et al. (2003). "The coevolution of individual behaviors and group level institutions." Journal of Theoretical Biology 223(2): 135-147. Boyd, R. and J. Lorberbaum (1987). "No Pure Strategy Is Evolutionarily Stable in the Repeated Prisoner's Dilemma Game." Nature 327: 58-59. Boyd, R., H. Gintis, et al. (2003). "The evolution of altruistic punishment." Proceedings of the National Academy of Science (USA) 20: 123-143. Brady, T. A. (1985). Turning Swiss: Cities and Empire, 1450-1550. Cambridge, Cambridge University Press. Bright, C. and S. F. Harding (1984). Statemaking and social movements : essays in history and theory. Ann Arbor, University of Michigan Press. Caporael, L. R., R. M. Dawes, et al. (1989). "Selfishness examined: Cooperation in the Absence of Egoistic Incentives." Behavioral and Brain Sciences 12: 683-738. Chagnon, N. A. (1983). Yanomamo: The Fierce People. New York, Holt, Rhinehart and Winston. Clarke, D. E. M., Ed. (1923). The Havamal With Selections From Other Poems of the Edda, Illustrating the Wisdom of the North in Heathen Times. Cambridge, Cambridge University Press. Darwin, C. (1873). The Descent of Man. New York, D. Appleton and Company. de Tocqueville, A. (1958 [1830]). Democracy in America, Volume II. New York NY, Vintage. Eibl-Eibesfeldt, I. (1982). "Warfare, Man's Indoctrinability and Group Selection." Journal of Comparative Ethology 60(3): 177- 198. Ember, C. (1978). "Myths About Hunter-Gatherers." Ethology 17(4): 439-449. Flannery, K., J. Marcus, et al. (1989). The Flocks of the Wamani: A Study of Llama Herders on the Puntas of Ayacucho, Peru. San Diego, Academic Press. Foley, R. (1987). Another Unique Species: Patterns in Human Evolutionary Ecology. New York, John Wiley and Sons. Frank, S. A. (1995). "Mutual Policing and Repression of Competition in the Evolution of Cooperative Groups." Nature 377: 520-522.
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|39
Fudenberg, D. and E. Maskin (1986). "The Folk Theorem in Repeated Games with Discounting or with Incomplete Information." Econometrica 54(3): 533-554. Fudenberg, D. and E. Maskin (1990). "Evolution and Cooperation in Noisy Repeated Games." American Economic Review 80(2): 275-279. Gellner, E. (1983). Nations and nationalism. Ithaca, Cornell University Press. Gintis, H., E. A. Smith, et al. (2002). "Costly signaling and cooperation." Journal of Theoretical Biology 213(1): 103-119. Hamilton, W. D. (1975). Innate Social Aptitudes of Man: an Approach from Evolutionary Genetics. Biosocial Anthropology. R. Fox. New York, John Wiley and Sons: 133-155. Herlihy, D. and C. Klapische-Zuber (1985). Tuscans and their Families. New Haven, Yale University Press. Joshi, N. V. (1987). "Evolution of cooperation by reciprocation within structured demes." Journal of Genetics 66(1): 69-84`. Kaplan, H. and K. Hill (1985). "Food Sharing among Ache Foragers: Tests of Explanatory Hypotheses." Current Anthropology 26(2): 223-246. Keeley, L. (1996). War Before Civilization. New York, Oxford University Press. Kelly, R. C. (1985). The Nuer Conquest: The Structure and Development of an Expansionist System. Ann Arbor, University of Michigan Press. Kelly, R. L. (1995). The foraging spectrum : diversity in hunter-gatherer lifeways. Washington, Smithsonian Institution Press. Laland, K. N., F. J. Odling-Smee, et al. (2000). "Group Selection: A Niche Construction Perspective." Journal of Conciousness Studies 7(1/2): 221-224. Levy, R. (1957). The Social Structure of Islam. Cambridge, Cambridge University Press. MacDonald, K. (1995). "The Establishment and Maintenance of Socially Imposed Monogamy in Western Europe." Politics and the Life Sciences 14(1): 3-23. Mack Smith, D. (1959). Italy: A Modern History. Ann Arbor, University of Michigan Press. Matthew, D. (1992). Atlas of Medieval Europe. Oxford, Andromeda, Ltd. Meletti, J. (2001). Difende un fornaio, assassinato. La Republica: (June 28)13. Neves, E. G. (1995). "Village Fissioning in Amazonia." Rev. do Museo de Arqueologica e Ethnologia (S. Paulo) 5: 195-209. Parsons, T. (1964). "Evolutionary Universals in Society." American Sociological Review 29(3): 339-357. Pearson, K. (1894). "Socialism and Natural Selection." Fortnightly Review 56: 1-21. Price, G. R. (1970). "Selection and Covariance." Nature 227: 520-521. Richerson, P., R. Boyd, et al. (2001). "Was Agriculture Impossible During the Pleistocene but Mandatory During the Holocene? A Climate Change Hypothesis." American Antiquity 66(3): 387-411. Rogers, A. R. (1990). "Group Selection by Selective Emigration: The Effects of Migration and Kin Structure." American Naturalist 135(3): 398-413. Simon, H. A. (1990). "A Mechanism for Social Selection and Successful Altruism." Science 250: 1665-1667. Soltis, J., R. Boyd, et al. (1995). "Can Group-Functional Behaviors Evolve by Cultural Group Selection: An Empirical Test." Current Anthropology 36(3): 473-483. Tilly, C. (1975). The Formation of National States in Western Europe. Princeton, Princeton University Press. Tilly, C. (1990). Coercion, capital, and European states, AD 990-1990. Cambridge, Mass.,
40 | MICROECONOMIA
USA, B. Blackwell. Trivers, R. L. (1971). "The Evolution of Reciprocal Altruism." Quarterly Review of Biology 46: 35-57. Wallerstein, I. (1974). The Modern World-System: Capitalist Agriculture and the Origins of the European World-Economy in the Sixteenth Century. New York, Academic Press. Weber, E. (1976). Peasants into Frenchmen: The Modernization of Rural France, 18701914. Stanford, Stanford University Press. Weinstein, D. A., H. H. Shugart, et al. (1983). "Energy Flow and the Persistence of a Human Population: A Simulation Analysis." Human Ecology 11(2): 201-223.
XIV IL GOVERNO DELL’ECONOMIA: M ERCATI , S TATI E C OMUNITÀ
Quale di questi sistemi [pianificazione centralizzata o concorrenza] è probabile che sia più efficiente dipende da quale di essi possiamo aspettarci che assicuri un uso migliore dell’informazione esistente. E questo, a sua volta, dipende da se è più probabile riuscire a mettere a disposizione di una singola autorità centrale tutta l’informazione che deve essere utilizzata e che è inizialmente dispersa fra molti individui, oppure nel mettere a disposizione degli individui l’informazione addizionale di cui hanno bisogno per adeguare i loro piani a quelli degli altri. -F.A. Hayek, “L’uso dell’informazione nella società” [1945]
Il legislatore rende buoni i cittadini inculcandogli comportamenti, e questo è l’obiettivo di ogni legislatore; se non riesce a raggiungerlo, le leggi che promulga sono un fallimento. È in questo che si distingue una buona costituzione da una cattiva. -Aristotele, Etica Nicomachea (350 a.c.)
L’uomo dei sistemi…immagina di poter sistemare i diversi membri di una estesa società con la stessa facilità con la quale la mano sistema le differenti pedine su una scacchiera; non considera…che nella grande scacchiera della società ogni singola pedina possiede un proprio principio del movimento. -Adam Smith, Teoria dei Sentimenti Morali (1759)
In qualche quartiere di Chicago gli adulti consigliano ai ragazzini di non saltare la scuola, non fare rumore o non imbrattare i muri con graffiti. Inoltre, i residenti sono disponibili ad intervenire negli incontri pubblici per il mantenimento delle strutture di quartiere, ad esempio una caserma locale dei vigili del fuoco minacciata da tagli di bilancio. Sono tutti esempi di ciò che Sampson, Raudenbush e Earls (1997) chiamano efficacia collettiva. Quando il quartiere manifesta un elevato livello di efficacia collettiva le violenze criminali sono marcatamente minori, anche facendo una verifica su un’ampia gamma di comunità e di caratteristiche individuali, incluso il passato tasso di criminalità. Sampson, Raudenbush e Earls hanno rilevato una variazione
2 | MICROECONOMIA
notevole nei livelli di efficacia collettiva di quartiere, portando esempi di quartieri ricchi o poveri, principalmente abitati da persone di colore o da bianchi, che mostrano livelli sia alti sia bassi. E’ degno di nota il fatto che l’eterogeneità etnica sia risultata molto meno importante nel prevedere una scarsa efficacia collettiva rispetto a misurazioni dello svantaggio economico, del basso tasso di abitazioni di proprietà e di altri indicatori di instabilità residenziale. I quartieri di Chicago sono un’illustrazione di enforcement informale delle norme della comunità. L’esempio delle cooperative di pescatori della baia di Toyama in Giappone chiarisce un altro aspetto della risoluzione dei problemi di una comunità (Platteau e Seki 2001). Dovendo affrontare l’alta variabilità della pesca, così come l’alto livello e la natura mutevole delle abilità richieste nell’attività, alcuni pescatori hanno scelto di condividere i profitti, le informazioni e la formazione professionale. Una cooperativa, che ha avuto grande successo sin dalla sua costituzione a metà degli anni sessanta, è composta dagli equipaggi e dai capitani di sette battelli per la pesca dei gamberi. La pesca, lo scaricamento e la vendita delle singole imbarcazioni sono sincronizzate in modo da aumentare la trasparenza del processo di divisione e da rendere facile l’individuazione di eventuali aggiramenti dell’accordo dettati dall’opportunismo. Il successo delle cooperative per la pesca dei gamberi nella baia di Toyama e l’efficacia collettiva dei quartieri di Chicago sono esempi di governo della comunità. Le cooperative del legno compensato descritte nel capitolo 10 ne sono un altro esempio. Per comunità intendo un gruppo di persone che interagiscono direttamente, frequentemente e con modalità variegate. In questo senso, le persone che lavorano assieme costituiscono di solito una comunità, così come lo sono alcuni vicini, i gruppi di amici, le reti professionali e d’affari, le gang e le federazioni sportive. La connessione, e non l’affetto, è la caratteristica che definisce una comunità. I modelli evoluzionistici nel capitolo 7 hanno mostrato come la natura variegata e ripetuta delle interazioni sociali nelle comunità, il numero relativamente basso di persone coinvolte, e, come risultato, la disponibilità di informazioni sui propri associati possano sostenere un elevato livello di ciò cui talvolta ci si riferisce come capitale sociale: fiducia, attenzione per i propri associati e desiderio di vivere secondo le norme di una comunità e di punire coloro che non lo fanno. Questi comportamenti etero-interessati furono riconosciuti come ingredienti essenziali del buon governo tra i pensatori classici da Aristotele a Tommaso d’Aquino, da Jean-Jaques Rousseau ad Edmund Burke. Il Principe di Niccolò Macchiavelli (1513) e il Leviatano di Thomas Hobbes (1651) hanno rappresentato una netta frattura con la tradizione aristotelica. Queste opere fondamentali della moderna
IL GOVERNO DELL’ECONOMIA
|3
filosofia politica presero l’interesse personale come assunzione comportamentale fondamentale e si chiesero come le conseguenze potenzialmente distruttive del perseguimento autonomo dell’utile personale potessero essere vincolate dall’autorità di un governante sovrano. La nozione più radicale che le motivazioni egoistiche potrebbero essere sfruttate per il bene pubblico fu il contributo chiave della Favola delle api di Bernard Mandeville, pubblicata per la prima volta nel 1705 (Mandeville 1924). Il sottotitolo dell’edizione del 1714 della Favola proclamava che l’opera conteneva “diversi discorsi finalizzati alla dimostrazione delle fragilità umane… che potrebbero essere ribaltati a vantaggio della società civile, e concepiti per occupare il posto delle virtù morali.” Al posto della visione Aristotelica, secondo la quale le buone leggi producono buoni cittadini, Mandeville propose la più moderna nozione che regole giuste del gioco che governa le interazioni sociali dovrebbero sfruttare le motivazioni egoistiche per promuovere il benessere generale. A questa congettura radicale fu dato contenuto economico per mezzo dell’argomentazione della mano invisibile di Adam Smith. Dunque, sin dal tardo diciottesimo secolo, la maggioranza dei teorici della politica e dei pensatori costituzionali avevano preso l’homo economicus come loro assunzione fondamentale riguardante il comportamento. Anche per questa ragione hanno enfatizzato il ruolo dei mercati competitivi, dei diritti di proprietà ben definiti, e degli stati efficienti e ben intenzionati come ingredienti critici del governo. Le buone regole del gioco dunque giunsero per prendere il posto dei buoni cittadini come sine qua non del buon governo. I partiti rivali che emersero nel diciannovesimo secolo e nel primo ventesimo secolo sostenevano l’uno il laissez faire e l’altro l’intervento generale dello stato come la forma ideale di governo economico.1 Il dibattito negli anni venti e trenta sulla realizzabilità della pianificazione centrale fu emblematico del troncamento del menu costituzionale a “stato contro laissez faire”. Ludwig von Mises e altri (Hayek 1935) proposero la loro visione secondo cui il calcolo economico-razionale richiesto dalla pianificazione richiedeva la conoscenza dei prezzi che riflettevano la vera scarsità (i.e., la misurazione dei costi e dei benefici sociali marginali) e che questa informazione poteva essere ottenuta solo tramite un uso esteso dell’allocazione decentrata attraverso i mercati. Oskar Lange (Lange e Taylor 1938), Enrico Barone (1935), Abba Lerner (1944) e altri replicarono che i prezzi sono impliciti in qualsiasi problema di ottimizzazione (che i mercati esistano o meno). Questi prezzi impliciti (o “prezzi 1
Fuori dai circoli accademici, il menu di opzioni era considerevolmente più ampio, includendo i modelli economici “misti”, di cui i socialdemocratici dei paesi nordici erano pionieri e i modelli di mercato socialista introdotti da Oskar Lange. Dahl e Lindblom (1953) sono esemplari (ma ciò accade raramente) nell’evitare la polarizzazione del dibattito come “pianificazione contro mercato”.
4 | MICROECONOMIA
ombra”), essi sostenevano, potrebbero essere calcolati direttamente o estratti dall’osservazione dei comportamenti competitivi in un’economia che utilizza i mercati per implementare le allocazioni determinate dai pianificatori centrali. Se questo fosse il caso, il pianificatore potrebbe attuare qualsiasi allocazione raggiunta per mezzo di mercati competitivi decentralizzati. Tuttavia, in confronto, il pianificatore potrebbe ottenere risultati migliori in casi in cui ostacoli alla competizione o mercati mancanti hanno provocato un aumento delle inefficienze nelle allocazioni. Negli anni quaranta il dibattito si era quasi concluso. Anche l’oppositore per eccellenza del socialismo, Joseph Schumpeter, aveva ammesso: “Il socialismo può funzionare? Certo che può… non c’è niente di sbagliato nella teoria pura del socialismo” (Schumpeter 1942:167, 172). Schumpeter riecheggiava un altro oppositore del socialismo, Vilfredo Pareto (1897), che molto prima aveva affermato l’ammissibilità del calcolo economico-razionale in ciò che chiamava “regime collettivista.” In una sezione del suo famoso Manuel d’Economie Politique intitolata “Un argomento a favore della produzione collettivista” Pareto (1909:364) aveva concluso che “l’economia pura non ci fornisce un criterio veramente decisivo per scegliere tra l’organizzazione di un società basata sulla proprietà privata ed una organizzazione socialista.” Cos’era sbagliato allora nel socialismo? E cosa era sbagliato nella teoria economica che in modo così inadeguato catturava i difetti economici delle allocazioni centralizzate e giustificava nel dibattito la pianificazione socialista? Una caratteristica notevole del dibattito era che entrambe le parti schieravano il modello walrasiano a favore delle loro argomentazioni. Hayek si accorse presto dell’errore. In “The uses of information in society” (citato sopra) reimpostò il dibattito in termini di costi e di disponibilità limitata delle informazioni, concetti assenti dal paradigma walrasiano. Il problema del socialismo, secondo Hayek, era che le informazioni necessarie al pianificatore sono possedute privatamente da milioni di attori economici, i quali non hanno né la volontà, ed in molti casi neanche il modo, di trasferirle all’autorità centrale. Al contrario, continua Hayek, i mercati decentralizzati utilizzano efficacemente le informazioni disperse, poiché ogni attore conosce le proprie preferenze e risponde al vettore dei prezzi che, in circostanze ideali, è conosciuto all’attore individuale ed è il riflesso della vera scarsità sociale dei beni in questione. Ora sappiamo (capitolo 6) che non esiste un mercato neanche remotamente realistico nel quale queste condizioni sono valide, perché molti dei prezzi rilevanti semplicemente non esistono, altri non riflettono le scarsità sociali e
IL GOVERNO DELL’ECONOMIA
|5
altri ancora (i prezzi dei beni futuri, per esempio) non sono conoscibili. Tuttavia, focalizzando l’attenzione su quali istituzioni utilizzano in modo più efficace le informazioni che sono disponibili, l’articolo di Hayek, come la Favola di Mandeville, viene considerato una pietra miliare nella teoria delle istituzioni economiche. Nel formalizzare i maggiori difetti della pianificazione centralizzata, Hayek puntualizzò anche le mancanze del paradigma walrasiano, cioè l’assunzione di informazione completa. Per Ronald Coase, il dibattito aveva rivelato un’incoerenza, quella che dovette ispirarlo allo studio della teoria dell’impresa. Al termine della sua carriera, lo richiama domandandosi: Come si possono riconciliare le visioni espresse dagli economisti sul ruolo del sistema dei prezzi e dell’impossibilità di una pianificazione centrale economica di successo con l’esistenza … di queste società ed imprese apparentemente pianificate dentro la nostra società [?] (Coase 1992:715).
Poco dopo la caduta del comunismo, Stiglitz (1994:10) osservò ironicamente che “se il modello neoclassico dell’economia fosse corretto, il socialismo di mercato sarebbe stato un successo [e] il socialismo pianificato centralmente si sarebbe imbattuto in un numero molto inferiore di problemi.” Molto prima dell’economia neoclassica o del comunismo, John Stuart Mill (1976) aveva fornito una critica ai problemi di un’ipotetica economia socialista – la motivazione dei lavoratori, la riduzione dell’innovazione, la mancanza di diritti di proprietà appropriati – molto più penetrante di qualsiasi altra prodotta all’interno del paradigma neoclassico. Commentando il ruolo dei consulenti economici degli Stati Uniti nelle economie in transizione degli ex paesi comunisti negli anni novanta, Coase osservò: “Senza le istituzioni appropriate non è possibile nessuna economia di mercato di qualche significato. Se sapessimo di più delle nostre economie, saremmo in una migliore posizione per fornire loro consiglio.” (Coase 1992:714). Assieme al suo fallimento nel chiarire i problemi del sottosviluppo, l’incapacità dell’economia walrasiana di comprendere gli handicap del Comunismo o le istituzioni idonee per la transizione ad una economia fondata sul mercato costituiscono un chiaro segnale di debolezza di questo approccio. In questo capitolo adotteremo un approccio post-walrasiano per spiegare le sfide contemporanee della governance economica. Utilizzeremo i risultati dei precedenti capitoli per esplorare le modalità con cui congiuntamente mercati, stati e comunità possono fornire una soluzione ai problemi di coordinamento studiati nei precedenti capitoli. (Non forniremo queste soluzioni dal punto di vista della giustizia distributiva ma piuttosto ci focalizzeremo sulle loro implicazioni per l’efficienza allocativa). Scegliamo tre generiche strutture di governo – le comunità, gli stati e i mercati – per i
6 | MICROECONOMIA
modi distintivi in cui coordinano le attività congiunte e allocano diritti su beni e servizi.2 Inevitabilmente, la trattazione sarà stimolante, ma non esaustiva. Tirare i fili della prospettiva post-walrasiana è un primo compito suggerito dall’uso inappropriato delle assunzioni walrasiane nei dibattiti fra pianificazione e laissez faire. E’ ciò che faremo nel prossimo paragrafo. Di seguito identificheremo le capacità distintive e i difetti di mercati, stati e comunità. Concluderemo con una riconsiderazione della congettura radicale di Mandeville.
LA
SCIENZA ECONOMICA E LE SCIENZE SOCIALI EVOLUTIVE
Il paradigma walrasiano fornisce il solo modello compiutamente elaborato per tutte le economie che spieghi come le azioni di un gran numero di attori autonomi sostengano risultati sociali aggregati. Alcuni dei difetti di questo modello sono stati identificati nelle pagine precedenti, e sono state suggerite alcune formulazioni alternative. Per sintetizzare le caratteristiche principali dell’approccio walrasiano, caratterizzeremo il paradigma walrasiano con ciò che viene insegnato agli studenti, piuttosto che con l’impossibile eterogenea unione dei distinti contributi degli studiosi rappresentativi di questo paradigma. Questo necessariamente comporterà alcune discrepanze tra la rappresentazione del paradigma e lo stato dell’arte della conoscenza del settore. Per fare un esempio, si consideri l’unicità e la stabilità dell’equilibrio generale: agli studenti si insegna regolarmente che sono verificate – si consideri il grafico standard di domanda e offerta - anche se (come è stato puntualizzato nel capitolo 6) le assunzioni richieste per dimostrare l’unicità e la stabilità sono eccezionalmente restrittive. Utilizzeremo l’espressione scienze sociali evolutive per riferirci alle alternative al paradigma caratteristico walrasiano. Non esiste un paradigma unificato con questo nome, ma insiemi di approcci abbastanza disgiunti, molti dei quali piuttosto rudimentali. La maggior parte di questi sono stati introdotti nelle precedenti pagine. Resta da vedere se negli anni a venire questi approcci saranno unificati in un sostituto coerente del paradigma walrasiano. L’intuizione sulla quale è fondato questo libro è che si unificheranno. La Tabella 14.1. riassume i due approcci contrastanti. Sarebbe ridondante commentare ciascuna riga. Tuttavia, l’ultima riga nella tabella, riguardante riduzionismo e individualismo metodologico merita un commento. Il riduzionismo è un approccio alla scienza che preferisce spiegazioni fondate su entità di livello inferiore (le cellule, ad esempio) rispetto a postulare semplicemente le entità di livello più elevato che esse compongono (organismi multicellulari, ad esempio). 2
La famiglia potrebbe essere considerata una quarta struttura di governance. Le famiglie condividono molte delle caratteristiche delle comunità ma differiscono nei ruoli che vengono assegnati per età, sesso, e parentela.
IL GOVERNO DELL’ECONOMIA
|7
L’individualismo metodologico è un’espressione del riduzionismo nelle scienze sociali che sostiene fermamente che le spiegazioni dei fenomeni a livello di gruppo, quali le istituzioni o i prodotti aggregati, devono essere sviluppate a partire dalle azioni degli individui. L’approccio scelto in questo libro è coerente con l’individualismo metodologico in quanto ci si è focalizzati sui meccanismi causali che connettono ciò che gli individui fanno per aggregare i risultati sociali. Tuttavia, come è stato chiarito dalla discussione delle preferenze endogene e dell’evoluzione culturale, l’effetto dei risultati aggregati sugli individui è non meno importante. Il concetto convenzionale di equilibrio in economia è espressione dell’individualismo metodologico della disciplina. E’ una pratica standard – e frequentemente usata nelle pagine precedenti – quella di definire un equilibrio come uno stato in cui nessuno degli individui coinvolti ha una ragione per alterare il suo comportamento. Le proprietà aggregate dell’equilibrio – un’allocazione di risorse in tutte le economie, per esempio – sono dunque derivate dall’aggregazione dei comportamenti individuali di equilibrio. Le proprietà aggregate sono stazionarie poiché i comportamenti individuali sono stazionari. Tuttavia, come dimostra il modello di equilibrio generale di Foley (1994) descritto nel capitolo 6, la stazionarietà delle proprietà aggregate non richiede la stazionarietà delle entità di livello inferiore. Il modello di Foley mostra che, affinché i prezzi medi non cambino, non è necessario che gli scambi abbiano termine. L’analisi di Brian Arthur (1994a) della frequentazione del suo bar preferito veicola un messaggio simile. Nessuno vuole andarci quando è affollato e le persone stimano quante persone ci saranno sulla base delle esperienze passate. Arthur simula un processo di apprendimento adattivo, il cui risultato è che circa sessanta persone si presentano a El Farol ogni giovedì. Tuttavia, perché ciò accada non occorre che si presentino le stesse identiche persone, o che siano accurate o stazionarie le valutazioni di coloro che arrivano riguardo a quanti altri arriveranno. Tabella 14.1. Il paradigma walrasiano e qualche alternativa.
Economia Walrasiana (come insegnata)
Scienze Sociali Evoluzionistiche (in prospettiva)
Interazioni Sociali
Diritti completi e applicabili in modo coercitivo scambiati su mercati competitivi
Sono comuni relazioni dirette (non contrattuali) in ambienti non competitivi
Tecnologia
Funzioni di produzione esogene con rendimenti non crescenti
Rendimenti crescenti generalizzati sia nella tecnologia (endogena) sia nelle interazioni sociali (feedback positivi)
Aggiornamento
Individui lungimiranti si aggiornano in modo istantaneo sulla base della
Individui che guardano al passato e sulla base dell’esperienza si aggiornano utilizzando informazioni locali
8 | MICROECONOMIA
conoscenza dell’intero sistema Risultati
Un unico equilibrio stabile basato sulla stazionarietà delle azioni degli individui
Molteplici equilibri, i risultati aggregati possono essere medie di lungo periodo di entità di livello più basso non stazionarie
Tempo
Statica comparata
Dinamica esplicita
Caso
Rilevante solo per il rischio e per le assicurazioni
Componente essenziale delle dinamiche evoluzionistiche
Dominio
L’economia come entità che si limita e si regola da sola: preferenze ed istituzioni sono esogene
L’economia è inserita in un più ampio sistema ecologico e sociale: coevoluzione di preferenze ed istituzioni
Preferenze
Preferenze auto-interessate definite sui risultati
Preferenze auto-interessate e non autointeressate definite sui risultati e sui processi
Prezzi e quantità
I prezzi decidono l’allocazione delle risorse; gli attori non sono vincolati dalla quantità
Vincoli di quantità; opportunità contrattuali dipendenti dalla ricchezza
Metodo
Riduzionista (individualismo metodologico)
Non – riduzionista; selezione sugli individui ed altre entità di ordine più elevato
In questa e in molte altre applicazioni, le entità di livello inferiore non sono stazionarie, ma in modo tale da compensarsi nella media, non producendo nessun cambiamento nelle proprietà aggregate. L’analisi evolutiva nei capitoli dall’11 al 13 ha adottato questo metodo. Gli stati stabili in senso stocastico (capitolo 12) non sono risultati stazionari; piuttosto, descrivono comportamenti medi di lungo periodo di un sistema. I modelli nei capitoli 11 e 13 hanno descritto popolazioni costantemente in movimento, spinte da azioni premeditate di risposta non ottimale da parte di collettivi di individui, da altri comportamenti idiosincratici, dalla deriva genetica, e dall’innovazione istituzionale. I risultati delle simulazioni ad agenti erano medie di lungo periodo che riflettevano tutte queste influenze. L’individualismo metodologico è anche evidente in un comune approccio all’analisi delle istituzioni economiche. Schotter (1981:20) presenta un esempio: Se la scienza economica … intende studiare l’origine e l’evoluzione delle istituzioni sociali, si suggerisce un approccio metodologico molto semplice. Dovremmo far partire la nostra analisi da uno stato di natura lockiano nel quale non esistono del tutto istituzioni sociali, solo gli agenti, le loro preferenze e la tecnologia che hanno a loro disposizione … Il passo successivo sarebbe studiare, nel corso dell’evoluzione di questa economia, quando si svilupperebbero istituzioni quali la moneta, le banche, i diritti di proprietà, i mercati competitivi, i contratti di assicurazione, e lo stato.
IL GOVERNO DELL’ECONOMIA
|9
Non c’è dubbio che il metodo di Schotter sia interessante, e che si sia dimostrato penetrante. Se invece si prendessero tecnologie e preferenze endogene, violare i principi dell’individualismo metodologico fornirebbe intuizioni altrettanto profonde. Si potrebbe, per esempio, assumere un insieme di istituzioni e quindi chiedersi che tipo di preferenze e di tecnologie si svilupperebbero. L’approccio adottato in questa sede (specialmente nei capitoli dall’11 al 13) rappresenta le preferenze individuali e le istituzioni a livello di gruppo come entità che coevolvono, quindi senza privilegiare le entità di ordine inferiore rispetto a quelle di ordine superiore. Se sia necessario formulare un modello per i processi di gruppo o individuali (o entrambi, o altri oltre a questi) dipende dal problema analitico in questione e da considerazioni pratiche di trattabilità. Se non si formula un modello delle interazioni cellulari all’interno degli individui nella maggioranza delle applicazioni nelle scienze sociali si guadagna molto in semplicità e non si perde niente. Invece, tale strategia sarebbe debole ai fini della comprensione del cancro. Quando le caratteristiche di gruppo possono essere prese come date, formulare un modello a livello individuale è un approccio ragionevole. In modo simile, se possiamo astrarre dalle variazioni all’interno del gruppo, il processo di selezione a livello di gruppo può ben essere il centro della nostra attenzione, come è nei modelli di competizione tra imprese. Richard Dawkins (1989:3), un forte sostenitore del riduzionismo in biologia, osservò giustamente che fornisce più informazioni spiegare le automobili in termini di carburatori che di quark. Da questa prospettiva, ipotizzare un ambiente originario senza istituzioni è un modo curioso di investigare l’evoluzione storica delle vere istituzioni. La ragione è che sin dall’avvento degli esseri umani biologicamente moderni, ed anche tra gli altri primati, convenzioni sociali e diritti di proprietà di vario tipo hanno quasi certamente fornito un ambiente istituzionale per le nostre interazioni. Locke, Hobbes e altri filosofi hanno usato lo stato di natura come un’ipotetica indagine su ciò che potrebbe giustificare la proprietà, l’autorità dello stato, ecc…, non come parte di una spiegazione di come queste istituzioni si sono evolute storicamente. (Si ricordi la metafora di Hobbes, deliberatamente fantasiosa, dello stato di natura nell’epigrafe del capitolo 3: “consideriamo gli uomini come se spuntassero … come funghi”). Nel prologo ho distinto il metodo evolutivo dall’approccio dell’ingegneria sociale alla politica pubblica. Con il secondo intendo la visione secondo cui i risultati sociali sono determinati da azioni autonome di funzionari con senso civico, più o meno nello stesso modo in cui le pedine degli scacchi nell’epigrafe di Smith potrebbero essere mosse sulla scacchiera. Nessuno crede alla lettera a questo (meno
10 | MICROECONOMIA
di tutti i funzionari pubblici), ma molti non riescono a stimare la misura in cui questa visione falsifica il processo con cui sono determinati i risultati. Sebbene non abbiamo prestato attenzione ai problemi della politica pubblica, i modelli sviluppati in questo libro suggeriscono un approccio abbastanza differente, ovvero applicare ai funzionari dello stato le stesse assunzioni comportamentali che abitualmente adottiamo per chi è impegnato in scambi privati: far sì che le azioni dei funzionari siano risposte ottime fondate sulle loro preferenze in condizioni di incompletezza contrattuale. Adottando una prima versione di questo approccio, Jeremy Bentham era a favore di accordi costituzionali tali da strutturare gli incentivi in modo che i “doveri” dei dipendenti pubblici coincidano con i loro “interessi”. Tuttavia, questo obiettivo raramente viene realizzato. Nella visione evolutiva, gli effetti aggregati sono il risultato delle interazioni tra le azioni dei funzionari pubblici e le risposte ottimali di tutti gli individui coinvolti. Ciò non suggerisce che gli interventi del governo siano inefficaci, ma piuttosto che per essere efficaci nei modi desiderati occorre una comprensione del sistema dinamico in cui si sta intervenendo. Per esempio, le politiche che occorrono per sostituire un equilibrio socialmente non desiderabile in favore di qualche altro risultato possono essere completamente differenti a seconda che il sistema che produce i risultati sia caratterizzato da un singolo equilibrio o da molti equilibri stabili. Il compito della politica pubblica è sostituire un equilibrio ad un altro. L’esempio del lavoro minorile che segue chiarirà questo aspetto. Infine, proponiamo un commento che non riguarda direttamente i paradigmi contrastanti, ma piuttosto è diretto alle problematiche normative, mai assenti quando si discute di alternative istituzionali. “Utilità” è un termine pesantemente caricato di significati: gli economisti di solito lo usano per riferirsi alle motivazioni, ai comportamenti e al benessere. La convenienza di far collassare questi tre distinti usi in un singolo termine è considerevole. Tuttavia, perché ciò succeda è necessario introdurre l’assunzione implicita di razionalità sostanziale, ovvero, che le persone agiscano in modo tale da ottenere ciò che vogliono, la qual cosa a sua volta contribuisce al loro benessere, determinato da una qualche valutazione indipendente dei risultati rilevanti. Al contrario, la razionalità formale, assunta dalla maggioranza degli economisti, impone ai comportamenti solo requisiti di coerenza (come la transitività), senza alcun requisito per le ragioni soggettive delle azioni dell’individuo, edonistiche o di altro tipo, per la ragionevolezza dei mezzi adottata per il perseguimento di qualche risultato, o per le conseguenze sul benessere dell’individuo. Un masochista coerente non è irrazionale.
IL GOVERNO DELL’ECONOMIA
|11
Affinché sia di rilevanza pratica o morale, il ragionamento economico sulle istituzioni e sulle politiche pubbliche richiede la nozione di razionalità sostanziale. Se, per esempio, un individuo crede che terze parti non dovrebbero intervenire in transazioni volontariamente intraprese da attori economici adulti, non è sufficiente sapere che essi hanno preferenze complete e transitive. In aggiunta dobbiamo avere la certezza che le loro scelte non saranno distruttive per il loro benessere in modo grave o irreversibile. Lo stesso vale per la comune interpretazione dell’efficienza paretiana in termini di “benessere” degli individui. La sola razionalità formale non fornisce la motivazione per preferire risultati Pareto-superiori, eccetto che nella mente dei libertari estremi. Un’allocazione preferita da due masochisti potrebbe essere approvata da altri. Tuttavia, l’assunzione di razionalità sostanziale è basata su affermazioni forti di carattere empirico riguardanti la ragione per cui le persone fanno quello che fanno e le conseguenze delle loro azioni. Queste affermazioni sono in generale false. Numerose prove empiriche suggeriscono che, se valutate sulla base dello standard del benessere, le persone sono pessime nello scegliere. Siamo privi di lungimiranza, falliamo nel prevedere le preferenze che avremo quando le conseguenze rilevanti delle nostre azioni avranno luogo, non accumuliamo informazioni accurate sugli aspetti edonistici delle esperienze passate, agiamo in modo incoerente nelle situazioni di scelta intertemporale e violiamo di frequente le ipotesi dell’utilità attesa (Kahneman 1994, Camerer 2000). I soggetti che mostrano queste caratteristiche negli esperimenti e in situazioni del mondo reale troverebbero strano sentire chiamare i loro comportamenti “irrazionali”. Tra questi soggetti ci sono studenti delle università più selettive, professori di Harvard e tassisti di New York. Se le preferenze devono spiegare i comportamenti, non possono senza altro aiuto svolgere anche il compito della valutazione dei risultati. Questo è vero perché alcune comuni ragioni del comportamento – la debolezza della volontà e le dipendenze, ad esempio – inducono comportamenti che pochi tollererebbero. La disgiunzione tra le motivazioni dei comportamenti e gli standard con cui un politico liberale e democratico dovrebbe valutare i risultati conduce a dispute profonde, tali da contrapporre i valori liberali a quelli utilitaristi e paternalisti. Per esempio, se tra le persone l’avversione alle perdite è una potente reazione soggettiva, dovrebbe essere tenuta in considerazione nel valutare le politiche pubbliche? Procedere in questo senso avrebbe l’effetto di uno spostamento sostanziale in favore dello status quo, in quando i costi sostenuti dai perdenti sarebbero ora contati due volte o più. Ma rispondere a questi problemi ci porterebbe lontano.
12 | MICROECONOMIA
M E R C AT I
E S TAT I : U N C O N F R O N TO P O S T - WA L R A S IA N O
Dato che la retorica del dibattito sulla pianificazione contro il laissez faire fu altamente polarizzata, una conclusione da sottolineare è che mercati e stati sono difficili da distinguere da un punto di vista allocativo. Nel 1928 il discorso presidenziale di F. M. Taylor all’American Economic Association si aprì con le seguenti parole: Nel caso di uno stato socialista, il metodo idoneo per determinare quali beni saranno prodotti sarebbe in generale analogo … a quello adottato nell’attuale ordinamento economico di libera impresa competitiva. (Taylor 1929:1)
Questa inattesa somiglianza nei sistemi di allocazione risulta dalle assunzioni di informazione completa e di contrattazione completa fatte dalla maggioranza dei partecipanti al dibattito. Se ognuno conoscesse le stesse cose (e se ciò che ciascuno conosce fosse proponibile in tribunale), e se non ci fossero altri impedimenti alla contrattazione, le differenze istituzionali conterebbero di meno. Abbiamo già incontrato l’affermazione di Samuelson (nell’epigrafe del capitolo 10) di equivalenza walrasiana tra imprese dirette dai lavoratori e imprese dirette dai capitalisti: se la contrattazione è completa, infatti, non conta chi è colui che assume e chi è colui che viene assunto (“who hires whom”). Questa equivalenza significa che per comprendere le differenze operazionali tra imprese convenzionali e imprese possedute dai lavoratori, come le cooperative del legno compensato menzionate nel capitolo 10, si dovrebbero analizzare i differenti problemi di incompletezza contrattuale cui vanno incontro e le differenti capacità che dimostrano nel risolverli. La stessa conclusione regge per confronti tra mercati e stati. Come risultato, le comparazioni rilevanti si verificano tra configurazioni istituzionali imperfette. Questa attenzione ai relativi vantaggi ed imperfezioni delle istituzioni difettose è segno distintivo dell’economia delle istituzioni di Ronald Coase e Oliver Williamson (1985) e risale a Pareto, che, immediatamente dopo aver mostrato l’equivalenza di allocazioni competitive e collettiviste in un modello altamente astratto, introdusse l’idea di costi di transazione: “Una seconda approssimazione terrà conto del costo di mettere in pieno funzionamento il meccanismo della libera competizione e confronterà questi costi con quelli necessari a fondare qualche altro meccanismo sociale che si potrebbe desiderare di testare” (Pareto 1896:500). Quale combinazione di mercato, stato e comunità sia di maggior successo nel rispondere a dati problemi di coordinamento dipende dalle sottostanti realtà tecnologiche e sociali che fanno sorgere l’interdipendenza tra gli attori. Per esempio, rendimenti fortemente crescenti in un processo di produzione rendono sia la
IL GOVERNO DELL’ECONOMIA
|13
produzione isolata, sia la competizione di mercato non solo inefficiente (poiché non è ammissibile fissare il prezzo pari al costo marginale), ma anche difficile da sostenere (a causa dei feedback positivi generati dai rendimenti crescenti e del risultante aspetto del processo competitivo per cui “il vincitore prende tutto” (winner-take-all)). Le istituzioni influenzano quattro aspetti delle interazioni economiche. In primo luogo, le istituzioni influenzano la distribuzione delle informazioni, il modo in cui le informazioni vengono acquisite, nascoste, condivise e usate per far rispettare i contratti. In secondo luogo, le istituzioni, in congiunzione con una data distribuzione di ricchezza, differiscono nelle modalità di assegnazione del diritto di controllo e del diritto al residuo tra coloro che partecipano ad un’interazione. In terzo luogo, istituzioni differenti e distribuzioni di ricchezza generano distinti pattern di conflitto di interesse tra i soggetti che partecipano alle transazioni. Infine, le istituzioni che governano una particolare interazione influenzeranno le preferenze e le convinzioni (belief) dei partecipanti. Una sintesi in pillole dell’argomento è la seguente: le differenze istituzionali hanno importanti conseguenze allocative quando esistono conflitti di interesse tra attori la cui interdipendenza non è governata da contratti completi. I fallimenti di coordinamento che sorgono in queste situazioni possono essere attenuati da istituzioni che realizzano uno o più dei seguenti desiderata. In primo luogo, possono allineare più attentamente i diritti di controllo e le rivendicazioni residuali in modo tale che gli individui possiedano i risultati delle loro azioni, riducendo il grado di interdipendenza effettiva. In secondo luogo, possono ridurre il conflitto di interesse riguardo agli aspetti non contrattabili di una transazione tra le parti coinvolte. In terzo luogo, possono ridurre l’entità o l’importanza delle informazioni private, consentendo la formulazione di contratti più completi e una contrattazione più efficiente. L’utilizzo di queste idee per confrontare le istituzioni (incluse le comunità) occuperà la parte rimanente del capitolo. Quali sono le distinte qualità di mercati, governi e comunità che potrebbero servire questi fini? L’apprezzamento di Adam Smith per il valore dei mercati competitivi è particolarmente moderno: i mercati rendono la collusione difficile quando la competizione è socialmente benefica. “Le persone che operano nello stesso commercio raramente” ha scritto “si incontrano anche per divertimento e distrazione, senza che la conversazione finisca in una cospirazione contro il pubblico; o in qualche raggiro per alzare i prezzi” (Smith 1937: 128). Se tali cospirazioni devono essere efficaci in una situazione di mercato, grandi numeri di partecipanti
14 | MICROECONOMIA
potenziali ed effettivi devono cooperare in ciò che è un Gioco dei Beni Pubblici. Come abbiamo visto nel capitolo 13, sostenere la cooperazione in queste situazioni per mezzo della minaccia di una successiva ritorsione e di strategie ad essa assimilabili diventa eccezionalmente difficile al crescere del numero dei partecipanti. Dunque, aumentando il numero dei “cospiratori” necessari ad influenzare i prezzi, i mercati competitivi impediscono la collusione in una situazione in cui la collusione non è socialmente benefica. La prima caratteristica interessante dei mercati è dunque un risultato delle interazioni non-cooperative che deriva dalle interazioni di grandi numeri. La competizione di mercato è il mezzo per indurre gli agenti a rendere pubbliche le informazioni private economicamente rilevanti che possiedono. Si dice spesso che nei mercati le persone votano con il loro denaro, il che è corretto se ciò che si vuol intendere non è che i mercati sono democratici, ma piuttosto che è costoso esprimere una preferenza in un sistema di mercato competitivo. Infatti, l’unico modo di manifestare una preferenza è effettuare un acquisto di mercato. Il prezzo al quale si è disposti ad acquistare il bene veicola ciò che altrimenti sarebbe un’informazione privata, ovvero che il bene vale almeno quanto il prezzo pagato. In modo simile, in una interazione di mercato è remunerativo rivelare una capacità produttiva e costoso falsificare i veri costi di produzione. In un equilibrio di mercato competitivo con rendimenti non crescenti, i produttori che massimizzano il profitto renderanno disponibili i beni al loro costo marginale di produzione, rivelando in tal modo un importante pezzo di informazione (che diversamente sarebbe privato). Chi “falsifica” le sue capacità produttive offrendo beni a prezzi non uguali al costo marginale otterrà profitti minori rispetto a chi vende ad un prezzo che veicola i veri costi. In effetti, la competizione di mercato trasforma il problema della determinazione del prezzo in un dilemma del prigioniero con n giocatori in cui n n produttori hanno un interesse comune nel ridurre il prodotto e nel “gonfiare il loro costi” fissando p > mc . Tuttavia, se n è grande, ciascuna impresa ha un incentivo a defezionare vendendo ad un prezzo migliore di quello dei suoi rivali, e rivela di conseguenza le sue vere condizioni di produzione. Al contrario dei mercati, nei sistemi centralizzati non di mercato i produttori hanno tipicamente un incentivo a non dichiarare per intero le loro capacità produttive per assicurarsi una minore quota produttiva. I consumatori in modo simile hanno un incentivo a dichiarare necessità maggiori di quelle reali per stabilire un diritto superiore su beni e servizi. La seconda caratteristica è la seguente. Quando il diritto al residuo e i diritti di
IL GOVERNO DELL’ECONOMIA
|15
controllo sono rigorosamente allineati, la competizione di mercato fornisce un meccanismo di disciplina che punisce gli inetti e ricompensa chi ha una performance elevata. I mercati sono un modo per accrescere ciò che i biologi chiamano pressione selettiva: hanno l’effetto di ridurre la varianza della performance e dunque (sotto idonee condizioni) aumentare la performance media. La differenza sostanziale osservata tra performance alte e basse (capitolo 2) suggerisce che il processo opera in modo imperfetto, ma anche che quando funziona davvero, gli effetti risultanti sulla produttività possono essere significativi. Questi handicap dei mercati sono connessi ai loro punti di forza. I mercati, si dice, impongono severi vincoli di bilancio agli attori rilevanti, ma lo fanno solo quando coloro che prendono le decisioni ne possiedono i risultati. Ad ogni modo poiché le opportunità contrattuali dipendono dalla ricchezza e per altre ragioni, diritto al residuo e diritti di controllo sono spesso disallineati; di conseguenza, il processo di disciplina non opera in modo efficace. Un lavoro ben fatto non necessariamente darà dei benefici ad un impiegato al quale è pagato un salario fisso. La chiusura di un impianto, per fare un altro esempio, eliminerà le rendite da lavoro di centinaia di lavoratori; ma non necessariamente punirà quelli responsabili delle perdite che hanno provocato la chiusura. Inoltre, anche quando il controllo sulle azioni non contrattabili e il diritto al residuo del flusso di redditi di un progetto sono unificati, le esternalità ambientali e altri effetti esterni estendono le conseguenze delle azioni prese dal soggetto che prende le decisioni ben oltre la portata dei contratti. Contrariamente ai mercati, gli stati possono attenuare i fallimenti del coordinamento per mezzo della loro abilità nel permettere agli individui di, e spesso nell’obbligarli a interagire in modo cooperativo in situazioni in cui le interazioni non cooperative sono inefficienti. Il vantaggio comparato dei governi è nella produzione di regole: solo gli stati hanno il potere di imporre l’osservanza universale delle regole che governano l’interazione degli agenti privati. Quando gli individui fronteggiano situazioni del tipo del dilemma del prigioniero o altri problemi di coordinamento in cui il perseguimento autonomo di obiettivi individuali conduce ad un risultato non desiderabile, lo stato può fornire o imporre il coordinamento necessario ad evitare questo risultato. I servizi che possono espletare i soli governi, e non invece le comunità e i mercati, includono la definizione, l’assegnazione e l’applicazione dei diritti di proprietà, la fornitura di beni pubblici, la regolamentazione degli effetti ambientali e di altri effetti esterni o spillover, la regolamentazione dei monopoli naturali, la fornitura di alcune forme di assicurazione, e la regolamentazione macroeconomica. Sono meno ovvi i casi che comportano la selezione di un equilibrio: quando esistono equilibri multipli, un singolo intervento dello stato può
16 | MICROECONOMIA
essere in grado di implementare l’equilibrio socialmente desiderabile. Basu e Van (1998), per esempio, mostrano che una singola proibizione del lavoro minorile potrebbe spostare un equilibrio che costituisce una specie di trappola della povertà e causare lo spostamento ad un altro equilibrio in cui i bambini e le loro famiglie sarebbero tutti in una condizione migliore. Lo stato affronta i dilemmi del prigioniero in maniera diametralmente opposta a quella dei mercati. I mercati competitivi ostacolano la formazione di cartelli e di altre forme di collusione fornendo incentivi alla defezione, mentre lo stato può indurre la cooperazione impedendo la defezione. Poiché sia la defezione sia la cooperazione sono desiderabili in circostanze differenti, i mercati e gli stati svolgono ruoli complementari nel risolvere i problemi di coordinamento. Gli stati prevengono la defezione obbligando alla partecipazione in quegli scambi che non sarebbero scelti volontariamente da agenti economici che agiscono separatamente – per esempio, cooperare nella situazione del dilemma del prigioniero. Questa capacità di obbligare all’obbedienza con la forza può contribuire alla soluzione dei problemi di coordinamento anche quando gli individui hanno informazioni che sono private e dunque inaccessibili allo stato. Un esempio riguardante la disponibilità di alcuni tipi di assicurazione illustra questo principio. Prima di aver appreso le posizioni, lo stato di salute e i rischi specifici che fronteggiano come individui, tutti i membri di una popolazione potrebbero preferire l’acquisto di un’assicurazione. Ma, dopo aver appreso la propria specifica posizione, quelli con una bassa probabilità di incassare dall’assicurazione non desidereranno acquistarla, poiché starebbero sovvenzionando quelli con un’alta probabilità di riscossione. Dunque le persone a basso rischio uscirebbero dal mercato e il prezzo delle assicurazioni sarebbe troppo alto per le persone ad alto rischio. Poiché prima di ottenere una specifica conoscenza della propria posizione di rischio tutti avrebbero voluto stipulare un’assicurazione, e poiché questa non è disponibile sul mercato, si verifica un chiaro fallimento del mercato. Fornendo l’assicurazione e obbligando tutti gli agenti a pagare per essa, lo stato supera questo fallimento del mercato. Altri esempi sono stati forniti nei capitoli precedenti. Nel capitolo 6 implementare il coprifuoco ottimo da un punto di vista sociale può richiedere che il decisore della città fissi un coprifuoco (e dunque lasciare che gli Zucconi (Deadhead) e i Dormiglioni (Sleepyhead) usino le loro informazioni private per mezzo di una contrattazione à la Coase al fine di attuare miglioramenti paretiani rispetto al coprifuoco imposto). Nel capitolo 9 abbiamo visto che partendo da un’assegnazione
IL GOVERNO DELL’ECONOMIA
|17
dei diritti di proprietà in un equilibrio competitivo, una redistribuzione di ricchezza imposta dallo stato potrebbe accrescere sia l’efficienza tecnica, sia quella paretiana. Si possono fare altri esempi meno ovvi: conferendo il diritto di contrattazione collettiva agli impiegati, potrebbero essere attenuati la fornitura insufficiente di comfort sul luogo di lavoro e le opportunità di utilizzo arbitrario del potere del lato corto illustrato nel capitolo 10. Lo stato, ad ogni modo, ha diverse debolezze come struttura di governance. La prima è la mancanza di accesso dei funzionari statali all’informazione privata posseduta dai produttori e dai consumatori. La seconda è l’immagine speculare della prima: la mancanza di accesso dei votanti e dei cittadini (assumendo una politica democratica) alle informazioni private possedute dai funzionari dello stato. In questo caso, l’agente (lo stato) deve render conto solo in senso debole ai principali (i cittadini). Si possono ugualmente applicare a questo caso le stesse argomentazioni che mostrano che le soluzioni di first-best sono generalmente inattuabili in relazioni del tipo principale-agente nello scambio privato. Il terzo difetto dello stato come struttura di governo è che non esiste un sistema ideale per prendere decisioni che siano vincolanti per grandi numeri di persone. Poiché non c’è nessun modo democratico coerente per aggregare le preferenze degli individui in criteri di scelta sociale coerenti, i risultati della regola della maggioranza e di altri meccanismi di voto dipendono criticamente da chi controlla l’ordine del giorno delle votazioni. Inoltre, diversamente dai mercati, gli schemi di voto hanno difficoltà nel rappresentare l’intensità delle preferenze per differenti beni o risultati sociali. Infine, quando l’intervento del governo frena i risultati di mercato, gli attori economici privilegiati dall’intervento ottengono delle rendite – i redditi al di sopra della loro miglior opportunità alternativa. Dunque i gruppi intraprenderanno un comportamento volto alla ricerca di rendite (rent-seeking), nel tentativo di indurre lo stato ad intervenire nel loro interesse piuttosto che in quello di un altro gruppo o del pubblico in generale, dunque sprecando risorse e distorcendo gli effetti delle politiche pubbliche. Come nel caso dei mercati, queste debolezze derivano dalle possibilità peculiari dello stato. Per potere esercitare azioni coercitive e allo stesso tempo prevenire l’opzione di uscita lo stato deve essere universale e indiscutibile in alcune sfere. Questa universalità dello stato rende difficile far sì che lo stato diventi responsabile costringendolo alla fornitura competitiva dei suoi servizi. Inoltre, l’incapacità degli schemi di voto di aggregare le preferenze in maniera coerente richiede che modalità non elettorali per influenzare il processo decisionale collettivo – incluse le attività dei gruppi di interesse – siano disponibili come correttivi. Tuttavia
18 | MICROECONOMIA
è difficile regolare l’attività di rent-seeking rivolta a questi processi non elettorali senza alterare le procedure democratiche. Naturalmente, gli stati possono essere resi più responsabili favorendo la competizione tra governi locali, altre agenzie pubbliche ed enti privati, assicurando la competizione tra parti autonome e le libertà civili in modo da promuovere il monitoraggio attento delle azioni dei funzionari statali, sottoponendo le posizione elettive e amministrative interne allo stato ad incentivi ben strutturati e limitando le azioni dello stato a quelle che non possono essere regolate in maniera maggiormente responsabile da qualche altra struttura di governo.
IL
GOVERNO DELLA COMUNITÀ
Per Marx ed altri modernisti del diciannovesimo secolo, la “comunità” era l’antitesi del mercato che rappresentava un residuo anacronistico dell’era feudale, destinato ad essere spazzato via dai requisiti del progresso economico o, per dirla con Marx ed Engel (1972:475), dall’“acqua fredda del calcolo egotista.” Il carattere inerziale del governo di una comunità fu confermato dagli storici dell’economia che, come Marx, hanno indicato le restrizioni poste all’iniziativa individuale e i diritti di proprietà scarsamente definiti associati al processo decisionale richiesto dal sistema agricolo dei campi aperti che prevalse in Inghilterra e in molte parti dell’Europa dell’epoca moderna. Secondo questa visione, la produttività agricola fu frenata fino a quando le terre comuni furono recintate e assegnate a proprietari privati, come nell’Inghilterra del tardo diciottesimo secolo. Tuttavia, questo principio fondamentale dell’insegnamento economico è stato superato dagli storici dell’economia della scorsa generazione che hanno applicato metodi quantitativi. Uno dei principali appartenenti a questa nuova letteratura, Robert Allen (2000:43, 50) scrive:
I campi aperti furono un’istituzione efficiente nel soddisfare i bisogni dei contadini coltivatori di grano su piccola scala. Questi bisogni includevano la diversificazione…del rischio …e una crescente produttività agricola… Le recinzioni (enclosures) non spiegano né il vantaggio di produttività di cui l’Inghilterra ha goduto rispetto ad altri paesi nel 1800 né l’aumento di efficienza che si è verificato sin dal medio evo.
Le comunità che governavano il sistema dei campi aperti usavano le informazioni locali e la pressione tra consimili per promuovere l’innovazione e risolvere i problemi allocativi che sorgevano attraverso l’inevitabile interdipendenza degli agricoltori. Al contrario degli agricoltori del Palanpur la cui incapacità di coordinare una semina ottimale anticipata del loro raccolto ha ispirato l’introduzione del capitolo 1, a Taston in Inghilterra, nel 1703 “ogni anno il primo giorno tre braccianti venivano scelti per stabilire le date in cui [il raccolto] sarebbe stato seminato, quando gli animali dovessero pascolare e l’imposizione delle scorte di mantenimento” (Allen 2000:58).
IL GOVERNO DELL’ECONOMIA
|19
Recenti ricerche storiche hanno anche dimostrato l’importanza di un governo basato sulla comunità nel gestire i problemi di incentivo associati a contratti di credito incompleti nel settore delle banche nella Germania del diciannovesimo secolo (Banerjee, Besley, e Guinnase 1994). Il governo basato sulla comunità gioca un ruolo centrale in molti settori dell’economia moderna, dallo sviluppo e distribuzione dei software open source al ruolo dei network etnici nella raccolta e nell’allocazione di credito tra i proprietari di motel negli Stati Uniti. Dunque, ben lontano dall’essere una traccia residua del passato, il governo della comunità è sopravvissuto per merito della sua capacità di attenuare i problemi di incentivo che sorgono nelle economie contemporanee. Le comunità talvolta risolvono i problemi che sia gli stati sia i mercati riescono malamente ad affrontare, specialmente quando la natura delle interazioni sociali o i beni ed i servizi scambiati precludono la completezza contrattuale. Una comunità effettiva monitora il comportamento dei suoi membri, dunque rendendoli responsabili delle loro azioni. Grazie ad informazioni private disperse che spesso non sono disponibili a stati, imprenditori, banche e altre grandi organizzazioni formali, il governo della comunità applica ai membri ricompense e punizioni a seconda della loro aderenza o della loro deviazione dalle norme sociali. Al contrario di stati e mercati, le comunità effettivamente favoriscono e utilizzano gli incentivi che le persone hanno tradizionalmente dispiegato per regolare la loro attività comune: fiducia, solidarietà, reciprocità, reputazione, orgoglio personale, rispetto, vendetta e punizione, tra gli altri. Diversi aspetti delle comunità spiegano le loro capacità peculiari quali strutture di governo. Primo, in una comunità la probabilità che i membri che interagiscono oggi interagiscano anche in futuro è elevata. Dunque c’è un forte incentivo ad agire nel presente in modi socialmente benefici per evitare ritorsioni in futuro. Secondo, la frequenza delle interazioni tra membri di una comunità diminuisce il costo e aumenta i benefici associati con la maggiore scoperta di caratteristiche, comportamenti recenti, e probabili azioni future degli altri membri. Più facilmente vengono acquisite e più ampiamente sono disperse queste informazioni, più i membri della comunità avranno un incentivo ad agire in modi che risultano in effetti collettivamente benefici. Terzo, le comunità superano i problemi di free-riding, poiché i membri puniscono direttamente i comportamenti antisociali. Nei lavori di squadra, nelle associazioni di credito, nelle partnership, nelle situazioni di beni comuni locali e nel vicinato residenziale il monitoraggio e la punizione da parte dei compagni sono spesso mezzi effettivi per attenuare i problemi di incentivo che sorgono quando le azioni individuali che influenzano il benessere degli altri non sono soggette a contratti che
20 | MICROECONOMIA
possono essere fatti rispettare. Ma come potrebbero le comunità far osservare tali norme in assenza di un apparato giuridico statale? Si ricordi che Alchian e Demsetz (1972) suggeriscono che il diritto al residuo dovrebbe essere assegnato ad un individuo incaricato di monitorare gli input dei membri del team in modo da fornire incentivi per l’attività stessa (non contrattabile) di monitoraggio, eliminando allo stesso tempo l’incentivo dei membri al free-riding per mezzo della minaccia di licenziamento da parte del monitorante. (Abbiamo spiegato nel capitolo 10 le assunzioni sottese a questo argomento). Un’altra soluzione ben conosciuta è fornita da Hölmstrom (1982), che propone un modello di relazione tra un principale e una molteplicità di agenti nel quale l’efficienza o la quasi efficienza è raggiunta per mezzo di contratti che conferiscono ai singoli membri di una squadra il diritto al residuo sugli effetti delle loro azioni senza attribuire loro la proprietà dei diritti. La soluzione di Hölmstrom non è, ad ogni modo, attuabile quando ci sono significative influenze stocastiche sul livello della performance della squadra, i membri del team si trovano in una situazione di limitata ricchezza e i mercati del capitale e delle assicurazioni sono imperfetti. Queste spiegazioni sono accomunate dal fatto che gli individui sono considerati come auto-interessati. Al contrario, molti scienziati comportamentali al di fuori dell’economia hanno cercato di spiegare le comunità come relazioni di altruismo, affetto e altre motivazioni non auto-interessate. Molti di questi approcci, ad ogni modo, hanno trattato la comunità organicamente senza investigare se le abilità nella soluzione dei problemi attribuite alle comunità sono coerenti con il fatto che i singoli membri stanno perseguendo il proprio interesse (sia esso autointeressato o no). Come risultato, alcune trattazioni – come quella di Marx – rappresentano il governo basato sulla comunità come un anacronismo fondato su abitudini comportamentali collettiviste che avrebbero subito l’erosione del tempo e sarebbero state sostituite dalla scelta individuale. Ad ogni modo abbiamo visto nei capitoli 3 e 4 che le motivazioni di reciprocità, la vergogna, la generosità e altre preferenze sociali possono fornire le fondamenta comportamentali per un modello di monitoraggio reciproco che sia esente da questi difetti. L’esperimento dei beni pubblici con punizione e il corrispondente modello indicano che sotto circostanze istituzionali favorevoli e con un numero sufficiente di membri motivati dalle preferenze sociali, possono essere sostenibili elevati livelli di fornitura di beni pubblici.
IL GOVERNO DELL’ECONOMIA
|21
Come i mercati e i governi, anche le comunità falliscono. I contatti personali e durevoli che caratterizzano le comunità richiedono che queste ultime siano di dimensione relativamente piccola. Quindi, una preferenza per trattare con i membri della propria comunità spesso limita la loro capacità di sfruttare i guadagni derivanti dal commercio su base più ampia. Inoltre, la tendenza delle comunità ad essere relativamente omogenee può rendere impossibile raccogliere i benefici della diversità economica associata con forti complementarità tra differenti abilità e altri input. Nessuna di queste limitazioni è insormontabile. Scegliendo le informazioni, l’equipaggio e le abilità, per esempio, i pescatori giapponesi (menzionati sopra) hanno sfruttato economie di scala non attuabili da gruppi meno cooperativi, e hanno raccolto benefici sostanziali dalla diversità dei talenti presente tra i membri. In modo simile, la cooperazione nel network degli affari sociali in ciò che viene definita “la terza Italia” assieme ai governi locali associati a tali network permette, in modo diversamente inattuabile, alle piccole imprese di beneficiare di economie di scala nel marketing, nella ricerca e nella formazione, permettendo la loro sopravvivenza nella competizione con imprese giganti. Tuttavia, confrontato con la burocrazia e il mercato, che si specializzano nel trattare con gli sconosciuti, il limitato raggio delle comunità spesso impone costi inevitabili. Un secondo fallimento delle comunità è meno ovvio. Quando l’appartenenza al gruppo è il risultato delle scelte degli individui anziché delle decisioni del gruppo, è probabile che la composizione del gruppo sia più omogenea culturalmente e demograficamente rispetto a quanto qualsiasi membro vorrebbe, dunque privando le persone di forme di diversità alle quali queste attribuiscono un valore. Il modello della segregazione residenziale presentato nel capitolo 2 mostrava che se gli individui si raggruppano in comunità, ci sarà una forte tendenza per le comunità alla segregazione razziale, anche se questo è un risultato che nessun individuo preferisce. In casi analoghi, le comunità integrate costituirebbero una realtà migliore per tutti, ma si dimostrerebbero insostenibili se gli individui fossero liberi di muoversi. Quando le distinzioni tra membri e non membri sono effettuate su fondamenti che creano divisioni o che sono moralmente ripugnanti quali la razza, la nazionalità, o il genere, il governo della comunità, può contribuire più a favorire una ristretta mentalità provinciale e l’ostilità etnica che a risolvere i fallimenti di stato e mercati. Il problema è endemico. Le comunità funzionano perché riescono bene ad imporre l’osservanza delle norme; se ciò sia cosa buona dipende da quali siano le norme. La recente resistenza all’integrazione razziale dei residenti bianchi di Ruyterwacht (vicino a Cape Town) è un esempio estremamente interessante di azione del capitale sociale (Jung 2001). E’ ancora più straordinario lo studio di Dov Cohen (1998) delle
22 | MICROECONOMIA
differenze regionali negli Stati Uniti riguardante la relazione tra violenza e stabilità della comunità. Nisbett e Cohen (1996) hanno descritto una “cultura dell’onore” che spesso trasforma gli insulti e le discussioni pubbliche in combattimenti mortali tra uomini bianchi nell’ovest e nel sud degli Stati Uniti, ma non nel Nord. La ricerca di Cohen conferma che nel nord gli omicidi derivanti da discussioni sono meno frequenti in aree con elevata stabilità residenziale, misurata dalla frazione di persone che vivono nella stessa casa e nella stessa contea per un periodo di più di cinque anni. Tuttavia questa relazione risulta invertita nel sud e nell’ovest, essendo la stabilità residenziale positivamente e significativamente collegata alla frequenza di questi omicidi dove la cultura dell’onore è forte. Dunque, per una qualche serie di problemi di governo, le comunità contribuiscono ai desiderata delineati sopra: allineare il controllo e il diritto al residuo per mezzo della punizione di coloro che infliggono costi ad altri membri del gruppo; rendere l’informazione meno privata per mezzo di incentivi alla formazione di una reputazione tramite un comportamento coerente; ridurre il grado di conflitto di interesse rispetto agli aspetti non contrattabili dello scambio fornendo regole di divisione e altre norme in grado di funzionare anche quando i diritti di proprietà non sono ben definiti. Queste ragioni possono spiegare perché le comunità, a lungo ignorate dagli scienziati sociali in quanto residui anacronistici di un’era passata, non sono state offuscate dai mercati e dallo stato. L’abilità delle comunità nel risolvere i problemi di coordinamento dipende dalle tipologie di diritti di proprietà in vigore e dalla loro distribuzione tra la popolazione. Quando i membri di una comunità non sono titolari del diritto al residuo dei risultati delle loro azioni, ci può essere uno scarso incentivo ad impegnarsi nelle forme di sanzione e di costruzione di una reputazione che abbiamo sottolineato. Nei quartieri di Chicago che abbiamo menzionato all’inizio, per esempio, dove la maggioranza dei residenti erano locatari piuttosto che proprietari di un appartamento, l’efficacia collettiva era significativamente inferiore. Questo può essere dovuto al fatto che, se alcuni membri di un gruppo sono molto più benestanti rispetto ad altri, le norme condivise possono essere difficili da rispettare, e la punizione di azioni non cooperative può mancare di efficacia o credibilità. Per ragioni simili, le capacità distintive delle comunità dipendono dall’assegnazione dei diritti di proprietà e dalle opzioni esterne. Le comunità non sono in questo diverse dai mercati. Il vantaggio in termini di efficienza allocativa della decentralizzazione dei diritti di controllo (l’uso estensivo dei mercati o di altri sistemi di governo fondati sulla comunità) risiede nel mettere il
IL GOVERNO DELL’ECONOMIA
|23
processo decisionale nelle mani di coloro che hanno informazioni rilevanti che altri non possiedono. Perché ciò offra dei benefici, i detentori delle informazioni private devono essere titolari del diritto al residuo dei risultati delle loro azioni. Dal punto di vista dell’efficienza, la decentralizzazione agli individui per mezzo dell’utilizzo del mercato è favorita rispetto alla decentralizzazione alle comunità nei casi in cui i contratti sono relativamente completi e possono essere fatti rispettare ad un basso costo, e dunque nei casi nei quali gli interessi possono essere in conflitto senza generare fallimenti del coordinamento. La decentralizzazione alle comunità è preferita quando la redazione di contratti completi è preclusa, ma bassi livelli di conflitto di interesse all’interno della comunità e altri aspetti della struttura della comunità facilitano la trasmissione di informazioni private e monitoraggio reciproco tra membri della comunità. William Ouchi (1980) suggerisce che, quando non sono possibili né contratti completi né un’informale osservanza delle norme fondata sulla comunità, e quando i conflitti di interesse sono significativi, si ottiene come risultato un’organizzazione burocratica, di cui le moderne imprese convenzionali sono un esempio. Thomas Schelling (1960:20) espresse la stessa idea in modo più colorito: Quando la fiducia e la buona fede mancano e non c’è nessun ricorso legale per la violazione di un contratto . . . possiamo desiderare di chiedere consiglio all’oltretomba, o all’antico dispotismo, su come funzioni il prendere accordi.
La maggioranza delle interazioni economiche sono governate da un insieme eterogeneo di regole formali ed informali che riflettono gli aspetti dei mercati, degli stati e delle comunità. Alcune combinazioni funzionano meglio di altre.
C O M P L E M E N TA R I E T À
I S T IT U Z I O N A L I
ED
E F F E T TO
DI
S P IA Z Z A M E N TO
Per concretezza inizieremo presentando due esempi. I pescatori di aragoste sulla costa del Maine hanno regolamentato per decenni la loro pesca limitando l’accesso ad un definito territorio di pesca. Solo a coloro che appartengono ad una particolare cosiddetta “gang del porto” – il gruppo di persone che sono state nominate “membri” e che pescano da un particolare porto – è concesso per costume locale di gettare le reti ad imbuto nel territorio di pesca (Acheson 1988). Chi viola i confini è facile che ritrovi le proprie boe tagliate dalle loro reti che sono dunque impossibili da localizzare. Gli invasori sono stati attaccati. La violazione dei regolamenti ambientali o la violazione delle regole della gang vengono anche sanzionate da altri membri della gang. In anni recenti, lo stato del Maine ha formalizzato il sistema delle gang riconoscendo i territori delle “gang del porto” e istituendo consigli democraticamente eletti con il potere di regolamentare il numero
24 | MICROECONOMIA
di trappole e il numero di giorni di pesca. I funzionari statali intervengono occasionalmente quando i conflitti eccedono le capacità di enforcement delle comunità locali, come fecero nel 1920 di fronte ad un semi-collasso dell’industria della pesca, o quando c’è un’escalation di violenza tra gruppi. Tuttavia, lo stato impiega solo sei funzionari per far rispettare la legislazione ambientale lungo tutte le 4342 miglia di costa e per controllare la pesca di 6800 pescatori di aragoste. In anni recenti, i rendimenti della pesca sono cresciuti e i pescatori di aragoste hanno prosperato. La relazione tra le “gang del porto” e lo stato del Maine costituisce un esempio di complementarietà istituzionale. L’efficacia dei regolamenti dello stato è enormemente incrementata dalla sorveglianza informale da parte delle gang, mentre l’efficacia delle gang è rafforzata dalla disponibilità dello stato come autorità coercitiva di ultima istanza. Un altro esempio di complementarietà istituzionale è dato dagli effetti simbiotici fra sindacati (controllo dell’impegno sul luogo di lavoro) e regolamentazione macroeconomica (che riduce la volatilità della domanda di lavoro) nel rafforzare le contrattazioni di salario ed impegno che provocano un miglioramento paretiano delle quali è stato presentato un modello nel capitolo 8. La cattiva gestione delle foreste dell’Himalaya dei distretti di Kamaun e Garhwal in Uttar Pradesh, in India, fornisce un esempio in netto contrasto con il successo delle “gang del porto”. Prima del ventesimo secolo, ampi e ben definiti tratti di foresta venivano considerati proprietà esclusiva di ciascun villaggio. L’accesso era regolamentato dai panchayats del villaggio; se stranieri non autorizzati avessero rimosso i prodotti della foresta, poteva aversi un combattimento o l’imposizione di multe. Fino a quel periodo la gestione del patrimonio boschivo è stata simile alla regolamentazione decentralizzata delle “gang del porto” del Maine. Durante la prima guerra mondiale l’amministrazione coloniale britannica prese il controllo della gestione del patrimonio boschivo, cercando di soddisfare la domanda di traversine per i binari del treno e altri prodotti del legno. L’intervento coloniale sovvertì il regolamento delle comunità locali e provocò proteste incendiarie che distrussero grandi boschi di conifere. Il governo, come ripiego, consentì l’accesso alle foreste di minor valore a “tutti i residenti in bona fide di Kumaun”, dunque cancellando i confini tradizionali delle foreste dei villaggi e rendendo la regolamentazione locale virtualmente impossibile. Per esempio, nel 1932 un gruppo di abitanti del villaggio di Papdev proibì al villaggio loro vicino, Jeet Lal, di mietere l’erba della foresta, perché non aveva contribuito alla costruzione delle recinzioni di protezione dell’erba. Jeet Lal portò in tribunale i suoi vicini e loro vennero multati. La decisione fu confermata in appello perché, secondo i nuovi regolamenti, Jeet Lal aveva un diritto incondizionato di accesso.
IL GOVERNO DELL’ECONOMIA
|25
La distruzione da parte del governo della capacità della comunità di regolamentare l’accesso è un’illustrazione dell’opposto della complementarietà istituzionale, ovvero, l’effetto di spiazzamento istituzionale (institutional crowding out). Questo si verifica quando la presenza di un’istituzione compromette il funzionamento dell’altra. Un altro esempio di spiazzamento viene dal vicino Palanpur (sempre in Uttar Pradesh) dove l’estensione del mercato del lavoro (e l’aumentata mobilità geografica) sembra aver ridotto i costi di uscita e di conseguenza il valore della reputazione individuale, con l’effetto che l’azione informale di applicazione coercitiva dei contratti di prestito è stata indebolita (Lanjouw e Stern 1998:570). L’imposizione di multe per scoraggiare i ritardi nelle scuole materne di Haifa (capitolo 3) è un altro esempio di effetto di spiazzamento: utilizzare un meccanismo di mercato (la multa) sembra aver attenuato il senso di obbligazione personale dei genitori che suggeriva di non arrecare disturbo agli insegnanti. Gli esperimenti confermano che lo spiazzamento può essere un problema comune. Per esplorare gli effetti degli incentivi espliciti, Fehr e Gaechter (2000a) hanno progettato un gioco di scambio di doni in cui il principale (il datore di lavoro) propone un’offerta salariale con un livello di impegno stipulato dalla parte dell’agente (il lavoratore). L’agente può quindi scegliere un livello di impegno, con costi crescenti nell’impegno. Nel trattamento con “fiducia”, l’interazione termina, mentre nel trattamento con “incentivo”, dopo che l’agente ha selezionato un livello di impegno, il datore di lavoro può multare il lavoratore se pensa che il livello di impegno del lavoratore sia inadeguato. Al contrario del trattamento con fiducia, il trattamento incentivante collega il pagamento alla performance e quindi rappresenta un contratto più completo. In questo esperimento, il surplus totale derivante dall’interazione è dato dai profitti del principale, più il salario dell’agente, meno il costo dell’impegno (e della multa, quando è applicabile). Nel trattamento con fiducia un individuo auto-interessato sceglierebbe il livello minimo ammissibile di impegno indipendentemente dall’offerta salariale del principale e, anticipando questo, un principale auto-interessato offrirebbe il salario minimo. I soggetti sperimentali non si sono conformati a questa aspettativa: i datori di lavoro hanno fatto offerte davvero generose e il livello di impegno dei lavoratori è stato fortemente condizionato da queste offerte, essendo gli elevati livelli salariali ricambiati con un alto livello di impegno. L’introduzione di incentivi espliciti aveva invece effetti drammatici: il livello di impegno medio degli agenti era sostanzialmente più basso. Solo per offerte salariali veramente basse gli incentivi espliciti riuscivano a ottenere livelli (marginali) più alti di impegno. Per offerte salariali relativamente generose, l’impegno profuso con incentivi espliciti era circa un terzo del livello
26 | MICROECONOMIA
presente in loro assenza. L’esperimento è stato costruito in modo tale che se i soggetti avessero risposto in modo ottimale sulla base di preferenze auto-interessate, il surplus nel trattamento incentivante sarebbe stato più di due volte superiore rispetto al trattamento con fiducia. Tuttavia, il surplus totale era del 20 percento più elevato nel trattamento con fiducia in quei casi in cui il principale offriva un contratto tale che la multa attesa nel caso in cui il lavoratore fosse sorpreso con le mani in mano eccedeva il costo del lavoro (in modo tale che la condizione di impegno del lavoratore fosse soddisfatta) e del 53 percento quando il contratto del principale non rispettava la condizione per cui il lavoratore si impegna sul lavoro. Un risultato sorprendente di questo esperimento emerge se confrontiamo la distribuzione del surplus nel trattamento con fiducia e nel trattamento incentivante. Nel trattamento incentivante (confinando la nostra attenzione ai casi in cui il contratto del principale soddisfaceva la condizione di impegno), i profitti sono più di due volte più elevati rispetto ai profitti nel trattamento fiduciario, mentre i payoff netti dell’agente sono meno della metà. Il trattamento incentivante ha permesso ai datori di lavoro di risparmiare in termini di costi salariali abbastanza da compensare le riduzioni nell’impegno sul lavoro. Riassumendo il risultato, Fehr e Gaechter (2000a: 17) scrivono, “le opportunità di incentivo nel trattamento incentivante permettono ai principali di aumentare i loro profitti relativamente al trattamento con fiducia, ma … ciò è associato ad una perdita di efficacia.” Risultati simili sono stati ottenuti in un esperimento sul campo in Colombia condotto da Juan Camino Cardenas (Cardenas, Stranlund, e Willis 2000). L’esperimento, i cui soggetti sperimentali erano dei contadini, era una variante del gioco dei beni pubblici, e catturava la logica di un problema di estrazione di risorse comuni – il degrado di una vicina foresta. In assenza di incentivi espliciti i soggetti hanno selezionato livelli di estrazione non molto lontani dall’ottimo sociale e di molto inferiori al livello associato all’equilibrio di Nash basato sull’ottimizzazione individuale con preferenze auto-interessate. Ma quando è stato introdotto il monitoraggio dei livelli di estrazione dei soggetti (da parte dello sperimentatore) e la prospettiva di una multa per eccesso di estrazione, i soggetti hanno estratto di più, anziché di meno. Dopo pochi round, i loro livelli di estrazione approssimavano quelli dell’equilibrio di Nash (tenendo conto della multa). Come la multa imposta ai genitori in ritardo di Haifa, l’effetto di un “miglioramento” della struttura degli incentivi apparentemente è stato quello di ridurre la rilevanza delle motivazioni eterointeressate che erano all’opera in assenza degli incentivi.
IL GOVERNO DELL’ECONOMIA
|27
Un ultimo esperimento può fornire qualche intuizione sul funzionamento dell’effetto di spiazzamento (Frohlich e Oppenheimer 1995). I soggetti sperimentati giocavano dei giochi dei beni pubblici con cinque persone sotto due condizioni: un gruppo ha giocato il gioco standard del contributo e l’altro ha giocato un gioco modificato (per tenere conto del “velo di ignoranza”) nel quale l’assegnazione casuale dei payoff ha reso ottimale il contributo dell’ammontare massimale di bene pubblico. A metà dei soggetti (in ciascun trattamento) fu concesso di discutere prima di ciascuna giocata (naturalmente, la discussione non avrebbe dovuto avere alcun effetto sul risultato del gioco standard, in quanto la strategia dominante è non contribuire). Dopo otto round di gioco, sono stati effettuati otto round, questa volta con gli stessi gruppi, e ciascuno ha giocato il gioco standard. Tra quelli cui era stato permesso di discutere, quelli che avevano sperimentato un gioco (del velo di ignoranza) compatibile con gli incentivi hanno contribuito in modo significativamente inferiore negli otto round finali, e (in successivi questionari) hanno espresso minori preoccupazioni rispetto a questioni di giustizia. La spiegazione degli autori è che il meccanismo compatibile con gli incentivi ha ricompensato quelli che contribuivano al bene pubblico, dunque rendendo l’interesse personale una buona guida per l’azione, mentre coloro che hanno sperimentato il gioco standard hanno guadagnato payoff elevati solo nella misura in cui hanno fatto leva su considerazioni di giustizia come motivazioni distinte tra i loro compagni di gruppo. Gli autori concludono: Il fallimento … del meccanismo [compatibile con gli incentivi] nel porre i soggetti di fronte ad un dilemma etico sembra portare ad un misero o inesistente apprendimento del comportamento etico nel periodo successivo… E’ un’istituzione, come altri meccanismi compatibili di incentivo, che può generare risultati vicini all’ottimo… Comunque, dal punto di vista etico, non è soltanto un insuccesso per quanto riguarda il comportamento che ne consegue; sembra essere effettivamente dannoso. Indebolisce il ragionamento etico e i comportamenti eticamente motivati. (Frohlich e Oppenheimer 1995:44)
Fehr e List (2004) hanno offerto una differente interpretazione degli incentivi controproducenti trovati nei loro esperimenti con gli uomini d’affari in Costa Rica. Hanno trovato che il più alto livello di affidabilità si otteneva quando al principale era permesso di multare l’agente per un comportamento non affidabile, ma questi si rifiutava di usarlo, evidentemente un segnale di un comportamento fiduciario da parte del principale che era ricambiato dall’agente. Al contrario “minacce esplicite di penalizzare la mancanza di impegno avevano l’effetto opposto, inducendo un comportamento meno affidabile”. Essi concludono che: “il messaggio psicologico veicolato dagli incentivi – siano essi percepiti come benevoli o ostili – ha importanti effetti comportamentali.”
28 | MICROECONOMIA
Esperimenti condotti da psicologi hanno dimostrato condizioni sotto le quali le ricompense estrinseche (per utilizzare la loro terminologia), quali il pagamento monetario per l’esecuzione di un compito, possono diminuire le motivazioni intrinseche individuali nel portare a termine quel compito (Deci, Koestner, e Ryan 1999). Questi effetti di spiazzamento si manifestano per compiti interessanti piuttosto che per quelli noiosi e quando la ricompensa è attesa in anticipo e strettamente legata all’esecuzione del compito. Si può concludere che il pagamento basato sulla performance nei luoghi di lavoro diminuisce le motivazioni dell’impiegato nell’esecuzione di compiti che all’inizio considera intrinsecamente interessanti o stimolanti. Tuttavia le prove sono anche coerenti con l’attribuzione di un ruolo importante degli incentivi espliciti (estrinseci) nel motivare gli individui ad eseguire compiti rispetto ai quali hanno un basso interesse intrinseco (ovvero, la maggioranza dei lavori nell’economia moderna).
C O N C L U S IO N I : L ’ E R R O R E
DI
M A N D E V IL L E
La teoria dell’implementazione è una branca dell’economia che studia i modi in cui contratti che preservano l’autonomia privata e regole di decisione – in breve, le costituzioni - possono portare gli individui con preferenze auto-interessate ad implementare (come equilibrio di Nash) un risultato che non è voluto da nessuno degli individui partecipanti, ma che in qualche misura ha un valore sociale. I metodi della teoria contemporanea dell’implementazione sono nuovi, ma l’idea risale alla congettura radicale di Mandeville (nell’epigrafe del capitolo 2) secondo cui le interazioni potrebbero essere strutturate in modo che “il peggiore di tutta la Moltitudine faccia qualcosa per il Bene Comune.” L’obiettivo di sfruttare motivazioni ordinarie per fini elevati è stato centrale nel pensiero costituzionale sin dall’epoca. Si ricordi che David Hume (nell’epigrafe del capitolo 3) ha proposto la massima “nell’architettare qualsiasi sistema di governo… si dovrebbe presupporre che ogni uomo sia un delinquente e che non abbia altro fine, in tutte le sue azioni, diverso dal suo interesse privato”. Tuttavia, gli esempi sopraesposti di complementarietà istituzionale e di
spiazzamento suggeriscono che l’efficacia delle politiche e delle leggi deve dipendere non solo dalla loro capacità di utilizzare fini egoistici per propositi sociali, ma anche dalle preferenze che inducono o richiamano. Albert Hirschman (1985: 10) ha puntualizzato che gli economisti propongono di relazionarsi con comportamenti antietici o antisociali aumentando il costo di quei comportamenti piuttosto che indicando standard e imponendo proibizioni e sanzioni. La ragione è probabilmente che pensano ai cittadini come consumatori con gusti che non cambiano o cambiano in modo arbitrario negli affari civici così come nel comportamento legato alle merci… Uno dei principali propositi di leggi e regolamenti pubblicamente
IL GOVERNO DELL’ECONOMIA
|29
proclamati è stigmatizzare i comportamenti antisociali e dunque influenzare i valori dei cittadini e i codici comportamentali.
Come abbiamo appena visto, aumentare il costo di un comportamento antisociale e altri sistemi espliciti basati sugli incentivi possono effettivamente provocare dei danni. Esiste dunque un analogo del secondo teorema dell’economia del benessere riferito alle norme: quando i contratti sono incompleti (e dunque le norme possono essere importanti nell’attenuare i fallimenti del mercato), i mercati che approssimano in maniera migliore una contrattazione completa idealizzata possono esacerbare il sottostante fallimento del mercato (indebolendo le norme di valore sociale quali la fiducia e la reciprocità) e possono risultare in una allocazione di equilibrio meno efficiente. Una costituzione per delinquenti può produrre delinquenti. Il fatto che le istituzioni e le preferenze coevolvono suggerisce un’importante (anche se difficile) estensione della teoria dell’implementazione e una modificazione della massima di Hume. Nel cercare di attuare un risultato socialmente desiderato, si dovrebbe verificare che le preferenze necessarie ad implementare tale risultato siano sostenibili in presenza delle politiche, contratti, o regole usate nell’implementazione. Il problema è più difficile di quello che Hume ha suggerito, non solo perché le preferenze sono endogene, ma anche perché, come abbiamo visto nel capitolo 3, le popolazioni sono eterogenee e gli individui versatili. Il problema, allora, non è trovare una via per indurre una popolazione omogenea con individui auto-interessati ad implementare un risultato socialmente desiderabile. Piuttosto, è ideare delle regole tali che in casi in cui la cooperazione sia socialmente desiderabile, gli individui con preferenze etero-interessate abbiano l’opportunità di esprimere la loro prosocialità con modalità che inducano tutti o la maggioranza a cooperare, come negli esperimenti sui beni pubblici con punizione discussi nel capitolo 3. E il compito è esattamente opposto in situazioni in cui la competizione piuttosto che la cooperazione è essenziale per ottenere risultati che abbiano valore sociale. Fornire una consulenza pratica sul modo in cui ciò potrebbe essere fatto è una delle sfide maggiori degli studi contemporanei sulle istituzioni e i comportamenti economici. La moderna microeconomia ha dimostrato l’importante contributo che diritti di proprietà ben definiti possono apportare nell’accogliere questa sfida. Nella sua Nobel Prize lecture Ronald Coase ha espresso questa posizione succintamente: E’ ovviamente desiderabile che questi diritti siano assegnati a coloro che li possono usare nel modo più produttivo e con incentivi che li portino a fare in questo modo e che, per scoprire (e mantenere) una tale distribuzione di diritti, i costi del loro trasferimento siano mantenuti bassi dalla trasparenza della legge e dal fatto di rendere i requisiti legali di tali trasferimenti meno onerosi. (Coase 1992:718)
Tuttavia, la moderna microeconomia mostra anche che diritti di proprietà ben
30 | MICROECONOMIA
definiti e facilmente trasferibili non sono concretamente attuabili in importanti situazioni dell’interazione economica – nei mercati del credito e del lavoro, nelle relazioni di vicinato, nell’aderenza a norme che hanno un valore sociale, incluse le prescrizioni di legge, e nella produzione e distribuzione delle informazioni, per esempio. In questi casi, il governo può contribuire alla performance economica per mezzo di un’assegnazione diretta dei diritti di proprietà, piuttosto che semplicemente facilitando lo scambio privato. La frase di Robert Frost “buone recinzioni fanno buoni vicini” è l’epigrafe del capitolo intitolato “Capitalismo Utopico”. Tuttavia la posizione del poeta del New England era abbastanza opposta, poiché egli sosteneva che l’accettazione da parte del suo vicino bisbetico di ben definiti diritti di proprietà non potesse essere garantita. Di seguito alcuni versi della poesia: Dice solamente “buone recinzioni fanno buoni vicini.” …Perché fanno buoni vicini? Non era lì Che stavano le mucche?... Prima di costruire un muro m’informerei per sapere Cosa muro dentro e cosa muro fuori, e chi probabilmente offenderei. C’è qualcosa che non ama un muro, che lo vuole abbattere. Si muove nell’oscurità così come sembra a me, non del solo bosco e dell’ombra degli alberi. E gli piace il suo pensiero così bene Dice ancora, “Buone recinzioni fanno buoni vicini.” (Frost 1915:11 – 13) Il buon vicinato può essere necessario quando le buone recinzioni falliscono. Da Mandeville ad Arrow e Debreu, i pensatori dell’economia hanno cercato di ideare diritti di proprietà e altre regole che inducano individui auto-interessati ad implementare risultati aggregati socialmente desiderabili. Di particolare interesse è stato interrogarsi sotto quali condizioni lo scambio competitivo di diritti di proprietà ben definiti tra individui auto-interessati si risolve in un risultato che è in qualche senso ottimale. Alla luce dell’importanza dell’interesse personale nelle motivazioni umane, le intuizioni prodotte da questa tradizione di tre secoli sono un importante contributo alla scienza e alla politica pubblica. Tuttavia, come ora sappiamo grazie al teorema fondamentale, la mano invisibile richiede una contrattazione completa e rendimenti non crescenti, e questi non descrivono, neanche approssimativamente, alcuna economia conosciuta. Il progetto che era iniziato con la “Favola delle Api” può essere anche di minor rilevanza pratica nel futuro. La ragione è che le tecnologie e le interazioni sociali della moderna economia si allontanano in modo crescente da queste assunzioni canoniche. Le interazioni non contrattuali dirette con feedback positivi sorgono in modo
IL GOVERNO DELL’ECONOMIA
|31
crescente nelle moderne economie, così come lavori di squadra in produzioni ad alta intensità di informazione sostituiscono le catene di montaggio e altre tecnologie più facilmente gestite dai contratti, così come servizi difficili da misurare usurpano il ruolo preminente – sia per i fattori produttivi sia per i prodotti – giocato dalle quantità misurabili quali kilowatt di energia o tonnellate di acciaio. Danny Quah (1996) chiama il moderno sistema di produzione “l’economia senza peso”. Le caratteristiche chiave di una economia ad alta intensità di informazioni sono rendimenti crescenti generalizzati, in molti casi costi marginali vicini allo zero, assieme al fatto che la maggioranza delle informazioni non è soggetta a contratti completi o che è possibile far osservare in modo coercitivo, e se anche lo è, la sua allocazione è inefficiente. Kenneth Arrow (1999:162, 156) scrive che le informazioni sono una risorsa sfuggente… stiamo solo iniziando a fronteggiare le contraddizione tra sistemi di proprietà privata e di acquisizione e diffusione delle informazioni… [dobbiamo notare] una crescente tensione tra le relazioni legali e le determinati economiche fondamentali.
L’economia ad alta intensità di informazioni del futuro può più fedelmente assomigliare all’economia delle bande nomadi che cercavano cibo nella preistoria umana, piuttosto che all’economia del grano e dell’acciaio che l’ha sostituita. Inseguire delle buone idee con applicazioni pratiche è un progetto costoso ed incerto, molto simile alla caccia di grosse prede. Il successo è raro, ma i suoi frutti hanno valore immenso. L’appropriazione privata del premio è difficile da realizzare e genera sprechi sociali, poiché i benefici previsti per coloro che sono esclusi dall’accesso al premio superano di molto i guadagni che può ottenere colui che se ne appropria individualmente escludendo gli altri. Dunque non è sorprendente che il sistema di prestigio e di norme di condivisione in alcune parti della moderna economia ad alta intensità di informazione – chi è coinvolto in un progetto open source, ad esempio – in molti modi siano paralleli alla cultura delle bande nomadi. E’ improbabile che le sfide poste da Arrow siano risolte semplicemente per mezzo di una maggiore precisione nella definizione dei diritti di proprietà privati. Sembra ugualmente utopico pensare che i governi nazionali vogliano (o addirittura possano) ideare per questi problemi soluzioni centralizzate. Una configurazione complementare del governo del mercato, degli stati e della comunità può essere la miglior speranza per movimentare le capacità eterogenee e versatili delle persone nell’affrontare questi dilemmi, per meglio sfruttare il potenziale di espansione della conoscenza con l’obiettivo del miglioramento dell’essere umano, e dunque portare adeguatamente a termine quella che Alfred Marshall un secolo fa identificò come la promessa degli studi economici.
32 | MICROECONOMIA
Riferimenti bibliografici Acheson, J. (1988). The Lobster Gangs of Maine. Hanover, N.H., New England Universities Press. Alchian, A. A. and H. Demsetz (1972). "Production, Information Costs, and Economic Organization." American Economic Review 62(5): 777-795. Allen, R. (2000). Community and market in England: Open fields and enclosures revisited. Communities and Markets in Economic Development. M. Aoki and Y. Hayami. Oxforfd, Oxford University Press: 42-68. Arrow, K. (1999). Technical information and industrial structure. Firms, Markets and Hierarchies. G. Carroll and D. Teece. Oxford, Oxford University Press: 156163. Arthur, W. B. (1994). Inductive Reseasoning, Bounded Rationality and the Bar Problem, Sante Fe Institute Economics Research Program. Banerjee, A. V., T. Besley, et al. (1994). "Thy Neighbor's Keeper: The Design of a Credit Cooperative with Theory and a Test." Quarterly Journal of Economics 109(2): 491-515. Barone, E. (1935). The Ministry of Production in the Collectivist State. Collectivist Economic Planning. F. A. v. Hayek. London, Routledge: 245-290. Basu, K. and P. H. Van (1988). "The economics of child labor." American Economic Review 88(3): 412-427. Camerer, C. (2000). Prospect theory in the wild: Evidence from the field. Choices, Values, and Frames. D. Kahneman and A. Tversky. Cambridge, Cambridge University Press: 17-43. Cardenas, J. C., J. K. Stranlund, et al. (2000). "Local Environmental Control and Institutional Crowding-out." World Development 28(10): 1719-1733. Coase, R. H. (1992). "The Institutional Structure of Production." American Economic Review 82(4): 713-719. Cohen, D. (1998). "Culture, Social Organization, and Patterns of Violence." Journal of Personality and Social Psychology 75(2): 408-419. Dahl, R. and C. Lindblom (1953). Politics, Economics and Welfare. New York, Harper & Row. Dawkins, R. (1989). The Blind Watchmaker. New York, Norton. Deci, E. L., R. Koestner, et al. (1999). "A Meta-Analytic Review of Experiments Examining the Effects of Extrinsic Rewards on Intrinsic Motivation." Psychological Bulletin 125(6): 627-668. Fehr, E. and J. List (2004). "The hidden costs and returns of incentives: Trust and trustworthiness among CEOs." Journal of The European Economic Association 2(5): 743-771. Fehr, E. and S. Gaechter (2000). "Cooperation and Punishment in Public Goods Experiments." American Economic Review 90(4): 980-994. Foley, D. (1994). "A statistical equilibrium theory of markets." Journal of Ecomonic Theory 62(2): 321-345. Frohlich, N. and J. A. Oppenheimer (1995). "The Incompatibility of Incentive Compatible Devices and Ethical Behavior: Some Experimental Results and Insights." Public Choice Studies 25: 24-51. Frost, R. (1915). North of Boston. New York, Henry Holt. Hayek, F. A. (1935). Collectivist Economic Planning: Critical Studies on the Possibilities of Socialism. London, George Routledge.
IL GOVERNO DELL’ECONOMIA
|33
Hirschman, A. O. (1985). "Against parsimony:three ways of complicating some categories of economic discourse." Economics and Philosophy 1(1): 7-21. Hobbes, T. (1651/1968). Leviathan. New York, Penguin. Holmstrom, B. (1982). "Moral Hazard in Teams." Bell Journal of Economics 13(2): 324-340. Jung, C. (2001). Collective Action and Trust Revisited: Evidence from a Small Case. New School University, Department of Political Science. Kahneman, D. (1994). "New Challenges to the Rationality Assumption." Journal of Institutional and Theoretical Economics 150(1): 18-36. Lange, O. and F. M. Taylor (1938). On the Economic Theory of Socialism. Minneapolis, University of Minnesota Press. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Lerner, A. (1944). The economics of control; principles of welfare economics. New York, Macmillan. Mandeville, B. (1924). The Fable of the Bees, or Private Vices, Publick Benefits. Oxford, Clarendon Press. Marx, K. and F. Engels (1972). The Communist Manifesto. The Marx-Engels Reader, 2nd Edition. R. Tucker. New York, W. W. Norton & Company (first published in 1848). Mill, J. S. (1976). On Socialism. Buffalo, Prometheus. Nisbett, R. E. and D. Cohen (1996). Culture of Honor: The Psychology of Violence in the South. Boulder, Westview Press. Ouchi, W. (1980). "Markets Bureaucracies and Clans." Administrative Science Quarterly 25: 129-141. Pareto, V. (1897). "The New Theories of Economics." Journal of Political Economy 5(4): 485-502. Pareto, V. (1909). Manuel d'Economie Politique. Paris (First Italian edition published 1905), Giard et Briere. Platteau, J.-P. and E. Seki (2001). Community Arrangements to Overcome Market Failures: Pooling Groups in Japanese Fisheries. Communities and Markets in Economic Development. M. Aoki and Y. Hayami. Oxford, Clarendon: 344-402. Quah, D. (1996). The Invisible Hand and the Weightless Economy. London, London School of Economics Centre for Economic Performance Occasional Paper. Sampson, R. J., S. W. Raudenbush, et al. (1997). "Neighborhoods and Violent Crime: A Multilevel Study of Collective Efficacy." Science 277: 918-924. Schelling, T. (1960). The Strategy of Conflict. Cambrdige, MA, Harvard University Press. Schotter, A. (1981). Economic Theory of Social Institutions. New York, Cambridge University Press. Schumpeter, J. (1942). Capitalism, Socialism, and Democracy. New York, Harper & Row. Smith, A. (1937 [1776]). An inquiry into the nature and causes of the wealth of nations. New York, Random House. Stiglitz, J. E. (1994). Wither Socialism? Cambridge, MA, MIT Press. Taylor, F. M. (1929). "The guidance of production in a socialist stae." American Economic Review XIX(March): 1-8. Williamson, O. E. (1985). The Economic Institutions of Capitalism. New York, Free Press.