La cognizione umana e quei nuovi e diversi modelli di intelligenza artificiale

di Fabrizio Bonacci

Capita ormai sempre più di frequente sentir parlare di IA (intelligenza artificiale), machine learning, deep learning e, più in generale, di sistemi intelligenti. Ma di che cosa ci si sta occupando quando parliamo o sentiamo parlare

di queste cose? Più precisamente, in che modo e in che senso questi sistemi artificiali possono essere da noi concepiti come ‘intelligenti’?

Per tentare di rispondere a domande di questo tipo, è prima necessario delineare e definire più precisamente il concetto stesso di ‘intelligenza’. Una volta chiarito questo punto fondamentale, è poi necessario capire in che senso preciso sia comunque sempre possibile parlare di ‘intelligenza’ tanto nel caso dei sistemi biologici, come la cognizione umana, quanto nel caso dei sistemi artificiali, come i modelli proposti dal machine learning e dal deep learning.

L’argomento è certamente vastissimo e altrettanto variegate sono le posizioni e i punti di vista a riguardo dell’IA. Tuttavia, il nostro obiettivo qui non ha alcuna ambizione di completezza o esaustività. Il nostro unico scopo consiste nel cercare di stimolare il più possibile la curiosità di chi legge, con la speranza di poter così contribuire alla formulazione di possibili buone domande riguardo a questi temi. Crediamo infatti che ogni forma di scienza e di indagine, degne di questo nome, nascano dalla fondamentale individuazione di una domanda specifica. Un interrogativo che sappia volgere il nostro sguardo nella giusta direzione. La risoluzione del problema, a volte, risiede nella domanda stessa.

Andiamo dunque con ordine e chiediamoci, sebbene solo in modo del tutto intuitivo, ‘in che senso un’entità, naturale o artificiale, può essere definita intelligente?’. Molto in generale, potremmo definire ‘intelligenti’ una serie di abilità, di capacità e, come vedremo, di comportamenti, che vengono esibiti da numerosissimi sistemi naturali e artificiali. Ad esempio, esibisce tratti intelligenti un sistema biologico o artificiale che ha la capacità di adattarsi ai mutamenti dell’ambiente o del proprio contesto di interazione. Di conseguenza, è intelligente un’entità che possiede l’abilità di rispondere in maniera appropriata a tali cambiamenti e, in ultima analisi, che ha la capacità di apprendere e assimilare nuove informazioni, magari proprio a partire da tali mutamenti ambientali e contestuali. Inoltre, si può concepire come intelligente un’entità che possiede l’abilità di generalizzare. E cioè, un sistema che è in grado di estrapolare patterns, invarianti e dinamiche generali a partire da un numero (per quanto esteso ma comunque) limitato di casi individuali.

Esempi molto intuitivi di sistemi biologici intelligenti sono, chiaramente, il cervello dell’animale umano e i cervelli di altre svariate specie animali, una gran quantità di sistemi di biologia molecolare e una gran varietà di sistemi di comunicazione animale. Mentre, sul versante artificiale, esempi di sistemi intelligenti sono i sistemi di riconoscimento vocale e facciale (inclusi i face detection systems in uso nelle fotocamere digitali), e vari sistemi diagnostici utilizzati in ambito medico (come i sistemi che si occupano della diagnosi di varie patologie attraverso risonanza magnetica, MRI scans, e l’analisi delle tomografie computerizzate, CT scans).

artificial intelligence

Si noterà che, per quanto molto vincolanti, le caratteristiche da noi qui evidenziate che ineriscono al concetto di intelligenza sono sicuramente, per così dire, abbastanza a maglia larga. E questo per un motivo specifico che ha a che fare con i nuovi sistemi di intelligenza artificiale di cui ci stiamo occupando in questo articolo. I sistemi intelligenti che abbiamo qui in mente sono infatti da identificarsi con i nuovi modelli dell’intelligenza artificiale contemporanea che portano il nome di machine learning e deep learning. Tali modelli si discostano radicalmente dai modelli cosiddetti ‘classici’ dell’intelligenza artificiale, largamente diffusi nella seconda metà del ‘900 e, grosso modo, fino ai primi anni 2000. La differenza capitale fra i modelli ‘classici’ e i nuovi sistemi d’intelligenza artificiale consiste in un fondamentale cambio di prospettiva rispetto al passato. Spieghiamoci meglio. Per i modelli classici, l’insieme di dati (dataset) fissato nel programma aveva fondamentalmente un ruolo passivo. Con i nuovi modelli contemporanei assistiamo invece ad un vero e proprio capovolgimento di prospettiva. Gli algoritmi che costituiscono i sistemi di machine learning sono strutturati in modo da potersi adattare ed evolvere in base all’evoluzione e all’espansione del data base che analizzano e su cui realizzano le loro computazioni. Il data base, in costante evoluzione ed espansione, è fondamentalmente l’ambiente di calcolo di tali algoritmi e su cui essi basano il loro stesso apprendimento. In questo modo, gli algoritmi fondati sul machine learning danno vita ad un modello in grado di codificare patterns e regolarità estratti dalla base di dati effettiva su cui operano. Producendo così un modello dinamico e plausibile di una certa porzione di realtà. Di conseguenza, per tali sistemi di IA sono i dati stessi (data) non solo a condurre e gestire le operazioni di calcolo, ma anche ad indicare la direzione e il comportamento che il sistema stesso deve perseguire. E ciò allo scopo di ottenere un risultato (output) appropriato, plausibile e, in ultima analisi, intelligente. In questo senso, persino il ruolo del programmatore perde parte dalla sua centralità: una volta impostato l’algoritmo iniziale, sarà poi l’ormai sterminato data base offerto dal world wide web di internet a valutare e definire l’evoluzione del sistema artificiale stesso.

Un data base quello di internet che, al pari del nostro universo reale, è costantemente in espansione e in continua evoluzione. Non dimentichiamolo, un’espansione che contribuiamo ad alimentare e arricchire noi stessi in ogni istante, attraverso il nostro costante uso di social networks, mediante la produzione e ricerca di testi, informazioni, luoghi, la diffusione di immagini, di audio-video e quant’altro: questo enorme e sterminato universo fatto di dati e informazioni che è internet parla di noi in ogni suo angolo, in ogni sua forma. È dunque in questi termini che va interpretata l’intelligenza di questi nuovi sistemi artificiali che ormai abitano la nostra intera quotidianità: data la gigantesca mole di informazioni ormai accumulata e disponibile sui vari server e clouds di internet, saranno quindi i sistemi di deep learning a guidare l’adattamento e l’evoluzione dello stesso sistema artificiale attraverso l’identificazione e l’estrapolazione generalizzata di regolarità e patterns all’interno di tale ambiente virtuale.

Chiariti questi punti fondamentali, è giunto ora il momento di occuparci della seconda domanda da cui eravamo partiti. E cioè: quando si parla dell’intelligenza di un sistema artificiale e di quella di un sistema biologico, ci stiamo riferendo al medesimo tipo di intelligenza o stiamo forse parlando di due tipologie differenti di intelligenza? Il tipo di intelligenza che esibisce un sistema artificiale e un sistema biologico, come ad esmpio il cervello umano, coincidono o possiedono delle differenze fondamentali?

Consideriamo, sebbene in maniera molto sintetica e generale, come si comportano i sistemi di memoria nel caso in cui un frammento di informazione viene aggiornato o sostituito con un altro. Poniamo un caso esemplificativo molto intuitivo. Stiamo pedalando spensieratamente in sella alla nostra bicicletta quando, ad un tratto, percepiamo un improvviso rumore metallico. Nel voltarci brevemente ad osservare cosa potrebbe essere accaduto, notiamo delle lattine al margine dell’asfalto che abbiamo appena percorso. A questo punto, nella nostra mente concludiamo che il rumore sarà stato causato dal movimento improvviso delle lattine notate al margine della strada, a seguito dello spostamento d’aria della nostra bici in corsa. Alcuni minuti dopo, scopriamo che la catena della nostra bici si è ormai allentata parecchio. Sarà dunque il caso di fermarsi: il rumore percepito precedentemente non era causato dalle lattine ma dalla catena della bici che iniziava ad allentarsi e a stridere sulla corona. In quel preciso istante, un frammento di informazione in memoria è stato revisionato e sostituito con uno totalmente nuovo. Nel far questo, il cervello umano non ha la necessità (men che mai le risorse!) di riconsiderare l’intero data base in memoria. Grazie ad un complesso sistema di dispositivi neurocognitivi, il cervello umano è in grado di implementare delle procedure che, operando in parallelo e seguendo euristiche e specifici processi cognitivi sensibili alle informazioni contestuali, permettono l’accesso pressoché immediato al particolare frammento di informazione che va selezionato, identificato, revisionato e (ri)fissato in memoria. Mentre invece, per quanto riguarda un sistema di IA (come ad esempio le self-driving cars, automobili che guidano in maniera totalmente autonoma), la sola revisione di un tale frammento di informazione richiederebbe l’immediato accesso a tutta la sua intera storia di informazioni riguardo a quel tipo di scenario, inclusa la valutazione dettagliata di una vastissima rete di rappresentazioni distribuita nel suo sistema di memoria. In casi molto complessi, il sistema artificiale deve anche essere in grado di poter simulare un particolare scenario, i cui elementi costitutivi sono già distribuiti e fissati in memoria, al fine di poterne valutare la sua effettiva revisione e sostituzione. Inoltre, benché ciò non rappresenti un problema per i moderni sistemi artificiali, il tutto sarebbe reso possibile grazie ad un enorme dispendio di risorse computazionali.

Sebbene entrambi intelligenti, è evidente che il tipo di intellegenze di cui stiamo parlando vengono realizzate ed implementate dai due sistemi in modi profondamente diversi fra loro. Se questo è vero, potrebbe tale differenza fondamentale suggerire un significato ancora più profondo della distizione fra l’intelligenza esibita da un sistema biologico come il cervello umano e quella che mostra un sistema artificiale contemporaneo? Concluderemo questo articolo tentando di offrire alcuni importanti spunti di riflessione riguardo ad una possibile risposta a tale domanda, secondo noi assolutamente centrale.

La nostra idea generale è che la cognizione umana (data fondamentalmente dal prodotto del funzionamento del nostro cervello) e i sistemi di intelligenza artificiale (inclusi i modelli di machine & deep learning) rappresentano i due poli opposti del concetto generale di ‘intelligenza’ di cui ci siamo occupati finora. Crediamo infatti che, per dare un esempio specifico, la maniera in cui i sistemi artificiali generalizzano sia radicalmente diversa dal modo in cui invece la cognizione umana produce generalizzazioni. Proviamo ad approfondire un po’ l’argomento in questa direzione. Il nucleo centrale in cui risiede la forza prorompente dei sistemi intelligenti fondati sul machine learning e deep learning consiste nell’utilizzo massiccio ed estremamente potente di computazioni che avvengono grazie alla possibilità d’accesso istantaneo ad una enorme, pressoché sterminata, base di dati. Di conseguenza, potere computazionale e analisi dei dati (computational power and data analysis) rappresentano il cuore pulsante su cui risiede tutta la forza ed il successo dei sistemi d’intelligenza artificiale contemporanei. Al contrario, tutta la forza ed il potere predittivo su cui si basano le generalizzazioni e persino la presa di decisione (decision making) dei sistemi cognitivi umani sembrano invece derivare dall’impossibilità di poter avere di fatto accesso all’analisi di una base di dati (data base) completa ed esaustiva e, ulteriore aspetto fondamentale, alla naturale incapacità del nostro sistema cognitivo di implementare spontaneamente computazioni sufficientemente complesse che siano al contempo efficienti ed economiche (cost-effective), per lo meno sul piano implementativo. Sembrerebbe dunque che i sistemi cognitivi e quelli artificiali producano generalizzazioni in modi radicalmente differenti fra loro: ciò che rappresenterebbe un grave punto debole per l’uno, rappresenta invece il fulcro nevralgico del punto di forza per l’altro.