Proposte per i principi della cognizione e per gli strumenti che consentono di esprimerli



Documenti analoghi
Proposte per i principi della cognizione e per gli strumenti che consentono di esprimerli

Come funziona la cognizione

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Automazione Industriale (scheduling+mms) scheduling+mms.

risulta (x) = 1 se x < 0.

Capitolo 2. Operazione di limite

I libri di testo. Carlo Tarsitani

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Corrispondenze e funzioni

Matematica generale CTF

Dimensione di uno Spazio vettoriale

LE SUCCESSIONI 1. COS E UNA SUCCESSIONE

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Teoria delle code. Sistemi stazionari: M/M/1 M/M/1/K M/M/S

Alla ricerca dell algoritmo. Scoprire e formalizzare algoritmi.

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente

Capitolo 13: L offerta dell impresa e il surplus del produttore

Le funzioni continue. A. Pisani Liceo Classico Dante Alighieri A.S A. Pisani, appunti di Matematica 1

Complemento al corso di Fondamenti di Informatica I corsi di laurea in ingegneria, settore dell informazione Università la Sapienza Consorzio Nettuno

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

4 3 4 = 4 x x x 10 0 aaa

Corso di. Dott.ssa Donatella Cocca

CURRICOLO DI ITALIANO CLASSE PRIMA

Linguaggi e Paradigmi di Programmazione

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

1. Limite finito di una funzione in un punto

Da dove nasce l idea dei video

COS È UN LINGUAGGIO? LINGUAGGI DI ALTO LIVELLO LA NOZIONE DI LINGUAGGIO LINGUAGGIO & PROGRAMMA

Lezioni di Matematica 1 - I modulo

Capitolo II. La forma del valore. 7. La duplice forma in cui si presenta la merce: naturale e di valore.

PROGETTO EM.MA PRESIDIO

PROCESSO DI INDICIZZAZIONE SEMANTICA

Soluzione dell esercizio del 2 Febbraio 2004

Che cos è l intelligenza e come funzionano i test del Q.I.

Come visto precedentemente l equazione integro differenziale rappresentativa dell equilibrio elettrico di un circuito RLC è la seguente: 1 = (1)

Indice. 1 Il monitoraggio del progetto formativo di 6

Polli e conigli. problemi Piano cartesiano. Numeri e algoritmi Sistemi e loro. geometrica. Relazioni e funzioni Linguaggio naturale e

~ Copyright Ripetizionando - All rights reserved ~ STUDIO DI FUNZIONE

INTRODUZIONE I CICLI DI BORSA

Progettaz. e sviluppo Data Base

Alcune nozioni di base di Logica Matematica

Modulo: Scarsità e scelta

Definire la potenza e ricordare l unità di misura della potenza. Definire l energia e la sua unità di misura. Enunciare il teorema delle forze vive

SCUOLA PRIMARIA SCIENZE NATURALI E SPERIMENTALI. Competenza: 1. Comunicazione efficace Indicatore: 1.1 Comprensione

PROGRAMMAZIONE COMPETENZE CHIAVE DI CITTADINANZA

Prodotto libero di gruppi

Proof. Dimostrazione per assurdo. Consideriamo l insieme complementare di P nell insieme

OSSERVAZIONI TEORICHE Lezione n. 4

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

Il sapere tende oggi a caratterizzarsi non più come un insieme di contenuti ma come un insieme di metodi e di strategie per risolvere problemi.

( x) ( x) 0. Equazioni irrazionali

Dispense di Informatica per l ITG Valadier

Il principio di induzione e i numeri naturali.

COME AVERE SUCCESSO SUL WEB?

LA TRASMISSIONE DELLE INFORMAZIONI QUARTA PARTE 1

LE FUNZIONI A DUE VARIABILI

Lavorare in gruppo. Corso di formazione per i dipendenti dell Università di Palermo

II.f. Altre attività sull euro

Appunti di informatica. Lezione 2 anno accademico Mario Verdicchio

Tesina per il corso di Psicotecnologie dell apprendimento per l integrazione delle disabilità

L IT a supporto della condivisione della conoscenza

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

SISTEMI INFORMATIVI AVANZATI -2010/ Introduzione

La ricerca empirica in educazione

Pro e contro delle RNA

Appunti sulla Macchina di Turing. Macchina di Turing

Appunti del corso di Informatica 1 (IN110 Fondamenti) 4 Linguaggi di programmazione

Laboratorio di Pedagogia Sperimentale. Indice

UNA LEZIONE SUI NUMERI PRIMI: NASCE LA RITABELLA

UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI

SISTEMI DI NUMERAZIONE E CODICI

Spinoza e il Male. Saitta Francesco

GIOCHI MATEMATICI PER LA SCUOLA SECONDARIA DI I GRADO ANNO SCOLASTICO

Elementi di Psicometria con Laboratorio di SPSS 1

RICERCA AZIONE STRUMENTI

Che volontari cerchiamo? Daniela Caretto Lecce, aprile

L opposizione digitale-analogico: un problema di fondamenti di scienze dell informazione

Iniziamo con un esercizio sul massimo comun divisore: Esercizio 1. Sia d = G.C.D.(a, b), allora:

Il Problem-Based Learning dalla pratica alla teoria

MODELLO RELAZIONALE. Introduzione

Project Cycle Management La programmazione della fase di progettazione esecutiva. La condivisione dell idea progettuale.

Per lo svolgimento del corso risulta particolarmente utile considerare l insieme

TECNICHE DI SIMULAZIONE

Fondamenti e didattica di Matematica Finanziaria

come nasce una ricerca

organizzazioni di volontariato

CURRICOLO DISCIPLINARE DI ITALIANO ASCOLTO E PARLATO. Traguardi per lo sviluppo delle competenze. Obiettivi di apprendimento( conoscenze e

Obiettivo Principale: Aiutare gli studenti a capire cos è la programmazione

IT Questionario per formatori di insegnanti di lingue Analisi dei dati

Autismo e teoria della mente

Ascrizioni di credenza

03. Il Modello Gestionale per Processi

Architetture Applicative

Esponenziali elogaritmi

CONCETTO DI LIMITE DI UNA FUNZIONE REALE

INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI INTRODUZIONE AGLI ALGORITMI

Dall italiano al linguaggio della logica proposizionale

IL CICLO DI VITA DEL PROGETTO. Elementi essenziali di progetto. Fasi e tappe Gli Approcci

IDEE PER LO STUDIO DELLA MATEMATICA

Transcript:

Proposte per i principi della cognizione e per gli strumenti che consentono di esprimerli Devis Pantano * Draft Fino al capitolo 12. Versione giugno 2015 Presentazione Credo di avere ottenuto importanti risultati nel campo dei fondamenti delle scienze cognitive. È probabile che questo lavoro contenga la scoperta di una parte delle leggi, dei principi generali e dei principali meccanismi che regolano, permettono e costituiscono la cognizione. Il motivo per il quale mi sento, in totale onestà intellettuale, di poter fare queste affermazioni è dovuto semplicemente al fatto che quanto propongo funziona. Con le idee esposte in questo lavoro riesco a spiegare come funziona la cognizione, descrivo i principi generali che sono alla sua base, spiego cosa la rende possibile, in cosa consiste e come può funzionare. Con le idee esposte appare possibile proporre modelli per il funzionamento del sistema nervoso e spiegare come le informazioni e le conoscenze sono codificate al suo interno. Combinando questi modelli e i recenti risultati ottenuti nel campo dell apprendimento automatico (deep-learning) appare possibile progettare sistemi d intelligenza artificiale. Le spiegazioni che propongo possiedono i requisiti dell approccio razionale riduzionista. Non sto esponendo una teoria filosofica che si basa su qualche intuizione. Non demando a concetti e a spiegazioni che non siano ben descrivibili nel dettaglio in termini computazionali. Tutti i processi che descrivo o ai quali faccio riferimento appaiono riproducibili con metodi noti. Le idee esposte sono globalmente molto promettenti; tuttavia so per esperienza che spesso gli errori si nascondono nei dettagli e non posso escludere di averne commessi. Quelle che qui propongo sono, almeno per ora, solo delle proposte teoriche. Il lettore si chiederà, giustamente, per quale motivo con questo lavoro chi scrive * Per commenti ed informazioni mi si può contattare al seguente indirizzo: devis.pantano@unipd.it 1

avrebbe risolto con successo problemi che si sono dimostrati fino ad ora molto ostici. Se effettivamente c è qualcosa di buono in ciò che propongo, credo dipenda dal fatto che ho seguito una strada diversa da quelle usuali per lo sviluppo delle idee e dei concetti. Uno dei risultati che emerge da questo lavoro è che il motivo per cui ancora non sappiamo come funziona la conoscenza non dipende dall eccessiva complessità dei fenomeni cognitivi, ma dal fatto che sono mancati gli strumenti concettuali e metodologici corretti per affrontare il problema. È un po come se si cercasse di edificare la fisica senza il concetto di numero, o se si cercasse di comprendere l origine delle specie senza aver compreso il meccanismo di selezione naturale. Credo che alcuni dei concetti che sono utilizzati nella fondazione della logica e dell informatica teorica non siano del tutto corretti, ma siano anzi in parte fuorvianti poiché inducono a sviluppare dei modelli mentali che, se pur funzionali per molti compiti, impediscono di cogliere nella corretta prospettiva alcuni aspetti essenziali dei fenomeni cognitivi. Si provi a rispondere a questa domanda: cosa è una regola? Chi sa dare una definizione precisa, razionale, scientificamente esaustiva del concetto di regola? Riflettendo un po non è difficile convenire che se il mondo che ci circonda non fosse soggetto a regolarità, e se per esso non valessero delle regole, la stessa cognizione non sarebbe possibile. Le regole sono quindi fondamentali affinché il pensiero possa esistere. Ma se non possediamo gli strumenti per inquadrare con precisione un concetto così fondamentale, come possiamo pretendere di capire i principi e la logica che stanno alla base della cognizione? In questo lavoro propongo degli strumenti che consentono di colmare questa e altre lacune. Devo anticipare che scrivere libri sicuramente non è il mio mestiere. Chiedo quindi al lettore di portare pazienza se in alcuni punti la lettura non è scorrevole. Per un introduzione generale si veda il primo capitolo. Eventuali domande, richieste di chiarimenti e critiche sono benvenute. Copyright 2014 Devis Pantano All rights reserved. 2

Sommario Prima parte 1 Capitolo introduttivo... 9 1.1 Un problema di strumenti... 10 1.2 Alcune prime anticipazioni sui principi fondamentali della cognizione... 12 1.3 Primo principio: i limiti fondamentali del conoscibile e il concetto di struttura... 15 1.4 Secondo principio: cosa sono le regole... 21 1.5 Terzo principio: criterio di emergenza... 25 1.6 Un primo sguardo all interno di un sistema cognitivo... 28 1.7 Simulare il mondo in modo davvero efficace: la necessità di stratificare le rappresentazioni... 31 1.8 Cosa avviene all interno del ciclo percezione-azione?... 40 1.8.1 Alcuni punti sull analisi di struttura... 43 1.8.2 Rappresentare le azioni... 46 1.8.3 I simboli percettivi... 47 1.8.4 Le situazioni desiderabili e indesiderabili... 48 1.8.5 In cosa consistono e come si implementano le reti suggeritrici... 49 1.8.6 L apprendimento come via per concretizzare il tutto... 50 1.8.7 Alcuni punti su come si identificano le regole... 54 1.9 Alcuni punti su come costruire e addestrare un sistema artificiale... 58 1.10 Sulla struttura di questo lavoro... 60 2 Esistono valide alternative alle rappresentazioni simboliche?... 62 2.1 Introduzione... 62 2.2 Come possiamo comunicare?... 62 2.3 Un alternativa ai simboli... 65 2.4 Le rappresentazioni costrutturate e le simulazioni... 65 2.5 Sui limiti fondamentali del conoscibile... 69 2.6 Prima congettura di riferimento... 70 2.7 Alcune note di approfondimento... 71 2.8 Alcuni note tecniche sull uso dei simboli... 72 3 Strutture di prima specie, Operazioni fondamentali sulle strutture, Schemi... 76 3.1 Introduzione: Il problema del confronto... 76 3.2 Una metodologia per la rappresentazione delle strutture di prima specie..... 80 3.2.1 L insieme delle parti... 84 3.2.2 Il sistema di distinguibilità interna tra le parti... 84 3.2.3 Primi punti sul complesso delle relazioni esterne... 85 3.3 Strutture derivate... 87 3.4 Le principali operazioni di derivazione strutturale... 87 3.4.1 Le porzioni di struttura... 87 3.4.2 Le strutture quozienti... 88 3

3.4.3 Operazioni di morfismo... 90 3.5 Ancora sul problema del confronto... 92 3.6 Proprietà e relazioni strutturali non autonome... 93 3.7 Indistinguibilità per scambio di elementi strutturali corrispondenti... 94 3.8 Qualche nota di approfondimento sui grafi... 94 3.9 Sulle proprietà e relazioni strutturali emergenti dopo le operazioni di quoziente... 95 3.10 Sulle rappresentazioni strutturali usate in fisica... 98 3.9 Due congetture interessanti... 99 3.10 Operazioni di computo fondamentali e strutture di seconda specie: gli schemi... 101 3.10.1 Funzione di memoria... 101 3.10.2 Operazione di confronto... 102 3.10.3 Operazione di movimento lungo una struttura (di trasporto di informazione)... 102 3.10.4 Operazione di copia di elementi strutturali... 102 3.10.5 Operazione di associazione simbolica funzionale... 102 3.11 Coincidenza tra operazioni... 103 3.12 Gli elementi base del computo strutturale... 103 3.13 Strutture di seconda specie... 103 3.14 Concetto di schema ( o schema procedurale)... 104 3.15 Alcune riflessioni sul concetto di struttura di seconda specie... 105 3.16 Concetto di sistema di computo strutturale... 106 3.17 Concetto di operatore generalizzato... 107 3.18 Reti NAND (o NOR).... 107 3.19 Congruenza della teoria strutturale proposta con gli oggetti matematici standard... 109 3.19.1 Numeri naturali nella teoria delle strutture finite... 109 3.19.2 Numeri reali... 109 3.19.3 Il passaggio al continuo... 110 3.19.4 Le principali operazioni aritmetiche come operazioni su strutture... 110 3.19.5 Concetto di struttura continua... 111 3.19.6 Operatori differenziali ottenuti tramite il passaggio al limite di operatori discreti... 111 3.20 Nota: come si confrontano concretamente due oggetti complessi... 112 4 Seconda congettura di riferimento. Definizione del concetto di regola... 114 4.1 Introduzione... 114 4.2 L importanza delle regole... 115 4.3 Seconda congettura di riferimento... 116 4.4 Concetto di regola e concetto di regolarità... 119 5 Il fenomeno delle strutture emergenti. Strutture, schemi e logiche emergenti... 124 5.1 Introduzione.... 124 5.2 Interdipendenza funzionale tra strutture, criterio di emergenza... 126 5.3 Alcuni punti importanti sulle strutture emergenti... 128 4

5.4 Sul concetto di proprietà strutturale non autonoma... 129 5.5 Fenomeno delle regole e delle logiche emergenti... 130 5.6 Oggettività dei fenomeni di emergenza... 132 5.7 Concetto di Analisi di struttura.... 133 5.8 Strutture emergenti macroscopiche... 134 5.9 Rendere esplicite le strutture: il principio di convergenza delle verifiche...... 134 5.10 Ancora sul problema del confronto tra strutture... 136 5.11 La relatività della relazione di uguaglianza e il senso dell analisi di struttura... 141 5.12 Il meccanismo della chiave... 142 5.13 Analisi di struttura e riconoscimento... 143 5.14 Un esempio... 146 5.15 Separazione dal contesto sulla base delle irregolarità interne. Concetto di contenuto informativo interno... 149 5.16 Alcune idee sulla visione... 150 5.17 Le strutture derivate non bastano... 158 6 Esplicitazioni di informazione complessa: i soggetti dei processi cognitivi... 160 6.1 Introduzione... 160 6.2 Sulla terminologia... 163 6.3 Un primo approccio intuitivo... 164 6.4 Approccio funzionale... 164 6.5 Alcune proprietà dei soggetti cognitivi... 166 6.6 Ordinamento gerarchico dei soggetti cognitivi... 167 6.7 Dalle rappresentazioni strutturali ai concetti... 168 6.8 Insiemi strutturati di soggetti cognitivi... 171 6.9 Non è un espediente... 172 6.10 Sui concetti di feature e di pattern recognition... 173 6.11 Codificare soggetti di livello superiore... 174 6.12 Sull apprendimento in profondità e la stratificazione delle rappresentazioni... 176 7 Alcuni approfondimenti sulle regolarità e sulle regole... 178 7.1 Introduzione... 178 7.2 Regole e regolarità... 179 7.3 Le regole utili vincolano ma non troppo... 179 7.4 Regole procedurali e regole vincolanti nei risultati... 180 7.5 Le regole della fisica e dei sistemi strettamente deterministici... 181 7.6 Regole operazionali e regole associative... 182 7.7 Sulle regole associative... 186 7.8 Approfondimenti sul concetto di situazione... 188 7.9 Regole associative e reti... 191 7.10 Alcuni punti sulle regole deduttive... 192 5

8 Alcune idee per definire il concetto di problema... 194 8.1 Breve introduzione alla teoria dei sistemi di produzione... 194 8.2 Una possibile definizione del concetto di problema... 195 8.3 Regole di previsione e regole per la pianificazione delle azioni... 197 8.4 Alcuni punti importanti... 199 9 Un possibile modello di sistema cognitivo... 202 9.1 Punti generali... 202 9.2 Per iniziare... 203 9.3 La necessità di un sistema di reti... 206 9.4 Schema di funzionamento... 207 9.5 Alcuni primi punti sul funzionamento delle reti... 208 9.6 Teatri virtuali... 211 9.7 I limiti dei sensi... 212 9.8 Reti di analisi di struttura... 213 9.9 Operazioni di analisi che sfruttano il contenuto informativo interno... 215 9.10 Una possibile ricetta per l analisi di struttura... 217 9.11 Reti di analisi funzionale... 217 9.12 La rappresentazione complessiva della situazione globale del presente 218 9.13 La conoscenza semantica in un sistema cognitivo... 219 9.14 Reti di memorie da vagliare in continuazione per l implementazione di regole... 224 9.15 Primi accenni sulla rappresentazione delle azioni e dei comportamenti 226 9.16 La ricerca di soluzioni ai problemi e la conoscenza del fare... 229 9.17 Alcuni primi accenni al ruolo dell attenzione selettiva... 231 9.18 Alcuni primi punti sull apprendimento... 232 9.19 Graduale costruzione della conoscenza semantica... 235 9.20 Alcune idee sull apprendimento e la gestione degli obbiettivi... 238 9.21 Alcuni appunti sulla possibilità di costruire delle metarappresentazioni della stessa attività cognitiva... 241 10 Approfondimenti sul paradigma a reti.... 246 10.1 Approfondimenti sui sistemi di reti per costituire un sistema cognitivo. 246 10.2 Reti neurali... 248 10.3 Alcuni approfondimenti sulla gestione di un sistema cognitivo... 248 11 Approfondimenti su come si pianificano le azioni e i comportamenti. Le reti suggeritrici... 258 11.1 Introduzione... 258 11.2 Rappresentazione delle azioni e dei comportamenti... 259 11.3 Pianificazione di azioni e comportamenti... 264 6

11.4 Le reti suggeritrici... 267 11.5 Alcune idee su come sono fatte le reti suggeritrici e su come possono essere addestrate... 273 11.6 Nota sul livello di dettaglio richiesto per rappresentare le situazioni... 274 12 Idee sull apprendimento... 276 12.1 Alcune note introduttive... 276 12.2 Prime considerazioni generali... 279 12.3 Alcune note su come si studia attualmente l apprendimento... 283 12.4 È possibile partire da zero?... 286 12.5 La verifica a posteriori... 290 12.6 Procedere per tentativi... 291 12.7 Il confronto con la realtà, il ciclo di retroazione primaria... 292 12.8 Suddividere i processi di apprendimento in fasi successive... 294 12.9 Sulla pre-implementazione delle reti... 296 12.10 Tecniche di apprendimento con propagazione all indietro dell errore.. 297 12.11 Sfruttare processi paralleli interni... 298 12.12 Induzione... 299 12.13 Le regole associative dominanti... 302 12.14 Come identificare le regole associative di medio e alto livello... 303 12.15 Attenzione selettiva... 306 7

8

1 Capitolo introduttivo Come anticipato nella presentazione, ritengo che fino ad ora non è stato possibile comprendere come funziona la cognizione non perché questa sia un fenomeno troppo complesso, ma perché sono mancati gli strumenti concettuali e metodologici adeguati. Sono riuscito a formulare alcuni strumenti che si sono dimostrati particolarmente efficaci. Grazie ad essi mi è stato possibile identificare alcuni principi generali che appaiono governare la totalità dei processi cognitivi. Con questi principi sono riuscito a descrivere un modello potenzialmente completo di sistema cognitivo e mi è stato possibile stendere il progetto per una sua implementazione artificiale. Il percorso naturale per esporre questo lavoro consisterebbe nel presentare prima gli strumenti che ho sviluppato, in seguito, con l ausilio di questi, proporre una formulazione dei possibili principi della cognizione, quindi usare questi ultimi per proporre dei modelli per i processi cognitivi. Tuttavia procedendo in questo modo si presenta una difficoltà divulgativa importante. Accade infatti che l illustrazione degli strumenti richieda molte pagine, in parte tecniche, che possono risultare noiose e difficili da seguire. Come avviene per l apprendimento dei concetti della matematica, anche per comprendere gli strumenti che propongo in questo lavoro è necessario uno sforzo non banale da parte del lettore. Serve un certo impegno, simile a quello necessario per affrontare un esame universitario difficile. Di fronte a queste difficoltà alcune persone desistono anche perché possono nutrire dei dubbi sulla reale utilità dello sforzo richiesto. Oggettivamente è improbabile trovare in una monografia di questo tipo soluzioni valide a problematiche che si sono dimostrate particolarmente difficili. Comprendo questo punto di vista e parzialmente lo giustifico. Per superare questa impasse ho pensato di scrivere questa lunga introduzione con lo scopo di anticipare alcuni dei risultati più rilevanti al fine di mantenere vivo l interesse del lettore e facilitare la comprensione dei concetti. Per proporre queste anticipazioni devo però rinunciare a un po di rigore e semplificare alcuni passaggi. Ciò vale solo per questo primo capitolo, dal secondo le idee e i metodi proposti sono illustrati in modo più dettagliato. Il lettore tenga presente che mi trovo nella necessità di introdurre una serie di concetti, a volte non semplici, dovendo utilizzare una terminologia non pienamente adeguata poiché nel vocabolario comune non sono disponibili le parole adatte. Spesso per questo motivo userò il virgolettato per segnalare che i termini vanno interpretati secondo delle estensioni un po diverse da quelle 9

usuali. Un altra difficoltà deriva dal fatto che i modelli che intendo proporre funzionano tramite la sinergia di una serie di processi e di fasi che collaborano mutuamente al funzionamento del tutto. Il problema è che nell esposizione queste cose devono essere introdotte una alla volta, e le sinergie con ciò che viene descritto più avanti non possono essere pienamente colte prima di aver completato il quadro. Nelle prossime pagine di questo capitolo procedo anticipando e riassumendo i principi generali che ho indentificato. Nei paragrafi successivi li approfondisco mostrando, in modo veloce, i punti salienti degli strumenti metodologici che propongo per la loro precisazione. Proseguo quindi illustrando, anche questa volta in modo semplificato i punti principali del modello che propongo per la cognizione. Dal secondo capitolo due entro più nel dettaglio. I primi otto capitoli sono dedicati all illustrazione della parte più teorica: sia degli strumenti, sia dei principi generali. Dal capitolo nove illustro in modo più dettagliato i modelli. In questa versione che pubblico online ho omesso il capitolo 13. In esso espongo un progetto per la realizzazione di un sistema cognitivo artificiale. Mi scuso con il lettore di questa scelta. 1.1 Un problema di strumenti Certamente non sono mancate in passato varie proposte tese ad individuare possibili principi che regolano e determinano i fenomeni cognitivi. Molte di queste sono state accompagnate da teorie e modelli. Particolarmente interessante è la sintesi proposta recentemente da K. Friston, dell università di Londra [Friston 2006-2010]. Egli individua un principio generale, formalizzabile matematicamente, per spiegare aspetti importanti del funzionamento del cervello. Secondo la proposta di Friston il cervello tende a minimizzare una particolare grandezza, esprimibile analiticamente, chiamata energia libera (variazionale) in virtù delle sue analogie formali con l omonima grandezza usata in fisica. La teoria di Friston è sicuramente elegante. Indubbiamente merita di essere approfondita e sviluppata (su di essa tornerò più avanti). Tuttavia credo che la sua reale capacità esplicativa presenti alcuni limiti e non metta a disposizione un quadro concettuale e metodologico completo. Il problema, come anticipato, è strumentale. Il principio proposto da Friston appare applicabile ai sistemi biologici ed è, in certo senso, un principio che cerca di inquadrare, entro una unica formulazione matematica, le finalità, gli obbiettivi, dei processi cognitivi che avvengono nel cervello. Nelle prossime pagine propongo altri principi che riguardano aspetti più fondazionali e disincarnati, essi riguardano la natura delle entità che usiamo per 10

costruire le rappresentazioni del mondo, nonché la natura delle inferenze basilari e la natura dei fenomeni che le rendono possibili. Attualmente per descrivere le rappresentazioni interne alla mente si usano vari concetti e vari strumenti sviluppati in discipline quali: la logica, la matematica, la linguistica, l informatica teorica. Si usano concetti come quelli di: rappresentazioni pittoriche, analogiche, subsimboliche, oppure si parla in termini di simboli e di proposizioni. Molti autori usano il concetto generico di variabili interne. Altri autori parlano in termini di pattern di attivazione di reti neurali, di feature, o anche di simboli percettivi. Ritengo che nessuno di questi concetti e di questi strumenti sia idoneo a descrivere in modo completo la natura delle rappresentazioni cognitive e la loro logica fondamentale. Servono strumenti diversi. Posso ben argomentare che per comprendere la logica profonda dei processi cognitivi è necessario mettere a punto gli strumenti che consentano di precisare e trattare in maniera adeguata alcuni altri concetti per i quali solitamente ci accontentiamo di una comprensione solo intuitiva. I punti salienti della formulazione che propongo derivano, per buona parte, dal tentativo di trovare gli strumenti per precisare, con sufficiente rigore e generalità, i concetti di struttura, di regola, e di proprietà emergente. Ritengo sia importante analizzare il concetto di struttura e andare oltre la sua concezione intuitiva perché questa da sola non permette di comprendere alcuni punti fondamentali. Per fare un parallelo, la situazione è simile alla differenza che c è tra avere un concetto intuitivo di quantità, come potevano averlo gli uomini prima della scoperta dei rudimenti sui numeri, e essere invece in grado di usare la nozione di numero in modo appropriato. Il concetto di struttura è usato in modo intuitivo pressoché da tutti, ma ben pochi si sono presi la briga di analizzarlo e di cercare di precisarlo, eccetto alcuni matematici e alcuni filosofi. Un punto delicato della faccenda è che non è sufficiente trovare semplicemente un metodo, tra i vari possibili, che consenta di formalizzare questo concetto, ma è importante trovarne uno adeguato. Serve un metodo che sia in grado di cogliere in modo efficace, ed anche astuto, i meccanismi cruciali del fenomeno delle corrispondenze strutturali, vale a dire di quelle corrispondenze che possono esistere tra le strutture di entità e fenomeni fisicamente distinti. Ciò perché sono proprio queste corrispondenze a permettere di costruire rappresentazioni interne degli oggetti e dei fenomeni del mondo esterno. A mio avviso le formalizzazioni che sono state proposte fino ad ora non consentono di cogliere tali meccanismi e per questo motivo tendono a portare fuori strada. Ho sviluppato una metodologia per descrivere le strutture, che consente di lavorare con sufficiente precisione, che funziona bene per gli oggetti e i fenomeni della nostra percezione quotidiana, e che è in grado di cogliere alcuni aspetti essenziali che ritengo non siano stati analizzati nel modo opportuno. Si 11

tratta di quegli aspetti che consentono di eseguire delle operazioni che credo sia utile chiamare di derivazione strutturale. Ritengo che queste operazioni siano importanti perché consentono di passare, in modo naturale, da rappresentazioni più basilari ad altre più flessibili e astratte. Sappiamo che le rappresentazioni che si formano a ridosso dei sensi sembrano di tipo pittorico (da alcuni autori sono chiamate subsimboliche o anche analogiche). Ebbene, credo di poter mostrare che tali rappresentazioni pittoriche sono in realtà di tipo strutturale. Partendo da delle rappresentazioni strutturali di buona qualità, tramite le citate operazioni derivazione, è possibile ricavarne delle altre che costituiscono delle astrazioni strutturali delle prime. Si può mostrare che le operazioni di derivazione strutturale possono essere ripetute più volte generando così una stratificazione gerarchica di altre rappresentazioni che sono gradualmente più astratte. Queste operazioni permettono di evidenziare alcune proprietà contenute implicitamente nelle rappresentazioni di partenza. Esse permettono quindi di rendere esplicite tali proprietà. Si può mostrare che nel far questo si ottengono dei nuovi oggetti che sono comunque sempre delle rappresentazioni strutturali e non di altro tipo. È probabile che queste operazioni siano molto simili (se non identiche) a una parte di quelle che utilizza la nostra mente, il nostro cervello, per analizzare e organizzare le informazioni che riceve dai sensi, e per costruire le concettualizzazioni astratte. La metodologia è particolarmente efficace. Grazie ad essa è possibile identificare e codificare, con sufficiente precisione, alcuni principi generali dai quali si possono inferire ulteriori principi organizzativi e funzionali che portano alla comprensione di come la cognizione stessa può funzionare. Con ciò intendo affermare che questi principi consentono di capire nel dettaglio, sia a livello di microprocessi, sia di gestione globale, come funziona il tutto e come può essere riprodotto artificialmente. 1.2 Alcune prime anticipazioni sui principi fondamentali della cognizione Credo si possano individuare almeno tre principi generali che, combinati con gli strumenti che propongo, portano a identificare la maggior parte degli altri. Penso possa essere utile, per questo capitolo introduttivo, anticiparli in forma compatta in modo che il lettore possa costruirsene una prima idea. Si tenga però presente che per esprimerli ed illustrarli in modo corretto e completo sono necessari i concetti e i metodi illustrati nei prossimi capitoli. Questi tre principi possono essere così riassunti: 1. Il conoscibile del mondo esterno si limita alle strutture degli oggetti (e dei fenomeni), e alle operazioni computazionali possibili su queste 12

strutture. Al di là di tali strutture, e di tali operazioni, non c è alcuna realtà esterna conoscibile. 2. Ogni regolarità (e ogni regola) è sempre riconducibile a coincidenze tra strutture. Ogni regola (e ogni legge) consiste in una prescrizione strutturale, o delle operazioni che si possono (o si devono) eseguire, o dei risultati che si devono ottenere. 3. Le proprietà emergenti consistono in strutture derivate che manifestano qualche fenomeno di dipendenza funzionale (fisica) con altre. Sono regole emergenti quelle che si applicano a strutture emergenti. Si può ben argomentare che sono proprio tali regole emergenti quelle che il nostro cervello usa per costruire la cognizione del mondo esterno. Esse costituiscono la spina dorsale della nostra conoscenza della realtà. Queste regole non compaiono a livello di rappresentazioni delle strutture che possiamo chiamare di base. Per poterle identificare è essenziale passare ad altre rappresentazioni che sono estratte dalle prime. Per questo motivo le operazioni di derivazione strutturale sono essenziali, senza di esse sarebbe impossibile identificare le regole emergenti. Si può mostrare che è essenzialmente questo il motivo per il quale le rappresentazioni interne del mondo esterno devono essere gerarchizzate. Si può ben argomentare che è per questo motivo che le reti neurali devono essere profonde. Possiamo quindi proporre anche il seguente: 4. La cognizione è resa possibile dal fatto che dal substrato di leggi fisiche e matematiche fondamentali, che governano il mondo fisico a livello microscopico, sono estraibili un grande quantità di regole emergenti. Il trucco fondamentale della cognizione consiste nello sfruttare questa tipologia di regole. Si può mostrare che queste regole sono, per la maggior parte, regole associative e probabilistiche. Per questo motivo esse danno origine a delle strutture inferenziali simili alle reti di credenze (reti bayesiane). Forse, a un primo impatto, potrebbe sembrare che alcuni dei principi sopra enunciati non dicano granché. Essi potrebbero sembrare troppo generici e non sufficientemente ben definibili per poter ricavarne indicazioni sul funzionamento dei processi cognitivi. Mi permetto di far notare che anche i principi della dinamica se espressi solo verbalmente non comunicano molta informazione a chi non è provvisto degli strumenti matematici per tradurli in equazioni, numeri calcoli ecc Per una persona che non conosce i metodi della 13

matematica, l affermazione che: quando agisce una forza, si ha un accelerazione inversamente proporzionale alla massa, non dice molto. Se non avessimo gli strumenti per associare dei numeri ai concetti di forza, massa, e accelerazione, e per tradurre il tutto in equazioni, la sola descrizione verbale del secondo principio della dinamica sarebbe assai poco utile! Ebbene ritengo che la stessa cosa avvenga anche per i principi sopra enunciati. A prima vista essi non comunicano molte informazioni perché non si hanno gli strumenti concettuali e metodologici che consentono di tradurli nelle rappresentazioni e nelle procedure opportune. Con gli strumenti opportuni si può capire come questi principi possono essere precisati e come da essi si possano inferire molte informazioni importanti sul funzionamento della cognizione. Illustrerò i punti salienti di tali strumenti, anche se in modo semplificato, nei prossimi paragrafi. Per una trattazione più estesa si vedano i prossimi capitoli. I principi appena introdotti, possono essere confrontati con le idee proposte da Friston e con altre elaborate da vari altri autori, anche se in modo meno formale e più intuitivo. Sono, ad esempio, particolarmente interessanti le idee espresse, già alcuni anni fa, da Valentino Brainterberg come illustrato in un recente lavoro di G. Bocciglione [G. Boccignone 2013]. Su alcune di queste tornerò più avanti. Il principio secondo cui il cervello cerca di minimizzare l energia libera variazionale, è stato formalizzato da Karl Friston, e alcuni colleghi dell università di Londra [Friston, Kilner, Harrison 2006], sviluppando idee proposte da Geoffrey Hinton e Douglas Hosftater, in ricerche nel campo delle reti neurali e dell intelligenza artificiale [Sengupta, Steimmler, Friston 2013]. A suo tempo il concetto di energia libera variazionale è stata usato da R. Feynman nel 1972 come metodo per semplificare alcuni problemi complessi di calcolo delle probabilità [Feynman 1998]. Hinton e colleghi, hanno notato che, in alcune tipologie di reti neurali (di Hopfiled), alcuni dei passaggi chiave dei processi di apprendimento sono quantificabili con una funzione costo matematicamente equivalente all energia libera variazionale usata da Feynman. Questa osservazione è stata combinata da K. Friston con i risultati di sue precedenti ricerche di neuroscienze computazionali e ha indotto questo autore a proporre l idea che tale principio possa costituire una generalizzazione universale. Il formalismo usato da Friston e colleghi è un po difficile da seguire. Utilizza metodi che provengono dall inferenza statistica. Con questi metodi è possibile esprimere, in modo euristico e in termini probabilistici, alcune delle dipendenze che dovrebbero sussistere tra le variabili che descrivono l ambiente esterno (e i suoi effetti sui nostri sensi), e le loro codifiche presenti all interno del cervello. Queste dipendenze possono essere espresse e legate opportunamente in modo da esprimere una grandezza numerica. Tale grandezza quantifica, in termini di informazione (alla Shanon), le discrepanze tra le previsioni, o le aspettative, generate con i modelli interni, e quanto effettivamente si produce nei sensi. Questa discrepanza è espressa tramite al divergenza di Kullback- Leibler. Per una spiegazione più dettagliata devo rimandare ai lavori di Friston e colleghi. Secondo il principio proposto da Friston, un sistema come il cervello tende ad agire per minimizzare queste discrepanze o meglio, per minimizzare proprio la funzione scalare chiamata energia libera (variazionale). La formulazione di questo principio è indubbiamente molto elegante ed ha una certa plausibilità biologica. L idea sottostante (secondo la mia interpretazione), è che esso 14

possa risultare un sorta di vincolo evolutivo emergente. In altre parole, si propone che le pressioni selettive abbiano forzato i sistemi cognitivi biologici a evolversi in modo da soddisfare proprio a tale principio di minimizzazione dell energia libera variazionale. Al presente è presto per esprime un giudizio sulla validità di questa idea. Essa è indubbiamente attraente. Non possiamo però escludere che tale principio riesca a vincolare solo un approssimazione di come la natura riesce a sfruttare la possibilità di costruire rappresentazioni interne del mondo esterno per favorire la sopravvivenza e il successo riproduttivo delle specie. Nella sostanza non possiamo escludere che sia possibile sostituire tale principio con delle formulazioni alternative, più vicine alla realtà dei fenomeni in oggetto, o anche, semplicemente, più semplici da comprendere e da trattare. Come accennato penso sia utile notare che il principio di minimizzazione dell energia libera può essere usato per descrivere le finalità dei processi cognitivi che si sono evoluti nei sistemi biologici. Ma esso non appare idoneo per chiarire tutti gli aspetti più fondamentali dei meccanismi profondi che rendono possibili tali processi. Nelle prossime pagine mostrerò che questi meccanismi possono essere espressi con metodi diversi da quelli usati da Friston. Metodi che ritengo siano ben formalizzabili. Come visto la formulazione matematica del principio di minimizzazione dell energia libera è difficile. Soprattutto per questo motivo può essere di una certa utilità descrivere alcuni principi finalisti, usando una formulazione più intuitiva e semplice da comprendere. Per il momento posso anticipare alcuni concetti in modo intuitivo come segue: L attività cognitiva consiste, per una parte essenziale, nel costruire dei modelli interni che presentano, per gerarchie, delle corrispondenze strutturali con il mondo esterno, e che sono soggetti alle stesse regole emergenti. I sistemi cognitivi tendono a costruire al proprio interno, una mappa parziale del complesso delle regole emergenti del mondo esterno: Usano queste per generare inferenze, fare previsioni e pianificare in modo utile i propri comportamenti. Un sistema cognitivo tende a minimizzare le differenze tra le strutture del mondo esterno (presente o futuro) e quelle delle proprie rappresentazioni interne, relative al presente, alla proprie previsioni e alle proprie pianificazioni. Un sistema cognitivo tende a minimizzare gli imprevisti, gli errori di previsione e di pianificazione. 1.3 Primo principio: i limiti fondamentali del conoscibile e il concetto di struttura Ho scoperto recentemente, grazie ad un lavoro di Boccignone [2013] che alcune delle idee che cerco di precisare sul concetto di struttura sono state espresse anche da Valentino Braiinteberg, pur se in maniera più intuitiva: Secondo Braiinteberg (2008): 15

si può parlare di informazione contenuta in una struttura quando l azione di questa su altre strutture è determinata in maniera essenziale non dalla mera quantità dei suoi elementi, ma dalla loro disposizione. Penso che queste idea sia corretta, ma servono gli strumenti per poterla precisare. Nel 1902 Henri Poincaré pubblicò un trattato di epistemologia: La scienza e l ipotesi. In questo lavoro egli giunse a una conclusione che ritengo particolarmente importante. Secondo Poincaré la scienza può solo farci conoscere i rapporti tra le cose; al di là di questi rapporti non c è alcuna realtà conoscibile! Oggi questa conclusione di Poincaré può apparire sicuramente interessante ma allo stesso tempo può sembrare abbastanza innocua. Essa sembra informarci su qualcosa che riguarda i limiti della scienza, e sembra dare sostegno all approccio formalista che si è imposto come epistemologia dominante in alcune fondamentali discipline scientifiche. In realtà credo di poter mostrare che, reinterpretando questa conclusione in maniera leggermente diversa, estendendone il significato oltre il solo ambito della scienza e munendosi di opportuni strumenti, è possibile estrarre da essa uno dei principi fondamentali che stanno a fondamento della cognizione. Credo che questo pensiero di Poincaré contenga una verità molto importante che non riguarda solo i limiti della scienza, ma che investe in realtà i nostri limiti fondamentali di poter conoscere il mondo che ci circonda. Come anticipato credo che la conclusione di Poincaré possa essere riformulata in questo modo: Della realtà esterna è possibile conoscere solo la struttura delle cose e le operazioni computazionali possibili su queste strutture. Al di là di questa struttura e di queste operazioni non c è alcuna realtà esterna conoscibile. Ritengo che questo sia uno dei principi fondamentali della cognizione. Non appare possibile dimostrare con metodi rigorosi la sua validità universale, ma è possibile ben argomentarla. Posso quindi proporlo come una congettura. Una congettura che, per la sua importanza, indico come prima congettura di riferimento. Ammettendo valida di questa congettura e la metodologia che propongo per descrivere il concetto di struttura, si possono trarre molte importanti inferenze. Si può argomentare che la cognizione si basa pressoché totalmente sullo sfruttamento del fenomeno delle corrispondenze strutturali: le rappresentazioni che si realizzano all interno di un sistema cognitivo devono avere parte delle proprie strutture coincidenti con quelle degli oggetti e dei fenomeni rappresentati. 16

Se studiamo con attenzione come funzionano i simboli si può comprendere che in realtà questi necessitano di un artificio che non è invece necessario per le rappresentazioni strutturali. I simboli, infatti, richiedono che sia costruita un associazione artificiale tra l oggetto che fa da simbolo e ciò che questo rappresenta. Ad esempio, è necessario che la percezione del simbolo sia collegata con l attivazione delle memorie dell entità a esso associata. Quest associazione artificiale non è necessaria con le rappresentazioni strutturali. Esse, infatti, possiedono delle corrispondenze naturali con ciò che rappresentano. Queste corrispondenze consistono proprio nel fatto che le rappresentazioni e gli oggetti rappresentati hanno parte delle rispettive strutture in comune. Quest osservazione ci spinge a pensare che siano le rappresentazioni strutturali a costituire la prima base naturale per l informazione contenuta all interno di un sistema cognitivo. Ci spinge inoltre a pensare che il concetto di struttura sia centrale, e che per comprendere come funziona la cognizione sia necessario riuscire a descriverlo con precisione. Invito a riflettere sul pensiero di Poincarè. Se ammettiamo vera l idea che della realtà esterna possiamo conoscere solo i rapporti tra le cose, ne consegue che possiamo conoscere solo le entità che sono composte di una molteplicità di parti; in caso contrario non avremmo dei rapporti da poter conoscere. Come possiamo precisare cosa sono questi rapporti? Quali strumenti abbiamo per generalizzare questa idea? Uno dei concetti intuitivi che più sembra cogliere queste cose è proprio quello di struttura. Se vogliamo capirne la logica profonda dobbiamo trovare il modo di passare dalla concezione intuitiva a qualcosa di più preciso, a qualcosa di matematizzabile. È lecito quindi chiedersi se esiste qualche branca della matematica che si occupa di precisare questo concetto. Purtroppo le formalizzazioni già disponibili possono funzionare per oggetti matematici astratti, ma non vanno bene per trattare le strutture degli oggetti e dei fenomeni della nostra quotidianità. Serve una formulazione che sia, nello stesso tempo, precisa e sufficientemente duttile. Deve anche essere naturale nel senso di corrispondere ai metodi adottati dalla nostra mente. La mia proposta per questa metodologia è presentata in modo esteso nel capitolo 3. Di seguito, per brevità, mi limito a illustrarne alcuni dei punti salienti. L idea generale è che ogni struttura statica (capiremo tra non molto il perché di questa precisazione) può essere precisamente descritta specificando, con gli strumenti opportuni (che derivano, almeno primariamente, dalla matematica e dall informatica), tre gruppi di informazioni: 1. Le informazioni che individuano l insieme delle parti componenti ; queste parti sono, per le strutture, l equivalente degli elementi nella teoria degli insiemi. 17

2. Le informazioni che specificano e descrivono le proprietà interne delle parti componenti e che consento quindi di distinguere le une dalle altre, appunto dal punto di vista interno. 3. Le informazioni che specificano e descrivono le loro relazioni esterne. Si può mostrare che queste relazioni sono ciò che permette di distinguere le parti componenti, le une dalle altre, dal punto di vista esterno. Ad esempio, per un insieme di punti, che sono entità, per definizione, prive di qualunque struttura e proprietà interna; sono unicamente le relazioni esterne ciò che consente di distinguere i punti stessi gli uni dagli altri. La strategia di tenere separate le informazioni sulle proprietà interne da quelle sulle relazioni esterne è particolarmente importante perché permette di definire con facilità alcune operazioni che chiamo di derivazione strutturale, e che credo siano alla base della possibilità di astrarre. Si può definire con precisione quando due strutture sono uguali tramite la nozione di isomorfismo. Due strutture sono isomorfe se si può costruire una corrispondenza biunivoca tra i rispettivi insiemi delle parti componenti, se le distinguibilità interne corrispondono e se corrispondono anche le relazioni esterne (si veda il capitolo 3). Due strutture isomorfe sono coincidenti. Per precisare ulteriormente queste nozioni sono necessarie molte pagine. Per ora posso accennare che una struttura statica di base è identificata specificando due insiemi {a(i)..}, {p(j)..}che individuano, rispettivamente: le parti della struttura e una classificazioni dello loro proprietà interne. Una funzione tra i due, e un grafo che specifica le adiacenze. Mentre per le strutture estratte da quelle di base, si devono usare informazioni più complesse, ma che derivano sempre da quelle che definiscono la struttura di partenza dalle quali sono state ricavate. Come detto, fondamentale in questa metodologia è che da alcune strutture se ne possano derivare delle altre. Questa possibilità impone un ordinamento gerarchico naturale tra le rappresentazioni strutturali. Tra le principali operazioni di derivazioni strutturali ci sono quelle di porzione, di quoziente e di morfismo. Le operazioni di porzione sono molto semplici, consistono semplicemente nel considerare solo una porzione della struttura di partenza. Esse sono importanti sia perché possono essere usate in altre operazioni di derivazione, sia perché, come vedremo, ci possono essere delle porzioni di una struttura che sono delle entità emergenti. 18

Le operazioni di quoziente consistono in una sorta di cambio di scala. Si ottengono considerando una nuova rappresentazione strutturale che ha per nuove parti componenti delle intere porzioni della struttura di base. Un concetto sotteso è che passando a considerare la struttura quoziente in un certo senso ci si dimentica, parzialmente, che le sue parti sono a loro volta composte da più parti della struttura di base dalla quale è stata derivata. La nuova struttura della quale ci si occupa è qualcosa che è emergente rispetto a quella di base. Questa nuova entità ha una propria struttura che può essere descritta in modo indipendente. Usiamo un diverso insieme di parti, un diverso insieme di proprietà interne, e un diverso insiemi di relazioni tra le parti componenti! Sebbene queste informazioni siano comunque legate con quelle che definiscono la struttura di partenza. È da notare che l operazione di quoziente è possibile grazie all'accorgimento di trattare in maniera separata le distinguibilità interne e le relazioni esterne tra le parti che compongono una struttura. Le operazioni di morfismo si ottengono invece inibendo in una struttura ciò che rende le sue parti distinguibili le une dalle altre. Ciò si ottiene semplificando il sistema delle distinguibilità interne oppure il complesso delle relazioni esterne. Un esempio di operazione di morfismo che agisce sulle distinguibilità interne è quello che elimina i colori in una figura. Una caratteristica delle operazioni di morfismo è di far perdere informazione. Si può mostrare che queste operazioni sono molto comuni nella nostra attività cognitiva. Ad esempio siamo in grado di spostare l attenzione dall'osservare i singoli dettagli di un oggetto, per passare a una sua visione d insieme, dove i dettagli di prima fanno ora parte di altre entità strutturali che consideriamo come singoli oggetti: eseguiamo un operazione di quoziente. È molto probabile che queste operazioni costituiscano la base per l astrazione. Si può mostrare che, operando opportunamente con esse, è possibile passare da rappresentazioni più basilari (per intenderci, molto vicine a quelle pittoriche che si formano nei sensi) ad altre via via più astratte. Entro la cornice generale di queste tre tipologie di operazioni, che sono applicabili ad una classe molto ampia di strutture, è possibile definire varie operazioni più specifiche, ma comunque importanti, per analizzare le informazioni strutturali e per rendere esplicite le loro principali proprietà e caratteristiche potenzialmente emergenti. Il senso di queste operazioni sarà più chiaro fra qualche pagina. Un punto molto importante è che si può mostrare che il paradigma naturale per l implementazione di queste operazioni è costituito da un insieme di reti stratificate di funzioni, delle quali le reti neurali profonde ne sono un esempio. Anzi si può mostrare che è proprio la necessità di eseguire queste operazioni a imporre tali reti. 19

Poco sopra ho affermato che una struttura è sempre definibile specificando tre gruppi di informazioni che descrivono rispettivamente: un certo insieme di parti componenti, le proprietà interne di queste e le lo relazioni esterne. Non è difficile argomentare che ciò vale anche per le strutture derivate. In effetti è sempre vero, per forza di cose, che una struttura è un oggetto composto da più parti. Se così non fosse non avremmo una struttura di cui parlare. Per forza di cose, quindi, si potrà sempre individuare l insieme delle nuove parti componenti; ci saranno delle proprietà interne di queste parti che permettono di distinguerle, dal punto di vista interno, le une dalle altre (per operazioni di scambio); e ci saranno delle relazioni esterne tra queste nuove parti componenti. Abbiamo visto che per le strutture di base esistono gli strumenti matematici che permettono di trattare con precisione queste tre tipologie di informazioni. Ma ciò continua ad essere vero anche per quanto riguarda le strutture derivate? Credo che la risposta a questa domanda sia positiva. In effetti appare possibile trovare vari modi per descrivere, con metodi computazionali, le proprietà interne e le relazioni esterne di queste nuove strutture. Il problema è che quando si passa da una struttura di base, ad altre che sono derivate da questa, in genere le nuove parti componenti sono a loro volta degli oggetti complessi e, in quanto tali possono, esibire proprietà e relazioni esterne similmente complesse. Possiamo allora chiederci: esiste un metodo per dedurre quali sono le informazioni che descrivono le strutture derivate partendo da quelle usate per le strutture di base? Qui le cose sono complicate. Un problema è che non tutte le strutture potenzialmente derivabili sono anche entità cognitivamente significative. Affronteremo questo problema tra qualche paragrafo. Posso dire che in linea teorica si possono utilizzare le regolarità interne, che possono essere presenti entro una struttura di base, per procedere a selezionare quelle operazioni di derivazione strutturale che hanno buone probabilità di essere utili. Sempre in linea teorica, si possono usare queste regolarità interne anche per rendere esplicite le informazioni potenzialmente significative che descrivono le proprietà interne e le relazioni esterne. Il punto è che, all atto pratico, il problema di provare tutte le operazioni possibili è spesso troppo complesso. Inoltre non tutto ciò che si ricava con questo approccio costituisce necessariamente dell informazione utile. Si può mostrare che in realtà serve sempre un feedback che proviene dall uso pratico di queste informazioni. Si può mostrare che queste informazioni, sulle proprietà e sulle relazioni esterne delle nuove parti componenti, sono realmente utili se possono contribuire direttamente, o per passaggi interposti, a codificare delle regole (emergenti) utili! Muniti degli strumenti fin qui illustrati è possibile proporre una definizione precisa per i concetti di regolarità e di regola. 20

1.4 Secondo principio: cosa sono le regole Sebbene l idea di regola sia a tutti famigliare, ritengo che essa non sia stata ben compresa e non sia stata nemmeno ben compresa la sua importanza nella cognizione. Le regole sono fondamentali. Pressoché ogni processo cognitivo si basa sull utilizzo di regole. In un certo senso possiamo dire che le regole sono il motore dell attività cognitiva. Il nostro cervello applica regole in continuazione e ne usa contemporaneamente moltissime. Con buona probabilità, in ogni secondo, al suo interno sono vagliate, in parallelo, alcune centinaia di milioni di regole (e forse molte di più). È probabile che una parte importante della neocorteccia sia dedicata all implementazione di regole associative. Trovare una definizione precisa, che sia in grado di cogliere la vera natura, profonda e universale, di ogni regola, quindi di ciò che sta alla base di quasi tutti i processi cognitivi, può consentire di capire come questi funzionano. Se riusciamo a capire cosa sono le regole, come si possono presentare, come si possono identificare e usare, abbiamo capito davvero molto sulla natura e la logica profonda della cognizione. Prima di proporre una definizione per il concetto (esteso) di regola devo presentare brevemente alcuni altri punti importanti che riguardano le operazioni di computo possibili su strutture. Il primo punto consiste nell osservazione che probabilmente non è possibile rappresentare le operazioni di computo basilari usando solo strutture di prima specie. Sebbene ho proposto che l attività di costruire rappresentazioni riguarda la struttura degli oggetti e che esiste una metodologia universale potenzialmente in grado di descrivere ogni struttura statica, devo anche proporre l idea che non esiste la possibilità di descrivere, senza ambiguità, le operazioni basilari usando solo questi strumenti. Anche in questo caso non sono in grado di dimostrare in maniera rigorosa la validità di questo punto e devo proporlo come una congettura. Ma se ammettiamo che ciò sia vero: quindi che non ci sia modo di rappresentare senza ambiguità, usando solo strutture statiche, le operazioni di computo basilari, allora come possiamo costruire delle rappresentazioni per queste ultime e per le operazioni più complesse? In fondo esistono entità quali gli algoritmi che sono, come minimo, delle rappresentazioni di sequenze di operazioni eseguibili da qualche macchina computazionale. Deve quindi pur esserci qualche possibilità di costruire rappresentazioni di sequenze di operazioni di computo. A questo fine ci vengono incontro due fenomeni. Il primo è costituito dalla possibilità di usare dei simboli; l altro consiste nel fatto che le operazioni di computo fondamentali sono davvero poche e molto semplici. Si può 21