20 AEIT • numero 3/4 UN’OCCHIATA DENTRO IL BLACK BOX: BASI MATEMATICHE DELL’IA Riassumendo gli skill fondamentali di una formazione orientata all’IA e derivata dall’ICT, la tassonomia seguente distilla l’essenza o, per così dire, l’ontologia, delle basi matematiche di supporto. La trattazione, non certo esauriente o completa, elenca bensì solo i punti salienti di discipline vastissime e in continua espansione. In effetti, la vastità della materia richiederebbe articoli approfonditi o lavori di rassegna per ogni voce riportata. Logica binaria e algebra di Boole George Boole è l’inventore del calcolo logico utilizzato in tutti i computer e le comunicazioni digitali - in pratica una fusione di algebra e logica [15]. Nel 1854, pubblicò An Investigation of the Laws of Thought, in cui descriveva quella che oggi è conosciuta come algebra (o logica) booleana e nella quale proponeva di trattare le operazioni e le funzioni logiche mediante operatori simbolici manipolabili come numeri. L’algebra simbolica restò una curiosità matematica fino a quando non arrivò Claude Shannon con la sua tesi magistrale sulla applicazione della stessa logica al progetto di circuiti di commutazione elettrici [15]. In definitiva, la tesi diede l’avvio all’elettronica digitale, dai microprocessori ai circuiti VLSI. Tra gli altri padri nobili dell’informatica - nelle sue molteplici accezioni - dobbiamo aggiungere, nell’Ottocento, Charles Babbage (macchina analitica), Ada Lovelace (linguaggio di programmazione); e, nel Novecento, Kurt Gödel (teoremi di incompletezza), Alan Turing (test omonimo o gioco dell’imitazione, macchine pensanti), John von Neumann (architettura degli elaboratori), Norbert Wiener (cibernetica o governo dei sistemi). Equazioni differenziali, scienza dei sistemi e delle reti A partire dai sistemi lineari dinamici, modellabili con equazioni differenziali o alle differenze e trattabili con il calcolo operazionale (trasformata di Fourier - in particolare, FFT [Fast Fourier Transform] - trasformata di Laplace, trasformata zeta, ecc.), si è passati a sistemi via via più complessi arrivando sia a quelli non lineari (mappa logistica, frattali, caos deterministico, ecc.) sia alle reti di comunicazione, di trasporto, di telefonia, sociali, epidemiche, ecc. In particolare, le reti sociali ed epidemiche sono stati fattori di cambiamento e trasformazione epocali a partire dalla fine del XX secolo. Due libri di testo, che affrontano adeguatamente tutti questi temi, fornendo basi teoriche, analitiche e matematiche, sono [1617]. L’articolo [18] formula una proposta didattica sulle reti per studenti orientati alla comunicazione in senso umanistico nella prospettiva interdisciplinare qui auspicata (cfr. anche il paragrafo conclusivo). Ricordiamo che le reti ICT, in particolare nelle applicazioni sociali, favorendo le relazioni e le connessioni interpersonali, sono state e sono efficienti autocatalizzatori di progresso socio-economico. Probabilità e statistica Il detto “All models are wrong, but some are useful”, attribuito allo statistico George Box, non è solo un cliché, bensì ha anche una ragione d’essere. Coerentemente, “Every time I fire a linguist, the performance of the speech recognizer goes up”, diceva l’esperto di teoria dell’informazione Frederick Jelinek (IBM Research, Anni 70), quando, anziché basarsi su regole grammaticali speculative, privilegiava e cercava le regolarità statistiche nel riconoscimento vocale e nella traduzione automatica del linguaggio umano. Si può cogliere nella frase una marcata vena di polemica verso i linguisti ortodossi (quali Noam Chomsky e Steven Pinker), sostenitori di una grammatica universale innata e, da sempre, critici verso l’IA. Anche noi, parlando, applichiamo in automatico le regole della lingua nativa, benché, scrivendo, prestiamo più attenzione all’analisi grammaticale e logica. Un altro pilastro fondante è il teorema di Bayes, che è stato per la teoria delle probabilità l’equivalente di una bomba a orologeria a scoppio ritardato; infatti, pur concepito nel Settecento, è stato riconosciuto fondamentale solo pochi decenni fa. Parafrasando un ben noto detto attribuito a John Maynard Keynes, “When the facts change, I change my mind”, potremmo dire che quando si aggiungono nuovi dati di conoscenza occorre anche cambiare la stima delle probabilità. L’inferenza bayesiana parte da una conoscenza molto approssimativa della probabilità a priori, cioè iniziale, per arrivare a stimare valori successivi della probabilità, detta a posteriori, sempre più affidabili e meglio approssimati. Il teorema, nella sua forma più semplice, consiste in una formula di probabilità su due eventi A e B - ossia P[A|B] = P[A] x P[B|A]/P[B] - tanto facile da dimostrare quanto problematica da applicare correttamente. Gli LLM dell’IA generativa (ChatGPT e simili) sposano appieno l’intuizione di Jelinek con l’induzione bayesiana. Presumibilmente, il testo di livello universitario più completo in probabilità, processi casuali e statistica, nonché particolarmente attento agli algoritmi matematici dell’IA, è [19]. Il libro si rivolge a studenti e ricercatori in aree quali teoria delle comunicazioni, elaborazione dei segnali, reti, apprendimento automatico, bioinformatica, matematica finanziaria, argomenti per i quali sono presentati sia i fondamenti sia le applicazioni. Calcolo numerico e computazionale: analisi, metodi e algoritmi Emblematico è il caso, apparentemente privo di applicazioni pratiche, del calcolo matematico degli autovalori di una matrice stocastica, i cui elementi sono valori di probabilità. Ebbene, l’algoritmo computazionale, ben noto nell’algebra lineare, è stato oggetto di brevetto da parte di Larry Page - cofondatore di Google insieme a Sergej Brin - per classificare le pagine in cui si trovano le informazioni disponibili in Rete (information retrieval) [19-20]. Il brevetto PageRank si è dimostrato una fonte di business notevole con un giro d’affari e guadagni miliardari - fra i beneficiari c’è anche l’Università di Stanford. La novità è che, prima dell’ICT, formule e metodi matematici erano patrimonio comune, tutti potevano usarli liberamente e non era consentito brevettarli, invece negli ultimi anni, tradotti in programmi e algoritmi software di IA, sono diventati brevettabili. Un altro algoritmo fondamentale, soprattutto quando si parla di comportamento adattativo dell’IA, è quello del gradien-
RkJQdWJsaXNoZXIy MTA3MTUxMQ==