Dispense del corso RICERCA OPERATIVA. per i corsi di Laurea in Ingegneria BTRR e MMER. a cura di Laura Palagi.

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Dispense del corso RICERCA OPERATIVA. per i corsi di Laurea in Ingegneria BTRR e MMER. a cura di Laura Palagi."

Transcript

1 Dispense del corso RICERCA OPERATIVA per i corsi di Laurea in Ingegneria BTRR e MMER a cura di Laura Palagi palagi 29 Novembre 2012

2 Corso: Ricerca Operativa (Laurea e Laurea Magistrale) Settore: MAT09 - Crediti: 6 Sapienza Università di Roma A.A Obiettivi. Introdurre gli studenti alla programmazione matematica e alla loro applicazione in campo ingegneristico, logistico, economico, organizzativo. Fornire gli strumenti per: riconoscere classi di modelli standard (in particolare di programmazione lineare sia continua che a variabili intere, di programmazione convessa), individuare le soluzioni ottime utilizzando condizioni di ottimo. Programma Docente: Laura Palagi Programma. Il programma coincide con il contenuto delle dispense. La parte relativa alla modellistica matematica non è argomento in sede di esame scritto. È soprattutto utile ai fini della prova di laboratorio di RO. NON sono in programma le seguenti dimostrazioni/teoremi: 1. dimostrazione del Lemma dimostrazione dei teoremi 5.1.6, , 5.3.2, dimostrazione dei teoremi 6.2.4, , il paragrafo la dimostrazione del teorema (Lemma di Farkas) 6. il teorema il teorema , il teorema

3 Capitolo 1 Introduzione La Ricerca Operativa è una disciplina relativamente giovane. Il termine Ricerca Operativa è stato coniato in ambito militare verso la fine degli anni 30 e deriva dal termine inglese Operational Research, ovvero la ricerca sulle operazioni (militari). La Ricerca Operativa (di seguito indicata con l acronimo RO) si occupa dello sviluppo e dell applicazione di metodi quantitativi per la soluzione di problemi di decisione che si presentano nella gestione di imprese e organizzazioni. Quando la complessità dei sistemi era relativamente contenuta, e la quantità di dati disponibili estremamente limitata, il personale esperto era sufficiente a prendere le decisioni necessarie alla conduzione dell impresa. La crescente complessità dei sistemi aziendali congiuntamente all enorme quantità di dati messa a disposizione dall informatizzazione capillare ha reso indispensabile l utilizzo di strumenti automatici di decisione che attraverso la modellazione matematica permettano la soluzione di problemi di grandi dimensioni. La RO, quindi, è caratterizzata dall uso di modelli matematici definiti e risolti al fine di fornire indicazioni ai decisori nell atto della scelta. Non a caso, la RO è anche nota come management science, e cioè la Scienza della Gestione, definizione che ne sintetizza finalità e ambizioni. 1.1 Breve storia della Ricerca Operativa Il termine Ricerca Operativa, si è detto, è legato alle prime applicazioni della RO per aumentare l efficienza di operazioni militari della Seconda Guerra Mondiale. Tuttavia esistono esempi importanti di anticipazione dei metodi della RO in anni più lontani; il più famoso risale a F. Taylor che nel 1885 elaborò uno studio sui metodi di produzione; prima ancora, nel 1776, G. Monge aveva studiato un problema di trasporti. Tuttavia la nascita della RO è legata agli studi che negli anni immediatamente precedenti alla Seconda Guerra Mondiale vennero condotti in Gran Bretagna per risolvere problemi strategici e tattici in operazioni militari. Più in particolare questi studi erano legati all uso efficiente di un nuovo strumento di difesa: il radar. Infatti nel 0 A questo paragrafo sono associate le slide della lezione disponibili sul sito or/meccanica/slide prima lezione09-10.pdf 1

4 1937 la Royal Air Force iniziò degli esperimenti di un sistema di controllo della difesa aerea basato sull uso di una stazione radar situata a Bawdsey Research Station, nella costa est; già dai primi esperimenti si resero conto che era molto difficile gestire efficientemente le informazioni provenienti dal radar. Nel luglio 1938 furono compiuti altri esperimenti con l aggiunta di quattro stazioni radar lungo la costa nella speranza che il sistema di controllo migliorasse sia in copertura sia in efficienza; invece non fu così ; dai nuovi esperimenti emersero seri problemi: c era la necessità di coordinare e correlare le tante informazioni, spesso anche in conflitto tra di loro, che venivano ricevute dalle stazioni radar aggiunte. Nell imminenza della Guerra si rese necessario tentare qualche nuovo approccio; perciò il sovrintendente della Bawdsey Research Station propose di sviluppare un programma di ricerca che riguardasse gli aspetti operativi del sistema e non più solamente quelli prettamente tecnici che erano da considerare soddisfacenti. Il termine Operational Research Ricerca nelle operazioni (militari) fu coniato per descrivere questa nuova branca delle scienze applicate. Fu quindi selezionato un gruppo di scienziati di vari discipline per costituire un OR team ; il progetto fu diretto dal comandante in capo della Royal Air Force, Air Chief Marshal Sir Hugh Dowding. Nell estate del 1939 la Gran Bretagna effettuò l ultima esercitazione pre-bellica dove si evidenziò un notevole miglioramento nelle operazioni di difesa aerea grazie al contributo del gruppo di scienziati. Nacque quindi una vera e propria sezione che più tardi, nel 1941, prese il nome formale di Operational Research Section. Durante il conflitto mondiale furono molteplici e importanti i contributi strategici di questa sezione permettendo di salvare piloti e aerei. Al termine della guerra, alcuni degli scienziati coinvolti nel progetto formarono nuclei di ricercatori per lo sviluppo post bellico e la loro attività si estese a campi diversi da quello militare; in particolare, con l espandersi delle iniziative industriali e con l avvento dei computer che sono uno strumento essenziale per la risoluzione dei problemi, c è stata un espansione dell utilizzo della RO all interno di diverse realtà applicative. Dagli anni 60 in poi le applicazioni della RO hanno avuto diffusione crescente, inizialmente nell ambito di grandi gruppi industriali e succesivamente, grazie anche alla disponibilità di grandi potenze di calcolo a costi contenuti, in quasi ogni settore industriale, nei servizi e nelle amministrazioni pubbliche. 1.2 La Ricerca Operativa oggi Ai nostri giorni la rilevanza applicativa delle tecniche della RO è riconosciuta e apprezzata in ambito industriale. Negli ultimi cinque anni il numero di addetti del settore è infatti cresciuto di un fattore 100. Contestualmente, si è allargata la richiesta di esperti di RO nelle imprese manifatturiere e di servizi: un laureato, esperto di tecniche della RO può ragionevolmente aspirare, per esempio, a ricoprire incarichi di responsabilità nelle industrie manifatturiere, nella assicurazioni, nel marketing, nelle società di consulenza aziendale, nella pianificazione e, sempre di più, nelle telecomunicazioni. Alcuni esempi di problemi possono essere risolti per mezzo delle tecniche della RO sono i seguenti: Finanza e Investimenti; si vuole rispondere a domande del tipo: quanto dobbiamo investire, e come? Dove rimediare i capitali necessari? Quanto ci costerà? Alcuni esempi sono: 2

5 Selezione degli investimenti: si tratta di scegliere, fra un vasto insieme di alternative di investimento, quali attivare e quali no in presenza di vincoli di budget e con l obiettivo di massimizzare i ricavi. Scelta del portafoglio; consiste nel decidere in quali titoli e con quali quote investire i nostri capitali in modo da massimizzare il ricavo atteso, oppure minimizzare il rischio, etc. Determinazione del prezzo di derivati finanziari; si vuole determinare il prezzo di un prodotto derivato finanziario (per esempio di un opzione o di un future) in funzione del tempo e dell andamento del titolo sottostaste. pianificazione della produzione; come assegnare la forza lavoro alle varie attività della nostra impresa? Su quali macchine e per quanto tempo ci conviene effettuare i nostri processi? Si tratta di pianificare i livelli di produzione e/o l utilizzazione di risorse; si hanno spesso problemi di allocazione ottima di risorse cioè problemi riguardanti la distribuzione di risorse limitate tra alternative concorrenti in modo da minimizzare il costo complessivo o massimizzare il guadagno totale; tali risorse possono essere materie prime, manodopera, tempi di lavoro su macchine, capitali investiti. gestione ottima delle scorte; si tratta di determinare i livelli di produzione e di scorte nella gestione di materiali grezzi, prodotti in lavorazione etc.; quando e quanto conviene riordinare materiali o beni in modo da ottenere il miglior compromesso fra costi di riordino e di produzione/acquisto e costi di immagazzinamento. Conviene, cioè, ordinare o produrre più spesso minori quantità per far fronte alla domanda corrente, oppure ordinare/produrre maggiori quantità e lasciarle in magazzino per soddisfare anche la domanda futura? localizzazione e dimensionamento di impianti; Quanti depositi di un impresa di distribuzione alimentare costruire e dove localizzarli per servire i negozi a dettaglio in un area d interesse? Dove costruire degli ospedali (o scuole o stazioni dei vigili del fuoco) in modo da ottimizzare il servizio fornito? Dove conviene costruire le stazioni di base di una rete GSM/UMTS per coprire soddisfacentemente territorio e traffico, e con che potenza dovranno trasmettere? In senso lato, si tratta di problemi in cui si deve decidere dove istallare impianti di produzione in modo da rifornire in modo ottimale aree distribuite su un territorio. progetto di reti di comunicazione / telecomunicazione; si tratta di definire i collegamenti e dimensionare le capacità di una rete stradale, di telecomunicazione, di trasmissione dati, etc., in modo da garantire il traffico tra le varie origini e destinazioni e minimizzare il costo complessivo; ad esempio, per instradare le comunicazioni telefoniche e dati fra Roma e Venezia, conviene costruire una nuova linea ad alta velocità in fibra ottica fra Firenze e Bologna oppure istallare un ponte radio a larga banda? determinazione di flussi ottimi; si devono inviare merci (informazioni, telecomunicazioni, corrente elettrica, etc.) da alcune sorgenti (origini) a un certo numero di destinazioni utilizzando una rete di strade (fibre ottiche, doppini telefonici, cavi coassiali, emettitori) in modo da soddisfare le richieste minimizzando i costi di trasporto. 3

6 assegnazione di frequenze di trasmissione; quali frequenze (prese da una banda limitata) devo assegnare a una rete di trasmettitori radio-televisivi in modo da minimizzare le interferenze reciproche o massimizzare la copertura del territorio? sequenziamento; quali processo o operazione effettuare prima e quali dopo? Per esempio, come sequenziare i treni sulla rete in modo da evitare conflitti sulle tratte e minimizzare i tempi morti, le attese alle stazioni, etc.? project planning; come sequenziare le molteplici attività di un progetto? Quanto durerà il progetto? Come devono essere gestite le risorse? allocazione ottima di componenti elettronici (VLSI design); come disegnare una piastra madre in modo da minimizzare le lunghezze dei percorsi seguiti dai segnali elettrici? determinazione dei turni del personale; si tratta, ad esempio, di assegnare ai convogli il personale viaggiante sui treni (conducenti, bigliettai, etc.) in modo da minimizzare il numero di viaggi a vuoto (necessari per riportare il personale alla loro sede). Un problema analogo si presenta nell assegnazione di equipaggi (piloti, hostess, stewart) a voli. manutenzione di beni; cioè il problema di decidere quando e se effettuare la manutenzione di alcuni beni soggetti ad usura, in modo da minimizzare il costo complessivo. istradamento di veicoli; quali percorsi devono seguire i veicoli di una flotta di automezzi per, ad esempio, raccogliere l immondizia, o rifornire una rete di negozi, in modo da minimizzare le distanze complessive percorse? studi sulla struttura del DNA; come assegnare sequenze a geni minimizzando la probabilità dell errore sperimentale? Come determinare un albero filogenetico massimizzando la verosimiglianza? progettazione di forme ottime; che forma deve avere una macchina in modo da presentare meno resistenza possibile all aria? Che profilo deve evere l ala di un aereo in modo da massimizzare la portanza? calcolo delle traiettorie ottime; qual è la traiettoria che permette ad un veicolo spaziale di arrivare sulla luna e tornare usando la quantità minima di carburante? ricostruzione di immagini; come si possono visualizzare le informazioni fornite, per esempio, da una TAC in modo da renderle più leggibili possibili per il medico? progettazione strutturale ; qual è il progetto di un ponte o di un grattacielo che resiste meglio a venti molto forti o alle sollecitazioni derivanti da un terremoto? 4

7 yield management ; Letteralmente traducibile come Gestione del ritorno economico. In una azienda caratterizzata da varietà di servizi e di prezzi, domanda variabile nel tempo, stabilire quanti e quali servizi vendere avendo incertezza sulla domanda futura, allo scopo di massimizzare il profitto globale. Si tratta di un problema diffuso tra le compagnie di trasporto aereo, ferroviario, marittimo, ma anche per catene alberghiere e di noleggio auto. Questa lista, lungi dall essere esaustiva, serve a mettere in evidenza le potenzialità degli strumenti della RO nella risoluzione di problemi applicativi complessi e disparati. In Italia la penetrazione della RO è stata piuttosto lenta. La situazione è rovesciata negli Stati Uniti e nell Europa Centro-Settentrionale ove la crescita del settore è stata formidabile. Le ragioni del ritardo sono in primo luogo culturali: mancanza di conoscenze approfondite da parte delle aziende, insufficente disseminazione dei risultati da parte dell accademia. Lentamente, questa situazione va modificandosi anche in Italia, e la sensibilità delle aziende è fortemente cresciuta negli ultimi due-tre anni. In particolare ci si è resi conto che l informatizzazione capillare e l accresciuta potenza di calcolo non sono sufficienti a risolvere i problemi dell organizzazione aziendale in modo ottimale. A confermare questo asserto si consideri il seguente, illuminante esempio (dovuto a G. B. Dantzig 1 ): si supponga di essere a capo di un azienda che impiega 70 dipendenti e deve assegnare ciascuno di essi a 70 differenti mansioni; poiché le capacità lavorative di ogni singolo dipendente sono diverse, non è indifferente per l azienda come effettuare l assegnamento. Naturalmente si deve fare in modo che ciascun dipendente sia assegnato ad una sola mansione e che ciascuna mansione sia svolta esattamente da un dipendente. Il problema consiste nel confrontare le 70! possibilità che ci sono per selezionare quella migliore nel senso che permetta di ottenere il maggiore utile per l azienda. Le possibilità sono un numero molto grande, più grande di Ora si supponga di disporre di un calcolatore capace di effettuare un milione di calcoli al secondo e che sia in funzione dal tempo del big bang; avrebbe questo calcolatore oggi nell anno 2000 esaminato tutte le 70! combinazioni possibili? La risposta è no. Supponiamo allora di disporre di un calcolatore che possa effettuare un bilione di assegnamenti per ogni nano secondo; la risposta sarebbe ancora no. Supponiamo allora di riempire la superficie terrestre di calcolatori di questo tipo che lavorano in parallelo; la risposta sarebbe ancora no. Si dovrebbe disporre in verità di terre ciascuna ricoperta di calcolatori di questo tipo, in funzione dal tempo del big bang fino a quando il sole si raffredderà. Da questo esempio facile da enunciare si deduce come in certe situazioni sia assolutamente impossibile esaminare tutti i casi possibili per determinare qual è il migliore. Per questo, prima dell avvento della RO, l unica possibilità era affidarsi al buon senso di persone guidate dall esperienza che stabilivano regole ad hoc di base che dovevano essere seguite per risolvere i problemi ( ad hoc ground-rule approach). A questo tipo di approccio si contrappone la RO, il cui contributo centrale consiste nell introduzione del cosiddetto approccio modellistico-ottimizzatorio per la soluzione di un problema di decisione. In questo approccio si organizza l analisi di un problema reale in due fasi: la rappresentazione del problema attraverso un modello matematico che ne astragga gli 1 G.B. Dantzig - Linear Programming the story about it began: some legends, a little about historical significance, and comments about where its many mathematical programming extensions may be headed in History of Mathematical programming - a collection of personal reminiscences, J.K. Lenstra, A.H.G. Rinnooy Kan and A. Schrijver eds., NOrth Holland (1991). 5

8 aspetti essenziali e che schematizzi le interrelazioni esistenti tra i diversi aspetti del fenomeno che si sta studiando; lo sviluppo di metodi matematici efficienti (algoritmi di soluzione) per determinare una soluzione ottima del problema o una sua buona approssimazione. Naturalmente, per costruire correttamente un modello matematico-ottimizzatorio che rappresenti un particolare fenomeno, si devono individuare i parametri di controllo significativi e un criterio per la valutazione della qualità della soluzione. La determinazione del modello è un attività complessa e non completamente formalizzabile, che deve far ricorso da una parte a una conoscenza approfondita delle caratteristiche del problema in esame e dall altra a strumenti che provengono da diverse branche della matematica. Una volta determinato il modello corretto, la RO si occupa di fornire una procedura esplicita per determinare una soluzione di un problema; tale procedura può essere rappresentata da metodi matematici analitici o, come più spesso accade, da metodi numerici che determinano la soluzione del problema mediante specifici algoritmi di calcolo. Da quanto detto si può capire come la RO sia una metodologia tipicamente interdisciplinare, applicabile nei più svariati contesti e come proprio dagli stimoli provenienti da campi anche molto distanti tra di loro tragga una delle principlai ragioni della sua attuale vitalità. 6

9 1.3 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di oggetti reali. Esistono modelli concreti (come ad esempio i prototipi di aerei o automobili), ma più spesso, come nella Ricerca Operativa, si considerano modelli astratti cioè modelli matematici che usano il simbolismo dell algebra per mettere in evidenza le relazioni principali dell oggetto che deve essere modellato. I modelli di cui si tratterà in seguito sono quindi modelli matematici, e sono costituiti da un insieme di relazioni che descrivono in modo semplificato, ma rigoroso, uno o più fenomeni del mondo reale. La nozione di modello matematico per rappresentare il mondo reale non è certo nuova: già Pitagora nel IV secolo a.c. tentava di costruire un modello matematico dell Universo. L interesse per la modellistica matematica è notevolmente cresciuto e attualmente si confida che attraverso modelli matematici sia possibile rappresentare molteplici aspetti del mondo reale e studiarne le proprietà. Ciò ha portato ad un enorme sviluppo delle applicazioni della modellistica matematica anche al di fuori delle tradizionali applicazioni alle scienze fisiche. Si è così avuta di fatto una vasta utilizzazione di modelli matematici in settori lontani dagli ambiti più tradizionali come, ad esempio, le scienze sociali, la biologia, le scienze ambientali, la psicologia. Come esempi concreti, si pensi agli studi sulla dinamica della popolazione, sulla diffusione delle epidemie, sul risanamento ambientale. Questa notevole diffusione della modellistica matematica è anche dovuta al fatto che l evoluzione di un modello matematico può essere rapidamente studiata grazie all uso di moderni calcolatori elettronici. È evidente come in molti casi le situazioni rappresentate da un modello sono molto complesse e alcune volte influenzate da fenomeni di natura aleatoria; per questa ragione, sono state definite diverse classi di modelli matematici: modelli stocastici che considerano grandezze che possono essere influenzate da fenomeni aleatori e modelli deterministici che considerano grandezze esatte; inoltre a seconda che le interazioni tra le grandezze sono immediate o distribuite nel tempo, si parla di modelli statici e di modelli dinamici. L approccio modellistico per risolvere un problema di decisione o, più in generale, l impiego di metodi matematici per la soluzione di problemi applicativi, viene di solito realizzato attraverso diverse fasi. Tali fasi possono essere schematizzate nel seguente modo: Descrizione e Analisi del problema Costruzione del modello Analisi del modello Selezione di buone soluzioni (simulazione e/o ottimizzazione) Validazione del modello Descrizione e Analisi del problema La prima fase consiste nell analisi della struttura del problema e nell individuazione dei dati necessari per una descrizione per una corretta definizione del problema. Si tratta cioè di individuare i parametri di controllo e di individuare i legami logico-funzionali che definiscono il problema e lo/gli obiettivi. Costruzione di un modello matematico Nella fase di costruzione del modello matematico si deve fornire una descrizione formalizzata del problema di decisione facendo uso del linguaggio della matematica. Si dovrà cercare, quindi, 7

10 una corrispondenza tra relazioni del mondo reale (relazioni tecnologiche, leggi fisiche, vincoli di mercato, etc.) e relazioni matematiche (equazioni, disequazioni, dipendenze logiche, etc.). relazioni del mondo reale relazioni matematiche La costruzione di un modello richiede valutazioni e scelte non facilmente codificabili in un procedimento standard. In particolare, per la costruzione di modelli soddisfacente è necessaria una conoscenza approfondita dell applicazione d interesse e dei metodi matematici di soluzione. La conoscenza dell applicazione assicura che il modello sia soddisfacente e risponda alle domande concrete che l utilizzatore gli porrà. La conoscenza dei metodi permette la definizione di modelli risolvibili, cioé per i quali è possibile (al termine del processo di modellazione) la determinazione di soluzioni di buona qualità. È importante ribadire che un modello è definito per mezzo delle relazioni che lo costituiscono ed è quindi necessario che tali relazioni siano il più possibile indipendenti dai dati introdotti nel modello; questo perché uno stesso modello deve poter essere usato in differenti occasioni con dati (cioè costi, disponibilità di risorse, limiti tecnologici, etc.) diversi. Lo studio di questo aspetto, come già detto, rientra nella fase di analisi del modello sotto il nome di analisi della stabilità del modello rispetto ai dati introdotti. In generale, la costruzione formale di un modello di Programmazione Matematica si può sintetizzare come segue: 1. Associare opportune variabili di decisione alle grandezze reali. Tali variabili costituiscono le incognite del problema. 2. Esprimere quantitativamente i legami esistenti tra le variabili e le limitazioni derivanti da considerazioni di carattere fisico, economico, etc. Tali legami e limitazioni definiscono i vincoli. L insieme dei valori delle variabili per cui i vincoli sono soddisfatti costituisce l insieme ammissibile. 3. Esprimere formalmente l obiettivo che si intende minimizzare o massimizzare. Analisi del modello matematico Segue l analisi del modello che prevede la deduzione per via analitica, in riferimento a determinate classi di problemi, di alcune importanti proprietà; le principali sono: esistenza della soluzione ottima; condizioni di ottimalità, cioè una caratterizzazione analitica della soluzione ottima; stabilità delle soluzioni al variare dei dati o di eventuali parametri presenti. Lo studio delle condizioni di ottimalità ha sia motivazioni di natura teorica, sia motivazioni di natura algoritmica. Dal punto di vista teorico, una condizione di ottimalità può servire a 8

11 caratterizzare analiticamente le soluzioni di un problema di ottimo e quindi consentire di svolgere analisi qualitative, anche in assenza di soluzioni numeriche esplicite; un esempio è l analisi della sensibilità delle soluzioni di un problema di ottimo rispetto a variazioni parametriche. Selezione di buona soluzione La successiva fase di selezione di buona soluzione corrisponde alla possibilità di determinare tra tutte le scelte possibili costituite dalle soluzioni ammissibili, quella ottima o una sua buona approssimazione. I problemi di ottimizzazione che si presentano nella pratica sono di solito così complessi che non è possibile determinarne una soluzione per via analitica. La complessità è determinata innanzi tutto dal numero di variabili e di vincoli, che definiscono la dimensione del problema; e poi dalla eventuale presenza di funzioni non lineari tra le funzioni che definiscono l obiettivo e/o i vincoli. Se il modello è molto semplice può essere possibile risolvere le relazioni e utilizzare i dati a disposizione per determinare una soluzione analitica. La soluzione analitica è possibile solo nel caso di poche variabili e di funzioni estremamente semplici, e cioè solo nei casi che si utilizzano come esempi ed esercizi nei testi e sulla lavagna. Molto spesso, anche se esiste una soluzione analitica è estremamente complessa e la sua determinazione richiede molte risorse di calcolo; ad esempio invertire una matrice è un banale esempio per il quale esiste una formula analitica, ma che dal punto di vista numerico può per certe istanze non essere affatto banale. Quindi, nella pratica, per determinare una buona soluzione di un problema di ottimizzazione occorre fare ricorso all uso del calcolatore. I due aspetti più importanti e in qualche modo complementari nella ricerca Operativa dell uso del calcolatore per la soluzione di un modello matematico sono la simulazione e l ottimizzazione. Il processo di simulazione utilizza un modello matematico che consente di visualizzare l effetto di alcune decisioni sul sistema in esame senza che queste debbano essere realizzate effettivamente sul processo reale. La simulazione consiste quindi nella valutazione numerica delle funzioni che definiscono il modello per alcuni valori delle variabili di interesse allo scopo di verificare come influenzino alcune misure di performance dell uscita. Molto spesso, i modelli per i quali si utilizza la simulazione includono qualche aspetto di natura stocastica e anche dinamica (di evoluzione nel tempo). La simulazione può essere usata come strumento per l ottimizzazione nel senso che colui che prende le decisioni può procedere per tentativi e scegliere la migliore tra varie alternative possibile. Il modello matematico implementato nel simulatore consente di valutare l effetto delle sue decisioni sul sistema nel suo complesso. Questo tipo di approccio è detto analisi di scenari. L analisi di scenari è particolarmente utile nel caso di sistemi estremamente complessi e per i quali una rappresentazione analitica di tutti i legami logico-funzionali può non essere possibile. La soluzione determinata tramite l analisi di scenari possibili non ha però alcuna garanzia di essere quella ottima o una sua approssimazione. L uso della simulazione come strumento di ottimizzazione può essere poco significativo sebbene estremamente flessibile; viceversa può avere un ruolo molto significativo nella successiva fase di validazione del modello in quanto consente di individuare imprecisioni e/o errori nel modello stesso. Non si deve confondere quindi il ruolo di ottimizzazione e simulazione. Dato un modello, il processo di ottimizzazione consiste nella determinazione della soluzione ottima, se esiste, o almeno di una sua buona approssimazione. Nella pratica, per risolvere un problema di ottimizzazione occorre fare ricorso ad un algoritmo iterativo, cioè ad un programma di calcolo che, a partire da una approssimazione iniziale x 0 della soluzione, determina, con una appropriata se- 9

12 quenza di operazioni che definiscono una successione di valori {x k }, una nuova approssimazione x. La possibilità di realizzazione di algoritmi è fortemente legata alla capacità di definire condizioni di ottimalità che caratterizzano la soluzione ottima di un certo modello. L analisi del modello matematico e la definizione di un algoritmo per la sua soluzione sono aspetti fortemente legati tra di loro. Molto spesso software di ottimizzazione e di simulazione sono integrati con software statistico o con fogli elettronici (spreadsheets). La combinazione di simulazione e/o ottimizzazione con la visualizzazione dei risultati è una combinazione vincente. La visualizzazione rende l uscita del processo di simulazione e/o di ottimizzazione molto più comprensibile e aggiunge spesso maggior credibilità al modello, soprattutto nei confronti di un pubblico non tecnico. L uso di fogli elettronici per la costruzione di modelli per l uso di simulazione e di ottimizzazione sarà discusso in un capitolo successivo. Validazione del modello La soluzione numerica ottenuta al passo precedente deve poi essere valutata praticamente. Questa fase di costruzione del modello non deve essere sottovalutata. I motivi di inattendibilità di un modello possono essere molti; in particolare la maggior difficoltà consiste nell ottenere dati e/o informazioni validi. Spesso questo è legato al diverso linguaggio utilizzato dagli esperti del problema reale e dagli esperti di ottimizzazione. Informazioni essenziali sono spesso trascurate perché talmente scontate per l esperto del problema da non dover essere raccontate. O viceversa modelli matematici troppo dettagliati possono produrre soluzioni incomprensibili. La validazione del modello può avvenire attraverso una verifica sperimentale oppure con metodi di simulazione, allo scopo di ottenere, in questa fase di interazione con l esperto, un modello matematico sempre più attendibile. La definizione di un modello si configura quindi come un processo di raffinamento iterativo, che può essere schematizzato come rappresentato in Figura

13 ANALISI DEL PROBLEMA COSTRUZIONE DEL MODELLO ANALISI DEL MODELLO SOLUZIONE NUMERICA VALIDAZIONE DEL MODELLO Figura 1.1: Fasi dell approccio modellistico Vantaggi dell approccio modellistico Esistono diverse ragioni per adottare l approccio modellistico per la soluzione di problemi: si riassumono di seguito le principali. Maggiore comprensione del problema. Il modello è una rappresentazione semplificata del problema e spesso la sua costruzione consente di individuare proprietà strutturali del problema che altrimenti non sarebbero affatto evidenti. Possibilità di risolvere matematicamente il problema. Grazie al modello è possibile analizzare matematicamente il problema ed ottenere così una soluzione che, soprattutto in riferimento a scopi di pianificazione, permette di adottare strategie che da una sola analisi strutturale del problema non apparirebbero evidenti o che a volte potrebbero essere perfino controintuitive. Deduzione analitica di importanti proprietà. Nella fase di analisi del modello è possibile dedurre per via analitica alcune importanti proprietà del problema sulla base dei risultati disponibili per la classe di problemi a cui si fa riferimento. 11

14 Possibilità di simulazioni. Con un modello è possibile effettuare esperimenti che spesso non è possibile effettuare direttamente nella realtà. La fase di simulazione è un passo fondamentale nella costruzione di un modello che può essere utilizzata per verificare l effetto di una decisione, non necessariamente quella ottima, su un prototitpo del sistema e non sul sistema stesso; ad esempio, l uso di un modello consente di studiare gli effetti dell adozione di una particolare misura economica in un paese senza la necessità di sperimentarla direttamente. Il decision maker ha uno strumento che gli consente di valutare l effetto di una sua decisione senza essere necessariamente in grado di capire l aspetto modellistico del problema. Critiche all approccio modellistico Le principali critiche all approccio modellistico possono essere sintetizzate nei seguenti due punti: Impossibilità di quantificare soddisfacentemente con opportuni valori numerici alcuni dati richiesti dal modello; questo accade, ad esempio, nel tentativo di quantificare con un costo o con un profitto alcuni valori sociali soprattutto in relazione a scopi di pianificazione. La qualità delle risposte che un modello produce potrebbero dipendere profondamente dall accuratezza dei dati introdotti. La qualità delle risposte fornite dal modello dipende dall accuratezza della sua definizione: la fase di validazione é cruciale per valutare la soluzione numerica ottenuta e completare il modello introducendo elementi trascurati in una prima fase. 1.4 Un primo esempio di costruzione di un modello matematico Come primo esempio di costruzione di un modello matematico analizziamo un semplice problema di pianificazione degli investimenti. Esempio Capital Budgeting. Supponiamo di dover investire 1000 sul mercato finanziario. Supponiamo inoltre che il mercato offra tre tipi diversi di investimenti A, B, C ciascuno caratterizzato da un prezzo d acquisto e da un rendimento netto, che sono riassunti nella seguente tabella: A B C costo rendimento Si vuole decidere quali degli investimenti effettuare per massimizzare il rendimento sapendo che gli investimenti A, B, C non si possono effettuare in modo parziale cioà non sono frazionabili. Analisi del problema e costruzione del modello. Si tratta di un problema di pianificazione degli investimenti. Si devono definire formalmente le variabili di decisione, l insieme delle soluzioni ammissibili e la funzione obiettivo. 12

15 Variabili di decisione. In questo caso il decisore vuole semplicemente sapere, per ogni investimento, se tale investimento deve essere effettuato oppure no. Una scelta naturale delle variabili di decisione è la seguente: { 0 non si effetua l investimento i esimo x i = i = A, B, C (1.1) 1 si effettua l investimento i esimo Insieme ammissibile. In base alla definizione delle variabili, le possibili scelte compatibili con il nostro budget sono: (0) non si effettuano investimenti x A = x B = x C = 0 (1) si effettua l investimento A; x A = 1, x B = x C = 0 (2) si effettua l investimento B; x A = 0, x B = 1, x C = 0 (3) si effettua l investimento C; x A = x B = 0, x C = 1 (4) si effettuano gli investimenti A e B; x A = x B = 1, x C = 0 (5) si effettuano gli investimenti B e C; x A = 0, x B = x C = 1. (6) si effettuano gli investimenti A e C; x A = 1, x B = 0, x C = 1. (7) si effettuano gli investimenti A, B e C; x A = x B = x C = 1. Tra queste solo alcune sono compatibili con il nostro budget. In particolare, notiamo che le possibilità A, C e A, B, C non sono ammissibili in quanto il costo supera la nostra disponibilità, come si evince dalla Tabella 1.4. L insieme ammissibile oè costituito dalle scelte (0) (5) ed è dato da: S = 0 0, , 0 1 0, 0 0 1, 1 1 0, Si tratta quindi di un sottoinsieme dei vettori di IR 3 a componenti 0 1 ovvero S {0, 1} 3 Funzione obiettivo. L obiettivo che ci proponiamo è la massimizzazione del rendimento totale. Quindi dobbiamo esprimere la funzione obiettivo che corrisponde al rendimento netto relativo alla scelta di x = (x A, x B, x C ) T in S È possibile ottenere la soluzione ottima valutando esaustivamente la funzione obiettivo per ogni elemento di S, ottenendo in relazione alle possibili scelte i valori riportati nella Tabella 1.4. La soluzione ottima è ovviamente quella corrispondente alla scelta (4), cioè all effettuare gli investimenti A e B, con valore della funzione obiettivo pari a 25. Questo rappresentazione del problema ha alcuni difetti, in particolare: 1. L insieme ammissibile S è rappresentato in modo estensivo, cioè elencando tutte le soluzioni ammissibili. In questo caso la cardinalità dell insieme ammissibile è al più quella di {0, 1} 3 cioè 2 3, ma in generale, se la dimensione del problema fosse più grande sarebbe impossibile valutare esaustivamente le soluzioni del problema. Se, ad esempio, il numero degli investimenti fosse stato 100 (che dal punto di vista delle applicazioni reali è del tutto verosimile) la cardinalità dell insieme ammissibile sarebbe stata e per la 13

16 Investimento (0) (1) (2) (3) (4) (5) (6) (7) costi rendimento Tabella 1.1: Tabella costi e rendimenti relativi a tutte le possibili combinazioni di investimento valutazione di possibilità anche supponendo di utilizzare un calcolatore che effettui valutazioni al secondo (velocità superiore a quella raggiungibile dai calcolatori attuali) occorrerebbero secondi, cioè 3000 miliardi di anni! 2. Il modello non è indipendente dai dati del problema, cioè cambiando i dati del problema (prezzi e/o rendimenti) sarebbe necessario cambiare completamente il modello. In genere si cerca di dare una rappresentazione intensiva dell insieme ammissibile S, cioè individuare le proprietà P (x) che consentono di distinguere le soluzioni ammissibili dagli elementi dell insieme {0, 1} 3 che non lo sono. Si vuole quindi scrivere l insieme S in una forma del tipo: S = { x {0, 1} 3 : vale la proprietà P (x) }. Nell esempio, la proprietà distintiva degli elementi di S è il costo complessivo che non deve essere superiore a Possiamo esprimere matematicamente questa relazione come: e quindi l insieme ammissibile si può scrivere P (x) : 750x A + 200x B + 800x C 1000 S = { x = (x A, x B, x C ) T {0, 1} 3 : 750x A + 200x B + 800x C 1000 }. Anche la funzione obiettivo può essere scritta in forma più sintetica come: f(x) = 20x A + 5x B + 10x C. In conclusione, il problema di decisione può essere posto nella forma: max (20x A + 5x B + 10x C ) 750x A + 200x B + 800x C 1000 x i {0, 1} i = A, B, C. 14

17 Capitolo 2 Modelli di Ottimizzazione 2.1 Introduzione In questo capitolo ci occuperemo più nel dettaglio di quei particolari modelli matematici noti come Modelli di Ottimizzazione che rivestono un ruolo centrale nella RO. In termini generali, data una funzione f: IR n IR, ed S IR n, un problema di Ottimizzazione può essere formulato nella forma: min f(x) (P O) x S. Quindi un problema di Ottimizzazione consiste nel determinare, se esiste, un punto di minimo della funzione f tra i punti dell insieme S. I problemi di ottimizzazione sono spesso denominati, con terminologia equivalente, problemi di Programmazione Matematica. Osserviamo subito che un problema di massimo si può sempre ricondurre a un problema di minimo, cambiando di segno la funzione obiettivo. Infatti, i punti di massimo (ove esistano) del problema max f(x) x S coincidono con i punti di minimo del problema min f(x) x S e risulta: max f(x) = min ( f(x)). x S x S In base a tale osservazione ci si può riferire esclusivamente, senza perdita di generalità, a problemi di minimizzazione. La funzione f viene chiamata funzione obiettivo e l insieme S insieme ammissibile cioè l insieme delle possibili soluzioni del problema. Un punto x S si chiama soluzione ammissibile. 15

18 L insieme ammissibile S è un sottoinsieme di IR n e quindi x = (x 1, x 2,..., x n ) T è una variabile vettoriale n-dimensionale e la funzione obiettivo f è una funzione di n variabili reali f(x 1, x 2,..., x n ). 2.2 Definizioni preliminari Si riportano di seguito alcune definizioni fondamentali riguardanti i problemi di Ottimizzazione. Definizione (Problema inammissibile) Il problema di ottimizzazione (PO) si dice inammissibile se S =, cioè se non esistono soluzioni ammissibili. Definizione (Problema illimitato) Il problema di ottimizzazione (PO) si dice illimitato (inferiormente) se comunque scelto un valore M > 0 esiste un punto x S tale che f(x) < M. Un esempio di PO illimitato inferiormente è dato da f(x) = x 3 e S = {x : x 2}. Infatti, al tendere di x a la funzione obiettivo tende anch essa a. Notiamo che se, con la stessa funzione obiettivo, si cambia l insieme S, e si pone S = {x : x 0}, il problema non è più illimitato inferiormente. Definizione (Punto di minimo globale) Si dice che il problema di ottimizzazione (PO) ammette soluzione ottima (finita) se esiste un x S tale che risulti f(x ) f(x), per ogni x S. Il punto x è detto soluzione ottima o minimo globale e il corrispondente valore f(x ) di dice valore ottimo. Per esempio, se si pone f = x 2 e S = IR, l ottimo è l origine, e il corrispondente valore ottimo è zero. Se si prende S = {x : x 2}, l ottimo è 2 e il valore ottimo 4. In molti problemi di ottimo, in cui la ricerca di soluzioni globali può risultare difficile, può avere interesse anche la ricerca di soluzioni di tipo locale. Indichiamo allora con U(x) un intorno di un punto x e consideriamo la definizione seguente. 16

19 Definizione (Punto di minimo locale) Un punto x S si dice punto di minimo locale di f su S se esiste un intorno U(x ) di x tale che: f(x ) f(x), per ogni x S U(x ), e, in tal caso, si dice che f(x ) è un minimo locale di f su S. Si dice che x S è un punto di minimo locale stretto di f su S se esiste un intorno U(x ) di x tale che: f(x ) < f(x), per ogni x S U(x ), x x. Per esempio, se si pone f = x 2 e S = {x : 2 x 1}, l ottimo (minimo globale) è x = 2 di valore ottimo -4, ed il punto x = 1 è un minimo locale di valore pari a 1. È immediato rendersi conto del fatto che un punto di minimo globale è anche un punto di minimo locale, ma non è vero in generale il viceversa. Naturalmente si può anche presentare il caso in cui la funzione obiettivo è limitata inferiormente su S ossia: inf f(x) >, x S ma tuttavia non esistono punti di minimo globale di f su S. Risolvere un problema di ottimizzazione significa quindi, in pratica: - stabilire se l insieme ammissibile è non vuoto, oppure concludere che non esistono soluzioni ammissibili; - stabilire se esistono soluzioni ottime, oppure dimostrare che il problema non ammette soluzioni ottime; - determinare (eventualmente in modo approssimato) una soluzione ottima. All interno dei problemi di Ottimizzazione si possono distinguere le seguenti importanti classi di problemi: 17

20 Problemi di Ottimizzazione Continua. Le variabili possono assumere tutti i valori reali (x IR n ); ed inoltre si parla di problemi di ottimizzazione continua vincolata se S IR n non vincolata se S = IR n. Problemi di Ottimizzazione Discreta. Le variabili sono vincolate ad essere numeri interi (x Z n ); si possono distinguere all interno di questa classe di problemi altre due classi: programmazione a numeri interi se S Z n ottimizzazione booleana se S {0, 1} n. Problemi misti. Solo alcune delle variabili sono vincolate ad essere intere. 2.3 Problemi di Programmazione Matematica Di solito l insieme ammissibile S viene descritto da una numero finito di diseguaglianze del tipo g(x) 0, dove g è una funzione definita su IR n a valori reali. Cioè, formalmente, date m funzioni g i : IR n IR, i = 1,..., m si esprime S nella forma S = {x IR n g 1 (x) 0, g 2 (x) 0,..., g m (x) 0}. Ogni diseguaglianza g i (x) 0 prende nome di vincolo e l insieme ammissibile è quindi formato da tutti quei punti x IR n che sono soluzione del sistema di diseguaglianze g 1 (x) 0 g 2 (x) 0 g 3 (x) 0. g m (x) 0 Osservazione In questa formulazione dell insieme S si sono utilizzati vincoli di diseguaglianza nella forma di minore o uguale, ma è chiaro che questa notazione include i casi in cui i vincoli sono espressi con vincoli di disuguaglianza nella forma di maggiore o uguale e vincoli di uguaglianza; infatti si può sempre trasformare un vincolo di maggiore o uguale del tipo g(x) 0 in un vincolo di minore o uguale semplicemente riscrivendolo nella forma g(x) 0. Inoltre un vincolo di uguaglianza g(x) = 0 può essere riscritto nella forma equivalente delle due diseguaglianze g(x) 0 e g(x) 0. 18

21 Quindi si può riscrivere il problema di ottimizzazione (PO) nella forma min f(x) g i (x) 0, i = 1,..., m. (2.1) Un problema di questo tipo viene chiamato problema di Programmazione Matematica. I problemi di Programmazione Matematica si possono classificare in base alle proprietà della funzione obiettivo e dei vincoli prendendo in considerazione, tra le più significative la linearità, la convessità. Una prima distinzione è quella che fa riferimeno all ipotesi di linearità. Da tale punto di vista, possiamo distinguere: - problemi di Programmazione Lineare (PL), in cui l obiettivo è una funzione lineare del tipo c 1 x 1 + c 2 x c n x n, e i vincoli sono espressi da un sistema di equazioni e disequazioni lineari, cioè esprimibili nella forma a i1 x a in x n ( / =)b i - problemi di Programmazione Non Lineare (PNL), in cui l obiettivo oppure i vincoli non sono tutti lineari. I problemi di PNL corrispondono alla situazione più generale. I problemi non vincolati rientrano nella classe di PNL, infatti, in tal caso f è necessariamente una funzione non lineare da R n in R; è facile verificare che se f fosse lineare il problema non ammetterebbe soluzione. Inoltre, in linea di principio, possono essere formulati come problemi di PNL anche i problemi combinatori. La classificazione dei problemi di Programmazione Matematica in base alla proprietà di convessità sarà affrontata nel Capitolo 5. Alcuni esempi di problemi di Programmazione Matematica sono i seguenti: Esempio Si consideri una funzione obiettivo di due variabili f(x 1, x 2 ) = 2x 1 + x 2 che si vuole minimizzare, con i vincoli 2x 1 + x 2 1, x 1 0, x 2 0. Si ottiene il problema min 2x 1 + x 2 x 1 + x 2 1 x 1 0 x 2 0 che è nella forma (2.1) dove g 1 (x 1, x 2 ) = x 1 + x 2 1, g 2 (x 1, x 2 ) = x 1, g 3 (x 1, x 2 ) = x 2. L insieme ammissibile è descritto attraverso da tre vincoli. Poiché tutte le funzioni che compaiono sono lineari nella variabili x 1 e x 2, questo problema è un problema di Programmazione Lineare. Esempio Si consideri una funzione obiettivo f(x 1, x 2 ) = (x 1 1 2) 2 + (x 2 1 2) 2 che si vuole massimizzare, con i vincoli x 1 + x 2 1, x 1 1, x 2 1. Si ottiene il problema min (x 1 1 2) 2 (x 2 1 2) 2 x 1 + x 2 1 x 1 1 x

22 che è nella forma (2.1) dove g 1 (x 1, x 2 ) = 1 x 1 x 2, g 2 (x 1, x 2 ) = x 1 1, g 3 (x 1, x 2 ) = x 2 1. L insieme ammissibile è un poliedro; la funzione obiettivo è quadratica. Si tratta quindi di un problema di Programmazione Non Lineare. Esempio Si consideri una funzione obiettivo f(x 1, x 2 ) = 3x x x 2 che si vuole minimizzare, con vincoli x 1 + x 2 1 2, x 1 0, x 2 1. Si ottiene il problema min 3x x x 2 x 1 + x x 1 0 x 2 1 che è un problema di Programmazione Non Lineare che può essere facilmente ricondotto nella forma (2.1) riscrivendo gli ultimi due vincoli nella forma x 1 0 e x 2 1. Esempio Si consideri una funzione obiettivo f(x 1, x 2 ) = x 1 +x 2 che si vuole minimizzare sulla regione ammissibile descritta dal vincolo di uguaglianza 4x 1 x 2 = 2. Il problema risultante è: min x 1 + x 2 4x 1 x 2 = 2 che è un problema di Programmazione Lineare con un solo vincolo di uguaglianza. 2.4 Esempi di modelli di Programmazione Matematica Come primi esempi di costruzione di modelli verranno ora analizzati dei semplici problemi di pianificazione della produzione e un problema di progettazione industriale. Esempio (Un problema di produzione (allocazione di risorse)) Un colorificio produce due tipi di coloranti C1 e C2 utilizzando 3 preparati base in polvere P1, P2, P3 che vengono sciolti in acqua. La differente concentrazione dei preparati base dà origine ai due diversi tipi di coloranti. Le quantità (in ettogrammi) di preparati base necessarie per produrre un litro di colorante di ciascuno dei due tipi è riportato nella seguente tabella C1 C2 P1 1 1 P2 1 2 P3-1 Ogni giorno la quantità di ciascuno dei preparati base (in ettogrammi) della quale il colorificio può disporre è la seguente P1 P2 P Il prezzo di vendita del colorante C1 è di 7 Euro al litro, mentre il colorante C2 viene venduto a 10 Euro al litro. Determinare la strategia ottimale di produzione giornaliera in modo da massimizzare i ricavi ottenuti dalla vendita dei due coloranti. 20

23 Formulazione. Si vuole costruire il modello di Programmazione Lineare che rappresenti il problema in analisi considerando le limitazioni date dalle produzioni effettivamente realizzabili. È immediato associare le variabili di decisione ai quantitativi di coloranti prodotti. Siano, quindi, rispettivamente x 1 e x 2 i quantitativi (in litri) da produrre giornalmente dei due coloranti. Nel formulare il modello di Programmazione Lineare si deve verificare che siano soddisfatte le ipotesi fondamentali: Proporzionalità. I consumi dei preparati base e i ricavi ottenibili sono proporzionali ai quantitativi di coloranti prodotti. Ad esempio, per produrre una quantità x 2 di colorante C2 si consumano 2x 2 ettogrammi di P2 e dalla vendita di x 2 litri di C2 si ricavano 10x 2 migliaia di lire indipendentemente dalla quantità prodotta e venduta dell altro tipo di colorante. Additività. I consumi dei preparati base e i ricavi rispettivamente associati alla produzione dei due coloranti sono additivi, nel senso che per produrre x 1 litri di colorante C1 e x 2 di C2 si consumano x 1 +2x 2 ettogrammi di preparato di base P2 e si ricavano 7x 1 +10x 2 migliaia di lire. Continuità. Ogni variabile introdotta nel modello può assumere tutti i valori reali nell intervallo di ammissibilità. Variabili. Come già detto, prendiamo come variabili di decisione x 1 e x 2, rispettivamente i quantitativi (in litri) di colorante C1 e C2 da produrre giornalmente. Funzione obiettivo. È rappresentata dal profitto totale che per le ipotesi fatte è dato (in Euro) da 7x x 2. Vincoli. Poiché il consumo di preparati base non può essere superiore alla disponibilità si deve avere x 1 + x x 1 + 2x x Inoltre si deve esplicitare il vincolo di non negatività sulle variabili x 1 0, x 2 0. Quindi la formulazione finale è max 7x x 2 x 1 + x x 1 + 2x x x 1 0, x

24 Esempio (Un problema di pianificazione della produzione industriale)) Un industria chimica fabbrica 4 tipi di fertilizzanti, Tipo 1, Tipo 2, Tipo 3, Tipo 4, la cui lavorazione è affidata a due reparti dell industria: il reparto produzione e il reparto confezione. Per ottenere fertilizzante pronto per la vendita è necessaria naturalmente la lavorazione in entrambi i reparti. La tabella che segue riporta, per ciascun tipo di fertilizzante i tempi (in ore) necessari di lavorazione in ciascuno dei reparti per avere una tonnellata di fertilizzante pronto per la vendita. Tipo 1 Tipo 2 Tipo 3 Tipo 4 Reparto produzione Reparto confezionamento Dopo aver dedotto il costo del materiale grezzo, ciascuna tonnellata di fertilizzante dà i seguenti profitti (prezzi espressi in Euro per tonnellata) Tipo 1 Tipo 2 Tipo 3 Tipo 4 profitti netti Determinare le quantità che si devono produrre settimanalmente di ciascun tipo di fertilizzante in modo da massimizzare il profitto complessivo, sapendo che settimanalmente il reparto produzione può lavorare al più 100 ore mentre il reparto confezionamento può lavorare al più 50 ore settimanali. Analisi del problema e costruzione del modello. Si tratta di un problema di pianificazione della produzione industriale. Costruiamo un modello di Programmazione Matematica rappresentante il problema in analisi supponendo di voler pianificare la produzione settimanale. Variabili di decisione. La scelta delle variabili di decisione é molto delicata: infatti la qualitá dell intero modello dipenderá da essa. In genere, per stabilire l opportuno insieme di variabili di decisione, conviene porsi la seguente domanda: che cosa vuole sapere il decisore alla fine del processo di ottimizzazione? Ancora meglio, cosa gli é sufficiente sapere, per prendere le sue decisioni? In questo caso, ad esempio, tutto ció che il decisore deve conoscere sono le quantitá di fertilizzante da produrre per ciascun tipo. Dunque introduciamo le variabili reali x 1, x 2, x 3, x 4 rappresentanti rispettivamente le quantità di prodotto del Tipo 1, Tipo 2, Tipo 3, Tipo 4 da fabbricare in una settimana. Funzione Obiettivo. Ciascuna tonnellata di fertilizzante contribuisce al profitto totale secondo la tabella data. Quindi il profitto totale sarà 250x x x x 4. (2.2) L obiettivo dell industria sarà quello di scegliere le variabili x 1, x 2, x 3, x 4 in modo che l espressione (2.2) del profitto sia massimizzata. La (2.2) rappresenta la funzione obiettivo. Vincoli. Ovviamente la capacità produttiva della fabbrica limita i valori che possono assumere le variabili x j, j = 1,..., 4; infatti si ha una capacità massima lavorativa in ore settimanali di ciascun reparto. In particolare per il reparto produzione si hanno a disposizione al più 100 ore settimanali e poiché ogni tonnellata di fertilizzante di Tipo 1 utilizza il reparto produzione per 2 ore, ogni tonnellata di fertilizzante di Tipo 2 utilizza il reparto produzione per 1.5 ore e così via per gli altri tipi di fertilizzanti si dovrà avere 2x x x x (2.3) 22

25 Ragionando in modo analogo per il reparto confezionamento si ottiene 0.5x x x 3 + x (2.4) Le espressioni (2.3), (2.4) costituiscono i vincoli del modello. Si devono inoltre esplicitare vincoli dovuti al fatto che le variabili x j, j = 1,... 4 rappresentando quantità di prodotto non possono essere negative e quindi vanno aggiunti i vincoli di non negatività La formulazione finale sarà quindi x 1 0, x 2 0, x 3 0, x 4 0. max 25x x x x 4 2x x x x x x x 3 + x 4 50 x 1 0, x 2 0, x 3 0, x 4 0. Questa formulazione è un problema matematico ben definito e costituisce il modello di Programmazione Matematica rappresentante il problema di pianificazione della produzione industriale in analisi. Si tratta, in questo caso, di un problema di programmazione lineare. Esempio (Dimensionamento ottimo) Un industria deve costruire un silos di forma cilindrica. Tale silos deve essere posto in un magazzino appoggiato su una delle basi. Tale magazzino è a pianta rettangolare di dimensioni metri ed ha un tetto spiovente lungo il lato di 10 metri, che ha altezza massima di metri 5 e altezza minima di metri 3. Per costruire questo silos deve essere usato del materiale plastico sottile flessibile che può essere tagliato, modellato e incollato saldamente. Sapendo che si dispone di non più di 200 m 2 di tale materiale plastico si costruisca un modello che permetta di determinare le dimensioni del silos (raggio di base ed altezza) in modo da massimizzare la quantità di liquido che può esservi contenuto. Analisi del problema e costruzione del modello. Si tratta di determinare il dimensionamento ottimale di un contenitore cilindrico per uso industriale cercando di massimizzare il suo volume tenendo presente che deve essere contenuto in un magazzino di dimensioni fissate. Si devono definire formalmente le variabili di decisione, l insieme delle soluzioni ammissibili e la funzione obiettivo. Variabili di decisione. È immediato introdurre due variabili x e y che rappresentano rispettivamente la lunghezza (in metri) del raggio di base e dell altezza del contenitore cilindrico. Funzione obiettivo. La funzione obiettivo è rappresentata dal volume del contenitore cilindrico ed è data da πx 2 y. Vincoli. Il diametro della base non può superare le dimensioni del magazzino e quindi deve essere 2x

26 La limitazione dell altezza del contenitore varia al variare del diametro di base in quanto il tetto è spiovente. Dato che la pendenza del tetto è del 20%, dovrà risultare y x. Inoltre disponendo solo di una quantità limitata di materiale plastico la superficie totale del contenitore cilindrico non può superare 200m 2 e quindi deve risultare 2πx 2 + 2πxy 200. Si devono infine esplicitare i vincoli di non negatività x 0, y 0. La formulazione complessiva risulta quindi max x 2 y x 5 y x 2πx 2 + 2πxy 200 x 0, y 0. Il modello è quindi un modello di programmazione non lineare. Esempio (Discriminazione del prezzo) Consideriamo un monopolista che operi su due mercati distinti (ad es. nazionale ed estero) ciascuno con una diversa funzione di domanda. Indichiamo con x i l offerta sul mercato i = 1, 2 e con P i = f i (x i ) la funzione di domanda inversa sul mercato i. Supponiamo inoltre che il costo di produzione sia proporzionale con una costante c alla offerta complessiva x 1 + x 2. Il problema consiste nel massimizzare il profitto del monopolista. Analisi del problema e costruzione del modello. Variabili di decisione. È immediato considerare le due variabili x 1, x 2 che rappresentano l offerta sui due mercati distinti del bene. Funzione obiettivo. Su vuole massimizzare il profitto, ovvero ricavo meno costi. La funzione ricavo è x 1 f 1 (x 1 ) + x 2 f(x 2 ), mentre il costo è c(x 1 + x 2 ). Il profitto totale sarà quindi f(x) = x 1 f 1 (x 1 ) + x 2 f(x 2 ) c(x 1 + x 2 ). Vincoli. Poiché le due variabili rappresentano un offerta si tratta di quantità non negative x i 0 per i = 1, 2. Più in generale nel caso di n mercati distinti, posto x = (x 1,..., x n ) T si ha l insieme ammissibile: Il problema di ottimizzazione corrispondente è S = {x R n : x 0}. max x S n n x i f i (x i ) c x i. i=1 i=1 24

27 Molto spesso le funzioni f i (x i ) hanno un andamento lineare del tipo f i (x i ) = a i m i x i con m i > 0. La funzione ricavo risulta essere quindi una funzione quadratica del tipo n x i (a i m i x i ) = x T Mx + a T x i=1 con M matrice diagonale ad elementi positivi diag{m i } n i=1 e a = (a 1..., a n ) T. Esempio (Problemi di approssimazione o di curve fitting) Supponiamo di conoscere i valori φ(t i ) che una funzione continua φ : R R assume in punti t i con i = 1,..., N in un intervallo [t min, t max ]. Si vuole approssimare φ(t) su un intervallo assegnato [t min, t max ] per mezzo di un polinomio di grado n: p n (t; x) = n x k t k, in cui x k, per k = 0,..., n sono i coefficienti (incogniti) del polinomio e in cui si é posto Si possono definire gli errori k=0 x = (x 0, x 1,..., x n ) R n+1. e i (x) = φ(t i ) p n (t i ; x), i = 1,..., m, che rappresentano la differenza tra il valore effettivo della funzione φ(t i ) e il valore ottenuto con la funzione approssimante p n (t i ; x). È allora possibile considerare diverse funzioni di ottimo 1. minimizzazione dell errore quadratico medio min m e i (x) 2, i=1 2. minimizzazione del massimo valore assoluto dell errore min max 1 i m e i(x). 3. minimizzazione della somma dei valore assoluto dell errore min m e i (x). i=1 Si tratta di problemi di ottimizzazione non vincolata. Osserviamo che nel caso 1, la funzione obiettivo é quadratica nelle incognite x (si veda l esempio 6.5.2). I problemi del tipo 2 e 3 hanno funzione obiettivo che non è continuamente differenziabile. Nel paragrafo si vedrà che problemi del tipo 2 e 3 possono essere ricondotti a problemi di programmazione lineare. 25

28 A titolo di esempio numerico sia φ(t), t R una funzione nota sperimentalmente che assume i valori seguenti: t Φ(t) Si vuole approssimare la funzione y = φ(t) con un polinomio di primo grado (ovvero una retta) del tipo y = x 1 t + x 0 in cui x 0, x 1 sono le incognite. Si definiscono gli errori I tre problemi diventano: e i (x i ) = y i (x 1 t i + x 0 ), i = 1,..., 4. min x [ x (x 1 + x 0 1) 2 + (2x 1 + x 0 4) 2 + (3x 1 + x 0 9) 2] min max { x 0, x 1 + x 0 1, 2x 1 + x 0 4, 3x 1 + x 0 9 } x [ min x0 + x 1 + x x 1 + x x 1 + x 0 9 ] x 26

29 Capitolo 3 Modelli di Programmazione Lineare In questo capitolo esaminiamo in modo più dettagliato la Programmazione Lineare. In particolare saranno presentati alcuni modelli di PL più o meno classici. 3.1 Struttura di un problema di Programmazione Lineare Come abbiamo già visto nel Capitolo 2 un problema di Programmazione Lineare è caratterizzato da una funzione obiettivo lineare (da minimizzare o massimizzare) della forma f(x) = c 1 x c n x n = e da un numero finito m di vincoli lineari della forma n c j x j j=1 a 11 x a 1n x n b 1 a 21 x a 2n x n b a m1 x a mn x n b m. dove con intendiamo, oppure =. Introducendo il vettore c IR n, definito c = (c 1,..., c n ) T, x IR n definito x = (x 1,..., x n ) T, il vettore b = (b 1,..., b m ) T e la matrice (m n) a a 1n A =.. a m1... a mn un generico problema di Programmazione Lineare può essere scritto nella forma (3.1) min c T x Ax b. 27

30 Si osservi che, indicando con a T i, i = 1,..., m, le righe della matrice A, ciascun vincolo del problema, ovvero ciascuna disuguaglianza della (3.1) può essere scritto nella forma a T i x b i, i = 1,..., m con pari a, oppure =. Un problema di PL consiste nel minimizzare (massimizzare) una funzione obiettivo lineare su un poliedro. Tra le forme di poliedri più usate nella definizione di problemi di PL abbiamo le seguenti: (a) S = {x R n : Ax = b} (b) S = {x R n : Ax b} (c) S = {x R n : Ax = b, x 0} (forma standard) In R 2 sono poliedri, ad esempio, gli insiemi definiti come segue. x 2 x 2 3 x S 3 S x x 1 x 1 S a) b) c) Figura 3.1: Esempi di poliedri in IR 2. (a) S = {x R 2 : x 1 + x 2 = 3} rappresentato in a) di Figura 3.1. La matrice A = (1 1) e b = 3. (b) S = {x R 2 : x 1 + x 2 3, x 1 1} rappresentato in b) di Figura 3.1. ( ) ( ) La matrice A = e b =

31 (c) (forma standard) S = {x R 2 : x 1 + x 2 = 3, x 1 0, x 2 0} rappresentato in c) di Figura 3.1. La matrice A = (1 1) e b = 3. In generale però è sempre possibile sempre riportarsi ad una delle forme (b) o (c) con semplici trasformazioni dei vincoli o delle variabili. È da notare che non è possibile ricondursi nel caso generale a problemi con soli vincoli di uguaglianza del tipo min c T x Ax = b. Tali problemi sono in effetti di scarsa rilevanza pratica in quanto è possibile dimostrare che se esiste una soluzione ammissibile e il problema non è illimitato allora tutte le soluzioni ammissibili sono ottime. In particolare vale il teorema Trasformazioni dei vincoli Osserviamo che si può sempre supporre che il secondo membro di un vincolo di uguaglianza o disuguaglianza sia non negativo. Infatti, se così non fosse, basta moltiplicare per ( 1) (ovvero cambiare di segno) ad entrambi i membri del vincolo e, eventualmente cambiare il verso della disuguaglianza. Supponiamo quindi nel seguito, senza perdere di generalità che b j 0. Da disuguaglianza a uguaglianza Con l introduzione di opportune variabili aggiuntive non negative, ogni vincolo di disuguaglianza può sempre essere posto nella forma di vincolo di uguaglianza. Infatti un vincolo del tipo può essere riscritto nella forma a T j x b j, (3.2) a T j x + x n+1 = b j, con x n+1 0 ove la variabile x n+1 rappresenta la differenza, non negativa, tra il secondo e il primo membro della disuguaglianza (3.2), e viene detta variabile di slack. D altra parte una disuguaglianza del tipo a T j x b j, (3.3) può essere posta nella forma a T j x x n+1 = b j, con x n+1 0 ove la variabile x n+1 rappresenta la differenza, non negativa, tra il primo e il secondo membro della disuguaglianza (3.3), e viene detta variabile di surplus. Quando la distinzione non è necessaria, le variabili slack e di surplus vengono chiamate variabili ausiliarie. Esempio Il sistema di vincoli 3x 1 + 4x 3 5 5x 1 + x 2 6x 3 = 7 8x 1 + 9x

32 può essere riscritto nella forma 3x 1 + 4x 3 + x 4 = 5 5x 1 x 2 + 6x 3 = 7 8x 1 + 9x 3 x 5 = 2 x 4 0 x 5 0 avendo introdotto la variabile slack x 4 e la variabile di surplus x 5, entrambe non negative. Da uguaglianza a disuguaglianza È anche possibile trasformare vincoli di uguaglianza in vincoli di disuguaglianza. Considerato il vincolo a T j x = b j si pu] o trasformare in due vincoli di disuguaglianza a T j x b j a T j x b j Trasformazioni delle variabili Nei problemi di programmazione lineare si può sempre assumere che le variabili di decisione siano non negative, e cioè che per ogni i risulti x i 0. Infatti se per qualche i deve risultare x i 0, basta effettuare la sostituzione x i = x i, con x i 0; se per qualche i la variabile x i non è vincolata in segno, basta sostituire ad essa la differenza tra due variabili aggiuntive entrambe vincolate in segno, cioè basta porre x i = x + i x i, con x+ i 0, e x i 0. Esempio Sia dato il vincolo x x 2 3 con x 2 0 e con x 1 non vincolata. Ponendo x 1 = x 1 x 3 e x 2 = x 2, equivale al vincolo x 1 0.5x 2 x 3 3 con x i 0, i = 1, 2, Trasformazioni equivalenti Consideriamo alcune formulazioni equivalenti di PL relative ad alcune importanti classi di problemi. In particolare, analizziamo il caso in cui la funzione obiettivo è il massimo tra funzioni lineari oppure nella funzione obiettivo sono presenti dei valori assoluti Funzione obiettivo di tipo max Si consideri il problema ( ) min max x S 1 i m {ct i x + d i } in cui S è un poliedro e c T i x + d i, i = 1,..., m sono assegnate con x IR n, c i IR n. Il problema (3.4) ha una funzione obiettivo che è della forma max 1 i m h i (x) con h i : R n R che, in generale, risulta non differenziabile e dunque non lineare. Un esempio di funzione di questo 30 (3.4)

33 Figura 3.2: max { 2x, x, 1 2 x + 9} tipo per n = 1 e m = 3 è rappresentato in Figura 3.2. I problemi di questo tipo sono di solito chiamati problemi minimax. Aggiungendo una variabile v R è possibile mostrare che tale problema è equivalente al problema di Programmazione Lineare: min x,v v x S c T i x + d i v, i = 1,..., m. (3.5) Per dimostrare l equivalenza dei problemi (3.4) e (3.5), dobbiamo fare vedere che data una soluzione x del problema (3.4) possiamo determinare una soluzione (x, v) del problema (3.5) e viceversa. Supponiamo di avere una soluzione x del problema (3.4). Posto x = x e v = max 1 i m {c T i x + d i } abbiamo che la coppia (x, v) è ammissibile per il problema (3.5), infatti x = x S c T i x + d i v = max 1 i m {ct i x + d i }. Inoltre v v per ogni (x, v) ammissibile. Viceversa, sia data una soluzione ottima (x, v) del problema (3.5), una soluzione ammissibile del problema (3.4) è x = x S. Si tratta anche della soluzione ottima perche v v = max 1 i m {ct i x + d i } 31

34 3.2.2 Funzione modulo Si consideri il problema min x S ct x (3.6) con x IR n, c IR n. Il problema (3.6) può essere equivalentemente scritto nella forma Figura 3.3: Curve di livello della funzione f(x, y) = x + y min x S max{ct x, c T x} (3.7) e dunque applicando la trasformazione descritta per il problema (3.4), si ottiene il problema equivalente min x,v v c T x v c T (3.8) x v x S. Sono inoltre equivalenti i seguenti problemi: ( ) min x,v v min max h i(x) v h i (x) v, i = 1,..., m x S 1 i m x S. 32

35 3.3 Semplici esempi di problemi di programmazione lineare Chiariremo meglio i concetti finora esposti con alcuni esempi. I problemi descritti hanno una funzione essenzialmente esemplificativa. In casi concreti, un problema di programmazione lineare può avere un numero di variabili di decisione e un numero di vincoli dell ordine delle decine e centinaia di migliaia Problemi di miscelazione. Si tratta di problemi in cui si hanno a disposizione un certo numero di sostanze ciascuna delle quali ha un certo costo ed un determinato contenuto di componenti utili. Si vuole ottenere la miscela più economica di queste sostanze tale che contenga una certa quantità di ciascuno dei componenti. vediamo un semplice esempio. Un problema di miscelazione Un industria conserviera deve produrre succhi di frutta mescolando polpa di frutta e dolcificante ottenendo un prodotto finale che deve soddisfare alcuni requisiti riguardanti il contenuto di vitamina C, di sali minerali e di zucchero. La polpa di frutta e il dolcificante vengono acquistati al costo rispettivamente di Lire 400 e Lire 600 ogni ettogrammo. Inoltre dalle etichette si ricava che 100 grammi di polpa di frutta contengono 140 mg di vitamina C, 20 mg di sali minerali e 25 grammi di zucchero, mentre 100 grammi di dolcificante contengono 10 mg di sali minerali, 50 grammi di zucchero e non contengono vitamina C. I requisiti che il prodotto finale (cioè il succo di frutta pronto per la vendita) deve avere sono i seguenti: il succo di frutta deve contenere almeno 70 mg di vitamina C, almeno 30 mg di sali minerali e almeno 75 grammi di zucchero. Si devono determinare le quantità di polpa di frutta e di dolcificante da utilizzare nella produzione del succo di frutta in modo da minimizzare il costo complessivo dell acquisto dei due componenti base. Formulazione. Si vuole costruire un modello di Programmazione Lineare che rappresenti il problema in analisi tenendo presente i requisiti di qualità richiesti. Si verifica facilmente che le ipotesi fondamentali di un modello di Programmazione Lineare sono soddisfatte. Variabili. È naturale associare la variabili di decisione alle quantità di polpa di frutta e di dolcificante da utilizzare per la produzione del succo di frutta. Quindi siano x 1 e x 2 rispettivamente le quantità espresse in ettogrammi di polpa di frutta e di dolcificante che devono essere utilizzate. Funzione obiettivo. È rappresentata dal costo complessivo dell acquisto dei due componenti base e quindi è data da 400x x 2. Questa espressione naturalmente deve essere minimizzata. Vincoli. Poiché un ettogrammo di polpa contiene 140 mg di vitamina C e il dolcificante non contiene vitamina C, il primo vincolo da considerare riguardante il contenuto di vitamina C del succo di frutta si può scrivere nella forma 140x

36 Analogamente per rispettare il requisito sul contenuto di sali minerali del succo di frutta si dovrà imporre il vincolo 20x x Infine il vincolo sul contenuto di zucchero del succo di frutta si può esprimere nella forma 25x x Infine si deve esplicitare il vincolo di non negatività sulle variabili cioè x 1 0, x 2 0. Quindi la formulazione finale è min 400x x 2 140x x x x x 2 75 x 1 0, x 2 0 Formalmente, supponiamo di disporre di n sostanze diverse che indichiamo con S 1, S 2,..., S n ciascuna delle quali contenga una certa quantità di ciascuno degli m componenti utili che indichiamo con C 1, C 2,..., C m. Supponendo che ogni sostanza S j abbia costo unitario c j, j = 1,..., n S 1 S 2 S n c 1 c 2 c n si desidera ottenere la miscela più economica che soddisfi alcuni requisiti qualitativi, cioè contenga una quantità non inferiore a b i di ciascun C i, i = 1,..., m C 1 C 2 C m b 1 b 2 b m. Si indichi con a ij, i = 1,..., m, j = 1,..., n la quantità di componente C i presente nella sostanza S j. Si può così costruire la seguente tabella S 1 S j S n C 1 a 11 a 1j a 1n C i a i1 a ij a in.... C m a m1 a mj a mn Supponendo che valgano le ipotesi di proporzionalità, additività ed inoltre assumendo che le quantità di sostanze da utilizzare siano frazionabili, si può formulare questo problema in termini di un problema di Programmazione Lineare. 34

37 Generalizzando quanto fatto nell esempio,è naturale introdurre le variabili di decisione x 1, x 2,..., x n rappresentanti la quantità di ciascuna sostanza S 1, S 2,..., S n da utilizzare nella miscela. Introducendo come spazio delle variabili lo spazio delle n uple reali IR n si può considerare un x IR n definendo x = (x 1,..., x n ) T. La funzione obiettivo può essere scritta z = c 1 x c n x n = n c j x j. Introducendo c IR n, definito c = (c 1,..., c n ) T, la funzione obiettivo può essere scritta in notazione vettoriale z = c T x. Si devono introdurre i seguenti vincoli: Vincoli di qualità. Tenendo conto del fatto che la miscela deve contenere una quantità non inferiore a b i di ciascun componente C i si dovrà avere n a ij x j b i, i = 1,..., m. j=1 Si devono considerare i vincoli di non negatività sulle variabili cioè x j 0, j = 1,..., n. Introducendo la matrice (m n) j=1 a a 1n A =.. a m1... a mn e il vettore b = (b 1,..., b m ) T la formulazione completa del problema può essere scritta nella forma min c T x Ax b (3.9) x 0, x IR n. Nella pratica, potrebbe essere necessario introdurre ulteriori vincoli: possono essere presenti limitazioni superiori o inferiori sulle variabili cioè x j L, x j M, j = 1,..., n; se è richiesto anche che la miscela contenga una quantità non superiore ad un valore d i di ciascun componente C i si dovrà aggiungere alla formulazione un altro vincolo di qualità: n a ij x j d i, i = 1,..., m; j=1 in alcuni casi si richiede che una certa sostanza appartenga alla miscela solo se un altra sostanza vi appartiene (o non vi appartiene). Questi vincoli sono detti disgiuntivi e la loro formalizzazione matematica sarà discussa nel Capitolo

38 3.3.2 Modelli di trasporto. Sono definite m località origini indicate con O 1,..., O m, e n località destinazioni indicate con D 1,..., D n. Ogni origine O i, (i = 1,..., m) può fornire una certa disponibilità a i 0 di merce che deve essere trasferita dalle origini alle destinazioni O 1 O m a 1 a m. Ad ogni destinazione D j, (j = 1,..., n) è richiesta una quantità b j 0 di merce. D 1 D n b 1 b n. Supponiamo che il costo del trasporto di una unità di merce da O i a D j sia pari a c ij. Tali costi nella realtà sono spesso collegati alle distanze tra origini e destinazioni. Si può così costruire la seguente tabella D 1 D j D n O 1 c 11 c 1j c 1n O i c i1 c ij c in O m c m1 c mj c mn Il problema consiste nel pianificare i trasporti in modo da soddisfare le richieste delle destinazioni minimizzando il costo del trasporto complessivo nella seguente ipotesi: la disponibilità complessiva uguaglia la richiesta complessiva, cioè m n a i = b j ; (3.10) i=1 si escludono possibilità di giacenze nelle origini, cioè tutta la merce prodotta in una origine deve essere trasportata in una delle destinazioni; si escludono possibilità di giacenze nelle destinazioni, cioè la quantità totale che arriva in una destinazione D j deve uguagliare la richiesta b j. Formulazione. Si vuole dare una formulazione del problema in esame in termini di un problema di programmazione lineare supponendo quindi che siano verificate le ipotesi di linearità e continuità. Variabili. Per ogni coppia di origine e destinazione O i, D j si introducono le variabili di decisione x ij rappresentanti la quantità di merce da trasportare da O i, a D j. Si tratta di mn variabili D 1 D j D n O 1 x 11 x 1j x 1n j=1.... O i x i1 x ij x in.... O m x m1 x mj x mn 36

39 Funzione obiettivo. La funzione obiettivo da minimizzare sarà data da costo totale del trasporto e quindi da m n z = c ij x ij. i=1 j=1 Vincoli. Per le ipotesi fatte, si avranno due tipi di vincoli: vincoli di origine n x ij = a i i = 1,..., m; (3.11) j=1 impongono che tutta la merce prodotta in una origine sia trasportata alle destinazioni; si tratta di m vincoli; vincoli di destinazione m x ij = b j j = 1,..., n; (3.12) i=1 impongono che la quantità totale di merce che arriva in ciascuna delle destinazioni uguaglia la richiesta; si tratta si n vincoli. Si devono infine considerare i vincoli di non negatività delle variabili x ij 0 i = 1,..., n; j = 1,..., m. Si è così ottenuta una formulazione del problema dei trasporti con mn variabili e m+n+mn vincoli: m n min c ij x ij i=1 j=1 n x ij = a i i = 1,..., m (3.13) j=1 m x ij = b j j = 1,..., n i=1 x ij 0 i = 1,..., n; j = 1,..., m. Osservazione 1 È chiaro che per le ipotesi fatte dovrà risultare Anzi vale il seguente risultato m n n m m n x ij = x ij = a i = b j. i=1 j=1 j=1 i=1 i=1 j=1 37

40 Teorema Condizione necessaria e sufficiente affinché il problema (3.13) ammetta soluzione, cioè che esista una soluzione ammissibile, è che risulti m a i = i=1 n b j. (3.14) Tale risultato chiarisce perché nella formulazione classica del problema dei trasporti si adotta l ipotesi (3.10) cioè che la disponibilità complessiva uguagli la richiesta complessiva. Passiamo, ora, ad analizzare alcune varianti della formulazione classica del problema dei trasporti; può infatti accadere che non tutte le rotte di trasporto siano disponibili: se non è possibile il trasporto da una certa origine O i ad una destinazione D j si pone, per convenzione, c ij =. Oppure possono esistere rotte di trasporto O i D j in cui vi sono limitazioni sulle quantità massima di merci trasportabili u ij. Questo produce dei vincoli del tipo x ij u ij. Infine, si può supporre che la disponibilità complessiva possa essere superiore alla domanda cioè m n a i b j. (3.15) i=1 In tal caso, possono essere ammesse giacenze nelle origini e/o nelle destinazioni; se si accetta di avere giacenze nelle origini, allora i vincoli di origine diventano j=1 j=1 n x ij a i i = 1,..., m; j=1 se si accetta di avere giacenze nelle destinazioni, allora i vincoli di destinazione diventano m x ij b j j = 1,..., n. i=1 Anche nel caso in cui valga la (3.15), il problema dei trasporti può essere posto nella sua formulazione classica, cioè con soli vincoli di uguaglianza, introducendo una destinazione fittizia che abbia una richiesta pari a m n a i i=1 e ponendo uguale a zero il costo per raggiungere questa destinazione fittizia da qualsiasi origine. Un problema di trasporto Consideriamo un industria che produce un bene di consumo in due stabilimenti di produzione, situati rispettivamente a Pomezia e a Caserta. La produzione viene prima immagazzinata in due depositi, situati uno a Roma e l altro a Napoli. Quindi i prodotti vengono distribuiti alla rete di vendita al dettaglio. Per ogni unità di prodotto, il costo del trasporto dallo stabilimento al deposito è dato dalla Tabella: j=1 b j 38

41 Roma Napoli Pomezia 1 3 Caserta Costi di trasporto euro/unità La capacità produttiva dei due stabilimenti è limitata, per cui ogni settimana il bene in questione non può essere prodotto in più di unità nello stabilimento di Pomezia e in più di 8000 unità nello stabilimento di Caserta. Inoltre le statistiche di vendita informano che ogni settimana vengono vendute mediamente unità tramite il deposito di Roma e 4600 unità tramite il deposito di Napoli. L industria vuole minimizzare il costo del trasporto della merce dagli stabilimenti ai depositi, assicurando che i depositi ricevano settimanalmente le quantità medie prima indicate. Le variabili di decisione sono le quantità del bene di consumo trasportate settimanalmente, che possiamo associare alle variabili x 1, x 2, x 3, x 4 nel seguente modo: che corrisponde in forma di tabella a quantità trasportata da Pomezia a Roma x 1 quantità trasportata da Pomezia a Napoli x 2 quantità trasportata da Caserta a Roma x 3 quantità trasportata da Caserta a Napoli x 4 Roma Napoli Pomezia x 1 x 2 Caserta x 3 x 4 Variabili decisione La funzione obiettivo è il costo sostenuto settimanalmente per il trasporto: z(x 1, x 2, x 3, x 4 ) = x 1 + 3x x x 4. Osserviamo che i a i = e j b j = 15600, dunque siamo nell ipotesi (3.15) e supponiamo di accettare giacenze nelle origini. Poichè i due stabilimenti hanno capacità produttiva limitata deve essere x 1 + x x 3 + x Poichè si vuole garantire il rifornimento medio settimanale (senza giacenza), deve essere x 1 + x 3 = x 2 + x 4 = Infine evidentemente deve risultare x i 0, i = 1, 2, 3, 4, e quindi il problema di programmazione lineare per l industria dell esempio è il seguente: min z = x 1 + 3x x x 4 x 1 + x x 3 + x x 1 + x 3 = x 2 + x 4 = 4600 x i 0, i = 1, 2, 3, 4. 39

42 3.3.3 Un problema di Yield Management ferroviario Una compagnia ferroviaria vende i biglietti per il treno che effettua il percorso dalla città A (Roma) alla B (Bologna) effettuando una fermata intermedia F 1 (Firenze). x 13 x 12 x L 1 L 2 Figura 3.4: Un treno con percorso composto da due tratte L 1, L 2 e tre Origini-Destinazione (1,2), (2,3), (1,3) Le tariffe sono fissate a priori e dipendono solo dalla distanza tra le origini-destinazioni. In particolare i prezzi in Euro (1 a classe) per per ciascuna possibile Origine-Destinazione (O-D) coperta dal treno sono riportati nella Tabella O-D A-F 1 A-B F 1 -B Tariffa 42,35 53,20 18,59 Tabella 3.1: Tariffe per le tre possibili O-D coperte dal treno Il numero di posti disponibili sul treno è pari a 700. All inizio del periodo di prenotazione la domanda per ciascuna origine-destinazione (O-D) è incerta, ma è nota una previsione sulla domanda il cui valor (medio) µ è riportato in Tabella O-D A-F 1 A-B F 1 -B µ Tabella 3.2: Domanda prevista per le tre possibili O-D coperte dal treno Il problema consiste nel determinare quanti posti vendere su ciascuna Origine -Destinazione (O-D) coperta dal treno in modo da massimizzare il profitto. Formulazione. Si vuole costruire un modello di Programmazione Lineare che rappresenti il problema in analisi tenendo presente i requisiti richiesti. Si assume che la domanda effettiva per ciascuna origine- Destinazione sarà almeno pari al valor medio µ. 40

43 Variabili. È naturale associare la variabili di decisione alle quantità di posti prenotabili su ciascuna Origine-Destinazione possibile. In questo caso, sono le tre variabili x 12, x 13 e x 23 che rappresentano rispettivamente i posti prenotabili sulla tratta A-F 1, A-B, F 1 -B. Funzione obiettivo. È rappresentata dal profitto (atteso) relativo alla vendita e quindi è data da 42, 35x , 20x , 59x 23. Questa espressione naturalmente deve essere massimizzata. Vincoli. Osserviamo innanzitutto che, poiché per ipotesi si avranno almeno µ domande per ciascuna Origine-Destinazione, è necessario imporre i vincoli x x x in quanto non è sensato prenotare più posti della domanda effettiva. Inoltre devono essere imposti i vincoli legato alla capacità di posti del treno. In particolare, nel tratto da A ad F 1 sono presenti sia i viaggiatori che si recano da A ad F 1 che quelli che vanno da A ad B. cosí nel tratto dal F 1 a B sono presenti sia i viaggiatori che vanno da A ad B che quelli che vanno da F 1 a B. Avremo quindi 2 vincoli x 12 + x x 23 + x Infine si deve esplicitare il vincolo di non negatività sulle variabili cioè x 12, x 23, x In principio le variabili rappresentano dei posti, e quindi si dovrebbero esplicitare anche i vincoli di interezza. Questi vincoli possono essere omessi come sarà chiarito in un prossimo capitolo. Quindi la formulazione finale è max 42, 35x , 20x , 59x 23 x 12 + x x 23 + x x x x (x 12, x 23, x 13 intere) Minimizzazione dello scarto massimo Consideriamo i casi 2 e 3 definiti nel Esempio Si vuole costruire un modello di Programmazione Lineare equivalente ai problemi 1. minimizzazione del massimo valore assoluto dell errore min max 1 i m e i(x). 2. minimizzazione della somma dei valore assoluto dell errore min m e i (x) i=1 41

44 utilizzando le trasformazioni nel paragrafo 3.2. Nel primo caso la funzione obiettivo è f(m, q) = max { x 1t i + x 0 y(t i ) } = max{ x 0, x 1 + x 0 1, 2x 1 + x 0 4, 3x 1 + x 0 9 }. i=0,1,2,3 Vincoli. Non ci sono vincoli espliciti, ma per poter ricondurre il problema di min max{ x 0, x 1 + x 0 1, 2x 1 + x 0 4, 3x 1 + x 0 9 } x 1,x 0 ad un problema di Programmazione Lineare è necessario introdurre una variabile aggiuntiva z R ed i vincoli Si ottiene il problema di PL: max{ x 0, x 1 + x 0 1, 2x 1 + x 0 4, 3x 1 + x 0 9 } z. min x1,x 0,z z z x 0 z z x 1 + x 0 1 z z 2x 1 + x 0 4 z z 3x 1 + x 0 9 z z 0. osserviamo che il vincolo x 0 è implicato dagli altri vincoli e dunque puo essere eliminato. Funzione obiettivo somma di moduli. Nel secondo caso la funzione obiettivo è f(m, q) = x 1 t i + x 0 y(t i ) = x 0 + x 1 + x x 1 + x x 1 + x 0 9. t=0,1,2,3 Vincoli. Non ci sono vincoli espliciti, ma per poter ricondurre il problema di min x ( x 0 + x 1 + x x 1 + x x 1 + x 0 9 ) ad un problema di Programmazione Lineare è necessario introdurre le variabile aggiuntive z i R, i = 1,..., 4 ed i vincoli x 0 z 1 x 1 + x 0 1 z 2 2x 1 + x 0 4 z 3 3x 1 + x 0 9 z 4. Si ottiene il problema di PL: min z 1 + z 2 + z 3 + z 4 x R 2,z R 4 z 1 x 0 z 1 z 2 x 1 + x 0 1 z 2 z 3 2x 1 + x 0 4 z 3 z 4 3x 1 + x 0 9 z 4. osserviamo che anche in questo caso il vincolo x 0 è implicato dagli altri vincoli e dunque puo essere eliminato. 42

45 Capitolo 4 Soluzione grafica di problemi PM in 2 variabili In questo paragrafo si vuole fornire una interpretazione geometrica di un problema di Programmazione matematica. In particolare, quando un problema di Programmazione matematica è definito solamente in due variabili, si può rappresentare efficacemente il problema sul piano cartesiano e si può determinare una sua soluzione in maniera elementare con semplici deduzioni geometriche. Le situazioni che verranno presentate nel seguito vogliono rappresentare un punto di partenza intuitivo per la trattazione di problemi di Programmazione Lineare in n variabili; i risultati che verranno dedotti per via elementare nel caso bidimensionale trovano, infatti, una generalizzazione consistente nel caso di un generico problema di Programmazione Lineare. 4.1 Rappresentazione di vincoli nel piano cartesiano In questo paragrafo si richiamano le rappresentazioni geometriche nel piano di alcune curve note in modo analitico Vincoli lineari Nel piano cartesiano Ox 1 x 2 l equazione lineare a 1 x 1 + a 2 x 2 = c (4.1) rappresenta una retta che partiziona il piano in due semipiani. Ciascun semipiano è caratterizzato da punti P (x 1, x 2 ) che soddisfano la disequazione ax 1 + bx 2 c oppure la disequazione ax 1 + bx 2 c. Quindi ogni disequazione del tipo ax 1 + bx 2 c oppure ax 1 + bx 2 c individua univocamente un semipiano. Si riporta, ora, un semplice risultato geometrico che verrà utilizzato nel seguito. Lemma Si considera una famiglia di rette parallele a 1 x 1 + a 2 x 2 = c (4.2) 43

46 con a 1, a 2 IR fissati e con c IR. Il vettore a = ( a1 a 2 ) individua una direzione ortogonale alle rette della famiglia (4.2) ed è orientato dalla parte in cui sono le rette della famiglia ottenute per valori crescenti della c, cioè verso il semipiano in cui risulta a 1 x 1 + a 2 x 2 c. Dimostrazione. Sia x un vettore di componenti x 1 e x 2. La famiglia di rette (4.2) può essere scritta in forma vettoriale a T x = c. Siano ora x e z due punti appartenenti alla retta a T x = c. Risulta quindi a T z = c e a T x = c e sottraendo membro a membro queste due uguaglianze si ottiene a T ( z x) = 0. Quindi il vettore a è ortogonale al vettore z x che individua la direzione della famiglia di rette cioè il vettore a rappresenta una direzione ortogonale alla famiglia di rette (4.2). Si consideri ora un punto x = (x 1, x 2 ) T appartenente alla retta a T x = c e un punto ȳ = (y 1, y 2 ) T tale che a T y c. Si vuole dimostrare che il punto ȳ appartiene al semipiano individuato dalla retta a T x = c verso il quale è orientato il vettore a. Infatti, per le ipotesi fatte, si ha a T ȳ c e a T x = c e sottraendo membro a membro queste due relazioni si ottiene a T (ȳ x) 0 e questo significa che l angolo θ che il vettore ȳ x forma con il vettore a deve essere acuto e quindi il vettore a deve essere orientato verso il semipiano ove si trova il punto ȳ, cioè il semipiano individuato dalla diseguaglianza a T x c. (Figura 4.1) Come esempio del risultato riportato dal( lemma ) appena dimostrato, si consideri la disuguaglianza lineare 3x 1 +x 2 6. Il vettore a = individua una direzione ortogonale alla retta 3 1 3x 1 + x 2 = 6 ed è orientato verso il semipiano individuato dalla disuguaglianza 3x 1 + x 2 6 (Figura 4.2). Nella pratica, per determinare quale dei due semipiani è individuato dalla disuguaglianza lineare a 1 x 1 +a 2 x 2 c si può procedere semplicemente in questo modo: dopo aver rappresentato la retta a 1 x 1 + a 2 x 2 = c per individuare qual è il semipiano di interesse, si può scegliere un punto P del piano (l origine degli assi è il piú semplice) e valutare l espressione a 1 x 1 + a 2 x 2 in questo punto; se il valore così ottenuto è maggiore o uguale di c allora il semipiano individuato dalla disuguaglianza lineare a 1 x 1 + a 2 x 2 c è quello contenente il punto P ; in caso contrario è quello opposto Vincoli quadratici Nel piano cartesiano Ox 1 x 2 le equazioni quadratiche rappresentano delle coniche. Consideriamo delle equazioni del tipo h(x 1, x 2 ) = 0 polinomi di grado massimo pari a due. Ci limiteremo a richiamare le equazioni h = 0 della circonferenza e della parabola. 44

47 x 2 T a x > C - y T a x C _ x θ a x 1 Figura 4.1: Interpretazione geometrica del Lemma x + x x + x 1 > a 2 Figura 4.2: Rappresentazione del vincolo lineare 3x 1 + x

48 Nel piano cartesiano Ox 1 x 2 l equazione quadratica h(x 1, x 2 ) = (x 1 a 1 ) 2 + (x 2 a 2 ) 2 r 2 = 0 (4.3) rappresenta una circonferenza di centro C=(a 1 a 2 ) T e raggio fissato r. Il gradiente di h è dato ( ) (( ) ( )) 2(x1 a h(x) = 1 ) x1 a1 = 2 2(x 2 a 2 ) x 2 a 2 Ad una circonferenza possono essere associati due insiemi S = {x IR 2 : (x 1 a 1 ) 2 + (x 2 a 2 ) 2 r 2 } S = {x IR 2 : (x 1 a 1 ) 2 + (x 2 a 2 ) 2 r 2 } la cui intersezione è la circonferenza stessa. S è l insieme dei punti interni alla circonferenza, mentre S rappresenta i punti esterni. Nel piano cartesiano Ox 1 x 2 le equazioni quadratiche riconducibili alla forma h(x 1, x 2 ) = x 2 ( a 1 x a 2 x 1 + a 3 ) = 0 h(x 1, x 2 ) = x 1 ( a 1 x a 2 x 2 + a 3 ) = 0 rappresentano rispettivamente una parabola con asse parallelo all asse delle ordinate e ascissa del vertice pari a a2 2a 1 e una parabola con asse parallelo all asse delle ascisse e ordinata del vertice pari a a 2 2a 1. Consideriamo senza perdere di generalità la prima delle due equazioni e gli insiemi individuati dai due vincoli di disuguaglianza corrispondenti S = {x IR 2 : x 2 a 1 x a 2 x 1 + a 3 } S = {x IR 2 : x 2 a 1 x a 2 x 1 + a 3 } S è l insieme dei punti che si trova internamente alla parabola stessa e S è l insieme dei punti esterni. 4.2 Rappresentazione di funzioni obiettivo Quanto esposto nel paragrafo precedente è utile anche per esaminare la variazione di una funzione lineare/quadratica che rappresenta la funzione obiettivo di un problema di Programmazione Matematica. In particolare, data una generica funzione obiettivo f(x 1, x 2 ), si rappresentano le curve di livello della funzione ovvero le curve f(x 1, x 2 ) = k (4.4) ottenuta al variare di k. Se il problema è di minimizzazione, si cercherà di ottenere un valore piú basso possibile per la k in corrispondenza di valori ammissibili per x 1 e x 2 ; viceversa, se il problema è di massimizzazione, si cercherà ottenere un valore piú alto possibile per la k Funzioni lineari In due variabili, la funzione obiettivo di un problema di Programazione Lineare è un espressione del tipo f(x 1, x 2 ) = c 1 x 1 + c 2 x 2 da massimizzare o da minimizzare. Per rappresentare questa 46

49 funzione obiettivo su un piano cartesiano Ox 1 x 2 si considera la famiglia di rette parallele (k = C) c 1 x 1 + c 2 x 2 = C (4.5) ottenuta al variare di C, che rappresentano le rette di livello della funzione. Sulla base di quanto esposto nel paragrafo precedente, ( valori ) superiori della C si determinano traslando le rette nel c1 verso individuato dal vettore che rappresenta, quindi, una direzione di crescita per la c 2 funzione c 1 x 1 + c 2 x 2. Ovviamente, la direzione opposta sarà una direzione di decrescita. Quindi, geometricamente, un problema di massimizzazione consisterà nel considerare la traslazione nel verso della direzione di crescita della funzione obiettivo, mentre in un problema di minimizzazione si considera la traslazione nel verso opposto (Figura 4.3) x direzione di crescita x +x = x +x =8 2 x +x = x 1 Figura 4.3: Rette di livello della funzione 2x 1 + x Funzioni quadratiche In due variabili, consideriamo la funzione obiettivo quadratica f(x 1, x 2 ) = (x 1 a 1 ) 2 + (x 2 a 2 ) 2 (4.6) Per rappresentare questa funzione obiettivo su un piano cartesiano Ox 1 x 2 si considera la famiglia di curve (k = r 2 ) (x 1 a 1 ) 2 + (x 2 a 2 ) 2 = C 2 (4.7) 47

50 ottenuta al variare di C, che rappresentano circonferenze concentriche di raggio variabile C. Se il problema è di massimizzazione si vuole trovare il massimo valore di raggio ottenibile in corrispondenza di valori ammissibili per x 1 e x 2 ; viceversa se si tratta di minimizzazione. Osserviamo che se il centro della circonferenza base è ammissibile, esso costituisce il punto di minimo globale. 4.3 Esempi di risoluzione grafica Verranno considerati alcuni esempi di problemi di Programmazione Matematica. Esempio Sia la funzione obiettivo da minimizzare: f(x) = x 1 e sia l insieme ammissibile F definito dai vincoli: (x 1 3) 2 + (x 2 2) 2 = 13 (x 1 4) 2 + x Determinare graficamente, se esiste, un punto di minimo. Soluzione. Questo esempio evidenzia geometricamente la definizione di minimo locale vincolato in un problema a 2 variabili. x 2 B C A x 1 Figura 4.4: Soluzione grafica in IR 2 dell Esempio L insieme ammissibile F, rappresentato in Figura (4.4), ed è dato dall arco di circonferenza ACB (tratteggiato in verde). Poiché esso è compatto e f è continua, in base al Teorema di Weierstrass, l esistenza di un minino globale è assicurata. 48

51 Le curve di livello x 1 = k sono rette parallele all asse delle ordinate con valore crescente all aumentare di k. Si determina il punto di minimo globale nel punto A = (0, 0) T di valore f = 0. Si osserva che il punto C è un massimo globale, mentre il punto B risulta essere un minimo locale. Esempio Sia dato il problema di ottimizzazione vincolata min 2x 1 + 3x 2 6x 1 + x 2 2 x 2 12 x 1 4x 2 2 x 1, x 2 0 Determinare, se esiste, un punto di minimo globale. Esempio Si consideri la funzione obiettivo: f(x) = 1 2 (x x 2 2 ) e sia l insieme ammissibile F definito dai vincoli: Determinare se esiste un punto di minimo. x 1 + x 2 = 1 (x 1 1) 2 + x Soluzione. L insieme ammissibile F é dato dal segmento di retta che ha per estremi i punti ( ) T ( ) x = 1 1 2, e x = , T. 2 L esistenza di una soluzione é garantita dal Teorema di Weierstrass poiché la funzione obiettivo é continua e l insieme ammissibile é compatto. Le curve di livello della funzione obiettivo 1 2 (x x 2 2 ) = r 2 sono circonferenze di centro l origine e raggio r. Esempio Si consideri ora il problema di allocazione ottima di risorse del Paragrafo che è rappresentato dal seguente problema di Programmazione Lineare: max 7x x 2 x 1 + x x 1 + 2x x x 1 0, x 2 0. Sul piano cartesiano Ox 1 x 2 ciascun vincolo individua un semipiano. In particolare, in Figura 4.6 è evidenziato il semipiano individuato dal primo vincolo x 1 + x

52 Figura 4.5: Soluzione grafica in IR 2 dell Esempio In Figura 4.7 è evidenziato il semipiano individuato dal secondo vincolo x 1 + 2x Infine in Figura 4.8 è evidenziato il semipiano individuato dal terzo vincolo x Ovviamente i vincoli di non negatività delle variabili x 1 0 e x 2 0 rappresentano rispettivamente il semipiano delle ascisse non negative e il semipiano delle ordinate non negative. L insieme ammissibile del problema di Programmazione Lineare che stiamo esaminando è dato quindi dall intersezione di tali semipiani e si può indicare con S = { } (x 1, x 2 ) IR 2 x 1 + x 2 750, x 1 + 2x , x 2 400, x 1 0, x 2 0. Tale regione di piano prende nome di regione ammissibile, è un insieme convesso ed è rappresentato in Figura 4.9. Tutti i punti P (x 1, x 2 ) appartenenti a questa regione sono punti dell insieme ammissibile del problema e quindi tutti i punti di questa regione costituiscono soluzioni ammissibili del problema. Si consideri ora la funzione obiettivo 7x x 2 e si consideri la famiglia di rette 7x x 2 = C ottenute al variare del parametro C. Esse costituiscono le curve di livello della funzione in due variabili f(x 1, x 2 ) = 7x x 2 che sono ovviamente delle rette come rappresentato in Figura In riferimento al problema di allocazione ottima rappresentato dal problema di Programmazione Lineare che stiamo esaminando, il parametro C rappresenta il profitto totale che deve 50

53 Figura 4.6: Semipiano individuato dal vincolo x 1 + x Figura 4.7: Semipiano individuato dal vincolo x 1 + 2x

54 Figura 4.8: Semipiano individuato dal vincolo x Figura 4.9: La regione ammissibile S 52

55 Figura 4.10: Curve di livello della funzione f(x 1, x 2 ) = 7x x 2 e punto di ottimo essere massimizzato. Per C = 0 si ottiene la linea di livello passante per l origine del piano Ox 1 x 2. Ovviamente, scegliendo x 1 = 0 e x 2 = 0 (che è un punto ammissibile in quanto (0, 0) S) si ottiene il profitto totale nullo. All aumentare del valore di tale profitto, cioè all aumentare del valore della costante C, graficamente si ottengono rette parallele alla retta di livello passante( per) l origine traslate nella direzione di crescita della funzione 7x x 2 7 data dal vettore (Figura 4.10). Poiché si desidera massimizzare la funzione obiettivo, 10 si cercherà di raggiungere il valore piú alto per la C ottenuto scegliendo per x 1 e x 2 valori ammissibili cioè tali che (x 1, x 2 ) S. Osservando la rappresentazione grafica della regione ammissibile S si deduce che all aumentare di C, le rette di livello della funzione obiettivo intersecano la regione ammissibile finché C Tale valore è ottenuto per x 1 = 500 e x 2 = 250 e non esistono altri punti della regione ammissibile in cui la funzione obiettivo assume valori maggiori. Il valore 6000 è, quindi, il massimo valore che la funzione obiettivo può raggiungere soddisfacendo i vincoli. Tale soluzione ottima è raggiunta in corrispondenza del punto P di coordinate (x 1, x 2 ) = (500, 250); tale punto non è un punto qualsiasi, ma costituisce quello che nella geometria piana viene detto vertice del poligono convesso che delimita la regione ammissibile. Il fatto che l ottimo del problema è raggiunto in corrispondenza di un vertice della regione ammissibile non è casuale, ma come si vedrà in seguito, è una caratteristica fondamentale di un generico problema di Programmazione Lineare. Si osservi fin d ora che la frontiera della regione ammissibile è definita dalle rette x 1 + x 2 = 750, x 1 + 2x 2 = 1000, x 2 = 400, x 1 = 0, x 2 = 0 53

56 e che ogni intersezione di due di queste rette è un vertice della regione ammissibile; il numero di queste possibili intersezioni (non tutte necessariamente appartenenti alla regione ammissibile) è ovviamente pari al piú a 10. Si osservi, infine, che nel punto di ottimo sono attivi i vincoli x 1 + x e x 1 + 2x mentre non è attivo il vincolo x Figura 4.11: Esempio di soluzione non unica Nel caso particolare che abbiamo esaminando, la soluzione ottima determinata è unica, ma in generale può accadere che le rette di livello della funzione obiettivo siano parallele ad un segmento del perimetro del poligono che delimita la regione ammissibile; in questo caso potrebbe accadere che esistano piú punti ammissibili in cui la funzione assume lo stesso valore ottimo e quindi la soluzione non sarebbe piú unica; nel problema in esame, ciò accadrebbe, ad esempio, se la funzione obiettivo fosse cx 1 + 2cx 2 con c costante reale positiva (Figura 4.11); infatti, tutti i punti del segmento AB rappresentano soluzioni ottime. Tuttavia, anche in questo caso si può sempre trovare un vertice che costituisce una soluzione ottima. Esempio Consideriamo ora un problema di miscelazione descritto nel paragrafo che è rappresentato 54

57 dal seguente problema di Programmazione Lineare: min(400x x 2 ) 140x x x x x 2 75 x 1 0, x 2 0 Nelle figure che seguono rappresentati i vincoli lineari di questo problema; In particolare nella Figura 4.12 è evidenziato il semipiano individuato dal vincolo 140x Nella Figura 4.13 Figura 4.12: Semipiano individuato dal vincolo 140x 1 70 e nella Figura 4.14 sono evidenziati rispettivamente i semipiani individuati dai vincoli 20x x 2 30 e 25x x Ovviamente i vincoli di non negatività delle variabili x 1 0 e x 2 0 rappresentano rispettivamente il semipiano delle ascisse non negative e il semipiano delle ordinate non negative. L insieme ammissibile del problema di Programmazione Lineare che stiamo esaminando è dato quindi dall intersezione di tali semipiani e si può indicare con { } S = (x 1, x 2 ) IR 2 140x 1 70, 20x x 2 30, 25x x 2 75, x 1 0, x 2 0. L insieme S rappresenta la regione ammissibile del problema di Programmazione Lineare in esame ed è rappresentata in Figura Tutti i punti P (x 1, x 2 ) appartenenti a questa regione sono punti dell insieme ammissibile del problema e quindi tutti i punti di questa regione costituiscono soluzioni ammissibili del prob- 55

58 Figura 4.13: Semipiano individuato dal vincolo 20x x 2 30 Figura 4.14: Semipiano individuato dal vincolo 25x x

59 Figura 4.15: La regione ammissibile S lema. Si osservi che, a differenza della regione ammissibile del problema considerato nell esempio precedente, la regione ammissibile S è illimitata. Ora, tracciando le curve di livello della funzione obiettivo 400x x 2 si ottiene la famiglia di rette 400x x 2 = C. Trattandosi di un problema di minimizzazione si vuole determinare il valore piú basso di C ottenuto scegliendo per x 1 e x 2 valori ammissibili cioè tali che (x 1, x 2 ) S. Osservando la rappresentazione grafica della( regione ) ammissibile S e osservando che la direzione di decrescita 400 è quella opposta al vettore, si deduce che al diminuire di C, le rette di livello della 600 funzione obiettivo intersecano la regione ammissibile finché C 1000 (Figura 4.16) Tale valore è ottenuto per x 1 = 1 e x 2 = 1 e non esistono altri punti della regione ammissibile in cui la funzione obiettivo assume valori minori. Il valore 1000 è, quindi, il minimo valore che la funzione obiettivo può raggiungere soddisfacendo i vincoli. Tale soluzione ottima è raggiunta in corrispondenza del punto P di coordinate (x 1, x 2 ) = (1, 1); si osservi che anche in questo caso tale punto è un punto particolare della regione ammissibile. Si osservi, infine che in questo punto sono attivi i vincoli 20x x 2 30 e 25x x 2 75 mentre risulta non attivo il vincolo 140x Abbiamo esaminato due esempi di interpretazione geometrica e soluzione grafica di problemi di Programmazione Lineare in due variabili. In entrambe i problemi è stato possibile 57

60 Figura 4.16: Curve di livello della funzione 400x x 2 e punto di ottimo determinare una soluzione ottima. Tuttavia è facile dedurre, sempre per via geometrica, che un problema di Programmazione Lineare può non ammettere soluzione ottima. Ad esempio, se nell Esempio sostituiamo il vincolo x con il vincolo x , la regione ammissibile sarebbe vuota nel senso che non esisterebbe nessun punto del piano che soddisfa tutti i vincoli. In questo caso il problema risulterebbe inammissibile e questo indipendentemente dalla funzione obiettivo e dal fatto che il problema è in forma di minimizzazione o massimizzazione. Un altro esempio di problema di Programmazione Lineare che non ammette soluzione ottima si può ottenere considerando il problema dell Esempio e supponendo che la funzione obiettivo debba essere massimizzata anziché minimizzata. In questo caso nella regione ammissibile (che è illimitata) la funzione obiettivo può assumere valori arbitrariamente grandi cioè tali che comunque scelto un valore M > 0 esiste un punto in cui la funzione obiettivo assume valore maggiore di M; questo significa che il problema è illimitato superiormente e quindi non può esistere una soluzione ottima. Sulla base di queste considerazioni sulla geometria di un problema di Programmazione Lineare (PL) in due variabili si può intuire che le situazioni che si possono verificare sono le seguenti: 58

61 il problema di PL ammette soluzione ottima (che può essere o non essere unica) in un vertice del poligono convesso che delimita la regione ammissibile; il problema di PL non ammette soluzione ottima perché la regione ammissibile è vuota la regione ammissibile è illimitata e la funzione obiettivo è illimitata superiormente (se il problema è di massimizzazione) o illimitata inferiormente (se il problema è di minimizzazione). Quindi se si suppone che esiste un punto ammissibile, cioè che la regione ammissibile sia non vuota, allora sembrerebbe di poter dedurre che o il problema di Programmazione Lineare ammette soluzione ottima in un vertice del poligono convesso che delimita la regione ammissibile oppure è illimitato. Questi asserti, ora semplicemente dedotti intuitivamente per via geometrica, hanno in effetti una validità generale e verranno enunciati e dimostrati in maniera rigorosa nel capitolo 10. Come ultima considerazione intuitiva si vuole citare la possibilità che la regione ammissibile sia x x 1 Figura 4.17: Regione ammissibile costituita da una striscia di piano costituita da una striscia di piano, cioè dalla porzione di piano compresa tra due rette parallele (Figura 4.17). In questo caso non esistono vertici per la regione ammissibile e il problema risulta 59

62 illimitato ad eccezione del caso particolare in cui le rette di livello della funzione obiettivo sono parallele alle rette che delimitano la striscia di piano; in questo caso si hanno infinite soluzioni. La non esistenza di vertici in questo caso si intuisce essere legata al fatto che la regione ammissibile costituita da una striscia di piano contiene rette. Infatti nei casi delle regioni ammissibili S e S dei problemi di Programmazione Lineare dell Esempio e dell Esempio non esistono rette interamente contenute in S o in S. Anche la regione illimitata S può contenere semirette, ma non rette. Nel caso in cui la regione ammissibile non contiene nemmeno semirette (che è il caso della regione S dell Esempio 4.3.4), cioè la regione ammissibile sia chiusa e limitata, è possibile garantire l esistenza di un minimo (e un massimo) assoluto per funzioni continue grazie al teorema di Weierstrass. 60

63 Capitolo 5 Problemi di ottimizzazione convessa e concava Tra i problemi di Ottimizzazione sono di particolare interesse i cosiddetti problemi convessi. Per poter definire correttamente cosa si intende per problema convesso è necessario introdurre alcuni concetti preliminari. 5.1 Insiemi Convessi Definizione Un vettore y in IR n x 1,..., x p se risulta si dice combinazione convessa di p 1 vettori p y = λ i x i i=1 p λ i = 1 λ i 0 i = 1,..., p. i=1 Possiamo allora introdurre la seguente definizione Definizione Siano x e y due punti in IR n. L insieme dei punti di IR n ottenuti come z = (1 β)x + βy, al variare di β nell intervallo [0, 1] viene definito come segmento chiuso viene sinteticamente indicato con [x, y]. di estremi x e y e Esempio Nella figura 5.1 è rappresentato il segmento in IR 2 avente per estremi i punti x = (1, 1) T e y = (8, 5) T. Per β = 0 ritroviamo il punto x, mentre per β = 1 ritroviamo il punto y; i punti segnati nella figura come x a, x b e x c corrispondono rispettivamente a valori di β pari a 0.25, 0.5 e

64 5 x 2 x 2 4 β = 0.75 x c 3 β = 0.5 x b 2 β = 0.25 x a 1 β = 0 x 1 x Figura 5.1: Esempio di segmento. Dalla figura 5.1 risulta ovvio che il concetto di segmento è la generalizzazione, al caso di IR n dell usuale concetto di segmento valido nel piano. Notiamo anche come, nel caso in cui gli estremi appartengano ad IR 1, e sono quindi due numeri (scalari), diciamo a e b, il concetto di segmento di estremi a e b coincida con quello di intervallo [a, b], fatto che giustifica la notazione [x, y] impiegata per indicare il segmento. Definizione Un insieme X IR n è convesso se per ogni coppia di punti appartenenti all insieme, appartengono all insieme anche tutti i vettori ottenibili come loro combinazione convessa. Utilizzando il concetto di segmento chiuso, la definizione di insieme convesso può essere riformulata nel modo seguente: Un insieme X è convesso se per ogni coppia di vettori x, y X si ha [x, y] X. Dalla definizione segue che l insieme vuoto e l insieme costituito da un solo vettore sono insiemi convessi (banali). Il più semplice insieme convesso non banale è il segmento di estremi x, y IR n. Esempio In IR 2 gli insiemi (a), (b) della figura 5.2 sono convessi, mentre gli insiemi (c), (d) della stessa figura non lo sono. Infatti agli insiemi (c),(d) appartengono coppie di punti, quali quelle segnate nella figura, tali che il segmento che li congiunge presenta dei punti non appartenenti all insieme; ciò non avviene invece comunque si prendano coppie di punti negli insiemi (a) e (b). Una importante proprietà degli insiemi convessi è espressa dal seguente teorema. 62

65 a b c d e Figura 5.2: Insiemi convessi e non convessi. Teorema L intersezione di due insiemi convessi è un insieme convesso. Dimostrazione: Siano X 1, X 2 IR n due insiemi convessi e sia X = X 1 X 2 la loro intersezione. Siano x ed y due vettori in X, allora x, y X 1 ed x, y X 2. Poiché X 1 ed X 2 sono insiemi convessi abbiamo che [x, y] X 1 e che [x, y] X 2. Ma allora [x, y] X e l insieme X è convesso Esempio L insieme (e) della figura 5.2 è dato dall intersezione di due insiemi convessi ed è convesso Dal Teorema (5.1.6) si può derivare, con un semplice ragionamento induttivo, il seguente corollario. Corollario L intersezione di un numero finito di insiemi convessi è un insieme convesso. Passiamo ora a considerare dei particolari insiemi convessi che rivestono un ruolo importante nella teoria della programmazione lineare. Consideriamo l espressione a 1 x a n x n = b che, con notazione vettoriale possiamo scrivere a T x = b, con a IR n e b IR. Possiamo allora dare le seguenti definizioni. Definizione Sia a un vettore di IR n e b un numero reale. L insieme H = {x IR n : a T x = b} è detto iperpiano definito dall equazione a T x = b. Gli insiemi S = {x IR n : a T x b} S = {x IR n : a T x b} sono detti semispazi chiusi definiti dalle disequazioni a T x b e a T x b. Nel caso dello spazio IR 2 il concetto di iperpiano coincide con quello di retta, mentre nel caso dello spazio IR 3 il concetto di iperpiano coincide con quello di piano. In maniera intuitiva, i semispazi possono essere pensati come l insieme dei punti che giacciono da una stessa parte rispetto all iperpiano. 63

66 x 2 10x 1 + 5x x 1 10x 1 + 5x x + 5x =25 Figura 5.3: Retta e semipiani individuati da un equazione lineare. Esempio Con riferimento alla figura 5.3, l iperpiano (= retta) 10x 1 + 5x 2 = 25 divide lo spazio (= piano) in due semispazi: S = {x IR 2 : 10x 1 + 5x 2 25}, indicato in grigio nella figura, e S = {x IR 2 : 10x 1 + 5x 2 25}, indicato in bianco nella figura. Notiamo che l iperpiano H fa parte di tutti e due i semispazi e che l intersezione dei due semispazi coincide con l iperpiano. In termini insiemistici abbiamo che H S, H S, S S = H. I semispazi e gli iperpiani sono insiemi convessi. Teorema Un semispazio chiuso è un insieme convesso. Dimostrazione: Dimostreremo il teorema per un semispazio S = {x IR n : a T x b}, la dimostrazione per il semispazio S ottenuto invertendo il verso della disequazione è analoga. Consideriamo due generici vettori x ed y appartenenti ad S, vogliamo dimostrare che ogni vettore z [x, y] appartiene ad S, ovvero soddisfa la relazione a T z b. Sia z = βx + (1 β)y con 0 β 1. Poiché x ed y appartengono ad S abbiamo che a T x b e a T y b. Inoltre, poiché β ed 1 β sono reali non negativi abbiamo che e quindi che a T z b a T (βx + (1 β)y) = βa T x + (1 β)a T y βb + (1 β)b = b Utilizzando il Teorema (5.1.11) e il Teorema (5.1.6) e ora facile dimostrare che anche un iperpiano è un insieme convesso. 64

67 Corollario Un iperpiano è un insieme convesso. Dimostrazione: Un iperpiano è l intersezione di due semispazi chiusi (S e S ). Per il Teorema (5.1.11) un semispazio chiuso è un insieme convesso mentre, per il Teorema (5.1.6), l intersezione di due insiemi convessi è un insieme convesso Poliedro e punti estremi di un insieme convesso In particolare è usuale introdurre la seguente definizione: Definizione Un insieme P IR n è un poliedro se è l intersezione di un numero finito di semispazi chiusi e iperpiani. In IR 3 possibili poliedri sono i cubi, i tetraedi ecc. segmenti, le rette, poligoni piani, ecc. Naturalmente, risulta: In R 2 sono poliedri, ad esempio, i Un poliedro è un insieme convesso. Introduciamo ora il concetto di punto estremo, che ha un ruolo molto importante nello studio dei problemi di Programmazione lineare. Definizione (Punto estremo) Sia C R n un insieme convesso. Un punto x C si dice punto estremo di C se non può essere espresso come combinazione convessa di due punti di C distinti da x, o, equivalentemente, se non esistono y, z C con z y tali che x = (1 λ)y + λz, con 0 < λ < 1. Sono esempi di punti estremi: per un cerchio, i punti della circonferenza che lo delimita; per un segmento [x 1, x 2 ], gli estremi x 1, x 2 ; per un triangolo, i suoi vertici (non sono punti estremi i punti dei lati che non siano vertici). L insieme dei punti estremi di un insieme convesso C verrà indicato con il simbolo Ext(C), ossia: Ext(C) = {x C : x è punto estremo di C}. Un insieme convesso può non ammettere punti estremi. Ad esempio, un iperpiano, un semispazio, una sfera aperta non hanno punti estremi. Osserviamo inoltre che Ext(C) è contenuto nella frontiera di C e quindi nessun insieme convesso aperto può ammettere punti estremi. Esempio Nell insieme di figura 5.4 il punto A non è un punto estremo, in quanto è interno al segmento che congiunge i punti B e C, anch essi appartenenti all insieme; lo stesso vale per il punto D, interno al segmento [E,F]. Sono invece punti estremi dell insieme i punti E, F, G, H. 65

68 G F A C H B D E Figura 5.4: Punti estremi di un insieme. Nel caso in cui l insieme convesso sia un poliedro, i punti estremi sono detti anche vertici Funzioni convesse e concave Definizione Una funzione f(x) si dice convessa su un insieme convesso C se, presi comunque due punti y, z C risulta che: f((1 β)y + βz) (1 β)f(y) + βf(z), β [0, 1]. (5.1) La funzione f(x) si dice poi strettamente convessa se, per y, z C, y z,risulta f((1 β)y + βz) < (1 β)f(y) + βf(z), β (0, 1). 1 In realtà la definizione di vertice è concettualmente diversa, ma si dimostra che un punto di un poliedro è punto estremo se e solo se è un vertice. 66

69 Definizione Una funzione f(x) si dice concava su un insieme convesso C se, presi comunque due punti y, z C risulta che: f((1 β)y + βz) (1 β)f(y) + βf(z), β [0, 1]. (5.2) La funzione f(x) si dice poi strettamente concava se, per y, z C, y z,risulta f((1 β)y + βz) > (1 β)f(y) + βf(z), β (0, 1). Una funzione f(x) si dice (strettamente) concava su un insieme convesso C se la funzione f(x) è (strettamente) convessa su C. Nella (5.1) y, z, f(y), f(z) sono dati, e β varia tra 0 e 1. Se mettiamo in esplicita evidenza la dipendenza da β, introducendo la funzione φ(β) = f((1 β)y + βz) otteniamo per una funzione strettamente convessa che: φ(β) < (1 β)φ(0) + βφ(1) β (0, 1) Quest ultima relazione mette in evidenza che, se si rappresenta graficamente nel piano (β, φ) la funzione φ(β), il grafico della funzione nell intervallo (0, 1) si trova al di sotto del segmento, detto secante, che congiunge i punti (0, φ(0)) e (1, φ(1)) e coincide solo negli estremi del segmento. Si può concludere che una funzione strettamente convessa è caratterizzata dalla proprietà di avere il grafico sempre al di sotto di ogni sua secante. Una funzione lineare del tipo c T x + b è sia convessa che concava (ma NON è strettamente convessa o strettamente concava). 5.3 Problemi di ottimizzazione Dal punto di vista delle proprietà di convessità possiamo distinguere: - problemi di programmazione convessa: sono i problemi di minimo in cui la funzione obiettivo è convessa e l insieme ammissibile è un insieme convesso (o anche i problemi di massimo in cui la funzione obiettivo è concava e l insieme ammissibile è convesso) - problemi di programmazione concava: sono i problemi di minimo in cui la funzione obiettivo è concava e l insieme ammissibile è un insieme convesso (o anche i problemi di massimo in cui la funzione obiettivo è convessa e l insieme ammissibile è convesso) - problemi generali, in cui non sono soddisfatte tali condizioni. Riconoscere che un problema di ottimizzazione è convesso o concavo fornisce importanti informazioni qualitative sulle sue soluzioni. Osserviamo che Una problema con insieme ammissibile convesso S e funzione obiettivo lineare è sia convesso che concavo. 67

70 e dunque Una problema di Programmazione Lineare è sia convesso che concavo. Esempio Sia dato il problema max x 2 x 2 x x 1 + x 2 1 x 1, x 2 0, dire se è convesso. Si tratta di un problema di massimo con funzione obiettivo lineare e quindi concava. L insieme ammissibile è rappresentato in figura 5.5. Si tratta di un insieme convesso. Quindi il problema dato è convesso. Notiamo che, poiché la funzione obiettivo è lineare, si tratta anche di un problema di massimizzazione di una funzione convessa su insieme convesso e cioè di un problema concavo! S Figura 5.5: Insieme ammissibile S dell Esempio Per riconoscere se un problema generale è convesso o concavo dobbiamo verificare che S sia un insieme convesso, e che f(x) sia convessa/concava su S, il che non è sempre facile. Consideriamo un insieme S definito da vincoli di uguaglianza e disuguaglianza: g i (x) 0, i = 1,..., m h j (x) = 0, j = 1,..., p. 68 (5.3)

71 Nel caso in cui g i per i = 1,..., m e h j per j = 1,..., p siano funzioni lineari, S è un poliedro e quindi un insieme convesso. Se invece qualche g i o h j è non lineare possiamo utilizzare la seguente proposizione fornisce una condizione solo sufficiente per la convessità di S. Teorema Sia g : R n R e S = {x R n : g(x) 0, }. Se la funzione g(x) é convessa in IR n, allora l insieme S è convesso. Dimostrazione. Siano y e z due punti appartenenti a S. Per la convessità di g si ha g((1 β)y + βz) (1 β)g(y) + βg(z) con β [0, 1], Quindi poiché g(y) 0 e g(z) 0, si ottiene g((1 β)y + βz) 0 con β [0, 1], Ovvero tutti i punti del segmento [y, z] sono in S che dimostra che l insieme S i è convesso. É possibile quindi enunciare la seguente condizione sufficiente. Teorema Sia S = {x R n : g i (x) 0, i = 1,..., m h j (x) = 0, j = 1,..., p}. Se per ogni i le funzioni g i (x) sono convesse in IR n, e per ogni j le funzioni h j sono funzioni del tipo a T j x b j, allora l insieme S è convesso. Dimostrazione. L insieme ammissibile S è ottenuto come intersezione degli insiemi S i = {x R n : g i (x) 0} e H j = {x R n : a T j x b j = 0} che nelle ipotesi poste sono convessi per la proposizione e per il Corollario Il risultato segue dal Corollario Otteniamo quindi la seguente condizione sufficiente per riconoscere se un problema è convesso o concavo. Teorema Sia dato il Problema min f(x) g i (x) 0, i = 1,..., m h j (x) = 0, j = 1,..., p. (5.4) Si assuma che i vincoli di disuguaglianza siano dati da funzioni g i (x) convesse in IR n, e che i vincoli di uguaglianza siani dati da funzioni del tipo a T j x b j. Se la funzione obiettivo f(x) è una funzione convessa in IR n, il Problema (5.4) è convesso. Se la funzione obiettivo f(x) è una funzione concava in IR n, il Problema (5.4) è concavo. Notiamo che, la condizione sufficiente del Teorema non è soddisfatta nell Esempio a causa della non convessità del vincolo x 3 1 x

72 5.3.1 Problema di ottimizzazione convesso I problemi di ottimizzazione convessi sono di particolare importanza per due motivi. Il primo è che la grande maggioranza dei problemi di ottimizzazione che si incontrano nella pratica sono convessi. Il secondo è che la convessità induce alcune proprietà che semplificano l analisi e la soluzione di un problema convesso. Una delle proprietà più significative è la seguente: Teorema [Assenza di ottimi locali] Sia S R n un insieme convesso e f una funzione convessa su S. Allora, il problema min f(x) x S o non ha soluzione, o ha solo soluzioni globali; non può avere soluzioni esclusivamente locali. Dimostrazione. La dimostrazione è per assurdo. Ammettiamo che esista un minimo globale x e che ˆx sia una soluzione locale, ma non globale, di min x S f(x). Allora risulta f(x ) < f(ˆx). La costruzione utilizzata nella dimostrazione è illustrata schematicamente nella figura 5.6. Figura 5.6: Costruzione geometrica utilizzata nella dimostrazione del Teorema N.B. nella figura x é il minimo locale, e x rappresenta il minimo globale Consideriamo il segmento [ˆx, x ]: per la convessità di f, si ha: f((1 β)ˆx + βx ) (1 β)f(ˆx) + βf(x ) = f(ˆx) + β(f(x ) f(ˆx)), per ogni β [0, 1]. Il termine β(f(x ) f(ˆx)) risulta < 0, per ogni β (0, 1], e si annulla solo per β = 0. Quindi, poichè in ogni punto x (ˆx, x ] risulta f(z) < f(ˆx), non esiste nessun intorno di raggio ρ > 0 in cui ˆx può soddisfare la definizione di minimo locale. 70

73 5.3.2 Problema di ottimizzazione concavo I problemi di programmazione concava costituiscono una classe molto ampia di problemi non convessi, che include numerose classi di problemi inerentemente difficili. La difficoltà principale che si manifesta nella soluzione di problemi di tipo concavo risiede nel fatto che possono esssere presenti molti punti di minimo locale che non sono punti di minimo globale. In casi del genere la ricerca delle soluzioni globali può divenire un problema di natura combinatoria, che può richiedere, nel caso peggiore, tempi di calcolo esponenzialmente crescenti con le dimensioni del problema (È possibile dimostrare, in particolare, che, sotto opportune ipotesi, molti problemi di ottimizzazione combinatoria possono essere riformulati come problemi (continui) di programmazione concava.). Per i problemi di programmazione concava è possibile dimostrare che le soluzioni ottime, ove esistano, appartengono alla frontiera dell insieme ammissibile. Più precisamente vale il risultato seguente. Teorema [Assenza di soluzioni ottime interne] Sia S R n un insieme convesso e f una funzione concava su S. Allora, se esiste un punto di minimo globale del problema min f(x) x S e se la funzione obiettivo non è costante su S, ogni punto di minimo globale appartiene alla frontiera di S. Dimostrazione. Supponiamo che il problema ammetta soluzione e che x sia una soluzione ottima. Poichè, per ipotesi, f non è costante su S deve esistere un punto ˆx S tale che f(ˆx) > f(x ) = min x S f(x). Supponiamo ora che z S sia un punto interno all insieme ammissibile. Deve allora esistere una sfera aperta B(z; ρ) con centro in z e raggio ρ > 0 tutta contenuta in S. Sulla retta congiungente ˆx con z possiamo allora determinare un y B(z; ρ) S tale che z appartenga al segmento [ˆx, y] e risulti y z, ossia possiamo trovare un λ con 0 λ < 1 tale che z = (1 λ)ˆx + λy. Per la concavità di f e l ipotesi che sia f(ˆx) > f(x ), tenendo conto del fatto che f(y) f(x ) e che 1 λ > 0 (perchè y z), si ottiene: f(z) (1 λ)f(ˆx) + λf(y) > (1 λ)f(x ) + λf(x ) = f(x ). Ciò dimostra che f(z) > f(x ) e quindi che non può esistere una soluzione ottima in un punto interno. Per quanto riguarda la Programmazione Lineare, poiché si tratta di un problema sia convesso che concavo, abbiamo, come immediata conseguenza, il seguente corollario Corollario Se un problema di Programmazione Lineare ammette soluzione, allora il minimo globale si trova sulla frontiera del poliedro ammissibile. Nel seguito vedremo che nel caso in cui l insieme ammissibile sia un poliedro, vale una proprietà più forte. In particolare, nel caso di problemi di Programmazione Lineare (Capitolo 10), almeno un punto di minimo globale deve trovarsi su un vertice del poliedro ammissibile. 71

74 5.4 Caratterizzazione funzioni convesse continuamente differenziabili Se f è una funzione convessa differenziabile possiamo dare condizioni necessarie e sufficienti di convessità espresse per mezzo delle derivate prime o seconde dalla funzione. Ci limitiamo a riportare i risultati seguenti. Teorema (Condizioni necessarie e sufficienti di convessità) Sia C un insieme convesso aperto, sia f : C R e supponiamo che f sia continuo su C. Allora f è convessa su C se e solo se, per tutte le coppie di punti x, y C si ha: f(y) f(x) + f(x) T (y x). (5.5) Inoltre f è strettamente convessa su C se e solo se, per tutte le coppie di punti x, y C con y x, si ha: f(y) > f(x) + f(x) T (y x). (5.6) Dal punto di vista geometrico, la condizione del teorema precedente esprime il fatto che una funzione è convessa su C se e solo se in un qualsiasi punto y C l ordinata f(y) della funzione non è inferiore alle ordinate dei punti del piano tangente al grafo della funzione in un qualsiasi altro punto x di C. Nel teorema successivo riportiamo una condizione necessaria e sufficiente di convessità espressa per mezzo delle derivate seconde. Teorema (Condizioni necessarie e sufficienti di convessità) Sia C un insieme convesso aperto, sia f : C R e supponiamo che la matrice Hessiana 2 f sia continua su C. Allora f è convessa su C se e solo se, per ogni x C, la matrice 2 f(x) è semidefinita positiva. Se si prendono in considerazione le derivate seconde, non è vero, in generale, che una condizione necessaria di convessità stretta è la definita positività della matrice Hessiana (basti pensare alla funzione y = x 4 in x = 0). Si può stabilire tuttavia che se la matrice Hessiana è definita positiva allora f è strettamente convessa. Teorema (Condizione sufficiente di convessità stretta) Sia C un insieme convesso aperto, sia f : C R e supponiamo che la matrice Hessiana 2 f sia continua e definita positiva su C. Allora f è strettamente convessa su C Funzioni e forme quadratiche Tra le funzioni di particolare interesse in problemi di Programmazione Matematica ci sono le funzioni quadratiche. Una funzione quadratica è una funzione del tipo q(x) = 1 2 xt Ax + c T x, dove A è una matrice quadrata e simmetrica di dimensione (n n), con elementi a ij = a ji, i, j = 1,..., n. Il gradiente e la matrice hessiana sono f(x) = Ax 2 f(x) = A. 72

75 Data una matrice A si definisce forma quadratica associata alla matrice A la funzione x T Ax = n i=1 j=1 n a ij x i x j. (5.7) Una forma quadratica è quindi una particolare funzione quadratica in cui il termine lineare è identicamente nullo (c = 0). Si verifica facilmente che il gradiente e l Hessiano della forma quadratica sono dati rispettivamente da 2Ax e 2A. La forma quadratica x T Ax si dice: - definita positiva, se risulta x T Ax > 0 x IR n, x 0; - semidefinita positiva se risulta x T Ax 0 x IR n ; - indefinita se per qualche x risulta x T Ax > 0, e per altri x risulta x T Ax < 0. Corrispondentemente, si dice che la matrice A associata alla forma quadratica è rispettivamente definita positiva, semidefinita positiva, indefinita. La forma quadratica x T Ax si dice (semi)definita negativa se x T Ax è (semi)definita positiva. Nel caso di funzioni quadratiche, la matrice hessiana A è costante e la condizione di convessità dei Teoremi e diventa: Teorema Una funzione quadratica q(x) è convessa su IR n se, e solo se, risulta: 1 2 yt Ay 0, per ogni y IR n ; inoltre, la funzione q(x) è strettamente convessa su IR n se e solo se risulta 1 2 yt Ay > 0, per ogni y IR n. Notare che nel caso di funzione quadratica la condizione di stretta convessità è condizione necessaria e sufficiente. Per verificare se una matrice A è definita positiva, si può utilizzare un semplice test. Criterio 1 Siano A k, k = 1..., n gli n minori principali della matrice A, detti sottomatrici principali di nord-ovest, cioè le n sottomatrici con elementi a ij, i, j = 1,..., k,ottenute da A eliminando le ultime n k righe e colonne. Denotato con deta k il determinante di A k, risulta che: - A è definita positiva se, e solo se, deta k > 0, per k = 1,..., n. Si osserva che se A è semidefinita positiva allora risulta deta k 0, ma non è vero in generale il viceversa. Basta prendere come esempio la matrice ( ) 0 0 A = 0 2a 22 73

76 con a 22 < 0 e la forma quadratica associata a 11 x a 12 x 1 x 2 + a 22 x 2 2 in cui a 11 = a 12 = 0. I minori principali A 1 e A 2 hanno determinante nullo, e quindi soddisfano il criterio deta k 0, ma q(x) è semidefinita negativa!!! Per verificare se una matrice A è semidefinita positiva si deve applicare un criterio molto più oneroso riportato di seguito. Criterio 2 Siano D ik,j k le sottomatrici di A con elementi a ij,ottenute da A eliminando n k righe e colonne in tutti i possibili modi, dette minori principali di A, ovvero le sottomatrici con elementi a ij, i = i 1,..., i k, j = j 1,..., j k, per 1 k n. Denotato con detd ik,j k il determinante di D ik,j k, si ha: - A è semidefinita positiva se, e solo se, D ik,j k 0 per ogni 1 k n. Osserviamo che il criterio fornisce delle condizioni sufficienti di NON convessitá. In particolare, data una matrice A quadrata e simmetrica, se risulta a ii < 0 per qualche i = 1,..., n allora la matrice NON è semidefinita posiitva (né dunque definita positiva). Analogamente se risulta detd ik,j k < 0 per un qualunque minore principale allora la matrice NON è semidefinita posiitva. Per analizzare se una matrice A è definita/semidefinita negativa si possono applicare i criteri precedenti alla matrice A associata alla forma quadratica. Un altro test per verificare il segno di una forma quadratica consiste nel determinare gli autovalori della matrice A, cioe i valori α i, i = 1,..., n che risolvono l equazione di grado n: det(a αi) = 0, ove I è la matrice identica di ordine n. Se la matrice A è simmetrica, si ha che gli autovalori sono tutti reali. Risulta che: - A è definita positiva se, e solo se, α i > 0, per i = 1,..., n; - A è semidefinita positiva se, e solo se, α i 0 per i = 1,..., n; - A è indefinita, altrimenti. È evidente che il test basato sui minori è di più semplice impiego di quello basato sugli autovalori: infatti calcolare determinanti, fino all ordine n, è piu semplice che risolvere un equazione di grado n. Nel seguito indicheremo α min (A) e α max (A) rispettivamente il più piccolo e il più grande autovalore di una matrice A. Esempio Un esempio di funzione quadratica strettamente convessa è la funzione rappresentata in figura x x 2 2 x 1 74

77 Figura 5.7: Grafico della funzione quadratica convessa Dell Esempio

78 Capitolo 6 Problemi di ottimizzazione non vincolata 6.1 Introduzione Con riferimento al problema di ottimizzazione min x R n f(x), iniziamo in questo capitolo lo studio delle condizioni di ottimalità. Nei successivi capitoli affronteremo lo studio delle condizioni di ottimalità in relazione alle classi di problemi vincolati di nostro interesse. In termini molto generali, una condizione di ottimalità è una condizione (necessaria, sufficiente, necessaria e sufficiente) perché un punto x risulti una soluzione ottima (locale o globale) del problema. Ovviamente, una condizione di ottimalità sarà significativa se la verifica della condizione risulta più semplice o più vantaggiosa (da qualche punto di vista) rispetto all applicazione diretta della definizione. Le condizioni di ottimalità si esprimono infatti, tipicamente, attraverso sistemi di equazioni, sistemi di disequazioni, condizioni sugli autovalori di matrici opportune. Lo studio delle condizioni di ottimalità ha sia motivazioni di natura teorica, sia motivazioni di natura algoritmica. Dal punto di vista teorico, una condizione di ottimalità può servire a caratterizzare analiticamente le soluzioni di un problema di ottimo e quindi consentire di svolgere analisi qualitative, anche in assenza di soluzioni numeriche esplicite; un esempio è l analisi della sensibilità delle soluzioni di un problema di ottimo rispetto a variazioni parametriche. Dal punto di vista algoritmico, una condizione necessaria può servire a restringere l insieme in cui ricercare le soluzioni del problema originario e a costruire algoritmi finalizzati al soddisfacimento di tale condizione; una condizione sufficiente può servire a dimostrare che un punto ottenuto per via numerica sia una soluzione ottima del problema e quindi a definire criteri di arresto del procedimento risolutivo. 6.2 Direzioni di discesa Allo scopo di definire condizioni di ottimalità è necessario introdurre la seguente definizione. 76

79 Definizione (Direzione di discesa) Sia f : R n R e x R n. Si dice che un vettore d R n, d 0 è una direzione di discesa per f in x se esiste t > 0 tale che f(x + td) < f(x), per ogni t (0, t ]. Il concetto di direzione di discesa ci consentirà di caratterizzare i minimi locali di una funzione. Nel caso di funzione lineare f(x) = c T x, si ottiene facilmente applicando la definizione c T (x + td) = c T x + tc T d < c T x per ogni t > 0 che una direzione è di discesa se e solo risulta c T d < 0 per ogni t > 0. Osserviamo che, in questo caso particolare, la caratterizzazione di direzione di discesa non dipende dal punto x in cui ci troviamo. Se f è una funzione lineare, ossia se f(x) c T x allora d è una direzione di discesa (in un qualsiasi punto x IR n ) se e solo se c T d < 0. In generale, per funzioni continuamente differenziabili, è possibile caratterizzare la direzione di discesa utilizzando informazioni sulle derivate prime della funzione. Vale in particolare la seguente condizioni sufficiente: Teorema (Condizione di discesa) Supponiamo che f sia continuamente differenziabile nell intorno di un punto x R n e sia d R n un vettore non nullo. Se risulta f(x) T d < 0, allora la direzione d è una direzione di discesa per f in x. Dimostrazione. È noto (vedi Appendice A) che per una qualunque funzione continuamente differenziabile possiamo scrivere f(x + td) = f(x) + t f(x) T d + α(x, t) (6.1) α(x, t) dove α(x, t) soddisfa lim = 0. Per valori sufficientemente piccoli di t possiamo dunque t 0 t scrivere f(x + td) f(x) t f(x) T d; se f(x) T d < 0 risulta allora f(x + td) f(x) < 0 che quindi dimostra che d è una direzione di discesa. Ricordando che f(x) T d = f(x) d cos θ dove θ è l angolo compreso tra f(x) e d, dal punto di vista geometrico la condizione f(x) T d < 0 esprime il fatto che se una direzione d forma un angolo ottuso con il gradiente di f in x, allora d è una direzione di discesa per f in x. Sia f continuamente differenziabile e sia d R n un vettore non nullo. Se l angolo θ tra f(x) e d soddisfa θ > 90 o allora d è di discesa per f in x. 77

80 Tra le direzioni di discesa, un ruolo particolarmente importante è svolto dalla direzione dell antigradiente d = f(x). Se f(x) 0, la direzione dell antigradiente d = f(x) è sempre una direzione di discesa, infatti risulta f(x) T d = f(x) T f(x) = f(x) 2 < 0. La definizione è illustrata nella figura 6.1, con riferimento agli insiemi di livello di una funzione in R 2. La direzione dell antigradiente è utilizzata per la definizione di un semplice algoritmo f( x*) f(x)=f( x*) x* > 90 o x*+t d f(x)<f( x*) d direzione di discesa x* Figura 6.1: Esempio di direzione d di discesa in IR 2. per la determinazione di punti di minimo (vedi il paragrafo 6.4). Naturalmente è possibile dare una condizione sufficiente analoga al teorema affinché una direzione sia di salita. Sia f sia continuamente differenziabile nell intorno di un punto x R n e sia d R n un vettore non nullo. Se risulta f(x) T d > 0, allora la direzione d è una direzione di salita per f in x. Naturalmente se f(x) 0, la direzione del gradiente d = f(x) è sempre una direzione di salita in x. 78

81 Osserviamo che nel caso di funzione lineare f = c T x, risulta f(x) = c, quindi la condizione espressa dal Teorema coincide con la caratterizzazione ottenuta in base della definizione di direzione di discesa. Nel caso lineare, la relazione (6.1) vale con α(x, t) 0 e dunque la condizione del Teorema caratterizza tutte e sole le direzioni di discesa. Si tratta cioè di una condizione necessaria e sufficiente, mentre nel caso generale è solo una condizione sufficiente. Nel caso di funzione lineare vale quindi la seguente caratterizzazione: Sia f è una funzione lineare, ossia f(x) c T x allora 1. d è una direzione di discesa in x se e solo se f(x) T d = c T d < 0; 2. d è una direzione di salita in x se e solo se f(x) T d = c T d > 0; 3. d è una direzione lungo cui la funzione si mantiene costante rispetto al valore in x se e solo se f(x) T d = c T d = 0. Nel caso generale, la condizione di discesa enunciata è solo sufficiente, in quanto possono esistere direzioni di discesa tali che f(x) T d = 0. Illustriamo le varie possibilità nel seguente esempio. Esempio Consideriamo la funzione f(x) = x x 2 2 3x 1. sia dato il punto x = ( 1, 0) T e la direzione d = ( 1, 0) T. Il gradiente della funzione vale ( ) 3x 2 f(x) = x 2 Si verifica facilmente che il gradiente della funzione si annulla nel punto x, quindi la condizione sufficiente espressa dal teorema non è soddisfatta in quanto f( x) T d = 0. La direzione d è però di discesa in x. Infatti risulta x + td = ( 1 t, 0) T e la funzione vale: f( x + td) = ( 1 t) 3 3( 1 t) = 1 t 3 3t 3t t = t 3 + 3t Mostriamo che esiste un valore di t tale che t 3 3t < 2 = f( x) per ogni 0 < t t. La condizione che si ottiene è t 3 3t 2 < 0 che risulta verificata per qualunque valore di t > 0, quindi effettivamente la direzione è di discesa nel punto. si consideri ora il punto x = (1, 0) T e la stessa direzione d = ( 1, 0) T. Si verifica facilmente che il gradiente della funzione si annulla nel punto x, e quindi la condizione sufficiente espressa dal teorema anche in questo caso non è soddisfatta in quanto f( x) T d = 0. In questo caso però la direzione d non è di discesa, risulta infatti x + td = (1 t, 0) T e la funzione vale: f( x + td) = (1 t) 3 3(1 t) = 1 t 3 3t + 3t t = t 3 + 3t 2 2 Dobbiamo quindi verificare se esiste un t > 0 tale che per ogni t (0, t] risulta t 3 + 3t 2 = t 2 ( t+3) < 0. Si verifica facilmente che la condizione è verificata solo per valori di t abbastanza grandi (t > 3) e quindi d non è di discesa. Si tratta invece di una direzione di salita, infatti scegliendo t < 3, si ottiene che f( x + td) > f( x) per ogni t (0, t]. Consideriamo ora il punto ˆx = (0, 0) T in cui il gradiente di f vale f(ˆx) = ( 3, 0) T. Risulta che la direzione d = ( 1, 0) T è di salita in ˆx, mentre la direzione opposta d = (1, 0) T è di discesa. 79

82 Dall esempio e dalle considerazioni precedenti risulta evidente che dato in un punto x ed una direzione d, sono possibili solo questi casi: Sia f sia continuamente differenziabile nell intorno di un punto x R n e sia d R n un vettore non nullo. 1. se f(x) T d < 0 allora la direzione è di discesa in x; 2. se f(x) T d > 0 allora la direzione è di salita in x; 3. se f(x) T d = 0 allora non si può concludere se la direzione è di discesa o di salita in x o lungo la quale la funzione si mantiene costante. La condizione del teorema diventa anche necessaria nel caso di convessità della funzione obiettivo. Teorema Se f è convessa allora una direzione d è di discesa in un punto x se e solo se f(x) T d < 0. Dimostrazione. Sia f convessa, dobbiamo solo dimostrare che la condizione f(x) T d < 0 è necessaria (la sufficienza è data dal teorema 6.2.2). Sia x IR n e sia d una direzione di discesa per f in x. Possiamo scrivere per la convessità della funzione f(x + αd) f(x) + α f(x) T d. Se per assurdo fosse f(x) T d 0 allora per α > 0 sufficientemente piccolo, si avrebbe f(x + αd) f(x) contraddicendo l ipotesi che d sia di discesa. Se f è differenziabile due volte è possibile caratterizzare l andamento di f lungo una direzione assegnata tenendo conto anche delle derivate seconde e di ciò si può tener conto, come si vedrà in seguito, per stabilire condizioni di ottimo del secondo ordine. Introduciamo la definizione seguente. Definizione (Direzione a curvatura negativa) Sia f : R n R due volte continuamente differenziabile nell intorno di un punto x R n. Si dice che un vettore d R n, d 0 è una direzione a curvatura negativa per f in x se risulta d T 2 f(x)d < 0. Una direzione a curvatura negativa è quindi tale che la derivata direzionale seconda è negativa in x, per cui diminuisce localmente la derivata direzionale del primo ordine. In particolare vale il risultato seguente. 80

83 Teorema (Condizione di discesa del secondo ordine) Sia f : R n R due volte continuamente differenziabile nell intorno di un punto x R n e sia d R n un vettore non nullo. Supponiamo che risulti f(x) T d = 0, e che d sia una direzione a curvatura negativa in x, ossia che d T 2 f(x)d < 0. Allora la direzione d è una direzione di discesa per f in x. Dimostrazione. Poiché f è differenziabile due volte, si ha: f(x + td) = f(x) + t f(x) T d t2 d T 2 f(x)d + β(x, td) in cui β(x, td)/t 2 0. Essendo per ipotesi f(x) T d = 0, si può scrivere: f(x + td) f(x) t 2 = 1 2 dt 2 f(x)d + β(x, td) t 2 e quindi, poiché β(x, td) lim t 0 t 2 = 0, per valori sufficientemente piccoli di t si ha f(x + td) f(x) < 0, per cui d è una direzione di discesa. Esempio Consideriamo la funzione del esempio 6.2.3, f(x) = x x 2 2 3x 1. nel punto x = ( 1, 0) T. La direzione d = ( 1, 0) T è tale che f( x) T d = 0, quindi la condizione sufficiente espressa dal teorema non è soddisfatta. Verifichiamo la condizione del Teorema La matrice hessiana è 2 f(x) = ( 6x ) ( x 6 0 = 0 2 Risulta allora d T 2 f( x)d = 6 e quindi la direzione soddisfa la condizione sufficiente del Teorema 6.2.6, per cui si può concludere che è di discesa. 6.3 Ottimizzazione non vincolata Abbiamo già osservato nel capitolo 2 che i problemi non vincolati sono una particolare classe di problemi non lineari, in cui S = R n. Il problema in oggetto è quindi ). min f(x), (P NV ) x IR n 81

84 con f : IR n IR non lineare e continuamente differenziabile. Osserviamo preventivamente che in questo caso non si può applicare in modo diretto il teorema di Weierstrass per l esistenza di un minimo. Condizioni di esistenza possono essere comunque ottenute con riferimento ad un insieme ammissibile fittizio. In particolare, dato un qualunque punto ˆx in cui la funzione vale f(ˆx), e si considera l insieme non vuoto (contiene almeno ˆx) L(ˆx) = {x IR n : f(x) f(ˆx)}. Possiamo allora considerare il problema vincolato min f(x) x L(ˆx) (P NV L) Se ˆx non è il minimo globale di (P-NV), allora il minimo globale x, se esiste, sicuramente si trova in L(ˆx). Infatti per definizione f(x ) f(x) per ogni x e quindi in particolare vale anche f(x ) f(ˆx). Quindi risolvere (P-NV) é equivalente a risolvere (P-NVL). Per assicurare l esistenza di un minimo globale di (P-NVL) (e quindi di (P-NV), possiamo utilizzare il teorema di Weierstrass. È sufficiente richiedere che esista un ˆx per cui l insieme L(ˆx) sia compatto. Se esiste un ˆx IR n per cui l insieme L(ˆx) é compatto, allora il problema (P-NV) ammette un minimo globale. Deriviamo ora le condizioni di ottimo per (P-NV). Una conseguenza immediata della Definizione di direzione di discesa è la condizione necessaria di minimo locale enunciata nel teorema successivo. Teorema (Condizione necessaria di minimo locale) Sia x S un punto di minimo locale del problema (P) allora non può esistere in x una direzione di discesa per f. La condizione necessaria può consentire di selezionare tra tutti i punti ammissibili i potenziali candidati ad essere punti di minimo locale. Per ricavare delle condizioni di ottimalità dalla condizione enunciata nel Teorema occorre utilizzare una caratterizzazione analitica delle direzioni di discesa. In effetti la verifica della condizione espressa dal Teorema è essenzialmente equivalente all applicazione della definizione di minimo locale. Si può però specificare ulteriormente la condizione necessaria utilizzando la caratterizzazione di direzione di discesa. Si ottiene allora la seguente condizione necessaria. Se x è un punto di minimo locale del del problema (P) non può esistere una direzione d R n in x tale che f(x ) T d < 0. Tale condizione può essere equivalentemente enunciata come segue. Teorema (Condizione necessaria di minimo locale) Se x è un punto di minimo locale del del problema (P), allora risulta f(x ) T d 0 per ogni direzione d R n. 82

85 Ricordando che f(x ) T d = f(x ) d cos θ dove θ è l angolo compreso tra f(x ) e d, dal punto di vista geometrico la condizione f(x ) T d 0 richiede che 0 o θ 90 o per ogni d. Se x è un punto di minimo locale del del problema (P), allora per ogni d l angolo θ formato con f(x ) è 0 o θ 90 o. Si ottiene quindi la seguente condizione necessaria. Teorema (Condizione necessaria di minimo locale non vincolato) Sia f : R n R continuamente differenziabile su R n e sia x R n. Se x è un punto di minimo locale non vincolato di f in R n allora si ha f(x ) = 0. Dimostrazione. Se x R n è un punto di minimo locale non possono esistere direzioni di discesa in x. Se f(x ) 0, esisterebbe una direzione d = f(x ) 0 di discesa in x. Ma questo è assurdo. Definizione (Punto stazionario) Sia f : R n R continuamente differenziabile su R n. Un punto x tale che f( x) = 0 si dice punto stazionario di f. I possibili candidati ad essere punti di minimo locale del problema (P-NV) si determinano determinando le soluzioni di f(x) = 0. Esempio Sia dato il problema f(x 1, x 2 ) = x x 2 4 3x 1 x 2, sapendo che esiste un punto di minimo, determinarlo utilizzando le condizioni necessarie. Il gradiente della funzione è dato da: ( ) 4x 3 f = 1 3x 2 4x x 1 Dall annullamento del gradiente si ottiene il sistema { { ( 4x 3 1 3x 2 = x2 27 x8 2 3 ) = 0 4x 3 2 3x 1 = 0 x 1 = 4 3 x3 2 ( 3 Si ottengono le soluzioni: A(0, 0), B 2, ) ( 3 2, C 3 2, ) 3 2. Le curve di livello della funzione sono nella Figura 6.2 da cui si individuano i tre punti stazionari. Il punto (0, 0) T ( è un punto di sella con valore della funzione f(0, 0) = 0. I punti B, C = ± 3 2, ± ) 3 2 abbiamo ( ) f = sono punti di minimo globale di valore della funzione obiettivo f =

86 Figura 6.2: Curve di livello della funzione x x 4 2 3x 1 x 2. Senza ulteriori ipotesi sulla funzione obiettivo, la condizione è solo necessaria. Ricordando che se f(x ) 0 la direzione d = f(x ) è di salita nel punto x, si ottiene che la condizione f(x ) = 0 è anche necessaria di massimo locale. In generale si hanno questi possibili casi. Sia f : R n R continuamente differenziabile su R n e sia x R n tale che f(x ) = 0 allora è vera una delle seguenti affermazioni: 1. x è un minimo locale (non esistono in x direzioni di discesa); 2. x è un massimo locale (non esistono in x direzioni di salita); 3. x è un punto di sella (esistono in x sia direzioni di discesa che di salita). Un esempio di punto di sella è in Figura 6.3. Teorema (Condizione sufficiente di minimo globale non vincolato) Sia f : R n R continuamente differenziabile su R n e sia x R n. Si supponga che f sia convessa. Se f(x ) = 0, allora x è un punto di minimo globale di f su R n. Inoltre, se f è strettamente convessa su R n, allora x è l unico punto di minimo globale di f su R n. Dai teoremi e si ottiene quindi una condizione necessaria e sufficiente di minimo globale non vincolato. Teorema (Condizione necessaria e sufficiente di minimo globale non vincolato) Sia f : R n R, con f continuo su R n e si supponga che f sia convessa. Allora x è un punto di minimo globale di f su R n se e solo se f(x ) = 0. Inoltre, se f è strettamente convessa su R n e se in x si ha f(x ) = 0, allora x è l unico punto stazionario di f e costituisce anche l unico punto di minimo globale della funzione. 84

87 f(x) salita discesa x* x 2 x1 Figura 6.3: Esempio di punto di sella in IR 2. Possiamo dare delle condizioni che utilizzano la caratterizzazione del secondo ordine di direzione di discesa espressa al Teorema In particolare quindi abbiamo: Teorema (Condizione necessaria del 2 o ordine di minimo locale) Se x è un punto di minimo locale del del problema (P), allora per ogni d tale che f(x ) T d = 0 risulta d T 2 f(x ) T d 0 per ogni direzione d R n Se si considera la matrice Hessiana si ottiene una condizione necessaria del secondo ordine. Teorema (Condizione necessaria del secondo ordine) Sia f : R n R due volte continuamente differenziabile in un intorno di x R n. Allora, se x è un punto di minimo locale non vincolato di f si ha: (a) f(x ) = 0; (b) 2 f(x ) è semidefinita positiva, ossia y 2 f(x )y 0, per ogni y R n. 85

88 Dimostrazione. La (a) segue dalla caratterizzazione di direzioni di discesa del secondo ordine data dal Teorema Se tuttavia 2 f(x ) è definita positiva, si può stabilire un risultato più forte, che riportiamo nel teorema successivo. Teorema (Condizione sufficiente del secondo ordine) Sia f : R n R due volte continuamente differenziabile in un intorno di x R n. Supponiamo che valgano le condizioni: (a) f(x ) = 0 (b) la matrice Hessiana è definita positiva in x, ossia: Allora x è un punto di minimo locale stretto. y 2 f(x )y > 0 per ogni y R n, y 0. Dimostrazione. Utilizzando il Teorema di Taylor, e tenendo conto del fatto che f(x ) = 0, possiamo scrivere: f(x + αd) = f(x ) α2 d 2 f(x )d + o(α 2 ), e quindi si ottiene: f(x + αd) f(x ) α 2 = 1 2 d 2 f(x )d + o(α2 ) α 2 Quindi per valori di α piccoli, l ultimo termine è trascurabile (o(α 2 )/α 2 0 per α 0), per cui f(x + αd) f(x ) > 0 per ogni d, il che prova l enunciato. Dai risultati precedenti si possono dedurre facilmente condizioni necessarie e condizioni sufficienti di massimo locale (basta infatti imporre condizioni di minimo su f). In particolare, la condizione che x sia un punto stazionario, ossia tale che f(x ) = 0 è condizione necessaria sia perché x sia un punto di minimo, sia perchè x sia un punto di massimo. Una condizione necessaria del secondo ordine per un massimo locale è che f(x ) = 0 e 2 f(x ) sia semidefinita negativa. Una condizione sufficiente di massimo locale è che f(x ) = 0 e 2 f(x) sia semidefinita negativa in un intorno di x. Condizione sufficiente perchè x sia un punto di massimo locale stretto è che f(x ) = 0 e 2 f(x ) sia definita negativa. Se risulta f(x ) = 0 e la matrice Hessiana 2 f(x ) è indefinita (ossia, esistono vettori d per cui d 2 f(x )d > 0 e altri per cui d 2 f(x )d < 0) allora si può escludere che x sia un punto di minimo o di massimo locale e x viene usualmente denominato punto di sella. Un punto di sella è un punto stazionario in corrispondenza al quale esistono sia direzioni di discesa (quando d 2 f(x )d < 0) sia direzioni di salita (quando d 2 f(x )d > 0). o Se f(x ) = 0 e 2 f(x ) è semidefinita (negativa o positiva) non si può determinare la natura di x in assenza di altre informazioni. Tuttavia se 2 f(x ) non è semidefinita positiva (negativa) si può escludere che x sia un punto di minimo (massimo). 86

89 Una classe di particolare interesse di funzioni non lineari è quella delle funzioni quadratiche, ovvero del tipo f(x) = 1 2 xt Qx + c T x con Q matrice simmetrica n n e c IR n. Poiché la matrice hessiana di una funzione quadratica è costante è facile verificare la convessità della funzione (vedi paragrafo 5.2 del Capitolo 5). Nel caso quadratico è anche possibile formalizzare i risultati di esistenza di un minimo globale. Vale in particolare la seguente caratterizzazione. Teorema (Minimizzazione di una funzione quadratica) Sia q(x) = 1 2 xt Qx+c T x, con Q simmetrica e c R n. Allora: 1. q(x) ammette un punto di minimo se e solo se Q è semidefinita positiva ed esiste x tale che Qx + c = 0; 2. q(x) ammette un unico punto di minimo globale se e solo se Q è definita positiva; 3. se Q è semidefinita positiva ogni punto x tale che Qx + c = 0 è un punto di minimo globale di q(x). Dimostrazione. Ricordiamo che risulta q(x) = Qx + c e 2 f(x) = Q. Inoltre se risulta Q semidefinita positiva, q(x) è convessa, se risulta Q definita positiva, q(x) è strettamente convessa. Assegnati x, x R n e posto x = x + s si può scrivere: q(x) = q(x + s) = q(x ) + (Qx + c) T s st Qs. (6.2) Supponiamo ora che Qx + c = 0 e che Q sia semidefinita positiva; in tal caso dalla (6.2) segue q(x) q(x ) per ogni x R n. Inversamente, se q ammette un punto di minimo x, per il Teorema deve essere q(x ) = 0 e risulta q(x) q(x ) per ogni x IR n. Dalla (6.2) segue 0 q(x) q(x ) = 1 2 st Qs con s = x x, ovvero Q 0. Ciò prova la (1). La (2) segue dalla (1) e dal fatto che, s T Qs > 0 per ogni s se e solo se Q è definita positiva. Infine, la (3) segue ancora dalla (6.2) perchè per ogni x tale che q(x ) = 0 si ha q(x) q(x ). Illustriamo questo teorema con un esempio. Esempio Sia data la funzione q(x 1, x 2 ) = 1 2 (αx2 1 + βx 2 2) x 1. Studiamo le esistenza e la natura dei punti estremali al variare dei parametri α e β. Scriviamo il gradiente e la matrice hessiana di q. Si ha ( ) ( ) αx1 1 q = 2 α 0 q = βx 2 0 β 87

90 Figura 6.4: Grafico di q(x 1, x 2 ) per α = β = 1. ( ) T 1 Se α > 0 e β > 0, allora esiste un unica soluzione al sistema q = 0 ed è α, 0. Inoltre la matrice 2 q è definita positiva; si tratta quindi dell unico punto di minimo globale. Se α = 0 e β è qualsiasi, non esiste soluzione al sistema q = 0. Notare che se β 0 la matrice è semidefinita positiva, ma questo non assicura l esistenza del minimo globale. ( ) T 1 Se α > 0 e β = 0, esistono infinite soluzioni al sistema q = 0 ed è α, ξ con ξ qualsiasi. Inoltre la matrice 2 q è semidefinita positiva; si tratta quindi di infiniti punti di minimo globale. Se α < 0 e β > 0 si ha un unica soluzione ( 1, 0). Ma la matrice hessiana è indefinita; si tratta α quindi di un punto di sella. ( ) T 1 Nel caso di α < 0 e β < 0, allora esiste un unica soluzione al sistema q = 0 ed è α, 0. Inoltre la matrice 2 q è definita negativa; si tratta quindi dell unico punto di massimo globale. 88

91 Figura 6.5: Grafico di q(x 1, x 2 ) per α = 0 β = Utilizzo algoritmico delle condizioni di ottimo non vincolate Consideriamo il problema di ottimizzazione non vincolata: min f(x) (6.3) x Rn in cui f : R n R e supponiamo verificata la seguente ipotesi che garantisce l esistenza di un punto di minimo x : Ipotesi 1 La funzione f : R n R è una funzione continuamente differenziabile ed esiste un x 0 R n tale che l insieme di livello L x 0 sia compatto. Gli algoritmi per la soluzione del problema (6.3) consentono, in generale, soltanto la determinazione di punti stazionari di f, ossia di punti dell insieme Ω := {ω R n : f(ω) = 0}. In generale si riesce anche a garantire che, se x 0 non è già un punto stazionario, vengano comunque ottenuti punti in cui la funzione obiettivo assume un valore inferiore al valore assunto nel punto iniziale x 0 e ciò consente di ottenere soluzioni soddisfacenti in molte applicazioni. Se la funzione obiettivo è convessa, la determinazione di un punto stazionario risolve completamente il problema, poiché, come è noto, ogni punto stazionario di una funzione convessa è un punto di minimo globale. 89

92 Figura 6.6: Grafico di q(x 1, x 2 ) per α = 1 β = 0. Gli algoritmi che ci proponiamo di studiare possono essere descritti per mezzo dello schema concettuale seguente: Schema generico di algoritmo di ottimizzazione non vincolata 1. Si fissa un punto iniziale x 0 R n e si pone k = Se x k Ω stop. 3. Si calcola una direzione di discesa d k R n. 4. Si calcola un passo α k R lungo d k ; 5. Si determina un nuovo punto x k+1 = x k + α k d k. Si pone k = k + 1 e si ritorna al Passo 2. Commentiamo brevemente lo schema considerato. 1. Scelta del punto iniziale. Il punto iniziale dell algoritmo è un dato del problema e deve essere fornito in relazione alla particolare funzione che si intende minimizzare. Il punto x 0 dovrebbe essere scelto come la migliore stima disponibile della soluzione ottima, eventualmente facendo riferimento a un modello semplificato della funzione obiettivo. Nella maggior parte dei casi, tuttavia, non esistono criteri generali per effettuare una buona scelta di x 0. 90

93 Figura 6.7: Grafico di q(x 1, x 2 ) per α = 1 β = 1. Nella soluzione di problemi applicativi (non convessi) può essere conveniente ripetere la ricerca a partire da punti iniziali differenti, ad esempio generati casualmente, e scegliere poi il punto stazionario migliore tra quelli così determinati. 2. Criterio di arresto. La verifica effettuata al Passo 2 sull appartenenza di x k all insieme Ω equivale a controllare se f(x k ) = 0. In pratica, per l utilizzo su calcolatore con precisione finita, occorre specificare un criterio di arresto. Una possibilità consiste nell arrestare l algoritmo quando f(x k ) ε (6.4) in cui ε > 0 è un valore sufficientemente piccolo (valori standard richiedono ε [10 8, 10 3 ]). Per quanto riguarda la scelta della norma, tra le più utilizzate ci sono 2 e. Ricordiamo che x 2 = n i=1 x2 i e x = max 1 i n { x i }. 3. Scelta della direzione. I criteri seguiti nella scelta della direzione di ricerca d k individuano il particolare metodo di ottimizzazione utilizzato. Tra i metodi esistenti, il metodo del gradiente (o metodo della discesa più ripida) utilizza come direzione d k = f(x k ); 91

94 Figura 6.8: Grafico di q(x 1, x 2 ) per α = β = Calcolo del passo. Il calcolo dello scalare α k > 0 costituisce la cosiddetta ricerca unidimensionale o ricerca di linea e viene effettuato valutando la funzione obiettivo lungo la direzione d k. Per la ricerca unidimensionale sono disponibili diversi algoritmi che possono prevedere il calcolo del punto di minimo di f(x k + αd k ) rispetto a α (ricerca di linea esatta) oppure l individuazione di un intervallo di valori accettabili per α k ai fini dell ottenimento della convergenza (ricerca di linea inesatta). In questo corso non entreremo nel dettagli delle Ricerche di Linea. 6.5 Modelli di ottimizzazione non vincolata Esempio Il problema di discriminazione del prezzo con f i (x) = a i m i x è un problema di programmazione quadratica strettamente convessa del tipo min x T Mx (a c) T x x 0. Si osservi che il minimo non vincolato x, ovvero il punto che annulla il gradiente della funzione obiettivo 2Mx (a c) = 0, ha componenti x i = a i c i. Dunque se a i c i 0 pe ogni i, il 2m i punto x ha tutte le componenti non negative ed é ottimo (unico) anche del problema vincolato. Vediamo un esempio numerico. Un monopolista che produce un unico bene ha due tipi di clienti A e B. Si indicano con x A e x B le quantità di bene offerte dal monopolista ai due clienti. I 92

95 clienti di tipo A sono disposti a pagare il prezzo f A (x A ) = 50 5x A e i clienti di tipo B sono disposti a pagare il prezzo f B (x B ) = x B. Il costo di produzione dipende solo dalla quantità di prodotto finale x = x A + x B ed è C = x. Seguendo il modello precendente si ottiene per il profitto l espressione: f(x A, x B ) = x A P A + x B P B [ (x A + x B )] = (50 5x A )x A + (100 10x B )x B 90 20(x A + x B ) e deve essere massimizzato. Raggruppando e portando in forma standard di minimizzazione, si ottiene il problema min 5x 2 A + 10x2 B 30x A 80x B 90 x 0. Si tratta di un problema quadratico con ( ) 10xA 30 f = 20x B 80 2 f = ( ) La mat rice hessiana è definita positiva, ed esiste un unico punto di che annulla il gradiente x = (3, 4) T che ha componenti positive, dunque é soluzione del problema vincolato originario. Esempio (Minimi quadrati) Consideriamo il caso 1 definito nel Esempio min x [ x (x 1 + x 0 1) 2 + (2x 1 + x 0 4) 2 + (3x 1 + x 0 9) 2]. Si tratta di un problema quadratico del tipo con min Q = ( x1 x 0 ( ) T ( ) ( ) x1 Q + c T x1 x 0 x 0 ) c = ( Il problema è strettamente convesso. Esiste un unico punto di minimo globale che si ottiene come soluzione di 2Qx + c = 0 e vale ( 1, 3) T. Dunque la funzione lineare che minimizza l errore quadratico è y = 3t 1. ) 93

96 Capitolo 7 Ottimizzazione vincolata 7.1 Introduzione Con riferimento al problema di ottimizzazione min f(x) x S con S R n, illustriamo nel seguito alcune condizioni di ottimalità in relazione alle classi di problemi di nostro interesse. In particolare ci riferiremo a problemi i cui S è un generico insieme convesso, a problemi di programmazione matematica con insieme ammissibile poliedrale. Al fine di individuare le condizioni di ottimo, introduciamo il concetto di direzione ammissibile che insieme al concetto di direzione di discesa introdotto nel Capitolo 6 consentirà di caratterizzare i punti di minimo locale. 7.2 Direzione ammissibile Una direzione è ammissibile in un punto x S se è possibile muoversi lungo tale direzione mantenendosi in S. Più formalmente possiamo dare la seguente definizione riferita ad un generico insieme S IR n. Definizione (Direzione ammissibile) Sia S un sottoinsieme di R n e x S. Si dice che un vettore d R n, d 0 è una direzione ammissibile per S in x se esiste t max > 0 tale che x + td S, per ogni t [0, t max ]. Esempio Sia dato l insieme (poliedro) S = {x R 2 : x 1 + x 2 3, x 1 1, x 2 0} 94

97 x 2 (1,1) x 1 Figura 7.1: Poliedro Esempio rappresentato in Figura 7.1 e consideriamo il punto ammissibile x = (1, 1) (indicato con un puntino rosso in figura). È facile convincersi che la direzione d = (1, 0) è ammissibile in x. Risulta infatti ( ) ( ) ( ) t x + td = + t = Sostituendo nei vincoli si ha: 1. x 1 + x 2 = (1 + t) + 1 = 2 + t che risulta 3 per valori di t x 1 = 1 + t che risulta 1 per ogni t 0; 3. x 2 = 1 > 0. Quindi per ogni t [0, 1] (t max = 1) risulta x + td S. È altrettanto facile convincersi che la direzione opposta d = ( 1, 0) non è ammissibile in x. Risulta infatti ( ) ( ) ( ) t y = x + t( d) = + t = Sostituendo nei vincoli si ha: 1. x 1 + x 2 = (1 t) + 1 = 2 t che risulta 3 per valori di t x 1 = 1 t che risulta 1 solo per t 0; 95

98 3. x 2 = 1 > 0 per ogni t. Quindi NON esiste un t max > 0 per cui il punto y appartiene ad S. La direzione non è dunque ammissibile. Il concetto di direzione ammissibile è riferito ad un generico insieme S non necessariamente poliedrale né con particolari proprietà. Vedremo nel seguito come caratterizzare le direzioni ammissibili nel caso id particolari insiemi ammissibili. 7.3 Condizioni di ottimo vincolate In questo paragrafo ricaviamo le prima condizioni di ottimalità per il generico problema min f(x) x S (P ) Una conseguenza immediata della Definizione di direzione di discesa e della Definizione di direzione ammissibile è la condizione necessaria di minimo locale enunciata nel teorema successivo. Teorema (Condizione necessaria di minimo locale) Sia x S un punto di minimo locale del problema (P) allora non può esistere una direzione ammissibile in x che sia anche di discesa per f. Dimostrazione. Sia x un minimo locale. Per assurdo, se esistesse una direzione d al tempo stesso ammissibile e di discesa in x, allora in ogni intorno di x sarebbe possibile trovare, per t > 0 abbastanza piccolo, un punto x + td S tale che f(x + td) < f(x ), il che contraddice l ipotesi che x sia un punto di minimo locale. La condizione necessaria può consentire di selezionare tra tutti i punti ammissibili i potenziali candidati ad essere punti di minimo locale. Il risultato espresso nel Teorema può essere poco significativo qualora vi siano regioni (di frontiera) dell insieme ammissibile, tali che nei punti di queste regioni non esistano affatto direzioni ammissibili. In tal caso, la condizione del Teorema non è in grado di discriminare le soluzioni ottime dagli altri punti ammissibili. Una situazione del genere si verifica, tipicamente, quando siano presenti vincoli di eguaglianza non lineari. Consideriamo, a titolo esemplificativo, un problema in due variabili. Esempio Sia dato il problema min x 2 x x 2 2 = 1 L unico punto di minimo è il punto (0, 1) T. Se consideriamo un qualsiasi punto (x 1, x 2 ) S l insieme delle direzioni ammissibili è vuoto e quindi la condizione del Teorema è soddisfatta in ogni punto di S e non dà alcuna informazione aggiuntiva per la selezione di punti candidati ad essere ottimi. Tale situazione è illustrata nella figura

99 x 2 S (x 1,x 2 ) x 1 (0,-1) Figura 7.2: Esempio in cui in qualunque punto ammissibile non esiste direzione ammissibile. Per ricavare delle condizioni di ottimalità dalla condizione enunciata nel Teorema occorre utilizzare una caratterizzazione analitica delle direzioni di discesa e delle direzioni ammissibili. In effetti la verifica della condizione espressa dal Teorema è essenzialmente equivalente all applicazione della definizione di minimo locale. Si può però specificare ulteriormente la condizione necessaria utilizzando la caratterizzazione di direzione di discesa del teorema Si ottiene allora la seguente condizione necessaria. Se x è un punto di minimo locale del problema (P) non può esistere una direzione ammissibile d R n in x tale che f(x ) T d < 0. Tale condizione può essere equivalentemente enunciata come segue. Teorema (Condizione necessaria di minimo locale) Se x è un punto di minimo locale del del problema (P), allora risulta f(x ) T d 0 per ogni direzione ammissibile d R n in x. Ricordando che f(x ) T d = f(x ) d cos θ dove θ è l angolo compreso tra f(x ) e d, dal punto di vista geometrico la condizione f(x ) T d 0 richiede che 0 o θ 90 o per ogni d ammissibile. 97

100 Se x è un punto di minimo locale del del problema (P), allora per ogni d ammissibile l angolo θ formato con f(x ) è 0 o θ 90 o. La condizione espressa dal Teorema è solo necessaria di minimo locale. condizione con un esempio. Illustriamo la Esempio Sia dato il problema di ottimizzazione min x 2 1 x x x 2 1 Si tratta della minimizzazione di una funzione quadratica concava su un poliedro (la regione ammissibile e le curve di livello della funzione obiettivo sono rappresentate in Figura 7.3.) Geometricamente si individuano i minimi globali sui vertici del cubo ammnissibile. Consideri- x 2 (1,1) S x 1 Figura 7.3: Illustrazione Esempio amo il punto di minimo x = (1, 1) T. Il gradiente della funzione obiettivo è ( ) 2x1 f(x) = 2x 2 e in x vale f(x ) = ( 2, 2) T (freccia rossa in Figura 7.3). Si osservi che il gradiente della funzione obiettivo NON si annulla in x. Le direzioni ammissibili d nel punto x sono in base 98

101 alla definizione le soluzioni del sistema definito da x + td con t 0 (in Figura 7.3 sono i vettori nella regione compresa tra le frecce blu), cioè: x 1 + td 1 = 1 + td 1 1 x 1 + td 1 = 1 + td 1 1 x 2 + td 2 = 1 + td 2 1 x 2 + td 2 = 1 + td 2 1 ovvero le direzioni ammissibile sono quelle che soddisfano 2 + td 1 0 td td 2 0 td 2 0. La seconda e quarta condizione impongono d 1, d 2 0, mentre la prima e terza impongono solo delle condizioni sullo spostamento t e richiedono ( rispettivamente ) che 0 t 2/ d 1 e 0 t 2/ d 2. Dunque risulta f(x ) T d1 d = ( 2 2) = 2(d d 1 + d 2 ) 0 per ogni d 2 ammissibile (ovvero tale che d 1, d 2 0). Quindi la condizione necessaria è soddisfatta. Sia dato ora il punto x = (0, 0) T interno alla regione ammissibile (nessun vincolo attivo). Ogni vettore d IR 2 è ammissibile in x. Inoltre risulta f( x) T d = 0 per ogni d, in quanto f( x) = 0, quindi è verificata la condizione necessaria. Ciononostante il punto x non è un minimo locale, anzi è un massimo. Infatti per ogni d IR 2 risulta x + td = (td 1, td 2 ) T e la funzione vale f( x + td) = t 2 (d d 2 2). Per ogni t 0 e d 0 risulta f( x + td) = t 2 (d d 2 2) < f( x) = 0, ovvero qualunque d non identicamente nulla è di discesa in x. Possiamo dare delle condizioni che utilizzano la caratterizzazione del secondo ordine di direzione di discesa espressa al Teorema In particolare quindi abbiamo: Teorema (Condizione necessaria del 2 o ordine di minimo locale) Se x è un punto di minimo locale del del problema (P), allora per ogni d ammissibile in x tale che f(x ) T d = 0 risulta d T 2 f(x ) T d 0 per ogni direzione ammissibile d R n in x. A partire dalle condizioni espresse dai teoremi e è possibile ricavare condizioni più specifiche in base alle caratterizzazioni delle direzioni ammissibili, e quindi in base alla struttura e alle proprietà delle funzioni che definiscono i vincoli del problema. Considereremo nel seguito solo i casi di nostro interesse. 7.4 Ottimizzazione su insieme convesso generico Consideriamo un problema di ottimo in cui in cui supponiamo che l insieme ammissibile S sia un insieme convesso, ovvero min f(x) (P CONV ) x S. Possiamo caratterizzare le direzioni ammissibili di questo insieme. 99

102 Teorema (Direzioni ammissibili insieme convesso) Sia S IR n un insieme convesso e sia x un qualsiasi punto di S. Allora comunque si fissi x S tale che x x, la direzione d = x x è una direzione ammissibile per S in x. Dimostrazione. Sia x S. Comunque preso x S, con x x, per la convessità di S, si ha che (1 β) x + βx S per ogni β [0, 1] e quindi x + β(x x) S per ogni β [0, 1]. Da cui segue che la direzione d = x x è una direzione ammissibile per S in x. È facile verificare che, inversamente, se d 0 è una direzione ammissibile per S in x allora esiste un punto x S e uno scalare t tale che d = t(x x). Quindi utilizzando direttamente il teorema 7.3.3, otteniamo la seguente condizione necessaria. Teorema [Condizioni necessarie di minimo locale con insieme ammissibile convesso] Sia x S un punto di minimo locale del problema (P-CONV) e supponiamo che f sia continuamente differenziabile su IR n. Allora si ha: f(x ) T (x x ) 0, per ogni x S. (7.1) Dim. Osserviamo innanzitutto che in base al teorema la direzione d = x x è una direzione ammissibile per f in S per ogni x S. Se esistesse d = x x tale che f(x ) T d < 0 per il Teorema la direzione ammissibile d sarebbe di discesa ma questo è assurdo perché in base al Teorema sappiamo che non può esistere una direzione ammissibile di discesa in x. Nel caso che f sia convessa, si può dimostrare che la condizione è anche sufficiente. Vale in effetti il seguente risultato. Teorema [Condizioni necessarie e sufficienti di minimo globale nel caso convesso] Sia S un sottoinsieme convesso di R n e supponiamo che f sia una funzione convessa continuamente differenziabile su IR n. Allora x S è un punto di minimo globale del problema (P-CONV) se e solo se f(x ) T (x x ) 0, per ogni x S. (7.2) Dimostrazione. La necessità segue dal Teorema La sufficienza segue dal Teorema Infatti, se f è convessa e x S deve essere, per ogni x S: f(x) f(x ) + f(x ) T (x x ), e quindi se vale la (7.2) si ha che f(x) f(x ) per ogni x S, il che prova che x è un punto di minimo globale. Teorema (Condizioni necessarie del secondo ordine di minimo locale con insieme ammissibile convesso) 100

103 Sia x S un punto di minimo locale del problema (P-CONV). Se f è due volte continuamente differenziabile su un insieme aperto contenente S, risulta (x x ) T 2 f(x )(x x ) 0, per ogni x S tale che f(x ) (x x ) = 0. (7.3) Dimostrazione. In base al Teorema sappiamo che non può esistere una direzione ammissibile di discesa. Se f è due volte continuamente differenziabile ed esiste x S tale che la direzione ammissibile d = x x soddisfi f(x ) T d = 0. Applicando il teorema si ottiene allora la (7.3). Consideriamo il seguente esempio in cui i vincoli sono solo limitazioni superiori ed inferiori sulle variabili. Esempio Consideriamo l esempio min x 2 1 x x x 2 1 L insieme ammissibile è convesso, quindi le condizioni necessarie richiedono che in un punto x risulti f(x ) T (x x ) 0 per ogni x S. In particolare in questo caso ( ) 2x1 f = 2x 2 e deve risultare quindi 2 x 1 (x 1 x 1 ) 2 x 2 (x 2 x 2 ) 0 per ogni 1 x x 2 1. Verifichiamo che le condizioni sono soddisfatte in x = (1, 1) T. Deve risultare 2(x 1 1) 2(x 2 1) 0 per ogni 1 x x 2 1. Il termine x per punti x S e analogamente x per x S, quindi la condizione è effettivamente soddisfatta. 7.5 Ottimizzazione su un poliedro Una classe significativa di problemi di programmazione matematica è quella in cui l insieme ammissibile è un poliedro. Consideriamo, senza perdita di generalità (vedi considerazione del capitolo 3), un poliedro definito come S = {x IR n : Ax b} in cui A è una matrice reale m n e b IR m. Il problema in esame è quindi min f(x) Ax b (P P OL) in cui f è una funzione continuamente differenziabile. Ci proponiamo nel seguito di particolarizzare le condizioni di ottimo già enunciate nei paragrafi precedenti per ricavare condizioni di ottimo (locale e globale) che tengano conto della struttura dell insieme ammissibile. 101

104 7.6 Direzioni ammissibili di un poliedro Per caratterizzare le direzioni ammissibili di un poliedro è necessario introdurre ulteriori definizione. A tal scopo analizziamo nuovamente l esempio Esempio Consideriamo nuovamente il poliedro S = {x R 2 : x 1 + x 2 3, x 1 1, x 2 0} in Figura 7.1 e il punto ammissibile x = (1, 1). x 2 x 2 (1,1) (1,1) x 1 x 1 Figura 7.4: Semispazi individuati rispettivamente dai vincoli x 1 +x 2 3 e x 1 1 dell Esempio In Figura 7.4 sono rappresentati i due semispazi definiti singolarmente dai due vincoli x 1 + x 2 3 e x 1 1 che definiscono il poliedro S. Se valutiamo i vincoli in x = (1, 1) T (in rosso nella figura 7.4) abbiamo: x 1 + x 2 < 3, x 1 = 1 x 2 > 0 ovvero solo il vincolo x 1 1 è soddisfatto all uguaglianza. Dalla figura 7.4 è evidente che nel punto x ogni direzione d IR n è ammissibile rispetto al vincolo x 1 + x 2 3 a patto di scegliere adeguatamente il valore dello spostamento t. Analogamente rispetto al vincolo x 2 0 (non rappresentato in figura 7.4) che individua il primo e secondo quadrante, nel punto x ogni direzione è ammissibile. Se invece consideriamo il semispazio individuato dal vincolo x 1 1 è evidente che non tutte le direzioni sono ammissibili. Ad 102

105 esempio la direzione d = ( 1 0) T (considerata nell esempio e disegnata in rosso in figura 7.4) non consente di mantenere l ammissibilità del vincolo per nessun valore di t > 0. Da queste semplici osservazioni appare evidente che in un punto ammissibile, le direzioni ammissibili sono determinate da quei vincoli che sono soddisfatti all uguaglianza. Mentre il valore di t max dipende dal valore degli altri vincoli. Introduciamo allora la seguente definizione: Definizione (Vincoli attivi) Sia S = {x R n : Ax b} e sia x S. Se x soddisfa il a T i x = b i si dice che il vincolo i-esimo è attivo in x. Dato x S si indica con I( x) l insieme degli indici di tutti i vincoli attivi n x, ovvero: I( x) = {i {1,..., m} : a T i x = b i } Nell esempio 7.2.2, in x è attivo il secondo vincolo e cioè I( x) = {2}. La definizione di vincolo attivo non è legata alla particolare forma del poliedro, ma può essere estesa al caso generale. In particolare, notiamo che i vincoli di uguaglianza sono, per definizione, sempre attivi in un punto ammissibile. Possiamo quindi affermare Dato un poliedro definito come S = {x IR n : Ax = b}, risulta I( x) = {1,..., m}. Dato un poliedro in forma standard S = {x IR n : Ax = b, x 0}, i vincoli attivi sono quelli di uguaglianza più gli eventuali componenti di x j = 0, ovvero risulta I( x) = {1,..., m} {j {1,..., n} : x j = 0}. Possiamo ora caratterizzare le direzioni ammissibili di un poliedro. Teorema Dato il poliedro S = {x R n : Ax b}. Sia x un punto ammissibile e sia I( x) = {i {1,..., m} : a T i x = b i} l insieme degli indici attivi in x. Una direzione d è ammissibile in x se e solo se risulta a T i d 0, per ogni i I( x). (7.4) Inoltre per ogni direzione ammissibile d, il punto x + td è ammissibile per ogni valore di t che soddisfa la condizione 0 < t t max = min j / I( x): a T j d<0 a T j x b j a T j d (7.5) dove si intende che, se l insieme {j / I( x) : a T j d < 0} su cui si effettua il minimo è vuoto, il valore t max =. 103

106 Dimostrazione. Sia x tale che a T i x b i per ogni i = 1,..., m. Definiamo un punto x = x+td con t > 0. Verifichiamo che le direzione ammissibili sono tutte e sole quelle per cui vale la (7.4). Si tratta quindi di verificare le condizioni su d per cui risulta a T i ( x + td) = a T i x + ta T i d b i per ogni t > 0. Per ogni i I( x), vale a T i x = b i da cui a T i x + tat i d = b i + ta T i d. Quindi si ottiene per i I( x): a T i x + ta T i d b i per ogni t > 0 se e solo se a T i d 0. Per ogni j / I( x), vale a T j x > b i da cui a T j x + tat j d > b j + ta T j d. Abbiamo due possibili casi: 1.) a T j d 0 oppure 2.) at j d < 0. Se a T j d 0, allora per ogni t > 0 risulta b j + ta T j d b j e il punto è sempre ammissibile rispetto al vincolo j esimo. Se invece a T j d < 0, è necessario scegliere t abbastanza piccolo in modo che a T j x t at j d continui ad essere b j per t > 0. In ogni caso (1. o 2.) la direzione risulta ammissibile. Verifichiamo che il valore di t max deve soddisfare la (7.5). Sia quindi data d ammissibile. Dalle considerazioni precedenti si ha che per ogni i I( x), vale a T i ( x + td) b i per ogni t > 0. Consideriamo allora gli indici j / I( x). Abbiamo già visto che nel caso a T j d 0, possiamo scrivere per ogni t > 0 a T j ( x + td) = at j x + tat j d at j x > b j per ogni t > 0. Consideriamo allora il caso a T j d < 0 in cui sappiamo che t non può assumere tutti i valori positivi. Dobbiamo trovare il valore di t che soddisfa la condizione di ammissibilità espressa da a T j ( x + td) = at j x + tat j d = at j x t at j d b j. Risolvendo la condizione a T i x t at j d b j si ottiene che t at j x b j a T i d. Poiché questo deve valere per ogni j / I( x) e tale che a T j d < 0, si ottiene la limitazione data dalla (7.5). Introduciamo la seguente notazione matriciale: indichiamo con A I( x) la matrice I( x) n costituita dalle righe di A con indice in I( x), ovvero, se A = (a T i ) i=1,...,m, si ha A I( x) = (a T i ) i I( x). Sia x S, le direzioni ammissibili in x sono tutte e sole le soluzioni del sistema lineare A I( x) d 0 dove A I( x) è la matrice A I( x) = (a T i ) i I( x) e I( x) = {i : a T i x = b i}. Illustriamo con un esempio. 104

107 Esempio Sia dato il poliedro ed il punto ammissibile x = (0, 12) T. Risulta 3x 1 2x x 1 x 2 12 x 1 0 x x 1 2 x 2 = 12 > 30 2 x 1 x 2 = 12 x 1 = 0 x 2 = 12 > 0 Quindi I( x) = {2, 3} e le direzioni ammissibili d = (d 1, d 2 ) devono soddisfare il sistema 2d 1 d 2 0 d 1 0 Il valore di t max si ottiene considerando i vincoli non attivi e dipende ovviamente dalla particolare direzione ammissibile considerata. Sia, ad esempio d = (1, 2) T. Risulta a T 1 d = 3 4 < 0 e a T 4 d = 1 > 0. Quindi il valore di t max è individuato dal primo vincolo e si ha in particolare t max = at 1 x b 1 a T 1 d = 3 x 1 2 x d 1 2 d 2 = 6 1 = 6. In figura 7.5 è rappresentato il poliedro, il punto x, l insieme delle direzioni ammissibili (insieme compreso tra le due frecce blu tratteggiate), i punto ottenibili spostandosi da x lungo le direzioni ammissibili (regione compresa tra le due frecce blu a tratto intero) e il valore del passo t max relativo alla direzione ammissibile d = (1, 2) T. Il punto x + t max d = (6, 24)T è indicato in rosso in figura 7.5. Corollario Dato il poliedro S = {x IR n : Ax b}. Sia x un punto ammissibile e sia I( x) = {i {1,..., m} : a T i x = b i} l insieme degli indici attivi in x e supponiamo che esista un vettore d non nullo tale che a T i d = 0, per ogni i I( x). Allora le direzioni d e d sono ammissibili in x ed esistono valori t + max > 0 e t max > 0 tali che con t + max = x + td S per ogni t [0, t + max) x td S per ogni t [0, t max) a T j min x b j j / I( x): a T j d<0 a T j d t a T j max = min x b j j / I( x): a T j d>0 a T j d (7.6) Si intende che se l insieme degli indici su cui viene calcolato il minimo è vuoto, il corrispondente valore t + max e/o t max vale. Dimostrazione. La dimostrazione segue facilmente dal Teorema 7.6.3, applicandolo separatamente alla due direzioni d e d. 105

108 x 2 (0,12) t max x 1 Figura 7.5: Poliedro Esempio Dato un poliedro S = {x IR n : direzione d tale che Ax b} e un punto x S. Supponiamo che esista una A I( x) d = 0 I( x) = {i {1,..., m} : a T i x = b i }. Allora il punto y = x ± t d con t [0, t ± max] è ammissibile e risulta I(y) I( x) t [0, t ± max]. Naturalmente è possibile caratterizzare anche le direzioni ammissibili nel caso di poliedri in forma standard S = {x IR n : Ax = b, x 0}. Preventivamente consideriamo il caso di soli vincoli di uguaglianza Ax = b. Sia x un punto ammissibile, ovvero tale che A x = b. La definizione di direzione ammissibile d richiede che A( x + td) = b per t sufficientemente piccolo. Sviluppando si ottiene A x + tad = b + tad = b Ad = 0 per ogni t. Si osservi che in questo caso, t può assumere qualunque valore non nullo (anche negativo). 106

109 Dato un poliedro definito da un sistema di equazioni lineari del tipo Ax = b, e un punto ammissibile x. Una direzione d è ammissibile se e solo se risulta Ad = 0. Inoltre ogni punto del tipo x + td è ammissibile per ogni valore di t 0. Riportiamo senza dimostrazione il seguente risultato relativo a poliedri in forma standard. Teorema (Direzioni ammissibili di un poliedro in forma standard) Sia dato un poliedro del tipo {x IR n : Ax = b, x 0} e sia x un punto ammissibile e sia J( x) = {j {1,..., n} : x j = 0}. Una direzione d è ammissibile in x se e solo se risulta Ad = 0, d j 0 per ogni j J( x). Inoltre per ogni direzione ammissibile d, un punto x + td è ammissibile per ogni valore di t che soddisfa la condizione x j 0 t t max = min j: x j 0: d j<0 d j dove si intende che se l insieme su cui si effettua il minimo {j : valore t max =. 7.7 Condizioni di ottimo su un poliedro (7.7) x j 0 : d j < 0} è vuoto, il Utilizzando la caratterizzazione di direzioni ammissibili per un poliedro, possiamo applicare il teorema ed ottenere la seguente condizione necessaria. Teorema (Condizione necessaria di minimo locale su un poliedro) Se x è un punto di minimo locale del problema (P-POL) allora risulta f(x ) T d 0 per ogni direzione d R n : a T i d 0, i I(x ) = {i : a T i x = b i }. Questa condizione può essere formulata come non esistenza di soluzione di una sistema lineare. Utilizzando la notazione matriciale introdotta precedentemente, possiamo scrivere la condizione necessaria espressa dal teorema come segue. Se x è un punto di minimo locale di (P-POL) allora non esiste una soluzione d R n al sistema di disequazioni lineari A I(x )d 0, (7.8) f(x ) T d < 0. Illustriamo questa condizione necessaria con un esempio. 107

110 Esempio Consideriamo il problema min (x ) 2 + (x 2 12) 2 3x 1 2x x 1 x 2 12 x 1 0, x 2 0 il cui poliedro è stato descritto nell Esempio Consideriamo il punto ammissibile x = (0, 12) T che risulta essere minimo (vedi Figura 7.6 per le curve di livello della funzione obiettivo e la regione ammissibile). x 2 x 1 Figura 7.6: Poliedro Esempio Il sistema delle direzione ammissibili è già stato definito nell Esempio Il gradiente della funzione obiettivo ( ) 2(x1 + 10) f(x) = 2(x 2 12) che in x vale f( x) = (20, 0) T. Il sistema (7.8) diventa 2d 1 d 2 0 d d 1 < 0 che non ha ovviamente soluzione (le ultime due disequazioni incompatibili). (7.9) 108

111 Ricordando che un poliedro è un insieme convesso e quindi vale la caratterizzazione delle direzione ammissibili data nel teorema è possibile applicare il Teorema e ottenere il seguente risultato. Teorema (Condizione necessaria e sufficiente di minimo globale su un poliedro) Sia f(x) convessa. Un punto x S è un minimo globale per problema (P-POL) se e solo se f(x ) T d 0 per ogni direzione d R n : a T i d 0, i I(x ) = {i : a T i x = b i }. Anche in questo caso si può riscrivere la condizione come: Sia f una funzione convessa. Un punto x S è minimo globale di (P-POL) se e solo se non esiste una soluzione d R n al sistema di disequazioni lineare A I d 0, f(x ) T d < 0. (7.10) Consideriamo nuovamente un esempio. Esempio Consideriamo nuovamente il problema dell Esempio La funzione obiettivo è strettamente convessa. Quindi la condizione (7.10) è necessaria e sufficiente di minimo globale. Quindi il punto (0, 12) T che la verifica è un minimo globale. Verifichiamo cosa succede in un punto diverso, ad esempio ˆx = (0, 0) T. In ˆx risulta I(ˆx) = {3, 4} e le direzioni ammissibili soddisfano: d 1 0, d 2 0. Inoltre si ha f(ˆx) = (20, 24) T, quindi il sistema (7.10) è 20d 1 24d 2 < 0 d 1 0 d 2 0 In Figura 7.7 sono rappresentate le direzioni ammissibili (tutti i vettori tra le due frecce blu) e il gradiente della funzione obiettivo (freccia rossa). È facile verificare che esistono soluzioni al sistema; in particolare sono soluzione tutti i vettori d = (d 1, d 2 ) T tali che 0 d 1 < 6 5 d 2. Quindi, come già sapevamo, il punto ˆx non è minimo globale in quanto non è soddisfatta la condizione necessaria e sufficiente. Possiamo inoltre dare una condizione necessaria del secondo ordine utilizzando il teorema Teorema (Condizioni necessarie del 2 o ordine di minimo locale sul poliedro) Sia x un punto di minimo del Problema (P-POL). Allora risulta d T 2 xf(x )d 0 per ogni d IR n : a T i d 0, i I(x ) e f(x ) T d = 0. Le considerazioni svolte nel caso di poliedro descritto da soli vincoli di disuguaglianza Ax b, possono essere applicate anche a poliedri definiti da vincoli di uguaglianza e disuguaglianza. 109

112 x 2 x x 1 Figura 7.7: Poliedro Esempio Possiamo infatti utilizzare la caratterizzazione delle direzioni ammissibili data nel paragrafo 7.6. Consideriamo allora il caso piú generale di problema min f(x) a T i x b i a T j x = b j i = 1,..., m j = 1,..., p (7.11) Se x è minimo globale del problema (7.11) allora non esiste una soluzione d R n al sistema di disequazioni lineare a T i d 0 i I(x ) {1,..., m} a T j d = 0 f(x ) T d < 0. j = 1,..., p Un esempio importante è un problema con vincoli in forma standard del tipo: min f(x) Ax = b x 0 (P P OL ST ) In questo caso, utilizzando la condizione espressa dal Teorema 7.6.6, possiamo affermare: 110

113 Se x è minimo globale del problema (P-POL-ST) allora non esiste una soluzione d R n al sistema di disequazioni lineare Ad = 0, con J(x ) = {j {1,..., n} : x j = 0}. d J(x ) 0 f(x ) T d < 0. (7.12) Naturalmente anche in questo caso le condizioni diventano necessarie e sufficienti nel caso in cui la funzione obiettivo sia convessa Condizioni di ottimo per la Programmazione Lineare Tra i problemi di minimizzazione su poliedro particolare interesse rivestono i problemi di Programmazione Lineare del tipo min c T x (P L) Ax b. Utilizzando il teorema 7.7.3, possiamo enunciare la seguente condizione che caratterizza ulteriormente (rispetto ai risultati del Capitolo 10) le soluzioni ottime di un problema di Programmazione Lineare. Sia dato il problema (PL). Un punto x è minimo globale se e solo se non esiste una soluzione d R n al sistema di disequazioni lineare A I(x )d 0, c T d < 0. (7.13) Analogamente nel caso di problemi di Programmazione Lineare in forma standard del tipo min c T x Ax = b x 0, (P L ST ) possiamo affermare: Un punto x è minimo globale del problema di Programmazione Lineare (PL-ST) se e solo se non esiste una soluzione d R n al sistema di equazioni e disequazioni lineari Ad = 0, d J(x ) 0 c T d < 0. (7.14) con J(x ) = {j {1,..., n} : x j = 0}. Le condizioni di non esistenza di soluzioni di un sistema lineare ottenute in questo paragrafo, possono essere formulate in modo equivalente come condizioni di esistenza di un diverso 111

114 sistema di equazioni. Questa nuova formulazione costituisce la forma classica delle condizioni di ottimo per problemi di programmazione matematica. Sarà descritta nel Capitolo Utilizzo algoritmico delle condizioni di ottimo per problemi con vincoli convessi Consideriamo il problema di ottimizzazione vincolata: min x S f(x) (7.15) in cui f : R n R con S convesso e supponiamo verificata la seguente ipotesi (semplificativa) che garantisce l esistenza di un punto di minimo x S: Ipotesi 2 La funzione f : R n compatto. R è una funzione continuamente differenziabile ed S sia Gli algoritmi per la soluzione del problema (7.15) consentono, in generale, soltanto la determinazione di punti dell insieme Ω := {ω R n : f(ω) T (x ω) 0, per ogni x S}. Un possibile schema concettuale di algoritmo è il seguente: Schema generico di algoritmo di ottimizzazione vincolata per S convessi 1. Si fissa un punto iniziale x 0 S e si pone k = Se x k Ω stop. 3. Si calcola una direzione ammissibile e di discesa d k R n. 4. Si calcola un passo α k R lungo d k ; 5. Si determina un nuovo punto x k+1 = x k + α k d k S. Si pone k = k + 1 e si ritorna al Passo 2. Per i commenti generali rimandiamo al paragrafo 6.4. Qui ci limitiamo a commentare i seguenti punti: Scelta della direzione e Criterio di arresto. Assegnato un punto x k, possiamo considerare il problema vincolato min x S f(xk ) T (x x k ). (7.16) Osserviamo che la funzione obiettivo è lineare e poiché si è supposto che S sia compatto il problema precedente ammette una soluzione x k. La direzione d k = x k x k è una direzione ammissibile in x k. Se all ottimo risulta f(x k ) T (x k x k ) 0 allora il punto x k è ottimo per il problema (7.15) (e dunque risulta soddisfata la verifica effettuata al Passo 2 sull appartenenza di x k all insieme Ω). Viceversa se f(x k ) T (x k x k ) < 0 la direzione d k = x k x k risulta essere anche di discesa. È dunque possibile determinare con opportuni metodi un passo αk > 0 112

115 lungo d k, tale che x k+1 S e f(x k+1 ) < f(x k ). L algoritmo cosìdefinito è noto come Metodo di Frank-Wolfe o Conditional gradient method. Osserviamo che se l insieme ammissibile S è un poliedro, ovvero è definito da vincoli lineari, il sottoproblema (7.16) relativo al calcolo della direzione diviene un problema di programmazione lineare. 113

116 Capitolo 8 Teoremi dell alternativa 8.1 Introduzione Nel capitolo 7, le condizioni di ottimo per problemi con vincoli lineari sono state formulate come NON esistenza di soluzione di un sistema di equazioni e disequazioni lineari. Tali condizioni possono essere riscritte come condizioni di esistenza di soluzioni di un diverso sistema di equazioni e disequazioni lineare. A tale scopo si utilizzano i cosìdetti teorema dell alternativa. I teoremi dell alternativa consentono di ridurre il problema della non esistenza di soluzioni di un sistema di equazioni e disequazioni lineari assegnato a quello dell esistenza di soluzioni di un altro sistema lineare. Un risultato di alternativa relativo a due assegnati sistemi lineari (I) e (II), consiste nel dimostrare che: Il sistema (I) ha soluzione se e solo se il sistema (II) non ha soluzione. 8.2 Il Lemma di Farkas Tra i teoremi di alternativa per i sistemi di disequazioni lineari, uno dei più noti, e anche quello che utilizzeremo nei prossimi capitoli, è il Lemma di Farkas che si può enunciare nella forma seguente. Teorema (Lemma di Farkas) Sia B matrice p n e g IR n. Il sistema non ha soluzione d IR n se e solo se il sistema ha soluzione u IR p. Bd 0 g T d < 0 (I) B T u = g u 0 (II) 114

117 Dimostrazione. [(II) ha soluzione (I) non ha soluzione.] Sia ū soluzione del sistema (I) e supponiamo per assurdo che esista una soluzione d del sistema (II), ovvero che la coppia ū, d soddisfi: B d 0 g T d < 0, B T ū = g ū 0. Allora si può scrivere: B d 0 ū 0 = ū T B d 0 BT ū=g = g T d 0, che contraddice l ipotesi che d soddisfi g T d < 0. [(I) non ha soluzione (II) ha soluzione.] La dimostrazione di questa implicazione è in due parti. Si dimostra preliminarmente che se (I) non ha soluzione allora esiste un vettore u R p tale ch B T u = g. Successivamente dimostreremo che u 0. Se (I) non ha soluzione, allora in particolare non esiste una soluzione nemmeno al sistema di equazioni lineari Bd = 0 g T d = 1 [(I)eq]. Il sistema [(I)eq] si può scrivere in forma matriciale come segue: ( ) ( ) B 0 g T d = 1 È noto che tale sistema non ha soluzione se e solo se ( ) ( B B 0 rango g T rango g T 1 ) e quindi se: ( B 0 rango g T 1 ) ( B = rango g T ) + 1. (8.1) D altra parte, l ultima riga (g T 1) è linearmente indipendente dalle righe di (B 0) e quindi: ( ) B 0 rango g T = rango ( B 0 ) + 1 = rango(b) + 1. (8.2) 1 Dalle (8.1) (8.2), tenendo conto del fatto che il rango di una matrice è eguale al rango della trasposta, si ottiene rango ( B T g ) ( ) B = rango g T = rango(b) e ciò implica che il sistema B T u = g ha soluzione, ovvero esiste una rappresentazione di g del tipo: p g = u i b i. (8.3) i=1 Dimostriamo ora che u 0. La dimostrazione è per induzione sul numero di disequazioni che compongono il sistema, ovvero sul numero di righe p della matrice B. 115

118 Dimostriamo innanzitutto che la tesi è vera per p = 1 e quindi supponiamo che d R : g T d < 0, b T 1 d 0. Quindi per la (8.3) risulta g = ub 1 con u R. Se c = 0, il risultato è ovvio in quanto si può assumere u = 0. Se c 0 deve anche essere b 1 0 e possiamo considerare il vettore d = b 1 0. Ne segue che b T 1 d = b 1 2 > 0 e quindi, per ipotesi, deve risultare c T d 0. Si ottiene quindi che implica u 0. g T d = (ub1 ) T (b 1 ) = u b 1 2 0, Supponiamo ora che il risultato sia vero per una matrice con p 1 righe e dimostriamo che vale per una matrice con p righe. Quindi supponiamo che: con B matrice p n. non esista d R n tale che Bd 0, g T d < 0 (8.4) Sappiamo che esiste u R p tale che vale la (8.3). Tra tutti i possibili u per cui vale la (8.3) determiniamo un vettore ū con il massimo numero di componenti non negative e indichiamo con s il numero di componenti non negative di ū. Riordiniamo le componenti di ū e conseguentemente le colonne di B in modo che le componenti non negative siano le prime s, ovvero risulti Allora possiamo scrivere ū 1,..., ū s 0, ū s+1,..., ū p < 0. g = s ū i b i + i=1 p 1 i=s+1 ū i b i + ū p b p. Si tratta di dimostrare che deve essere s = p. Per assurdo supponiamo che s < p. Possiamo scrivere avendo posto g = ĝ + ĝ = m 1 i=s+1 ū i b i, (8.5) s ū i b i + ū p b p (8.6) La dimostrazione procede in due passi principali. Si dimostra inizialmente che i=1 [Affermazione 1] Se d R n : Bd 0 c T d < 0 = d R n : Bd 0 ĝ T d < 0 Successivamente che [Affermazione 2] Se d R n : Bd 0 ĝ T d < 0 = d R n : b T i d 0, i = 1,..., p 1, ĝ T d <

119 Se [Affermazione 1] e [Affermazione 2] sono vere, come conseguenza dell ipotesi 8.4, si ha che d R n tale che b T i d 0 i = 1,..., p 1 ĝ T d < 0. (8.7) Ma poiché il sistema (8.7) è di dimensione p 1, soddisfa l ipotesi induttiva e quindi esiste un û R p 1 tale che p 1 ĝ = û i b i, û i 0, i = 1,..., p 1. i=1 Sostituendo questa espressione di ĝ nella definizione (8.6) di c, si ottiene: g = ĝ + = = p 1 i=s+1 s û i b i + i=1 i=1 p 1 ū i b i = û i b i + p 1 i=s+1 p 1 i=1 (ū i + û i )b i m 1 i=s+1 s û i b i + (ū i + û i )b i + 0 b p i=s+1 Quindi c risulta essere la combinazione lineare dei vettori b i con s + 1 coefficienti non negativi û 1,..., û s, û p = 0. Ma questo è assurdo perché per ipotesi avevamo supposto che s fosse il massimo numero di coefficienti non negativi nella definizione di g. Si tratta quindi di dimostrare che valgono le [Affermazione 1] e [Affermazione 2]. Dimostrazione [Affermazione 1]. Sia d tale che Bd 0, e quindi, per ipotesi g T d 0; moltiplicando scalarmente la (8.5) per d si ottiene 0 g T d = ĝ T d + Poiché ū s+1,..., ū p 1 < 0, la p 1 i=s+1 p 1 i=s+1 L [Affermazione 1] è cosí dimostrata. ū i b i 0 }{{} ū i b T i d per ogni d : b id 0 i = 1,..., p. ū i b T i d 0 e quindi deve essere necessariamente: ĝ T d 0 per ogni d : Bd 0. Dimostrazione [Affermazione 2]. Per definizione (8.6), ĝ è la combinazione lineare dei vettori b i con coefficienti ū 1,..., ū s, 0,..., 0, ū p tutti non negativi tranne l ultimo ū p. La dimostrazione è per assurdo, quindi supponiamo che non sia vera, cioè che esista d R n tale che b T i d 0 per i = 1,..., p 1 e ĝ T d < 0. Per definizione di ĝ possiamo scrivere ĝ T d = s ū i b T d i + ū p b T d. p i=1 117

120 Se b T i d 0 per i = 1,..., p 1, allora s ū i b T i d 0. D altra parte ū p < 0 e quindi ĝ T d < 0 se i=1 e solo se risulta b T p d > 0. Quindi d è un vettore tale che b T i d 0 i = 1,..., p 1 b T p d > 0, ma allora per ipotesi deve essere ĝ T d 0 che contraddice ĝ T d < 0. Quindi anche l [Affermazione 2] è dimostrata. 118

121 Capitolo 9 Le condizioni di Karush-Kuhn-Tucker 9.1 Introduzione In questo capitolo deriveremo le condizioni necessarie di Karush-Kuhn-Tucker (KKT) per problemi vincolati in cui S è descritto da vincoli di disuguaglianza e/o di uguaglianza lineari. Si tratta di formulare in modo alternativo le condizioni necessarie del paragrafo 7.5. A questo scopo si devono utilizzare i teoremi dell alternativa descritti nel Capitolo Le condizioni di Karush-Kuhn-Tucker Consideriamo il problema di ottimizzazione su un poliedro e senza perdita di generalità ci riferiamo inizialmente ad un poliedro con soli vincoli di disuguaglianza. Il problema in considerazione è quindi: min f(x) (P P OL) Ax b Nel paragrafo 7.5 abbiamo derivato le condizioni necessarie di ottimo: Se x è un punto di minimo locale allora non esiste una soluzione d R n al sistema di disequazioni lineare A I(x )d 0, (9.1) f(x ) T d < 0. dove A I(x ) è la matrice A I(x ) = (a T i ) i I(x ) di dimensione I(x ) n e I(x ) = {i : a T i x = b i }. Identificando il sistema (9.1) con il sistema (I) del Lemma di Farkas, e utilizzando il Lemma di Farkas, possiamo affermare quanto segue. 119

122 Non esiste una soluzione d R n al sistema di disequazioni lineare (9.1) se e solo se esiste una soluzione del sistema A T I(x ) u = f(x ), u 0. dove u è un vettore di dimensione I(x ). (9.2) Esempio Consideriamo il sistema (7.9) ottenuto nell esempio 7.7.2: 2d 1 d 2 0 d d 1 < 0 A cui corrispondono A I(x ) = ( ) f(x ) = (20, 0) T. Il sistema (7.9) non ammette soluzione. Applicando il Lemma di Farkas deve esistere un vettore u IR 2 tale che u 0 e ( ) T ( ) ( ) 2 1 u1 20 = 1 0 u 2 0 Il sistema si scrive che ammette la soluzione u 1 = 0, u 2 = 20. 2u 1 + u 2 = 20 u 1 = 0 u 1 0, u 2 0 Utilizzando il Lemma di Farkas, possiamo stabilire le condizioni di ottimo per (P-POL), note come condizioni di Karush-Kuhn-Tucker (KKT), nella forma seguente. Teorema (Condizioni di Karush-Kuhn-Tucker per (P-POL)) Sia x un punto di minimo locale del problema (P-POL). Allora esiste un vettore λ R m tale che risultino soddisfatte le condizioni seguenti: (i) Ax b, (ii) f(x ) A T λ = 0, (iii) λ 0, (iv) λ i (b i a T i x ) = 0 per i = 1,..., m. Dimostrazione. Sia x un punto di minimo locale; poiché x deve essere ammissibile vale la (i). Inoltre non deve ammettere soluzione il sistema (9.1). Abbiamo già osservato che, identificando il sistema (9.1) con il sistema (I) del Lemma di Farkas, possiamo affermare che esiste una soluzione u del sistema (9.2). 120

123 Sia u i 0, i I(x ) una soluzione del sistema precedente e definiamo un vettore λ R m ponendo: { λ u i = i per i I(x ) 0 per i / I(x (9.3) ). Risulta ovviamente λ 0 ed è soddisfatta la (iii). Inoltre, la (iv) è una conseguenza immediata della definizione (9.3) di λ. Abbiamo infatti che { λ i (b i a T i x u ) = i (b i a T i x ) = 0 per i I(x ) 0(b i a T i x ) = 0 per i / I(x ). Infine, ricordando che la (9.2) può essere scritta f(x ) = u i a i possiamo scrivere È quindi soddisfatta la (ii). f(x ) = i I(x ) u i a i + i I(x ) i I(x ) 0 a i = A T λ. Il vettore λ IR m si dice moltiplicatore di Lagrange (generalizzato) relativo ai vincoli Ax b. Osserviamo che la (ii) esprime il fatto che in un punto di minimo locale il gradiente della funzione è esprimibile come combinazione non negativa (conica) dei gradienti dei vincoli attivi in x : f(x ) = λ i a i, λ i 0 i I(x ) La condizione (iv) è nota come condizione di complementarità ed esprime il fatto che in un punto di minimo locale deve essere nullo, per ciascun vincolo, il prodotto λ i (b i a i T x ), per cui, se il vincolo non è attivo, si deve annullare il corrispondente moltiplicatore. Tenuto conto che λ 0 e Ax b 0 la condizione (iv) si può scrivere equivalentemente come λ T (b Ax ) = m λ i (b i a T i x ) = 0. i=1 Le condizioni enunciate si possono esprimere in una forma equivalente facendo riferimento alla funzione Lagrangiana. La funzione Lagrangiana per il problema (P-POL) è definita come L(x, λ) = f(x) + λ T (b Ax) Indicando con x L(x, λ) = f(x) A T λ il gradiente di L rispetto a x, la condizione (ii) esprime il fatto che nel punto (x, λ ) deve annullarsi il gradiente della funzione Lagrangiana 121

124 rispetto a x, per cui la coppia (x, λ ) costituisce un punto stazionario della funzione Lagrangiana. Possiamo allora riscrivere le condizioni di KKT come segue (Condizioni necessarie di Karush-Kuhn-Tucker) Sia x un punto di minimo locale del problema (P-POL). Allora esiste un vettore λ IR m tale che risultino soddisfatte le condizioni seguenti: (i) Ax b, (ammissibilità) (ii) x L(x, λ ) = 0 (stazionarietà), (iii) λ 0, (iv) λ T (b Ax ) = 0 (complementarità). Osserviamo che in un punto x che sodisfa le condizioni di KKT risulta L(x, λ ) = f(x ). I punti candidati ad essere minimo di un problema del tipo (P-POL) possono essere determinati risolvendo le condizioni di KKT. Introduciamo allora la seguente definizione. Un punto x è detto punto di KKT del problema (P-POL) se esiste λ IR m tale che valgano le condizioni: (i) A x b, (ii) L( x, λ) = 0, (iii) λ 0, (iv) λ T (b A x) = 0. I possibili candidati ad essere minimo locale sono quindi i punti di KKT. Esempio Consideriamo il problema max x x 1 x 1 x x 1 + x 2 1 x 1 0 Determiniamo tutti punti di KKT. Mettiamo innanzitutto il problema nella forma (P-POL). min x x 1 x 1 + x x 1 x 2 1 x

125 La funzione Lagrangiana per questo problema è: L(x, λ) = x x 1 + λ 1 ( 1 + x 1 x 2 ) + λ 2 ( x 1 + x 2 ) λ 3 x 1 Le condizioni di KKT sono: (i) (ammissibilità) x 1 + x x 1 x 2 1 x 1 0 (ii) (stazionarietà) λ λ 2 λ 3 = 0 2x 2 λ 1 + λ 2 = 0 (iii) (non negatività) (iv) (complementarità) λ 1, λ 1, λ 3 0 λ 1 ( 1 + x 1 x 2 ) = 0 λ 2 ( x 1 + x 2 ) = 0 λ 3 x 1 = 0 Determiniamo i punti di KKT esaminando tutti i casi possibili. Dalla condizione λ 3 x 1 = 0 si ottiene che (iv) x 2 = 1 2 λ2 = 0, (ii)2 λ 1 = 2 (ii)3 λ 3 = 3 2 x 1 = 0 (i) (iv) 1 1 x 2 1 x 2 = 1 λ1 = 0, (ii) 2 λ 2 = 2, 0 = λ 3 x 1 = λ 3 = 0 λ 2 = 0 λ 2 > 0 (ii) 1 1 < x 2 < 1 (iv) λ 1 = λ 2 = 0, (ii) 2 x 2 = 0, (ii) 3 λ 3 = 1 2 λ1 = 1 2, (ii) 2 x2 = 1 4, (iv) 1 x 1 = 3 4 (iv) 1,2 +(i) λ 1 > 0 x 1 = 4 3, x 2 = 1 3, (ii) 1,2 λ 2 = 7 9 λ 1 = 1 9 λ 1 = 0 (ii) 1 λ2 = 1, (ii) 2 x2 = 1 2, (iv) 2 x 1 = 1. Quindi abbiamo trovato 4 punti di KKT 1. (0, 1) T con moltiplicatori λ = (2, 0, 3/2) T con valore della funz. obiettivo f = 1; 2. (3/4, 1/4) T con moltiplicatori λ = (1/2, 0, 0) T con valore della funz. obiettivo f = 7/16; 123

126 4. (4/3, 1/3) T con moltiplicatori λ = (1/9, 7/9, 0) T con valore della funz. obiettivo f = 7/9; 5. (1, 1/2) T con moltiplicatori λ = (0, 1, 0) T con valore della funz. obiettivo f = 3/4; Poiché l insieme ammissibile è compatto, esiste un punto di minimo globale e si trova tra i punti di KKT determinati so pra. Si tratta di scegliere quello con valore della funzione obiettivo minore: si tratta dei due punti (0, 1) e (0, 1). Ricordando che la condizione (9.1) diventa necessaria e sufficiente di ottimo globale nell ipotesi che f sia convessa, otteniamo che anche le condizioni di KKT sono necessarie e sufficienti di ottimo globale nell ipotesi che f sia convessa. Vale infatti il teorema seguente. Teorema (Condizioni necessarie e sufficienti di ottimo globale) Sia f una funzione convessa con f continuo in IR n. Un punto x è minimo globale di (P-POL) se e solo se esiste λ IR m tale che valgano le condizioni: (i) Ax b, (ii) f(x ) A T λ = 0, (iii) λ 0, (iv) λ T (b Ax ) = 0. Se inoltre f è strettamente convessa e valgono le condizioni precedenti, allora il punto x è l unico punto di minimo globale di f su S. Esempio Consideriamo il problema dell Esempio min (x ) 2 + (x 2 12) 2 3x 1 2x x 1 x 2 12 x 1 0, x 2 0 Si tratta di un problema convesso. La funzione Lagrangiana per questo problema è la funzione L : IR 2 IR 4 IR definita come: L(x, λ) = (x ) 2 + (x 2 12) 2 + λ 1 ( 30 3x 1 + 2x 2 ) + λ 2 ( 12 2x 1 + x 2 ) λ 3 x 1 λ 4 x 2 Le condizioni di KKT in un punto x ammissibile richiedono che valga ( ) 2(x1 + 10) 3λ x L(x, λ) = 1 2λ 2 λ 3 = 0 2(x 2 12) + 2λ 1 + λ 2 λ 4 con λ 0 λ 1 ( 30 3x 1 + 2x 2 ) = 0 λ 2 ( 12 2x 1 + x 2 ) = 0 λ 3 x 1 = 0 λ 4 x 2 = 0 124

127 Possiamo facilmente verificare che il punto ammissibile x = (0, 0) T non soddisfa le condizioni di KKT. Infatti dalle condizioni di complementaritá si ottiene che λ 2 = λ 1 = 0. Sostituendo in x L(x, λ) = 0 si ha 20 λ 3 = 0 24 λ 4 = 0 da cui si ottiene il valore λ 4 = 24 < 0 che non è accettabile. Consideriamo invece il punto (0, 12) T. In questo caso dalle condizioni di complementaritá si ottiene che λ 4 = λ 1 = 0. Sostituendo in x L(x, λ) = 0 si ha 20 2λ 2 λ 3 = 0 λ 2 = 0 da cui si ottiene λ 2 = 0 e λ 3 = 20 > 0. Quindi il punto (0, 12) T soddisfa le condizioni di KKT. Possiamo inoltre enunciare anche le condizioni necessarie del secondo ordine Teorema (Condizioni necessarie del 2 o ordine di minimo locale sul poliedro) Sia x un punto di minimo del Problema (P-POL). Allora esiste un vettore λ R m tale che risultino soddisfatte le condizioni di KKT ed inoltre risulta d T 2 xl(x, λ )d 0 per ogni d IR n : a T i d 0, i I(x ) e f(x ) T d = 0. La dimostrazione segue banalmente osservando che 2 xl(x, λ ) = 2 f(x ) e quindi si tratta di una semplice riscrittura del Teorema Dalle condizioni di KKT per problemi nella forma (P-POL) si possono anche derivare direttamente le condizioni di KKT per un problema con poliedro più generale. Analizziamo inizialmente il caso di poliedro descritto da soli vincoli di uguaglianza min f(x) Ax = b con A matrice m n. Il sistema di equazioni Ax = b si può equivalentemente scrivere come Ax b e Ax b, e dunque il problema si scrive: min f(x) Ax b Ax b Associando ai vincoli i moltiplicatori µ 1, µ 2 IR m, con µ 1, µ 2 0, la funzione Lagrangiana è : L(x, µ 1, µ 2 ) = f(x) + µ T 1 (b Ax) + µ T 2 ( b + Ax) = f(x) + (µ 1 µ 2 ) T (b Ax). Se si pone µ = µ 1 µ 2, si può scrivere L(x, µ) = f(x) + µ T (b Ax) 125

128 dove µ R m può assumere qualunque valore (positivo, negativo, nullo) in quanto differenza di due quantità non negative. Inoltre la condizione di complementarità è banalmente soddisfatta in ogni punto ammissibile. Dunque possiamo affermare: (Condizioni necessarie di Lagrange) Sia x un punto di minimo locale del problema min f(x) Ax = b Esiste un vettore µ IR m tale che x L(x, µ ) = f(x ) A T µ = 0 Consideriamo ora un problema in in forma standard min f(x) Ax = b x 0 e la funzione Lagrangiana per il problema (P-ST). (P ST ) La funzione Lagrangiana per il problema (P-ST) è definita come L(x, λ, µ) = f(x) + µ T (Ax b) λ T x Si derivano facilmente le condizioni di ottimo. Teorema (Condizioni di Karush-Kuhn-Tucker per (P-ST)) Sia x un punto di minimo locale del problema (P-ST). Allora esistono un vettore λ IR n e µ IR m tale che risultino soddisfatte le condizioni seguenti: (i) Ax = b, x 0 (ammissibilità), (ii) x L(x, λ, µ ) = f(x ) + A T µ λ = 0 (stazionarietà), (iii) λ 0, (iv) λ T x = 0 (complementarità). Naturalmente le condizioni di KKT possono essere scritte per un qualunque problema di minimizzazione su un poliedro 1. Nel caso generale supponiamo di avere un problema definito da vincoli di uguaglianza e disuguaglianza del tipo. min f(x) Dx = h Ax b (P GEN) 1 Nel caso in cui l insieme ammissibile non sia un poliedro, è ancora possibile definire le condizioni necessarie di KKT purché i vincoli soddisfino opportune ipotesi dette condizioni di qualificazione dei vincoli. In questo corso non si trattano vincoli non lineari generici. 126

129 in cui D è una matrice p n, A è una matrice q n, h IR p, b IR q. Allora La funzione Lagrangiana per (P-GEN) è con λ IR q, µ IR p. Inoltre L(x, λ, µ) = f(x) + λ T (b Ax) + µ T (Dx h), Le condizioni di KKT per il problema (P-GEN) sono soddisfatte in un punto (x, λ, µ ) IR n IR q IR p se: (i) Ax b, Dx = h (ammissibilità), (ii) x L(x, λ, µ ) = f(x ) A T λ + D T µ = 0 (stazionarietà), (iii) λ 0, (iv) λ T (b Ax ) = 0 (complementarità). Teorema (Condizioni di Karush-Kuhn-Tucker per (P-GEN)) Sia x un punto di minimo locale del problema (P-GEN). Allora esistono vettori λ R q, µ IR p tali che risultino soddisfatte le condizioni seguenti: (i) x L(x, λ, µ ) = 0, (ii) λ 0, (iii) λ i (b i a T i x ) = 0 per i = 1,..., q. Esempio Consideriamo la seguente modifica del problema dell Esempio max x x 1 x 1 x 2 = x 1 + x 2 1 x 1 0 Determiniamo tutti punti di KKT. Mettiamo innanzitutto il problema nella forma (P-GEN). min x x 1 La funzione Lagrangiana per questo problema è: x 1 x 2 = x 1 x 2 1 x 1 0 L(x, λ) = x x 1 + µ( 1 + x 1 x 2 ) + λ 1 ( x 1 + x 2 ) λ 2 x 1 Le condizioni di KKT sono: 127

130 (i) (ammissibilità) (ii) (stazionarietà) x 1 x 2 = x 1 x 2 1 x µ λ 1 λ 2 = 0 2x 2 µ + λ 1 = 0 (iii) (non negatività) (iv) (complementarità) λ 1, λ 2 0 λ 1 ( x 1 + x 2 ) = 0 λ 2 x 1 = 0 Determiniamo i punti di KKT esaminando tutti i casi possibili. Dalla condizione λ 2 x 1 = 0 si ottiene che x 1 = 0 (i) x 2 = 1 (iv) 2 λ 1 = 0, (ii)2 µ = 2 (ii)3 λ 2 = 3/2 0 = λ 2 x 1 = (ii) λ 1 = 0 1 (ii) 2 µ = 1/2, x2 = 1/4, (i) 1 x 1 = 3/4 λ 2 = 0 imponiamo λ 1 > 0 (iv) 2 +(i) x 1 = 4/3, x 2 = 1/3, (ii) 1 +(ii) 2 λ 1 = 7 9 µ = 1 9. Quindi abbiamo trovato 3 punti di KKT 1. x 1 = (0, 1) T con moltiplicatori µ = 2 e λ = (0, 3/2) T con valore della funz. obiettivo f = 1; 2. x 2 = (3/4, 1/4) T con moltiplicatori µ = 1/2 e λ = (0, 0) T con valore della funz. obiettivo f = 7/16; 3. x 3 = (4/3, 1/3) T con moltiplicatori µ = 1/9 e λ = (7/9, 0) T con valore della funz. obiettivo f = 7/9; Poiché l insieme ammissibile è compatto, esiste un punto di minimo globale e si trova tra i punti di KKT determinati sopra. Si tratta di scegliere quello con valore della funzione obiettivo minore: si tratta del punto x 1 = (0, 1). Possiamo inoltre scrivere le condizioni necessarie del secondo ordine. In particolare si ha: Teorema (Condizioni necessarie del 2 o ordine) Sia x un punto di minimo locale del problema (P-GEN). Allora esistono vettori λ IR p e µ IR q tali che risultino soddisfatte le condizioni di KKT e inoltre risulta z T 2 xxl(x, λ, µ )z 0 per ogni z : Dz = 0, A I(x )z 0 e f(x ) T z = 0 128

131 Consideriamo nuovamente l esempio Esempio Consideriamo i 3 punti di KKT precedentemente determinati e verifichiamo se soddisfano le condizioni necessarie del secondo ordine. La funzione Lagrangiana per questo problema è: il cui hessiano è L(x, λ) = x x 1 + µ( 1 + x 1 x 2 ) + λ 1 ( x 1 + x 2 ) λ 2 x 1 2 xxl(x, λ, µ) = ( ) = 2 f(x). ( ) 1/2 Quindi per ogni z = (z 1, z 2 ) T risulta z T 2 xxl(x, λ, µ )z = 2z2. 2 Inoltre f =. 2x 2 Consideriamo il punto x 1 = (0, 1) T. Dobbiamo determinare i vettori z che definiscono le direzioni ammissibili. In x 1 è attivo il vincolo di disuguaglianza x 1 0, quindi le direzioni ammissibili sono i vettori z R 2 che risolvono il sistema z 1 z 2 = 0 z 1 0, ovvero tutti i vettori del tipo z = (t, t) T con t 0. Inoltre deve risultare ( ) f(x 1 ) T z = (t, t) T 1 2 = 1 t + 2t = 0, 2 2 da cui si ottiene t = 0 e z = (0, 0) T. La condizione necessaria del secondo ordine quindi è soddisfatta in quanto 2t 2 0. Consideriamo il punto x 2 = (3/4, 1/4) T. In x 2 non è attivo nessun vincolo di disuguaglianza, quindi le direzioni ammissibili sono i vettori z R 2 che risolvono il sistema z 1 z 2 = 0 ovvero tutti i vettori del tipo z = (t, t) T. Inoltre deve risultare ( ) f(x 2 ) T z = (t, t) T = t t = 0. La condizione necessaria del secondo ordine quindi NON è soddisfatta in quanto 2t 2 0 non è verificata qualunque sia t. Il punto x 2 non può essere un minimo locale. Consideriamo il punto x 3 = (4/3, 1/3) T. In x 3 è attivo il primo vincolo di disuguaglianza, quindi le direzioni ammissibili sono i vettori z R 2 che risolvono il sistema z 1 z 2 = z 1 z 2 0 ovvero tutti i vettori del tipo z = (t, t) T con t 0. Inoltre deve risultare ( ) f(x 3 ) T z = (t, t) T 1 2 = t 2 3 t = 0, che è verificata per t = 0. Quindi l unico vettore z = (0, 0) T e la condizione necessaria del secondo ordine quindi è soddisfatta in quanto 2t 2 0 è verificata. 129

132 Capitolo 10 Teoria della Programmazione Lineare In questo capitolo i risultati dei capitoli precedenti saranno applicati a problemi di Programmazione Lineare (PL). Abbiamo già visto che l insieme ammissibile di un problema di programmazione lineare è un poliedro e dunque un insieme convesso e che la PL è un problema sia concavo che convesso. Dunque, se ammette soluzione, il minimo globale (non necessariamente unico) si trova sulla frontiera dell insieme ammissibile. Ci proponiamo di studiare alcune proprietà dei poliedri che consentano di caratterizzare le soluzioni ottime di un problema di programmazione Lineare. Successivamente si deriva la teoria della dualità per la PL a partire dalle condizioni di KKT Caratterizzazione dei vertici di un poliedro Passiamo ora a caratterizzare in modo algebrico i vertici di un poliedro in forma Ax b. Teorema (Vertici di un poliedro) Sia dato un poliedro S = {x R n : Ax b}. Un punto x S è un vertice se e solo se esistono n righe a T i della matrice A corrispondenti ai vincoli attivi in x linearmente indipendenti, cioè se e solo se risulta rango{a I( x) } = n dove A I( x) la matrice I( x) n costituita dalle righe di A con indice in I( x) Dimostrazione. Dimostriamo la parte necessaria, ovvero che se x è un vertice, allora rango({a i i I( x)}) = n. Per assurdo supponiamo che il rango sia p < n. Il sistema omogeneo a T i d = 0 i I( x) in I( x) equazioni e n incognite, ha rango inferiore a n e dunque ammette una soluzione non nulla. Dal teorema 7.6.3, sappiamo che d è una particolare direzione ammissibile; notiamo 130

133 inoltre che, poiché anche d è soluzione del sistema omogeneo, anche d è una direzione ammissibile. Allora possiamo considerare i due punti y = x + td z = x + t( d) e sappiamo che per valori di t sufficientemente piccoli sono entrambi ammissibili 1. Osserviamo però che possiamo scrivere x = 1 2 y z ovvero x può essere ottenuto come combinazione convessa con coefficiente β = 1 2 di due punti ammissibili e distinti. Ma questo contraddice che x sia un vertice. Dimostriamo la parte sufficiente, ovvero che se rango{a i i I( x)} = n allora x è un vertice. Osserviamo preliminarmente che la condizione rango({a i i I( x)}) = n implica che x sia l unica soluzione del sistema a T i x = b i per ogni i I( x). Procediamo ora per assurdo e supponiamo che il punto x non sia un vertice. Allora non può essere l unico punto ammissibile e in particolare esisteranno due punti ammissibili v e w distinti da x e tali che x possa essere espresso come combinazione convessa di v e w ovvero Per ogni i I( x) possiamo scrivere x = (1 β)v + βw con β (0, 1). b i = a T i x = (1 β)a T i v + βa T i w Osserviamo che deve essere necessariamente a T i v = b i e a T i w = b i per ogni i I( x). Se così non fosse, e a T i v > b i e/o a T i w > b i si avrebbe l assurdo b i = a T i x = (1 β)a T i v + βa T i w > (1 β)b i + βb i = b i. Ma allora otteniamo che sia v che w sono soluzioni del sistema a T i x = b i per ogni i I( x). Ma questo contraddice che x sia l unica soluzione. Possiamo enunciare alcuni corollari che discendono direttamente dal teorema appena dimostrato. Corollario Sia dato un poliedro S = {x IR n : Ax b}. Se la matrice A ha un numero di righe linearmente indipendenti minore di n, allora S non ha vertici. In particolare se m < n allora S non ha vertici. Corollario Un poliedro S = {x IR n : Ax b} ha un numero finito di vertici, pari al massimo a ( ) m m! = n n!(m n)! 1 per trovare il valore di t basta applicare la formula (7.5) alle due direzioni d e d. 131

134 Esempio Sia dato il poliedro dell Esempio che possiamo scrivere in forma matriciale x 1 2x x 1 x 2 12 x 1 0 x 2 0 ( x1 x 2 ) x 2 x 1 Figura 10.1: Poliedro Esempio Il poliedro è rappresentato in figura 10.1 e i vertici sono indicati con un puntino rosso. Verifichiamo che la condizione espressa dal Teorema è verificata. I tre vertici sono i punti ( ) ( ) ( ) v 1 = v 12 2 = v 0 3 =. 24 In v 1 sono attivi i vincoli 2x 1 x 2 12, x 1 0, ovvero I(v 1 ) = {2, 3}. Consideriamo le righe della matrice A corrispondenti ( 2 ) che si verifica sono linearmente indipendenti. 132

135 In v 2 sono attivi i vincoli 3x 1 2x 2 30, x 1 0, ovvero I(v 1 ) = {1, 3}. Consideriamo le righe della matrice A corrispondenti ( 3 ) che si verifica sono linearmente indipendenti. In v 3 sono attivi i vincoli 2x 1 x 2 12, 3x 1 2x 2 30, ovvero I(v 1 ) = {1, 2}. Consideriamo le righe della matrice A corrispondenti ( 3 2 ) 2 1 che si verifica sono linearmente indipendenti. Si noti che il teorema non esclude che in un vertice siano attivi più di n vincoli. Esempio Consideriamo il poliedro dell Esempio con l aggiunta di un vincolo x 2 24, ovvero: 3x 1 2x x 1 x 2 12 x 2 24 x 1 0, x 2 0 ( ) 6 Si verifica graficamente che il punto v 3 = è ancora un vertice. Osserviamo che in v 24 3 sono ora attivi tre vincoli I(v 3 ) = {1, 2, 3} e le righe della matrice A corrispondenti sono: Si verifica facilmente che il rango di questa matrice è 2. Esempio Sia dato il poliedro x 1 + 2x 2 + x 3 3 3x 1 x 2 + x 3 2 2x 1 + x 2 + x 3 3 4x 1 + x 2 + 2x 3 4 elenchiamo i vertici. In forma matriciale possiamo scrivere x x 2 x m! Si ha n = 3 e m = 4. Il numero massimo di vertici è quindi n!(m n)! = 4! 3! = 4 e si ottengono considerando tutte le possibili combinazioni di tre righe della matrice A. consideriamo quindi i casi possibili:

136 1. I = {1, 2, 3}; il sistema a T i x = b i con i I ha rango pari a 3 e l unica soluzione è il punto (1, 1, 0) T che però non risulta ammissibile, perché risulta ( 4 1 2)(1, 1, 0) T < 4; 2. I = {1, 2, 4} il rango della matrice è 2 < n, quindi non può essere un vertice; 3. I = {2, 3, 4} il sistema ammette l unica soluzione (3, 2, 5) che è ammissibile e quindi è un vertice; 4. I = {1, 3, 4} il sistema ammette l unica soluzione (2, 2, 3) che è ammissibile e quindi è un vertice. Tuttavia bisogna porre attenzione al fatto che esistono poliedri che non contengono vertici. Un esempio e dato nella figura 10.2 in cui il poliedro è la parte di piano contenuta tra due rette parallele r 1 e r x r r x 1 Figura 10.2: Poliedro senza vertici. Vedremo nel prossimo paragrafo che il caso in cui il poliedro non ha vertici è l unico caso in cui il problema di PL corrispondente può avere soluzione ottima (ovviamente sulla frontiera) senza che nessuna soluzione coincida con un vertice. Risulta quindi interessante capire quando un poliedro può non ammettere vertice. A tal scopo introduciamo la seguente definizione Definizione (Retta) Sia S un poliedro. punto x S e una direzione d IR n tale che Il poliedro contiene una retta se esiste un x + td S per ogni t IR. La caratterizzazione dei casi in cui un poliedro non ammette vertici è riportata nel seguente risultato, di cui omettiamo la prova. 134

137 Teorema Un poliedro P non vuoto non ha vertici se e solo se contiene una retta. È evidente che il poliedro nella Figura 10.2 contiene rette (in particolare contiene, per esempio, r 1, r 2 ) e quindi, non contiene vertici. Osservazione Nel caso le variabili del problema di PL siano vincolate ad essere tutte non negative ovvero tra i vincoli compaiono x 0, questo implica che il poliedro ammissibile è interamente contenuta nel primo ortante e quindi non può contenere rette. Quindi, in base al teorema precedente, tutti i poliedri contenuti nel primo ortante o sono vuoti o hanno dei vertici. Notiamo che questa è sicuramente la classe di poliedri che più frequentemente si incontra nelle applicazioni.possiamo dunque affermare: Se un poliedro S {x IR n : x 0} è non vuoto, ammette sempre almeno un vertice. Dumque, risulta vero il seguente risultato. Corollario Sia dato un poliedro del tipo S = {x IR n : poliedro non è vuoto, ammette sempre un vertice. Ax = b, x 0}. Se il Consideriamo un poliedro n forma standard del tipo S = {x IR n : Ax = b, x 0}. Possiamo caratterizzare i vertici di un poliedro in forma standard utilizzando la struttura particolare e osservando che in punto ammissibile x risulta I( x) = {1,..., m} {i : x i = 0}. Vale il seguente teorema che si riporta senza dimostrazione. Teorema (Vertici di un poliedro in forma standard) Sia dato un poliedro S = {x IR n : Ax = b, x 0}. Un punto x S è un vertice se e solo se le colonne della matrice A corrispondenti a componenti positive di x, sono linearmente indipendenti. Abbiamo osservato nel Capitolo 3 che è possibile passare da una rappresentazione di un poliedro ad altre equivalenti. In particolare ci interessa qui notare che un poliedro del tipo S = {x IR n : Ax b, x 0} (con A matrice m n) può essere trasformato in forma standard con l aggiunta di variabili di surplus come segue {( ) } S x = IR n+m : Ax s = b, x 0, s 0. s Possiamo mettere in relazione i vertici di S con i vertici di S. Vale infatti il seguente risultato. 135

138 Teorema ( ) x è un vertice del poliedro {( S = ){x IR n : Ax b, x 0} se e solo } se x con s = A x b è un vertice di S x s = IR n+m : Ax s = b, x 0, s 0. s ( ) x Dimostrazione. Osserviamo preliminarmente che x S se e solo se S. Infatti A x b per definizione A x b = s 0. ( ) Supponiamo che x sia un vertice di S ma per assurdo non sia vertice di S x s. Dunque ( ) ( ) x 1 x esistono altri due punti distinti s 1 S 2 e s 2 S tali che ( ) ( ) ( ) x 1 x 2 = (1 β) x s s 1 + β s 2 S per qualche β (0, 1) e Ax 1 s 1 = b, Ax 2 s 2 = b, x 1 0, s 1 0, x 2 0, s 2 0. Dunque x 1 ( S e x) 2 S. Inoltre ( x 1 ) x 2 altrimenti s 1 = Ax 1 b = Ax 2 b = s 2 e dunque x 1 x i due punti S 2 e S non sarebbero distinti. Ma allora risulta anche s 1 s 2 x = (1 β)x 1 + βx ( 2 che contraddice ) l ipotesi che x sia un vertice. x Supponiamo ora S sia un vertice di S A x b, ma, per assurdo, x NON sia vertice di S. Allora esistono due punti x 1, x 2 S tali che x = (1 β)x 1 + βx 2 per qualche β (0, 1). ( ) ( ) x Siano s 1 = Ax 1 b 0 e s 2 = Ax 2 1 x b 0, dunque s 1 S 2 e s 2 S. Inoltre si ha (1 β)s 1 + βs 2 = (1 β)(ax 1 b) + β(ax 2 b) = A ( (1 β)x 1 + βx 2) b = A x b = s che contraddice l ipotesi che ( x, s) T sia un vertice di S Il teorema fondamentale della PL Consideriamo ora il problema di Programmazione Lineare min x S ct x con S poliedro. È da notare che il caso di problemi con soli vincoli di uguaglianza del tipo min c T x Ax = b con A matrice m n é di scarsa rilevanza pratica in quanto è possibile dimostrare che se esiste una soluzione ammissibile e il problema non è illimitato allora tutte le soluzioni ammissibili sono ottime. Quindi il problema con soli vincoli di uguaglianza, si riduce essenzialmente allo studio di sistemi di equazioni lineari. In particolare vale il seguente risultato. 136

139 Teorema Sia dato il problema di PL min c T x Ax = b con A matrice m n. Se esiste un punto x tale che A x = b allora 1. il problema è illimitato inferiormente (in questo caso esiste un direzione d ammissibile tale che c T d < 0) oppure 2. tutte le soluzioni ammissibili sono ottime (in questo caso per ogni direzione d ammissibile risulta c T d = 0) Dimostrazione. Se x è soluzione unica del sistema Ax = b, allora banalmente è anche ottima (e non esiste alcuna direzione d ammissibile perché il sistema Ad = 0 non ammette soluzione non nulla). Supponiamo quindi che x non sia l unico punto ammissibile, allora per ogni d tale che Ad = 0, le direzione ±d sono ammissibili e risulta A( x ± td) = b per ogni t > 0. Se per ogni d ammissibile risulta c T d = 0 allora possiamo scrivere c T ( x + td) = c T x, cioè tutte le soluzioni ammissibili hanno lo stesso valore della funzione obiettivo. Se invece esiste una d ammissibile per cui c T d 0, possiamo senza perdere di generalità supporre che sia c T d < 0 (altrimenti sarebbe sufficiente considerare la direzione d). La direzione d è di discesa e possiamo scrivere c T ( x + td) = c T x + tc T d = c T x t c T d. Al tendere di t ad di ha c T ( x + td). Nel seguito quindi faremo riferimento solo a problemi di Programmazione Lineare con vincoli di disuguaglianza e senza perdere di generalitá considereremo solo problemi del tipo min c T x Ax b (10.1) Si tratta quindi di stabilire se un problema di PL ammette soluzione e come caratterizzare la soluzione ottima. Abbiamo già dimostrato con i Teoremi e che se esiste una soluzione ottima, allora si trova sulla frontiera del poliedro. Il Teorema Fondamentale della Programmazione Lineare caratterizza in modo più completo i problemi di Programmazione Lineare. Teorema (Teorema Fondamentale della Programmazione Lineare) Sia dato un problema di PL. Allora una e una sola delle seguenti affermazioni è vera: 1. La regione ammissibile è vuota; 2. Il problema è illimitato; 3. Il problema ammette soluzioni ottime. Se il problema ammette soluzioni ottime e il poliedro che definisce la regione ammissibile ha dei vertici, allora almeno una soluzione ottima cade su un vertice. 137

140 Nella dimostrazione del teorema fondamentale della PL, faremo riferimento a problemi di PL in forma (10.1) ed useremo l ipotesi (solo semplificativa della dimostrazione) che il poliedro non contenga rette, che, in base al Teorema , ci assicura l esistenza di almeno un vertice del poliedro. Teorema (Teorema fondamentale della PL) Sia dato il problema di PL in forma (10.1). Supponiamo che il poliedro S = {x R n : Ax b} non contenga rette. Allora è vera una e una sola delle delle seguenti tre affermazioni. (a) Il problema non ammette soluzioni ammissibili (la regione ammissibile è vuota). (b) Il problema è illimitato inferiormente sulla regione ammissibile. (c) Esiste almeno una soluzione ottima e almeno una di esse è un vertice del poliedro. Dimostrazione. Ovviamente le tre affermazioni dell enunciato sono incompatibili, nel senso che se è vera una, non possono essere vere le altre due. Quindi, per dimostrare il teorema, basterà mostrare che non può succedere che non si verifichi nessuna delle tre. Mostreremo questo facendo vedere che se non sono vere né (a) né (b), allora deve essere vera la (c). Supponiamo quindi che la regione ammissibile sia non vuota e che il problema non sia illimitato inferiormente. Si tratta quindi di dimostrare che esiste un vertice v tale che c T v c T x per ogni x ammissibile. Se il poliedro contiene solo un punto v allora v è ovviamente la soluzione ottima ed è anche un vertice. Supponiamo allora che il poliedro contenga più di un punto (e quindi infiniti). La dimostrazione prosegue in due parti. Nella prima parte dimostriamo la seguente affermazione Per ogni punto x S, esiste un vertice v k tale che c T v k c T x. La seconda parte utilizza invece risultati già noti. In particolare, dal Teorema , sappiamo che i vertici del poliedro sono in numero finito; li indichiamo con v 1,... v p. Quindi tra tutti i vertici v i possiamo scegliere quello per cui il valore della funzione obiettivo è minore, che indichiamo con v. Risulta quindi c T v c T v i per ogni vertice v i e quindi in particolare possiamo scrivere anche per il vertice v k determinato nel prima parte c T v c T v k Mettendo insieme le due affermazioni in rosso, possiamo finalmente scrivere c T v c T v k c T x, per ogni x S il che prova che l affermazione (c) è vera. Dimostriamo la prima parte. Sia x una soluzione ammissibile che non sia un vertice, dimostriamo che è possibile trovare un vertice v tale che c T v c T x. La dimostrazione è costruttiva. Poiché x non è un vertice, per il Teorema , il sistema a T i d = 0, i I( x) non ha rango massimo e quindi ammette una soluzione d non nulla. Dunque, per il Corollario 7.6.5, ± d sono direzioni ammissibili e i punti x+t d con t [0, t + max] e x t d con t [0, t max] sono ammissibili. Si dimostra ora che min{t + max, t max} <, cioè che lo spostamento ammissibile lungo almeno una delle due direzioni ± d è finito. A questo scopo, scegliamo la direzione d tale c T d 0 e dunque è possibile una delle due condizioni: 138

141 (i) c T d = 0; (ii) c T d < 0. Se c T d = 0 ovviamente anche c T ( d) = 0. Poiché il poliedro non contiene rette deve risultare che almeno uno tra t + max e t max è <. Senza perdita di generalità possiamo assumere che sia t + max <. Se invece c T d < 0, la direzione d risulta dunque essere una direzione di discesa (vedi paragrafo 6.2) e per ogni t > 0 risulta c T ( x + td) = c T x + tc T d = c T x t c T d per ogni t > 0. Supponiamo che t possa. Si ottiene lim t ct ( x + td) = c T x c T d lim t =. t Poiché per ipotesi il problema non è illimitato, questo non si può verificare, dunque t e necessariamente t + max <. In entrambi i casi otteniamo che x + t d è ammissibile per 0 t t + max <. Definiamo il punto y = x + t + max d; ricordando che c T d 0 risulta c T y = c T x t + max c T d c T x. Verifichiamo quali vincoli sono attivi in y. Ricordando che per i I( x) risulta a T d i = 0, otteniamo a T i y = a T i ( x + t + d) max = a T i x = b i i I( x) Quindi I( x) I(y). Facciamo ora vedere che I( x) I(y), ovvero che in y è attivo almeno un vincolo in più rispetto ad x. Consideriamo quindi i vincoli NON attivi in x e si indichi con j max / I( x) un indice per cui: t + max = at j max x b jmax a T j max d (cioè un indice per cui è raggiunto il minimo nella formula (7.6)). Per definizione risulta che l indice j max / I( x) e a T j max d < 0. Possiamo allora scrivere: a T j max x = a T j max x + t + maxa T j max d = a T jmax x t + max a T j max d = a T j max x at j max x b jmax a T j max d a T j max d = bjmax Quindi abbiamo che I(y) I( x) {j max }, cioè in y è attivo almeno un vincolo che non era attivo in x. Osserviamo che potrebbe esistere più di un indice per cui è raggiunto il minimo nella formula (7.6). In questo caso avrei attivi in y tanti vincoli in più rispetto a x quanti sono tali indici. Abbiamo quindi dimostrato che, a partire da un qualunque punto ammissibile x che non è un vertice, possiamo determinare un nuovo punto y con valore della funzione obiettivo non superiore e con un numero di vincoli attivi linearmente indipendenti maggiore rispetto a x. Se y non è un vertice, possiamo ripetere lo stesso procedimento fino a quando non troviamo un punto in cui sono attivi n vincoli linearmente indipendenti, cioè un vertice. Quindi abbiamo dimostrato l affermazione che ci serviva: 139

142 La dimostrazione è conclusa. Per ogni punto x S, esiste un vertice v tale che c T v c T x. Illustriamo con un esempio la tecnica costruttiva utilizzata nella dimostrazione del teorema precedente. Esempio Consideriamo il problema di PL il cui poliedro è riportato in Figura min 4x 1 x 2 3x 1 2x x 1 x 2 12 x 1 0, x 2 0 x 2 v 3 v 2 v d x 3 t + max x 1 Figura 10.3: Figura relativa all Esempio Il poliedro ha tre vertici che abbiamo già calcolato nell Esempio , che indichiamo con v 1, v 2, v 3 (puntini rossi in figura). Sia x = (3, 0) un punto ammissibile (puntino blu in figura). Si verifica facilmente che x non è un vertice. Infatti I( x) = {4} (è attivo solo il vincolo x 2 0) e risulta ovviamente rango{a i i I( x)} = 1 < n = 2. Consideriamo allora il sistema omogeneo a T 4 d = 0 ovvero d 2 = 0. Quindi una qualunque direzione del tipo (d 1, 0) T con d 1 0 è ammissibile in x. Sia d = ( 1, 0) una possibile soluzione (indicata in azzurro in Figura 10.3). Risulta c T d = 4d 1 = 4 < 0 e si consideri il punto x + t d = (3, 0) T + t( 1, 0) T = (3 t, 0) T. 140

143 Calcoliamo il valore di { t + max = min, , 3 } = min{13, 9, 3} = Si osservi in Figura 10.3 che i valori 13,9,3 che compaiono dentro il min per il calcolo di t + max corrispondono rispettivamente al valore del passo t per cui il punto x + t d sfonda rispettivamente il primo, il secondo e il terzo vincolo. Il valore di t + max = 3 corrisponde al massimo valore del passo t per cui il punto rimane ammissibile. Sia allora y = x + t + max d = (0, 0) T Risulta I(y) = {3, 4} = I( x) {3}. Inoltre la riga a 3 è linearmente indipendente da a 4. Si tratta del vertice v 1. Consideriamo in questo paragrafo i problemi di PL in forma standard, ovvero del tipo: min c T x Ax = b x 0. (10.2) Nel caso di problemi di PL in forma standard, ricordando che in questo caso il poliedro ammissibile non contiene rette, possiamo enunciare il teorema fondamentale come segue: Teorema (Teorema fondamentale della PL) Sia dato il problema di PL in forma min c T x Ax = b x 0. Allora è vera una e una sola delle delle seguenti tre affermazioni. (a) Il problema non ammette soluzioni ammissibili (la regione ammissibile è vuota). (b) Il problema è illimitato inferiormente sulla regione ammissibile. (c) Esiste almeno una soluzione ottima e almeno una di esse è un vertice del poliedro Cenni sul metodo del simplesso per la Programmazione Lineare Il Metodo del Simplesso è certamente l algoritmo di ottimizzazione più famoso e più utilizzato nelle applicazioni. Proposto nel 1947 da G.B.Dantzig, ha subito, negli oltre 50 anni di vita, numerosi miglioramenti che, pur non modificando in modo sostanziale la semplice struttura logica ideata da Dantzig, ne hanno certamente migliorato l efficienza computazionale e la facilità di uso. Esistono oggi numerosi package commerciali che implementano il Metodo del Simplesso e consentono la soluzione di problemi di Programmazione Lineare con milioni di variabili. Lo scopo di questo capitolo è quello di fornire una descrizione della struttura logica del Metodo senza entrare nei dettagli implementativi delle varie operazioni elementari (inversioni di matrici sparse, gestione dei passi degeneri, etc.) delle quali il Metodo si compone. Tali questioni 141

144 sono molto rilevanti se si vuole realizzare un algoritmo efficiente e robusto ma possono essere trascurate se si vuole semplicemnete sesere in grado di interpretare l output di un qualunque software che implementa tale metodo (vedi anche il capitolo 15). Il Metodo del Simplesso si applica a problemi di Programmazione Lineare in forma standard del tipo: min c T x (10.3) Ax = b x 0 n con b 0 m. Non vi è perdita di generalità nell assumere che il problema sia in forma standard e con termini noti non negativi. L obiettivo del metodo del simplesso è quello di individuare una soluzione di base ammissibile ottima del problema (10.3) ovvero un vertice ottimo del poliedro P = {x IR n : Ax = b, x 0 n }. L idea di cercare la soluzione ottima in un vertice della regione ammissibile, invece, trova giustificazione nei risultati dei capitoli precedenti e, in particolare, nel Teorema Il Metodo del Simplesso è caratterizzato dalle seguenti operazioni principali: 1. Individuazione di una prima base ammissibile B (se esiste). 2. Verifica dell ottimalità della soluzione di base ammissibile corrente. 3. Verifica dell illimitatezza del problema. 4. Costruzione di una nuova base ammissibile. Descriveremo brevemente una implementazione del Metodo del Simplesso, detta implementazione in due fasi. In tale implementazione, la procedura che consente di verificare se il problema di PL è ammissibile e, in caso affermativo, individua la prima base ammissibile viene detta Fase I del Metodo del Simplesso. Se il problema non possiede una soluzione di base ammissibile allora il poliedro P è vuoto ed il problema è inammissibile. In tal caso la Fase I termina segnalando l inammissibilità del problema. La Fase II del Metodo del Simplesso è caratterizzata dalle operazioni (2), (3) e (4). In tale fase, a partire da una SBA, l algoritmo costruisce una sequenza di soluzioni di base ammissibili, verificando, ad ogni iterazione, l ottimalità della SBA corrente e l illimitatezza del problema. Sotto opportune condizioni, l algoritmo converge in un numero finito di iterazioni alla soluzione ottima del problema (10.3). Alla base della struttura della Fase II, ci sono le operazioni di verifica dell ottimalità di una SBA, di verifica dell illimitatezza del problema (10.3) e di costruzione di una nuova SBA. Nel seguito descriveremo solo il criterio di ottimalitá usando nel simplesso perché costitusce un informazione contenuta negli output dei software commerciali. 142

145 Soluzione di Base Ammissbile (SBA) e costi ridotti Una sottomatrice B (m m) di A si dice matrice di base di A se è non singolare. Data una matrice di base B, è sempre possibile, eventualmente riordinando le colonne, esprimere la matrice A nella forma A = (B, N) dove N è la matrice definita dalle colonne fuori base. Analogamente si possono partizionare i vettori ( ) ( ) xb cb x =, c = x N c N le variabili x B si dicono variabili di base e le variabili x N variabili fuori base. Quindi si può riscrivere il problema in forma standard come segue: min c T B x B + c T N x N Bx B + Nx N = b x B 0, x N 0 Poiché B è non singolare per ipotesi, possiamo esprimere le variabili di base x B in funzione delle variabili x N e si ottiene x B = B 1 b B 1 Nx N (10.4) e sostituendo si può scrivere: min c T B B 1 b + (c T N ct B B 1 N)x N B 1 b B 1 Nx N 0 m, x N 0 (10.5) Questo problema nelle sole variabili x N è detto problema ridotto ed è ottenuto per proiezione delle variabili x B nel sottospazio delle variabili x N. Data una base B, una soluzione del tipo x B = B 1 b, x N = 0 si dice Soluzione Ammissibile di Base (SBA) se e solo se B 1 b 0. Le SBA ed i vertici di un poliedro in forma standard sono in stretta relazione. Vale infatti il seguente teorema. Teorema [2] Dato un poliedro in forma standard, un punto x è un vertice se e solo se è una SBA. Il problema (10.5), nelle sole variabili x N, è equivalente al problema (10.3). In particolare, risulta ovvio verificare ( quanto ) segue. ˆxB Un vettore ˆx = è una soluzione ammissibile di (10.3) se e solo se il vettore ˆx ˆx N è N una soluzione ammissibile di (10.5) e ˆx B = B 1 b B 1 N ˆx N. Inoltre, il valore della funzione obiettivo del problema (10.3) calcolata in ˆx è uguale al valore ( della) funzione obiettivo del B problema ridotto calcolata in ˆx N. Di conseguenza, se x = 1 b è la soluzione di base 0 n m ammissibile associata alla matrice B, abbiamo che x N = 0 n m è la soluzione corrispondente del problema ridotto e che c T B 1 b è il valore della funzione obiettivo per entrambi i problemi. I coefficienti di x N nella funzione obiettivo del problema ridotto sono le componenti del vettore γ definito da: γ T = c T N c T BB 1 N 143

146 che è detto vettore dei coefficienti ridotti. Le considerazioni appena svolte ci consentono di formulare un criterio sufficiente di ottimalità per una soluzione di base ammissibile. ( ) B Teorema (Criterio di Ottimalità) Sia x = 1 b, una soluzione di base ammissibile per il problema (10.3). Se il vettore dei coefficienti ridotti è non negativo, ovvero 0 n m se: c T N c T BB 1 N 0 T n m, ( ) B allora la soluzione di base ammissibile x = 1 b è ottima per il problema (10.3). 0 n m Dimostrazione. Dobbiamo dimostrare che, se il vettore dei coefficienti ridotti è non negativo, risulta c T x c T x per una qualunque soluzione ammissibile x. Calcoliamo c T x = c T B x B + c T N x N = c T B x B = c ( T B B 1 b. ) Una qualunque soluzione ammissibile x del problema (10.3) può essere suddivisa in xb. Allora risulta che c x T x = c T B x B + c T N x N e ricordando l espressione (10.4) di x B N c T x = c T BB 1 b + γ T x N D altra parte, per ipotesi γ 0 e x è ammissibile e quindi, in particolare, x N 0, quindi si ha: c T x c T BB 1 b = c T x. Ma la precedente relazione mostra che la soluzione di base ammissibile x associata alla matrice di base B è ottima per il problema (10.3). Esercizio Sia dato il problema di PL in forma standard min x 1 + 3x 2 + x 3 x 1 + 5x 2 + 2x 3 = 6 Le soluzioni di Base ammissibili (SBA) sono 1. x 1 = x 2 = 0 (non ammissibile) 2. x 1 = x 3 = 0 (non ammissibile) 3. x 1 = x 4 = 0 (non ammissibile) 4. x 2 = x 3 = 0, x 1 = 6, x 4 = 10 (SBA) 5. x 2 = x 4 = 0, x 1 = 1, x 3 = 5 2 (SBA) 2x 1 + x 2 x 4 = 2 x 1 0, x 2 0, x 3 0 x

147 6. x 3 = x 4 = 0, x 1 = 4 9 x 2 = 10 9 (SBA). 6 ( ) ( ) 0 x1 6 Consideriamo la SBA ; le variabili di base x 0 B = =, le variabili fuori x 4 10 ( ) 10 ( ) x2 1 0 base x N = = 0; la matrice di base B =. I coefficienti di costo ridotto x ( ) 1 0 γ T = c T N ct B B 1 N richiede il calcolo dell inversa B 1 =. Dunque sostituendo si 2 1 ottiene ( ) ( ) γ T = ( 3 1 ) ( 1 0 ) = ( 2 1 ) 0, dunque non è possibile concludere nulla sulla ottimlità della soluzione. 145

148 Capitolo 11 Condizioni di ottimo per la PL e teoria della dualità In questo capitolo utilizzeremo le condizioni di KKT del capitolo 9 per derivare le condizioni necessarie e sufficienti di ottimo per la programmazione lineare Le condizioni di ottimalità nella Programmazione Lineare Nel caso in cui la funzione obiettivo sia lineare ovvero del tipo f(x) = c T x, i problemi (P-POL), (P-ST), (P-GEN) analizzati nel paragrafo 7.7 sono problemi di Programmazione Lineare. Poiché si tratta di problemi convessi le condizioni di KKT sono necessarie e sufficienti. Consideriamo inizialmente il problema di PL min c T x Ax b (P L) La funzione Lagrangiana si scrive e le condizioni di KKT sono le seguenti. L(x, λ) = c T x + λ T (b Ax) = b T λ + (c T λ T A)x Teorema (Condizioni di KKT per il problema (PL)) Un punto x è minimo globale del problema di Programmazione Lineare (PL) se e solo se esiste λ IR m tale che valgano le condizioni: (i) Ax b, (ii) c = A T λ, (iii) λ 0, 145

149 (iv) λ T (b Ax ) = 0. Osserviamo che la (i) é una condizione nelle sole variabili x, le (ii) e (iii) sono condizioni nei soli moltiplicatori λ. Possiamo fare qualche ulteriore considerazione. Le condizioni (ii) e (iii) esprimono il fatto che λ IR m deve essere ammissibile rispetto ai vincoli lineari A T λ = c λ 0 (11.1) Il sistema (11.1) rappresenta un poliedro in forma standard nello spazio IR m. Consideriamo allora un x IR n soluzione ammissibile del problema (PL), e un λ IR m appartenente al poliedro definito da (11.1), ovvero una coppia (x, λ) che soddisfa Ax b, λ 0, A T λ = c. (11.2) Osservando che λ T (b Ax) = m i=1 λ i(b i a T i x) 0, possiamo facilmente scrivere c T x (λ 0, b Ax) c T x + λ T (b Ax) = b T λ + (c T λ T A)x (A T λ=c) = b T λ. Per ogni coppia (x, λ) che soddisfa Ax b, λ 0, A T λ = c risulta c T x b T λ. Si tratta di un risultato molto significativo, che riprenderemo più avanti. Notiamo che, in particolare, poiché il minimo globale x del problema (PL) è ammissibile, otteniamo immediatamente che vale c T x b T λ (11.3) per ogni λ che soddisfa (11.1). Possiamo quindi affermare che una qualunque soluzione λ IR m che soddisfa (11.1) consente di determinare una limitazione inferiore al valore ottimo del problema (PL). Per migliorare la limitazione inferiore espressa dalle disuguaglianza (11.3), si può rendere quanto più possibile grande il termine di destra b T λ della disuguaglianza (11.3), cioè si può massimizzare la quantità b T λ al variare del vettore λ IR m, tra tutti i vettori che soddisfano A T λ = c, λ 0. Piú formalmente si può cercare la soluzione del problema max b T λ A T λ = c λ 0 (11.4) Si tratta di un problema di PL in forma standard (è sufficiente cambiare verso all ottimizzazione da max a min). La coppia di problemi di Programmazione Lineare (PL) e (PL-ST) viene detta primale-duale. 146

150 (Problema primale e duale) Il problema e il problema min max c T x Ax b b T λ A T λ = c λ 0 costituiscono una coppia primale-duale di Programmazione Lineare. (11.5) (11.6) Vedremo nel seguito che, in maniera simmetrica, il problema (11.5) risulterà il problema duale del problema (11.6). La coppia primale (P) - duale (D) costituita dai problemi (11.5) e (11.6) è solo una possibile coppia primale-duale. La relazione tra i valori delle funzioni obiettivo del problema primale e duale in un qualunque punto ammissibile primale-duale che abbiamo ricavato in relazione alla coppia primale-duale (11.5) e (11.6) puó essere generalizzato ad una qualunque coppia primale-duale (P)-(D) e costituisce un risultato noto come Teorema della dualità debole. Teorema (Teorema della Dualità debole) Sia data una coppia primale (P) - duale (D) di problemi di programmazione lineare. Per ogni soluzione ammissibile x del problema di PL primale (P) ed ogni soluzione ammissibile λ del problema di PL duale (D) si ha b T λ ct x cioè il valore della funzione obiettivo duale in λ è minore o uguale del valore della fuzione obiettivo primale in x. Osserviamo ora che la condizione di complementaritá (iv) del Teorema può essere scritta in modo equivalente utilizzando la condizione (ii). In particolare possiamo scrivere (ricordando che (A T λ ) T = λ T A) 0 (iv) = λ T (b Ax ) = λ T b λ T Ax (ii) = λ T b x T c. Possiamo quindi scrivere le condizioni necessarie e sufficienti di KKT in una forma equivalente e più diffusamente utilizzata come condizioni di ottimo per la Programmazione Lineare. 147

151 (Condizioni necessarie e sufficienti di ottimo per (PL)) Un punto x è minimo globale del problema di Programmazione Lineare min c T x Ax b (P L) se e solo se esiste λ IR m tale che valgano le condizioni: (i) Ax b, (ii) c = A T λ, (iii) λ 0, (iv) b T λ = c T x. É possibile dimostrare che il valore de i moltiplicatori λ del teorema sono la soluzione ottima del problema (11.4). In effetti le condizioni necessarie e sufficienti di minimo globale per (11.6) sono le stesse condizioni per il problema (11.5). Questa affermazione costituisce il teorema della Dualità forte per la PL. Teorema (Teorema della Dualità forte) Il problema di PL (11.5) ammette minimo x IR n se e solo se il problema duale (11.6) ammette minimo λ IR m e risulta c T x = b T λ. Dimostrazione. La dimostrazione consiste nel far vedere che le condizioni di ottimo del problema primale coincidono con le condizioni di ottimo per il problema duale. Per quanto riguarda il problema primale (11.5) abbiamo già dimostrato che le condizioni di ottimo richiedono che esista un moltiplicatore λ IR m tale che (i) Ax b, (ii) c = A T λ, (iii) λ 0, (iv) b T λ = c T x. Dimostriamo ora che queste condizioni sono effettivamente anche condizioni necessarie e sufficienti di ottimo per il problema duale (11.4). Si utilizza il teorema Osserviamo che il problema duale (11.4) è in forma di massimizzazione e che è definito nello spazio IR m. Associamo agli n vincoli di uguaglianza A T λ = c i moltiplicatori z IR n e ai vincoli λ 0 i moltiplicatori v IR m. La funzione Lagrangiana è dunque L(λ, z, v) = b T λ + z T (A T λ c) v T λ. Per il teorema λ è minimo globale del problema (11.4) se e solo se esistono dei vettori z IR n e v IR m tali che (a) A T λ = c, λ 0, (b) b + Az v = 0, 148

152 (c) v 0, (d) v T λ = 0. La condizione (a) fornisce immediatamente le (i) e (ii). Dalla condizione (b) si può ricavare v e si ottiene b + Az = v. Imponendo la (c) v 0 si ottiene Sostituendo in (d) si ha poi b + Az 0 0 = v T λ = ( b + Az ) T λ = b T λ + z T A T λ = b T λ + z T c Identificando z = x si hanno dunque anche la (iii) e (iv). Possiamo quindi concludere che le condizioni necessarie e sufficienti di ottimo per i problemi di Programmazione Lineare (11.5) e (11.6) sono le stesse e richiedono l ammissibilità primale e duale e l uguaglianza dei valori delle funzioni obiettivo. È evidente la forte relazione che esiste tra i due problemi di Programmazione Lineare (11.5) e (11.6) e dunque le condizioni di ottimalità sono spesso riportate in riferimento alla coppia primale duale (PL) e (PL-ST). Condizioni di Ottimalità Siano dati x IR n e λ IR m. Allora x e λ sono soluzioni ottime rispettivamente per la coppia (P L) min c T x Ax b max b T λ A T λ = c λ 0 (P L ST ) se e solo se valgono le seguenti condizioni (i) A x b, (ammissibilità primale) (ii) A T λ = c, λ 0 (ammissibilità duale); (iii) c T x = b T λ (coincidenza dei valori delle funzioni obiettivo). La costruzione del problema duale a partire da un qualsiasi problema di PL è rimandata nel prossimo paragrafo. Il teorema della dualità debole e il teorema della dualità forte che abbiamo ricavato per la coppia primale-duale (PL) e (PL-ST) possono essere generalizzati ad una qualunque coppia primale-duale (P)-(D) e costituiscono i risultati fondamentali della teoria della dualità. Teorema (Teorema della Dualità Forte) Sia data una coppia primale (P) - duale (D) di problemi di programmazione lineare. Il problema primale (P) ammette una soluzione ottima x se e solo se il problema duale (D) ammette una soluzione ottima λ. Inoltre i valori delle funzioni obiettivo dei due problemi all ottimo sono uguali cioè risulta c T x = b T λ. 149

153 Ricordando inoltre che x è un minimo del problema (PL), e quindi risulta c T x c T x per ogni x tale che Ax b, possiamo affermare: (Limitazione superiore ed inferiore per il valore ottimo del problema (PL)) Sia x un minimo globale del problema di Programmazione Lineare (PL). Per ogni ( x, λ) che soddisfa Ax b, λ 0, A T λ = c, risulta b T λ c T x c T x. Analogamente per il problema in forma standard possiamo dare una limitazione inferiore e superiore al valore ottimo b T λ. Infatti, presa una qualunque coppia (x, λ) che soddisfa (11.2), si può scrivere b T λ (A T λ=c) = b T λ + x T (c A T λ) = c T x + λ T (b Ax) (λ 0, b Ax) c T x. Possiamo allora affermare: (Limitazione superiore ed inferiore per il valore ottimo del problema (PL-ST)) Sia λ un minimo globale del problema di Programmazione Lineare (PL-ST). Per ogni ( x, λ) che soddisfano (11.2), si ha b T λ b T λ c T x. Dal teorema si ottiene il seguente corollario. Corollario Se x è una soluzione ammissibile del problema primale (P) e λ una soluzione ammissibile del problema duale (D) tali che c T x = b T λ (11.7) allora x e λ sono soluzioni ottime rispettivamente per il problema primale (P) e per il problema duale (D). Utilizzando il teorema della dualità debole possiamo anche derivare delle condizioni di illimitatezza di un problema di PL. Vale in particolare questo risultato. Teorema (Condizione di illimitatezza del primale) Se il problema primale (P) è illimitato (inferiormente) allora il problema duale (D) è inammissibile. Viceversa se il problema duale (D) è illimitato (superiormente) allora il problema primale (P) è inammissibile. Dim.: Supponiamo che (P) sia illimitato e che, per assurdo, il problema duale (D) sia ammissibile, cioè che esista una soluzione ammissibile λ del problema duale (D). Allora, per il Teorema (Teorema della Dualità debole), risulta c T x b T λ per ogni soluzione ammissibile x del problema primale (P). Ma questo contraddice l ipotesi che (P) sia illimitato inferiormente. Analogamente si pu procedere con il viceversa. 150

154 Il Teorema Fondamentale della PL (cfr. Teorema ) afferma che per un problema di PL possiamo verificarsi solo tre possibili casi: il problema ammette soluzione ottima, oppure è illimitato oppure è inammissibile. Sulla base dei risultati fino ad ora esaminati si evince che data un coppia primale duale di problemi di Programmazione Lineare possono verificarsi solo le possibilità riportate schematicamente nella tabella che segue. DUALE ottimo finito illimitato inammissibile superior. ottimo finito SI NO NO PRIMALE illimitato inferior. NO NO SI inammissibile NO SI SI 11.2 Costruzione del duale di un problema di PL La coppia di problemi primale-duale definita nel paragrafo precedente è solo una delle possibile coppie primali-duali di problemi di Programmazione Lineare. Dato un qualunqur problema di PL, utilizzando le condizioni di ottimalità è possibile costruire il problema duale corrispondente. È però possibile definire delle regole di costruzione automatica che consente di scrivere il problema duale in forma rapida utilizzando alcuni accorgimenti. Si consideri un problema Programmazione Lineare scritto nella forma più generale cioè min c T 1 y + c T 2 z Cy + Dz = h Ey + F z g y 0 (11.8) in cui le variabili sono (y, z) T IR n suddivise in y IR n 1 e z IR n 2 con n = n 1 + n 2. Corrispondentemente abbiamo c 1 IR n1, c 2 IR n2. Le variabili y 0 mentre le variabili z non sono vincolate in segno. Le matrici C, D, E, F sono rispettivamente di dimensione: C matrice p n 1, D matrice p n 2, E matrice q n 1, F matrice q n 2. Dunque il problema ha p vincoli di uguaglianza espressi da Cy + Dz = h con h IR p e q vincoli di disuguaglianza Ey + F z g con g IR q. La notazione in cui è scritto questo generico problema di Programmazione Lineare (11.8) è tale da evidenziare separatamente gli elementi che intervengono nella formulazione: le variabili 151

155 sono partizionate nella variabili y vincolate in segno e z non vincolate in segno e corrispondentemente anche i coefficienti di costo della funzione obiettivo sono partizionati in c 1 e c 2 ; i vincoli sono scritti suddividendo quelli di uguaglianza (=) e quelli di disuguaglianza ( 0). Osservazione importante Nella definzione di regole per la costruzione del problema duale di un generico problema di PL è essenziale mettere il problema nella forma indicata, con particolare attenzione al verso dell ottimizzazione, cioè min o max, e al verso dei vincoli di disuguaglianza che corripondentemente devono essere nella forma o. Per costruire il problema duale del problema (11.8) è sufficiente riportarsi alla forma del problema (PL) con soli vincoli di disuguaglianza. A tale scopo riscriviamo il problema (11.8) nella forma equivalente min c T 1 y + c T 2 z Cy + Dz h Cy Dz h Ey + F z g y 0 ovvero in forma matriciale ( ) T ( ) c1 z min c 2 y C D ( ) h C D y h, E F z g I n1 0 0 dove I n1 è la matrice identità di ordine n 1. Quindi il problema (11.8) è stato ricondotto nella forma (PL) in cui C D h C D h A = b = c = E F g I n1 0 0 Siamo quindi in grado di scrivere il duale di questo problema nella forma (PL-ST) ( c1 c 2 ) max b T λ A T λ = c λ 0 in cui A T = ( C C E In1 D D F 0 e il vettore delle variabili duali si puó decomporre in λ = (u, v, w, t) T IR m = IR 2p+q+n 1. Il problema duale si scrive in forma matriciale ) 152

156 Sviluppando si ottiene max h T u h v g w 0 t ( C C E In1 D D F 0 u, v, w, t 0. ) u v w t = ( c1 c 2 ) max h T u h T v + g T w C T u C T v + E T w + I n1 t = c 1 D T u D T v + F T w = c 2 u 0, v 0, w 0, t 0 che è equivalente a max h T (u v) + g T w C T (u v) + E T w + t = c 1 D T (u v) + F T w = c 2 u 0, v 0, w 0, t 0. Effettuando il cambio di variabili u v = µ si ottiene il seguente problema max h T µ + g T w C T µ + E T w + t = c 1 D T µ + F T w = c 2 w 0, z 0. Eliminando la variabile t utilizzando il primo vincolo t = d C T µ E T w possiamo ancora scrivere max h T µ + g T w C T µ + E T w c 1 D T µ + F T w = c 2 w 0 nelle variabili (µ, w) IR q IR p, con µ non vincolata in segno e w 0. Il problema (11.9) è il problema duale del problema (11.8) che viene detto problema primale. Osservazione importante (11.9) Le variabili (x, y) sono dette variabili primali e corrispondono ai moltiplicatori dei vincoli lineari di tipo generale del problema duale. Le variabili (µ, w) sono dette variabili duali e corrispondono ai moltiplicatori dei vincoli lineari di tipo generale del problema primale. I due problemi costituiscono la generica coppia coppia primale duale. (P ) min c T 1 y + c T 2 z Cz + Dy = h Ez + F y g y 0 max h T µ + g T w C T µ + E T w c 1 D T µ + F T w = c 2 w 0. Dall osservazione dei due problemi si deducono facilmente le proprietà fondamentali di una coppia primale duale; innanzitutto un problema è di minimizzazione mentre l altro è di massimizzazione. Inoltre poiché la matrice dei coefficienti dei vincoli di un problema si ottiene (D) 153

157 trasponendo quella dell altro, si ha che ad ogni variabile di un problema corrisponde un vincolo nell altro. Si osserva inoltre uno scambio tra i termini noti di un problema e i coefficienti della funzione obiettivo dell altro. Queste proprietà possono essere così schematicamente riassunte: il problema duale di un problema di minimizzazione è un problema di massimizzazione e simmetricamente, il problema duale di un problema di massimizzazione è un problema di minimizzazione; ad ogni vincolo di uguaglianza del problema primale è associata una variabile nel problema duale non vincolata in segno; ad ogni vincolo di disuguaglianza (di maggiore o uguale) del problema primale è associata una variabile nel problema duale vincolata in segno; ad ogni variabile vincolata in segno del problema primale è associato un vincolo di disuguaglianza ( se il problema è di massimizzazione, se il problema è di minimizzazione) del problema duale; ad ogni variabile non vincolata in segno del problema primale è associato un vincolo di uguaglianza del problema duale. Queste corrispondenze possono essere riassunte nella tabella che segue dove gli insieme I, J, M e N sono insiemi di indici: PRIMALE min c T x DUALE max b T u VINCOLI = b i, i I u i, i I, libere b i, i J u i, i J, u i 0 VARIABILI VARIABILI x j 0, j M c j, j M x j, j N libere = c j, j N VINCOLI Esempio Si consideri il seguente problema di Programmazione Lineare max 4x 1 + 3x 2 + 2x 3 x 1 + 2x 2 + 3x 3 8 2x 1 x 3 7 3x 1 + 4x 2 x 3 5 x 2 + x 3 6 x

158 Il problema duale è il seguente problema di minimizzazione min 8u 1 + 7u 2 + 5u 3 + 6u 4 u 1 + 2u 2 + 3u 3 = 4 2u 1 + 4u 3 + u 4 3 3u 1 u 2 u 3 u 4 = 2 u 1 0, u 2 0, u 3 0, u 4 0. Esempio Si consideri il seguente problema di Programmazione Lineare min 2x 1 3x 2 + x 3 3x 1 + x 2 + 5x 3 7 x 1 + x 2 6x 3 9 4x 1 x 2 2x 3 = 8 x 1 0, x 2 0. Dopo aver riscritto il secondo vincolo come x 1 x 2 + 6x 3 9 si può formulare facilmente il problema duale associato max 7u 1 9u 2 + 8u 3 3u 1 u 2 + 4u 3 2 u 1 u 2 u 3 3v5u 1 + 6u 2 2u 3 = 1 u 1 0, u 2 0. Esempio Si consideri il problema di Programmazione Lineare min x 1 + 3x 2 x 1 + 4x x 1 + x 2 25 x 1 0, x 2 0 Geometricamente si ricava facilmente che questo problema ammette soluzione ottima nel punto (x 1, x 2 ) = (4, 5) e il valore ottimo della funzione obiettivo è pari a 19. Se si considera il problema duale max 24u u 2 u 1 + 5u 2 1 4u 1 + u 2 3 u 1 0, u 2 0; si ricava facilmente (geometricamente) che, in accordo con quanto previsto dal Teorema ( della 14 Dualità Forte, anche questo problema ammette soluzione ottima nel punto (u 1, u 2 ) = 19, 1 ) 19 e il valore ottimo della funzione obiettivo vale

159 Esempio Si consideri il problema di Programmazione Lineare max 2x 1 + 3x 2 2x 1 + x x 1 + x 2 6 x 1 0, x 2 0. Geometricamente si ricava che il problema è illimitato superiormente. Quindi, per l analisi teorica vista deve risultare che il suo duale è inammissibile. E infatti se si considera il problema duale associato min 3u 1 + 6u 2 2u u 2 2 u 1 + u 2 3 u 1 0, u 2 0 si vede facilmente che questo problema non ammette soluzioni ammissibili Il problema di Kanpsack continuo Utilizzando la teoria della dualità, determiniamo la soluzione ottima e il valore ottimo della funzione obiettivo del seguente problema di Knapsack continuo (non limitato). max c T x a T x b, x 0 in cui x, a, c sono vettori di IR n, c i > 0 e 0 < a i < b per i = 1,..., n. Il problema duale ha una sola variabile y IR ed è min by a i y c i, y 0 i = 1,..., n La soluzione di questo problema è banale. Indichiamo con { } c k ci = max a k 1 i n e sia I k = { i : a i c i = c } k l insieme degli indici per cui si raggiunge il massimo. Un vettore y a i a k è ammissibile duale se e solo se soddisfa y c k a k. Poiché si tratta di un problema di minimizzazione, la soluzione ottima duale è y = c k a k > 0. La soluzione ottima x deve soddisfare le condizioni di complementarità: x i (a iy c i ) = 0 y (b a T x ) = 0 i = 1,..., n 156

160 Per ogni i / I k, si ha, dalla prima delle equazioni precedenti, x i = 0. Inoltre, dalla seconda, si ha a T x = b. Evidenziando le variabili in I k si ottiene a i x i = b. i I k Se I k = {k}, allora la soluzione ottima è unica e vale x k = b, a k = 0, per ogni i k. x i Altrimenti (se I k 2) la soluzione del problema di knapsack non è unica; ogni soluzione che soddisfa il vincolo i I k a i x i = b è ottima. Ad esempio, ogni soluzione del tipo è ottima. x j = b a j, x i per un j I k = 0, per ogni i j Sia dato il seguente problema di Knapsack continuo (limitato). max c T x a T x b, 0 x 1 in cui x, a, c sono vettori di IR n, c i > 0 e 0 < a i < b per i = 1,..., n e si assuma che c 1 a 1 > c 2 a 2 >... > c n a n. Utilizzando la teoria della dualità, determinare la soluzione ottima e il valore ottimo della funzione obiettivo. Soluzione. Analogamente all esercizio precedente scriviamo il problema duale di che ha n + 1 variabili, y IR e z IR n, max c T x (λ) a T x b, (z i ) x 1 x 0 min by + e T z a i y + z i c i, i = 1,..., n y 0, z i 0 i = 1,..., n Nelle ipotesi poste il problema primale è non vuoto e limitato. Esiste quindi una soluzione ottima primale x e una soluzione ottima duale y, z che soddisfano le condizioni di complementarità: x i (a iy + zi c i) = 0 i = 1,..., n y (b a T x ) = 0 zi (1 x i ) = 0 157

161 Mostriamo innnanzitutto che, nelle ipotesi poste, esiste un solo k {1,..., n} tale che x k (0, 1) (per cui cioè x k è frazionaria). Infatti sia x k (0, 1), per le condizioni di complementarità risulta z k = 0 e a ky c k = 0, cioè y = c k. Se esistesse un altro indice h {1,..., n} tale che x h (0, 1), questo implicherebbe a k c k = c h, che è assurdo perchè abbiamo supposto che i rapporti peso-ingombro fossero ordinati a k a h in modo strettamente decrescente. 1 Sia quindi x k (0, 1). Allora y = c k 0 e quindi dalle a k condizioni di complementarità deve risultare a T x = b. Partizioniamo gli indici {1,..., n} \ {k} in due insiemi I 1 = {i : x i = 1} e I 0 = {i : x i = 0}. Allora possiamo scrivere i I 1 a i x i + i I 0 a i x i + a kx k = b, da cui si ottiene x k = b i I 1 a i a k. Possiamo ora dimostrare che risulta x i = 1 per i < k e x i = 0 per i > k. L indice k viene chiamato indice critico proprio perchè rappresenta l oggetto (attività, progetto o simili) il cui inserimento determina la violazione della capacità b. Dimostriamo quindi che I 1 = {1,..., k 1} I 0 = {k + 1,..., n}. Sia x i = 1, allora per le condizioni di complementarità risulta z i = c i a i y, ma zi 0 per l ammissibilità duale e quindi otteniamo y = c k c i che, nelle ipotesi di ordinamento dei a k a i coefficienti, vale solo se i < k. D altra parte, se x i = 0 risulta z i = 0 e per l ammissibilità duale a i y c i 0, cioè y = c k c i che vale solo se i > k. a k a i Analisi di sensitività alla variazione dei dati Nei modelli reali le variabili (primali) possono rappresentare, ad esempio, livelli di produzione e i coefficienti di costo possono essere associati ai profitti ricavati dalla vendita dei prodotti. Quindi la funzione obiettivo di un problema primale indica direttamente come un aumento della produzione può influenzare il profitto. Sempre in relazione, ad esempio, ad un modello per la pianificazione della produzione, i vincoli di un problema (primale) possono rappresentare una limitazione dovuta alla limitata disponibilità delle risorse; ora, un aumento della disponibilità delle risorse può consentire un aumento della produzione e quindi anche del profitto, ma questa relazione tra aumento della disponibilità delle risorse e aumento del profitto non si deduce facilmente dal problema formulato (il problema primale). Uno dei possibili usi della dualità è quello di rendere esplicito l effetto dei cambiamenti nei vincoli (ad esempio in quelli di disponibilità di risorse) sul valore della funzione obiettivo. L analisi della sensitività si occupa proprio di stabilire come si modifica la soluzione ottima di un modello lineare in conseguenza di variazioni dei dati. Un ruolo fondamentale in questa analisi è giocato dai cosidetti prezzi ombra, che, misurano i costi impliciti associati ai vincoli. Come vedremo, i prezzi ombra sono nient altro che le variabili duali. 1 Questa ipotesi serve solo per semplificare la trattazione del problema. Nel caso di ordinamento non crescente c 1 > c 2 >... > c n si può procedere come nell esercizio precedente (vedi anche??). a 1 a 2 a n 158

162 u 2 x 2 k=15 S D k=0 S P x 1 u 1 k=15 k=0 Figura 11.1: Soluzione grafica della coppia primale duale Interpretazione geometrica della variazione dei dati sui problemi primale duale Consideriamo la seguente coppia di problemi primale-duale di programmazione lineare: (P ) max 2x 1 + 6x 2 x 1 + 2x 2 5 x 1 + x 2 4 x 1, x 2 0 min 5u 1 + 4u 2 u 1 + u 2 2 2u 1 + u 2 6 u 1, u 2 0 Supponiamo che il problema primale rappresenti un semplice problema di produzione in cui x 1, x 2 rappresentano livelli di attività produttiva e in vincoli corrispondano a due risorse limitate. La soluzione grafica dei problemi (P) e (D) è riportata in Figura Il problema primale ha unica soluzione x = (0, 5/2) T, il duale ammette l unica soluzione ottima u = (3, 0) T. Si osserva geometricamente (ed è ovvio anche dal valore delle variabili duali u ) che in x è attivo un solo vincolo del problema primale, il primo. Questo significa che il livello di produzione ottima corrisponde ad utilizzare completamente la prima risorsa (x 1 + 2x 2 = 5), mentre la seconda risorsa è in eccesso (x 1 + x 2 = 2, 5 < 4). Inoltre il livello di produzione ottima pone x 1 = 0 che significa che il prodotto rappresentato da x 1 non è prodotto. Ci si possono porre allora due diverse domande (D) 159

163 1. conviene acquisire una quantità maggiore di risorsa relativa al primo vincolo? Quanta e a quale prezzo? 2. quando diventa conveniente produrre anche il prodotto x 1? Possiamo rispondere a queste domande facendo delle analisi di tipo geometrico sul problema primale e duale. Cambiamenti nei termini noti dei vincoli. Acquisire una quantità maggiore di risorsa relativa al primo vincolo significa incrementare il r.h.s del vincolo da 5 a 5 + δ con δ 0. Da un punto di vista analitico i due problemi (P) e (D) diventano (P ) δ x 1 + 2x δ x 1 + x 2 4 max 2x 1 + 6x 2 x 1, x 2 0 min (5 + δ)u 1 + 4u 2 u 1 + u 2 2 2u 1 + u 2 6 u 1, u 2 0 (D) δ Geometricamente un aumento di δ del r.h.s. del primo vincolo, corrisponde a spostare il vincolo verso l alto. La situazione è rappresentata geometricamente in Figura 11.2, in rosso le variazioni. È evidente che la soluzione ottima si sposta nel punto x 5+δ δ = (0, 2 )T di valore c T δ x δ = 6 (5+δ) 2 = c T x + 3δ. L aumento nella funzione obiettivo è quindi pari a 3δ. Il massimo valore che può assumere δ corrisponde al valore per cui il vincolo x 1 + 2x δ passa per il punto (0, 4) T, ovvero δ = 3. Per δ > 3, il primo vincolo non gioca più alcun ruolo nella definizione della regione ammissibile e la risorsa che diventa vincolante è la seconda. Nel problema duale, un variazione di δ corrisponde ad una variazione del coefficiente angolare della funzione obiettivo. La regione ammissibile del problema duale è rimasta invariata. Il valore δ = 3 corrisponde alla funzione obiettivo 8u 1 + 4u 2 rappresentata in rosso in Figura 11.2 per valore = 0. Le curve di livello di questa funzione sono parallele al secondo vincolo del problema duale. La soluzione ottima del problema duale (D) δ rimane la soluzione u = (3, 0) T per δ 3. Poiché la soluzione ottima u δ = u il valore c T δ u δ = (5 + δ)3 = 5u 1 + δu 1. La variazione del valore ottimo è 3δ pari a quanto determinato nel caso primale. Il valore 3 = u 1 rappresenta anche quanto sono disposto a pagare al massimo un unità in più di tale risorsa. Per valori di δ > 3, la soluzione ottima del problema duale cambia e diventa il punto (0, 6) T di valore 24 indipendente dal valore di δ. Possiamo riassumere le considerazioni fatte fin qui nella seguente affermazione L aumento della prima risorsa (r.h.s. primo vincolo) di un valore δ produce un aumento della funzione obiettivo pari a u 1δ = 3δ purché δ 3. Il valore ottimo della variabile duale u 1 rappresenta il massimo costo affrontabile per l aumento di una unità di risorsa. Il valore u 1 = 3 è detto prezzo ombra relativo alla prima risorsa (al primo vincolo). L intervallo 0 δ 3 è l intervallo entro cui la previsione sulla variazione della funzione obiettivo è valida. (In realtà si può prevedere anche un decremento δ). 160

164 u 2 x 2 δ max δ max S D (5+δ)/2 S P k=15+3δ =5+δ =5 x 1 u 1 Figura 11.2: Soluzione grafica della coppia primale duale al variare di δ Interpretazione economica della dualità e prezzi ombra Come visto nell esempio, in generale, le variabili duali (i prezzi ombra) rappresentano l effetto di cambiamenti nel termine noto dei vincoli. Si consideri, infatti un generico problema di Programmazione Lineare (in forma standard) (P), il suo duale (D) ed inoltre si consideri il problema (P ) ottenuto modificando il termine noto da b a b+ (con = (δ 1..., δ m ) T IR m ) e il corrispondente problema duale (D ): (P) min c T x Ax = b x 0 (D) { max b T u A T u c (P ) min c T x Ax = b + x 0 (D ) { max(b + ) T u A T u c Siano x e u rispettivamente la soluzione ottima del problema (P) e del problema (D). Siano inoltre x ( ) e u ( ) rispettivamente la soluzione del problema (P ) e del problema (D ) Dalle formulazioni di questi problemi si possono facilmente dedurre due osservazioni: 161

165 la variazione del termine noto b nel problema primale si riflette in un cambiamento dei coefficienti della funzione obiettivo del problema duale; la regione ammissibile del problema (D) e del problema (D ) sono uguali; da questo segue che se u IR m è soluzione ottima del problema (D) allora u è ammissibile per il problema (D ), ma non necessariamente è ottima per (D ). Inoltre per il Teorema della dualità forte applicato alla coppia primale duale (P) (D) deve essere c T x = b T u, (11.10) mentre, sempre per il Teorema della dualità forte ma applicato alla coppia primale duale (P ) (D ) deve essere c T x ( ) = (b + ) T u ( ). (11.11) Se la soluzione ottima x soddisfa un opportuna ipotesi (cioè che in x non ci siano più di n vincoli attivi) e se il vettore ha componenti sufficientemente piccole allora si può dimostrare che: u ( ) = u. (11.12) Utilizzando la (11.10), la (11.11) e la (11.12) si ha: c T x ( ) = (b + ) T u ( ) = b T u + T u = c T x + T u, (11.13) che può essere riscritta nella seguente forma: c T x ( ) c T x = δ 1 u 1 + δ 2 u δ m u m, (11.14) dove = (δ 1,..., δ m ) T. Dalla precedente relazione segue che una possibile interpretazione della variabile duale u i è quella di essere un prezzo associato ad un incremento unitario del termine noto b i. Per questa ragione le variabili duali u i, i = 1,..., m, vengono denominate prezzi ombra. Il prezzo ombra di un vincolo rappresenta la variazione del valore della funzione obiettivo quando il r.h.s. del vincolo è aumentato di una unità, mentre tutti gli altri dati del problema sono fissati. Sebbene la (11.12) (e di conseguenza la (11.14)) valga solamente sotto opportune ipotesi, in molte situazioni pratiche, le variabili duali u i, i = 1,..., m, forniscono delle utili indicazioni su quale componente b i variare per migliorare il valore ottimo della funzione obiettivo. Ricordiamo i principi generali che regolano l uso dei prezzi ombra. 1. I prezzi ombra sono tanti quanti i vincoli lineari generali (esclusi i vincoli di non negatività sulle variabili). 2. l unità di misura dei prezzi ombra è espressa in (unità di misura funzione obiettivo)/(unità misura vincolo). 3. I prezzi ombra corrispondono al valore delle variabili duali (all ottimo), ovvero ai moltiplicatori di KKT relativi alla soluzione ottima primale. 162

166 11.4 Interpretazione della Dualità Se un problema di Programmazione Lineare proviene da una precisa classe di problemi applicativi e dunque ha una struttura bene definita, il suo corrispondente duale si può prestare ad essere interpretato come problema applicativo diverso ma collegato al problema primale Il duale del problema di allocazione ottima di risorse Si consideri nuovamente il semplice problema di allocazione ottima dell Esempio che è rappresentato dal seguente problema di Programazione Lineare: max (7x x 2 ) x 1 + x x 1 + 2x x x 1 0, x 2 0. (11.15) Ricordiamo che le variabili x 1 e x 2 sono associate rispettivamente ai quantitativi di colorante C1 e C2 da produrre e che la produzione avviene utilizzando tre preparati base P1, P2 e P3 dei quali si ha una disponibilità massima rispettivamente pari a 750, 1000 e 400 ettogrammi. Supponiamo, ora di voler sottrarre preparati base dalla produzione dei coloranti per venderli direttamente. Indichiamo con u 1, u 2 e u 3 i prezzi associati rispettivamente alla vendita diretta di un ettogrammo di preparato base P1, P2 e P3. Supponendo di destinare tutti i preparati alla vendita diretta, il profitto che si otterrebbe sarebbe 750u u u 3. (11.16) Naturalmente si vorrà fare in modo che questa operazione di sottrazione dei preparati base dalla produzione dei coloranti e vendita diretta risulti economicamente conveniente e quindi mentre si vuole minimizzare l espressione (11.16) affinché i prezzi di vendita risultino competitivi sul mercato, si imporrà che il profitto ottenuto vendendo direttamente i quantitativi di preparato base necessario per ottenere un litro di colorante sia maggiore o uguale del profitto associato alla vendita di un litro di colorante stesso; quindi, utilizzando i dati del problema riportati nella tabella dell Esempio 2.4.1, si deve imporre che risulti per quanto riguarda il colorante C1 e u 1 + u 2 7 u 1 + 2u 2 + u 3 10 per quanto riguarda il colorante C2 e naturalmente deve essere u 1 0, u 2 0 e u 3 0. Quindi il modello lineare che rappresenta l operazione sopra descritta è il seguente: min (750u u u 3 ) u 1 + u 2 7 u 1 + 2u 2 + u 3 10 u 1 0, u 2 0, u 3 0. Esaminando questo problema si vede immediatamente che esso rappresenta il problema duale del problema dato (11.15). 163

167 In generale, se si considera un generico problema di allocazione ottima di m risorse R i, i = 1,..., m con la possibilità di fabbricare n prodotti P j, j = 1,..., n, come abbiamo già esaminato nel capitolo precedente si può formulare questo problema come max c T x Ax b x 0 (11.17) dove ricordiamo x IR n è il vettore avente per componenti i livelli di produzione di ciascuno dei prodotti, c IR n il vettore dei profitti netti e b IR m il vettore delle disponibilità massima di ciascuna delle risorse. Supponiamo ora di voler sottrarre risorse alla produzione per venderle direttamente e siano u i, i = 1,..., m i prezzi unitari associati alla vendita dell i-esima risorsa. Supponendo che per ciascuna risorsa si voglia destinare alla vendita una quantità pari alla disponibilità massima di quella risorsa, si ottiene un profitto pari a b 1 u 1 + b 2 u b m u m. Per rendere competitivi sul mercato i prezzi unitari u i da assegnare alle risorse vendute direttamente, si vogliono scegliere i valori piú bassi possibile per le u i, ma naturalmente, affinché questa operazione di vendita diretta in luogo della fabbricazione dei prodotti risulti conveniente si deve imporre che il profitto ottenuto vendendo direttamente le risorse necessarie per fabbricare un prodotto sia maggiore o uguale al profitto che si ricaverebbe dalla vendita del prodotto finito. Quindi per ogni prodotto, si deve imporre che valga a 11 u a m1 u m c 1 a 12 u a m2 u m c a 1n u a mn u m c n con u i 0, i = 1,..., m e dove le quantità a ij rappresentano la quantità di risorsa R i necessaria per fabbricare una unità di prodotto P j. Quindi il problema da risolvere può essere scritto nella forma min b T u A T u c u 0 che è il problema duale del problema (11.17) Il duale del problema di miscelazione. Si consideri il problema di miscelazione dell Esempio che è rappresentato dal seguente problema di Programmazione Lineare: min 400x x 2 140x x x x x 2 75 x 1 0, x

168 Ricordiamo che le variabili x 1 e x 2 rappresentano le quantità di polpa di frutta e di dolcificante da utilizzare nella produzione del succo di frutta che deve avere come requisito un contenuto minimo di 70 mg di vitamina C, 30 mg di sali minerali e 75 grammi di zucchero. Supponiamo ora che un industria farmaceutica venda compresse di nutrimenti puri, cioè compresse di vitamina C, di sali minerali e di zucchero e che vuole immettere queste compresse su un ipotetico mercato come offerta sostitutiva al succo di frutta per l acquisizione di vitamina C, di sali minerali e di zucchero. Naturalmente questa industria farmaceutica vuole massimizzare il profitto ricavato dalla vendita delle compresse, ma al tempo stesso deve dare un prezzo alle compresse tale da essere competitiva. Siano allora u 1, u 2 e u 3 i prezzi di vendita rispettivamente di 1 mg di vitamina C, di 1 mg di sali minerali e di 1 grammo di zucchero; supponendo che la vendita di questi nutrimenti puri sia pari ai fabbisogni minimi (cioè a 70 mg di vitamina C, a 30 mg di sali minerali e a 75 grammi di zucchero), l espressione del profitto dell industria farmaceutica che dovrà essere massimizzata è 70u u u 3. Affinché i prezzi di vendita dei componenti puri in compresse fissati dall industria siano concorrenziali, si deve imporre che il costo unitario dei nutrimenti puri sia minore o uguale al prezzo che si dovrebbe pagare per avere la stessa quantità di componente attraverso gli ingredienti del succo di frutta, cioè dalla polpa di frutta e dal dolcificante. Quindi si devono imporre i seguenti vincoli Inoltre dovrà essere u 1 0, u 2 0, u u u u u u Quindi il problema complessivo formulato dall industria farmaceutica è max 70u u u 3 140u u u u u u 1 0, u 2 0, u 3 0 che è il problema duale del problema di miscelazione considerato. In generale, consideriamo un generico problema di miscelazione in cui si hanno n sostanze S j, j = i,..., n ciascuna delle quali contiene una quantità a ij di componente utile C i, i = 1,..., m. Come abbiamo già esaminato nel capitolo precedente un problema di miscelazione di questo tipo si può formulare come min c T x Ax b (11.18) x 0 dove ricordiamo che x IR n è il vettore avente per componenti le quantità di ciascuna sostanza da introdurre nella miscela, c IR n il vettore dei costi unitari delle sostanze, b IR m il vettore dei requisiti minimi di componenti utili da introdurre nella miscela, e A IR m n la matrice i cui elementi sono le a ij. Supponiamo ora che un industria sia in grado di fornire componenti utili allo stato puro e che voglia immettere sul mercato questi componenti utili e siano u i, i = 1,..., m i prezzi unitari da assegnare a ciascuno di essi. Supponendo che la richiesta del mercato sia pari ai fabbisogni 165

169 minimi della miscela, cioè per ciascun componente pari a b i, il profitto totale dell industria che vende i componenti utili allo stato puro è b 1 u 1 + b 2 u b m u m. Inoltre, affinché i prezzi u i assegnati dall industria ai componenti puri siano concorrenziali, si deve imporre che il costo dei componenti puri sia minore o uguale al prezzo che dovrebbe pagare per avere la stessa quantità di componente ottenuto attraverso le sostanze e quindi deve valere m a ij u i c j, j = 1,..., n. i=1 Inoltre si deve imporre u i 0, i = 1,..., m. Quindi il problema formulato si può scrivere nella forma max b T u A T u c u 0 che è immediato verificare essere il problema duale del problema di miscelazione assegnato (11.18) Il duale del problema dei trasporti Si consideri un problema di trasporto che è rappresentato dal seguente problema di Programmazione Lineare: min(250x x x y y y 3 ) x 1 + x 2 + x 3 = 50 y 1 + y 2 + y 3 = 55 x 1 + y 1 = 30 x 2 + y 2 = 40 x 3 + y 3 = 35 x 1 0, x 2 0, x 3 0, y 1 0, y 2 0, y 3 0. dove x 1, x 2, x 3 rappresentano rispettivamente quantità di acqua da trasportare dal primo stabilimento a tre impianti e y 1, y 2, y 3 rappresentano rispettivamente la quantità di acqua da trasportare dal secondo stabilimento a tre impianti. Ricordiamo inoltre che la disponibilità giornaliera di acqua presso i due stabilimenti è rispettivamente di 50 e 55 ettolitri di acqua, mentre le richieste giornaliere di acqua presso i tre impianti sono rispettivamente di 30, 40 e 35 ettolitri. Supponiamo ora che una compagnia specializzata in trasporto di acqua (esterna all industria) voglia proporsi all industria di acque minerali per effettuare il trasporto dell acqua dagli stabilimenti agli impianti. Naturalmente la compagnia di trasporti, per convincere l industria di acque minerali ad avvalersi del servizio di trasporto esterno, dovrà proporre dei prezzi di trasporto vantaggiosi. A tale scopo la compagnia dei trasporti propone all industria di prelevare un ettolitro di acqua da ciascuno dei due stabilimenti per un prezzo unitario (in migliaia 166

170 di lire) rispettivamente pari a u 1 e u 2 e di consegnare un ettolitro di acqua a ciascuno dei tre impianti per un prezzo unitario (in migliaia di lire) rispettivamente pari a v 1, v 2 e v 3. Quindi la compagnia dei trasporti vorrà massimizzare la funzione che fornisce il suo profitto complessivo che è data da 50u u v v v 3. Tuttavia affinché l offerta della compagnia dei trasporti risulti vantaggiosa per l industria delle acque minerali i prezzi del trasporto proposti dovranno risultare non superiori a quelli che l industria avrebbe effettuando in proprio i trasporti stessi. Quindi dovrà risultare u 1 + v u 1 + v u 1 + v 3 85 u 2 + v u 2 + v 2 80 u 2 + v Quindi, la compagnia dei trasporti dovrà risolvere il problema max (50u u v v v 3 ) u 1 +v u 1 +v u 1 +v 3 85 u 2 +v u 2 +v 2 80 u 2 +v che si verifica immediatamente essere il problema duale del problema dei trasporti assegnato. In generale, consideriamo ora un generico problema dei trasporti già esaminato nel capitolo precedente. Supponiamo che un azienda voglia provvedere in proprio ad effettuare il trasporto di materiali e che quindi cerchi di risolvere il problema dei trasporti m n min c ij x ij i=1 j=1 n x ij = a i j=1 m x ij = b j i=1 i = 1,..., m j = 1,..., n x ij 0 i = 1,..., n; j = 1,..., m (11.19) dove, ricordiamo, che le c ij rappresentano il costo del trasporto dall origine i alla destinazione j, le a i le disponibilità all i-esima origine e le b j le richieste alla j-esima destinazione. Supponiamo, ora che una compagnia che esegue trasporti voglia proporsi a questa azienda, come alternativa vantaggiosa all effettuazione dei trasporti in proprio; a tale scopo questa compagnia propone all azienda di prelevare un unità di prodotto dall origine i per un prezzo unitario 167

171 u i e di consegnare una unità di prodotto alla destinazione j per un prezzo unitario v j. Per assicurare che i suoi prezzi siano competitivi rispetto a quelli che l azienda avrebbe effettuando i trasporti in proprio, la compagnia di trasporti deve fare sì che risulti u i + v j c ij per ogni i = 1,..., m e j = 1,..., n. D altra parte la compagnia di trasporti vuole scegliere i prezzi da proporre u 1,..., u m e v 1,..., v n in modo da massimizzare il suo profitto complessivo. Poiché le quantità a i e b j di prodotto rispettivamente disponibili all origine i e richieste alla destinazione j sono note alla compagnia di trasporti, questa cercherà di massimizzare la funzione m n max a i u i + b j v j. i=1 Quindi il problema che la compagnia di trasporti formula per determinare quali prezzi u i e v j proporre all azienda è il seguente j=1 m n max a i u i + b j v j i=1 j=1 u i + v j c ij i = 1,..., m, j = 1,..., n che è il problema duale del problema dei trasporti (11.19). (11.20) 168

172 Capitolo 12 Programmazione Lineare Intera La Programmazione Lineare Intera (PLI) tratta il problema della minimizzazione (massimizzazione) di una funzione lineare di più variabili, soggetta a vincoli di uguaglianza e disuguaglianza lineari ed alla restrizione che una o più variabili possano assumere soltanto valori interi. Si tratta dunque di problemi del tipo (PLI pura) min c T x Ax b x Z n ; o in cui solo alcune della variabili sono vincolate ad assumere valore intero (PLI mista): min c T x Ax b x 1 Z n 1, x 2 R n 2 ; con x = (x 1 x 2 ) e n 1 + n 2 = n. Grazie alla generalità del modello, un grandissimo numero di problemi reali possono essere rappresentati da modelli di Programmazione Intera. In generale, i modelli di Programmazione Lineare Intera sono adatti alle applicazioni caratterizzate dall indivisibilità delle risorse e dalla necessità di scegliere tra un numero finito di alternative. Queste applicazioni includono problemi operativi quali la distribuzione di beni ed il sequenziamento delle attività produttive; problemi di pianificazione quali la gestione ottima del portafoglio titoli e la localizzazione degli impianti ed infine problemi di progettazione quali il progetto di circuiti VLSI ed il progetto di sistemi automatici di produzione (robotica). Un problema di Ottimizzazione Combinatoria è un particolare problema di PLI in cui le variabili sono vincolate ad assumere solo valori {0, 1}. Nelle ipotesi che la regione ammissibile di PLI sia costituita da un insieme finito di punti, in linea di principio potrebbe essere sempre possibile risolvere il problema di PLI calcolando il valore della funzione obiettivo in ogni punto ammissibile e scegliendo quello che la minimizza. Definiremo questo metodo Enumerazione Totale. Se la cardinalità dell insieme ammissibile di PLI è piccola allore l enumerazione totale non solo è possibile, ma è certamente il modo migliore di risolvere un problema di PLI. Se, viceversa, la cardinalità dell insieme delle soluzioni ammissibili è molto grande, l enumerazione totale diviene non proponibile (vedi anche l esempio dovuto a Dantzig descritto nel paragrafo 1.2). 167

173 Osserviamo che se abbiamo un problema di PLI con dieci variabili e supponiamo che ognuna di queste variabili possa assumere dieci valori diversi, il numero di possibili punti ammissibili è di 10 10, cioè 10 miliardi. Questo semplice esempio mostra che l enumerazione totale è raramente utile nei casi pratici, dove spesso il numero di variabili intere è dell ordine delle centinaia se non delle migliaia. Le questioni teoriche poste da tali problemi e le tecniche usate per la loro soluzione hanno caratteristiche molto diverse da quelle relative ai problemi di ottimizzazione continua studiati nei precedenti capitoli. In generale la PLI è da un punto di vista algortimo più difficile della PL anche nel caso binario. Lo scopo di questo capitolo è quindi quello di dare alcune indicazioni sulle peculiarietà dei problemi di Programmazione Lineare Intera (PLI) e studiare una classe di algoritmi per la loro risoluzione Formulazioni Classiche di Problemi Lineari Interi In questo paragrafo vengono presentati esempi classici di problemi che possono essere formulati come problemi di PLI. Il primo uso delle variabili intere (binarie) che esamineremo è anche il più naturale. Si supponga di dover modellare il fatto che un dato evento possa verificarsi oppure no. La natura binaria del problema suggerisce immediatamente l idea di modellare questa dicotomia per mezzo di una variabile x che puó assumere solo valori 0, 1. In particolare, si porrà x = 1 se l evento si verifica e x = 0 altrimenti. Successivamente vedremo come le variabili intere e le disequazioni che le collegano possano essere usate come linguaggio formale per esprimere una serie di relazioni tra eventi Knapsack (zaino) binario Supponiamo di avere n progetti. Il j-esimo progetto, j = 1,..., n, ha un costo pari a a j ed un valore pari a c j. Ciascun progetto scelto deve essere realizzato completamente e non è accettata una realizzazione parziale del progetto. Infine esiste un budget b disponibile per la realizzazione dei progetti. Il problema di scegliere un sottoinsieme dei progetti allo scopo di massimizzare la somma dei valori senza superare il limite imposto dal budget è il cosiddetto problema di knapsack binario. Variabili. Per ogni progetto i = 1,..., n introduciamo le seguenti variabili binarie { 1 se il progetto i è selezionato x i = 0 altrimenti. Il vincolo sul budget (spazio) è dunque n j=1 a jx j b e il problema di scrive max n c j x j j=1 n a j x j b j=1 x j {0, 1} j = 1,..., n. 168

174 In questo caso l evento è costituito dalla effettuazione (o meno) del singolo progetto. In generale, questi problemi di scelta tra progetti possono avere più vincoli (si pensi al caso in cui il budget sia mensile e si voglia pianificare per più di un mese); in tal caso il problema viene detto di knapsack multidimensionale. Un esempio di problema di knapsack è l esempio di Capital Budgeting nel Capitolo Assegnamento Un generico problema di assegnamento consiste nel determinare il modo ottimale di assegnare lavori a persone o, più in generale, di assegnare mezzi (persone, macchine, etc. ) ad attività. Supponiamo che n persone P 1,...,P n, debbano svolgere n lavori L 1,..., L n ; ciascun lavoro deve essere svolto esattamente da una persona e ciascuna persona deve svolgere un lavoro. Naturalmente le persone hanno diversi livelli di esperienza, competenza ed abilità e quindi si può introdurre un costo dell assegnamento della persona i al lavoro j; indichiamo tale costo con c ij e supponiamo che sia noto. Questo costo può, ad esempio, essere interpretato come tempo medio impiegato dalla persona i ad eseguire il lavoro j. Il problema è quello di assegnare i lavori alle persone minimizzando il costo totale di realizzazione di tutti i lavori. Questo tipo di problemi sorge in molte situazioni pratiche: esempi tipici sono i problemi di assegnamento del personale all interno di una azienda e i problemi di assegnare determinati mezzi di trasporto ad alcune particolari linee. Esaminiamo, ora una formulazione. Formulazione. Variabili. Per ogni lavoro i e per ogni persona j, (i, j = 1,..., n) introduciamo le seguenti variabili binarie { 1 se la persona i è assegnata al lavoro j x ij = 0 altrimenti. Si tratta di n 2 variabili: L 1 L j L n P 1 x 11 x 1j x 1n.... P i x i1 x ij x in P n x n1 x nj x nn Funzione obiettivo. La funzione obiettivo da minimizzare sarà data dal costo totale cioè da n n c ij x ij. i=1 j=1 Naturalmente, se le c ij anziché essere dei costi fossero i valori utili ricavati dall assegnamento della persona i al lavoro j, allora la funzione obiettivo andrebbe massimizzata. Vincoli. (Vincoli di assegnamento.) Poiché esattamente una persona deve essere assegnata al lavoro j, allora si avranno i seguenti n vincoli n x ij = 1 j = 1,..., n. i=1 169

175 Inoltre, poiché ciascuna persona deve essere assegnata ad una sola attività, si avranno altri n vincoli n x ij = 1 i = 1,..., n. j=1 La formulazione completa sarà, quindi, data da n n min c ij x ij i=1 j=1 n x ij = 1 i=1 n x ij = 1 j=1 x ij {0, 1}, i, j = 1,..., n. Osservazione Nel seguito di questo capitolo si vedrá che in effetti il problema di assegnamento può essere formulato rimuovendo il vincolo di interezza, cioé equivalentemente come un problema di PL. Il vincolo x ij {0, 1} corrisponde a 0 x ij 1 con x ij intero; rimuovere il vincolo di interezza corrisponde dunque al problema: n n min c ij x ij i=1 j=1 n x ij = 1 i=1 n x ij = 1 j=1 0 x ij 1, i, j = 1,..., n. Esempio In un Dipartimento universitario, sono attivati cinque corsi diversi che possono essere tenuti da cinque professori. Ogni professore esprime delle preferenze sul corso che vorrebbe tenere, indicando un punteggio. A preferenza più alta corrisponde un punteggio più alto. I punteggi sono riportati nella seguente tabella: corso1 corso2 corso3 corso4 corso5 insegnante insegnante insegnante insegnante insegnante Si vuole assegnare ciascun professore ad un corso cercando di massimizzare il valore medio inteso come media delle preferenze. Formulazione Variabili. Le variabili di decisione sono le variabili booleane: 170

176 { 1 se l insegnante i è assegnata al corso j x ij = i, j = 1,..., 5. 0 altrimenti. Funzione obiettivo. Indicando con c ij il punteggio assegnato dall insegnante i alla corso j, la funzione obiettivo è il valore medio delle preferenze: Vincoli. I vincoli di assegnamento sono: i=1 j=1 5 c ij x ij. x 11 + x 12 + x 13 + x 14 + x 15 = 1 x 21 + x 22 + x 23 + x 24 + x 25 = 1 x 31 + x 32 + x 33 + x 34 + x 35 = 1 x 41 + x 42 + x 43 + x 44 + x 45 = 1 x 51 + x 52 + x 53 + x 54 + x 55 = 1 x 11 + x 21 + x 31 + x 41 + x 51 = 1 x 12 + x 22 + x 32 + x 42 + x 52 = 1 x 13 + x 23 + x 33 + x 43 + x 53 = 1 x 14 + x 24 + x 34 + x 44 + x 54 = 1 x 15 + x 25 + x 35 + x 45 + x 55 = 1 Quindi, complessivamente il problema si scrive: 5 5 min c ij x ij i=1 j=1 x 11 + x 12 + x 13 + x 14 + x 15 = 1 x 21 + x 22 + x 23 + x 24 + x 25 = 1 x 31 + x 32 + x 33 + x 34 + x 35 = 1 x 41 + x 42 + x 43 + x 44 + x 45 = 1 x 51 + x 52 + x 53 + x 54 + x 55 = 1 x 11 + x 21 + x 31 + x 41 + x 51 = 1 x 12 + x 22 + x 32 + x 42 + x 52 = 1 x 13 + x 23 + x 33 + x 43 + x 53 = 1 x 14 + x 24 + x 34 + x 44 + x 54 = 1 x 15 + x 25 + x 35 + x 45 + x 55 = 1 0 x ij 1 e x ij intero i, j 12.2 Uso di variabili booleane per modellare condizioni logiche Problema del costo fisso. Nei modelli di Programmazione Lineare le variabili di decisione rappresentano usualmente i livelli ai quali le varie attività vengono svolte e la funzione obiettivo da minimizzare è una 171

177 funzione lineare di tali variabili. In molti problemi pratici, tuttavia, tale ipotesi non è giustificata in quanto il costo di una attività, in funzione del livello cui essa viene svolta, può avere un andamento come quello riportato in Figura costo coeff. ang. c f x : livello dell'attività Figura 12.1: Costo dell attività j. In particolare, il costo dell attività j è zero se x j = 0 (cioè se l attività non è avviata) ed è invece uguale a f j + c j x j se x j > 0 con f j positivo. La funzione relativa all attivitá j è quindi { 0 se xj = 0 z j (x) = f j + c j x j se x j > 0 Il valore f j è detto costo fisso dell attività j e deve essere pagato solamente se l attività j viene svolta ad un livello non nullo. Per esempio, supponiamo che la variabile x j rappresenti la quantità di petrolio greggio che deve essere trasportata da un pozzo A ad una raffineria B. In questo caso, se il pozzo A non rifornisce la raffineria B il costo complessivo di trasporto è ovviamente nullo. Se, al contrario, si decide di inviare una quantità non nulla x j di greggio da A a B, al costo di trasporto c j x j (proporzionale alla quantità trasferita) dovrà essere sommato il costo fisso di costruzione dell oleodotto f j. Se indichiamo che J f le attività che prevedono un costo fisso, la funzione obiettivo può essere genericamente scritta come z(x) = c j x j + z j (x). j / J f j J f Chiaramente la funzione z(x) è discontinua nell origine e quindi non è lineare. È formulazione linearizzare la funzione obiettivo introducendo, per ciascuna attività, una variabile y j che valga 1 quando x j > 0 e 0 quando x j = 0, cioè { 0 se xj = 0 y j = 1 altrimenti In questo modo la funzione obiettivo può essere scritta z(x) = n c j x j + j=1 j J f y j f j = c T x + f T y, 172

178 dove y {0, 1} J f è il vettore le cui componente sono y j e z(x) è una funzione lineare. Il problema ha peró delle variabili binarie. Si deve inoltre imporre un vincolo che consenta di modellare la condizioni logiche x j > 0 y j = 1 x j = 0 y j = 0 Osserviamo infatti che in assenza di tale vincolo e nell ipotesi che f j 0, nella soluzine ottima il valore di y j sarebbe = 0 trattandosi di un problema di minimizzazione. Dunque la condizione x j = 0 y j = 0 non necessita di essere imposta. Se supponiamo di conoscere un limite superiore per la variabile x j, cioè un valore α positivo maggiore del più grande valore che può assumere la x j, il vincolo x j αy j 0 forza la variabile y j ad assumere valore 1 se x j > 0 1. Infatti se x j > 0, il vincolo impone αy j x j > 0 e dunque y j > 0 (cioé y j = 1). Il problema di costo fisso di PLI può essere quindi formulato, assumendo che tutti i costi fissi f j siano positivi, nel modo seguente: (F C2) min z(x) = c T x + f T y Ax = b x j αy j, x 0 n y j {0, 1}, j J f j J f dove α è un numero positivo maggiore del più grande valore che può essere assunto da ciascuna delle variabili x j in una soluzione ottima. Se x j > 0 la variabile y j sarà forzata ad assumere il valore 1 ed il suo costo fisso si aggiungerà al valore della funzione obiettivo. Esempio In una centrale elettrica sono a disposizione tre generatori e ogni giorno si deve decidere quali usare di giorno e quali di notte per assicurare una produzione di almeno 4000 megawatts di giorno e di almeno 2800 megawatts di notte. L uso di un generatore comporta la presenza di personale tecnico che sorvegli il suo funzionamento; tale personale viene retribuito in maniera diversa tra il giorno e la notte e a seconda del tipo di generatore; tali costi di attivazione sono riportati nella tabella che segue (in migliaia di lire) insieme al costo per ogni megawatt prodotta e alla massima capacità di produzione in megawatts per ogni singolo periodo (giorno/notte). Costo attivazione Costo per Capacità giorno notte megawatt max Generatore A Generatore B Generatore C Osserviamo che la condizione x j > 0 y j = 1 è equivalente a y j = 0 x j = 0. Inoltre, volendo modellare la condizione y j = 1 x j = 0, si puó imporre il vincolo x j α(y j 1)

179 Formulare un modello di PLI che permetta di rappresentare il problema in analisi. Formulazione. È un problema di costo fisso e può essere formulato in termini di Programmazione Lineare Intera come appena descritto in generale. Per brevità di notazione, chiameremo 1 o periodo il giorno e 2 o periodo la notte. Variabili. Indichiamo con x Ai, x Bi e x Ci, i = 1, 2, i megawatts generati rispettivamente dai generatori A, B e C nel periodo i. Inoltre, per ottenere una formulazione lineare, è necessario introdurre sei variabili 0 1, δ Ai, δ Bi e δ Ci, i = 1, 2, definite come segue : δ Ai = { 1 se il generatore A è attivato nell i-esimo periodo 0 se nell i-esimo periodo il generatore A non è attivato i = 1, 2. Analoga è la definizione per le altre variabili δ Bi e δ Ci, i = 1, 2. Funzione obiettivo. La funzione obiettivo da minimizzare può esser scritta 3x A1 + 3x A2 + 5x B1 + 5x B2 + 6x C1 + 6x C δ A δ A δ B δ B δ C δ C2. Vincoli. Si devono considerare i vincoli sulla richiesta cioè x A1 + x B1 + x C x A2 + x B2 + x C Inoltre, per quanto esposto nel caso generale si devono considerare i vincoli x Ai 2000δ Ai 0 i = 1, 2 x Bi 1700δ Bi 0 i = 1, 2 x Ci 2500δ Ci 0 i = 1, 2. Quindi la formulazione complessiva può essere scritta ( min 3x A1 + 3x A2 + 5x B1 + 5x B2 + 6x C1 + 6x C2 + ) +750δ A δ A δ B δ B δ C δ C2 x A1 + x B1 + x C x A2 + x B2 + x C x A1 2000δ A1 0 x B1 1700δ B1 0 x C1 2500δ C1 0 x A2 2000δ A2 0 x B2 1700δ B2 0 x C2 2500δ C2 0 x Ai 0, x Bi 0, x Ci 0, i = 1, 2 δ Ai {0, 1}, δ Bi {0, 1}, δ Ci {0, 1} i = 1,

180 Variabili indicatrici Un altro classico uso di variabili 0 1, consiste nell indicare le relazioni di dipendenza tra alcune grandezze di un problema; tali variabili binarie vengono dette variabili indicatrici. Supponiamo di conoscere un limite superiore per la variabile x, cioè un valore M positivo maggiore del più grande valore che può assumere la x; allora introducendo il vincolo x Mδ 0 (12.1) la variabile δ {0, 1} è forzata ad assumere valore 1 se x > 0; abbiamo, quindi, modellato la condizione logica x > 0 δ = 1 (12.2) e quindi anche la condizione equivalente δ = 0 x = 0; ma la (12.1) non implica il viceversa della (12.2) cioè δ = 1 x > 0; infatti dalla (12.1) si ha che se δ = 1 allora 0 x M, che è sempre verificato. Tuttavia, in alcuni casi, può essere necessario imporre la condizione δ = 1 x > 0 (12.3) (che è equivalente a x = 0 δ = 0). La condizione logica (12.3) non si può facilmente rappresentare con un vincolo; Supponiamo, ad esempio, che in un problema di miscelazione una variabile x rappresenti la quantità di un ingrediente da includere nella miscela e quindi si ha x 0; si può usare una variabile indicatrice δ {0, 1} per distinguere tra il caso in cui x = 0 e x > 0. La condizione logica (12.3) afferma che se δ = 1 allora l ingrediente rappresentato da x deve apparire nella miscela, ma non fornisce nessuna indicazione sulla quantità dell ingrediente. In realtà è più verosimile imporre una condizione logica del tipo δ = 1 x m > 0 (12.4) cioè se δ = 1 allora la variabile x assume un valore almeno pari ad m. La (12.4) è rappresentabile dal vincolo x mδ 0. (12.5) Riepilogando possiamo considerare il seguente schema: se x è una variabile non negativa e δ {0, 1} ed inoltre x < M e m > 0, allora x Mδ 0 x mδ 0 implica implica { x > 0 δ = 1 δ = 0 x = 0 { δ = 1 x m x = 0 δ = 0. Analizziamo, ora, un esempio di miscelazione in cui applichiamo quanto appena esposto. Esempio Sia data la seguente tavola di valori nutrizionali che riporta il tipo di alimento, il costo unitario, le unità di sostanze (proteine, carboidrati, grassi, vitamine, calcio) per unità di alimento 175

181 costo prot. carb. grassi vitam. calcio Formulare un problema di PLI che permetta di trovare una dieta di costo minimo sapendo che si devono assumere almeno 3 unità di proteine, 10 unità di carboidrati, 2 unità di grasso, 3 unità di vitamine e 2 unità di calcio e sapendo che se è presente l alimento 1 la dieta non può contenere l alimento 5. Formulazione. È un classico problema di miscelazione; le quantità di alimenti presenti nella dieta si suppongono frazionabili. A causa della presenza di una condizione logica, è necessario utilizzare, in aggiunta alle variabili del problema, una variabile 0 1 per modellarla cioè per esprimere con un vincolo il legame tra la presenza nella dieta dell alimento 1 e dell alimento 5. Variabili di decisione. Introduciamo come variabili del problema le unità di alimenti presenti nella dieta, x i con i = 1,..., 5. Inoltre, introduciamo la variabile booleana δ {0, 1}. Vincoli. Si hanno i seguenti vincoli: Vincoli di qualità: la dieta deve contenere alcuni valori minimi di sostanze nutrizionali; dalla tabella si ottiene che deve essere x 2 + 5x 3 + 2x 4 3 7x 1 + 2x 4 + 3x 5 10 x 1 + 3x 2 + 4x 3 + x 4 2 x 1 + x 2 + 3x 4 + 2x 5 3 4x 2 + x 3 + x 5 2 Vincolo logico: se nella dieta è presente l alimento 1 allora non deve esserci l alimento 5. Vogliamo quindi definire dei vincoli che consentano di esprimere le seguenti condizioni logiche x 1 > 0 δ = 1 δ = 1 x 5 = 0 Secondo quanto descritto, ciò può essere modellato introducendo i vincoli x 1 Mδ 0 x 5 M(1 δ) 0 dove M è un numero positivo maggiore del più grande valore che possono assumere le variabili. 176

182 Vincoli di non negatività: Si tratta di quantità di alimenti, e quindi deve essere x i 0 i = 1,..., 5. Funzione obiettivo. È il costo da minimizzare ed è data da 0.15x x x x x 5. Complessivamente la formulazione di PLI per questo problema può essere scritta min (0.15x x x x x 5 ) x 2 + 5x 3 + 2x 4 3 7x 1 + 2x 4 + 3x 5 10 x 1 + 3x 2 + 4x 3 + x 4 2 x 1 + x 2 + 3x 4 + 2x 5 3 4x 2 + x 3 + x 5 2 x 1 Mδ 0 x 5 M(1 δ) 0 x i 0 i = 1,..., 5 δ {0, 1} Il problema del commesso viaggiatore Siano assegnate n città che un commesso viaggiatore deve visitare in una settimana e la matrice D di dimensioni n n delle distanze fra tutte le coppie di città. Più precisamente gli elementi della matrice D sono definiti nel seguente modo. D(i, j) 0 indica la distanza della città i dalla città j, D(i, i) = 0 per tutti gli i, D(i, j) = D(j, i) per tutte le coppie (i, j). Il commesso viaggiatore, partendo dalla città in cui abita (sia per esempio la città 1), vuole effettuare tutte le visite e ritornare alla fine alla città di partenza, percorrendo una strada di lunghezza complessiva minima. Introducendo le variabili binarie x ij con il seguente significato. x ij = 1 se la città j viene visitata subito dopo la città i, x ij = 0 se la città j non viene visitata subito dopo la città i, e indicando con π l insieme di tutte le possibili partizioni (R, S) dell insieme di città (ossia tali che: RUS = {insieme di tutte le città}, R, S, R S = ), è possibile formulare il 177

183 problema come programmazione a numeri interi: min n n [D(i, j)x ij ] i=1 j=1 n x ij = 1 per j = 1, 2,..., n i=1 n x ij = 1 per i = 1, 2,..., n j=1 x ij 1 per (R, S) π i R,j S x {0, 1} n n. Il primo insieme di vincoli garantisce che in ogni città il commesso viaggiatore provenga da una sola altra città. Il secondo insieme di vincoli garantisce che dopo ogni città il commesso viaggiatore prosegua per una sola altra città. Il terzo insieme di vincoli garantisce che la soluzione fornita dal modello sia formata da un unico percorso che attraversa tutte le città e non da una serie disgiunta di percorsi che visitano sottoinsiemi diversi di città. Se non fosse per il terzo insieme di vincoli, il problema sarebbe uguale a quello dell assegnamento visto sopra. Il terzo insieme di vincoli complica il problema, facendo sì che non sia risolubile con la programmazione lineare. In effetti si tratta di uno dei piu difficili problemi combinatori con cui si ha normalmente a che fare e la sua soluzione richiede tipicamente algoritmi complessi e notevole dispendio di tempo di calcolo. Si noti che il terzo insieme di vincoli ha cardinalità esponenziale rispetto al numero di città da visitare. Si tratta infatti di 2 n 2 vincoli (in effetti esiste una formulazione più sofisticata che permette di scrivere il problema con solo n 2 vincoli aggiuntivi introducendo n variabili aggiuntive non binarie) Relazioni tra PL e PLI IN questo paragrafo, senza perdere di generalitá, faremo riferimento a problemi di PLI pura cioè del tipo: zi = min c T x Ax b (P LI) x intera Indichiamo con S I = {x Z n : Ax b} la regione ammissibile del problema PLI e con x I S I la soluzione ottima, cioè c T x I = z I. Si chiama rilassamento lineare o rilassamento continuo il problema di PL ottenuto da PLI eliminando il vincolo di interezza: z = min c T x Ax b (P L) Indichiamo con S il poliedro nello spazio continuo S = {x R n : Ax b} e con x S la soluzione ottima del rilassamento, cioè c T x = z. La regione di un Problema di PLI è ovviamente contenuta in quella del suo rilassamento PL (che è ottenuto, lo ripetiamo, eliminando un vincolo da PLI) ovvero S I S. Di conseguenza il 178

184 valore ottimo di PL è sicuramente non peggiore (migliore o al piú uguale) di quello di PLI cioé (trattandosi di minimizzazione) z z I, ovvero la soluzione del rilassamento lineare costituisce un limite inferiore al valore ottimo della soluzione ottima intera In generale dati due insiemi S S risulta min f(x) min f(x). x S x S Per chiarire ulteriormente quanto detto facciamo un semplice esempio informale. Supponiamo di voler trovare lo studente più giovane di una facoltá. Si tratta di trovare lo studente ( punto ammissibile ) che minimizza la funzione obiettivo che associa ad ogni studente la sua età. Consideriamo poi il problema di trovare lo studente più giovane di tutta l università. Ovviamente l insieme ammissibile di questo nuovo problema è più ampio di quello del problema precedente, comprendendo tutti gli studenti di tutte le facoltà ( problema rilassato ). Se noi risolviamo il problema rilassato il valore ottimo che troviamo (età dello studente più giovane di tutta l università) è ovviamente minore o tutt al più uguale al valore ottimo del problema di trovare lo studente più giovane della facoltà che ci interessa. Se poi risulta che lo studente più giovane di tutta l università è proprio uno studente della facoltà d interesse, allora è ovvio che questo studente è anche la soluzione ottima del problema originario, è cioè lo studente più giovane della facoltà che ci interessa. Dunque se la soluzione ottima del prblema di PL x S è intera, significa che x S I e dunque si tratta anche della soluzione ottima del problema di PLI. Se la soluzione ottima del rilassamento lineare x S è intera allora questa è anche la soluzione ottima del problema di PLI, cioè x = x I. Se, invece, anche una sola delle componenti di x S non è intera x non è ammissibile per PLI, dunque tantomeno ottima. Si può allora essere tentati di determinare una soluzione ottima di PLI arrotondando x a un punto a coordinate intere vicino a x. Questa Soluzione per Arrotondamento può essere un metodo pratico di grande utilità per la soluzione di PLI, se tutte variabili del problema sono variabili intere che rappresentano il numero di oggetti indivisibili usati o prodotti, ed è ragionevole aspettarsi che le variabili stesse abbiano valori abbastanza grandi all ottimo. Inoltre i vincoli lineari dovrebbero essere tali da poter facilmente decidere se l ammissibilità è preservata arrotondando una variabile non intera al più vicino valore intero (o, per esempio, al più vicino valore intero inferiore). Per esempio, se x 1 rappresenta il numero di automobili di un certo modello che devono essere assemblate durante un mese e se esiste una limitazione inferiore su x 1, è ragionevole aspettarsi che un valore x 1 = possa essere arrotondato a 1001 senza che venga violata l ammissibilità. Se tutte le variabili del problema sono di questo tipo e se esiste un metodo semplice di passare dalla soluzione non intera x di PR a una soluzione vicina, intera e ammissibile per PLI, allora un ragionevole approccio pratico alla soluzione di PLI è quello di risolvere il suo rilassamento lineare ed arrotondare quindi la soluzione. Tuttavia, se il valore delle variabili della soluzione ottima del rilassamento lineare è presumibilmente piccolo, questa tecnica non è molto sensata. Se, per esempio, x 1 rappresenta il 179

185 numero di portaaeri che devono essere costruite dall esercito italiano, è intuitivo capire che è molto difficile decidere se si debba arrotondare x 1 = 2.5 a 2 o a 3, e che le due possibilità portano a risultati completamente diversi. La situazione diventa ancora più drammatica quando le variabili intere sono, in realtà, variabili binarie. In questi problemi le variabili 0-1 indicano quale di due possibili scelte alternative deve essere attuata. In questo caso l arrotondamento è totalmente privo di senso logico. a Figura 12.2: Soluzione per arrotondamento: primo esempio. Consideriamo l esempio di figura Supponiamo che la soluzione del rilassamento lineare sia a ( x = a). Il punto a ha tutte le componenti non intere e tutti i punti a componenti intere ottenuti arrotondando le sue componenti all intero immediatamente superiore o inferiore non sono ammissibili per PLI. Da questo esempio dovrebbe risultare chiaro, inoltre, che è possibile costruire problemi PLI in cui la soluzione ottima del relativo rilassamento lineare è lontana quanto si vuole dal più vicino punto ammissibile di PLI. Anche nel caso in cui possa essere trovato un punto ammissibile vicino a x, questi può essere molto lontano dalla soluzione ottima di PLI. Un esempio al riguardo è dato nella figura 12.3, dove la soluzione ottima del rilassamento lineare è a, b è la soluzione ottenuta per arrotondamento, mentre c è la vera soluzione di PLI. Esempio [3] Sia consideri il problema le cui soluzioni ammissibili sono: min x 1 x 2 2x 1 + 5x 2 5 2x 1 2x 2 1 x 0, intero ( 0 0 ( ) 1 e l ottimo è x I = di valore z 1 I = 2. ) ( 0 1 ) ( )

186 c a b direzione di crescita della funzione obiettivo Figura 12.3: Soluzione per arrotondamento: secondo esempio. Risolvendo il suo rilassamento lineare min x 1 x 2 2x 1 + 5x 2 5 2x 1 2x 2 1 x 0 (12.6) si determina la soluzione x 1 = 5 2 = 2.5, x 2 = 2 con valore della funzione obiettivo z = 9 2. Arrotondando ( ) ( ) questa soluzione sia all intero superiore che inferiore si ottengono le due soluzioni 2 3, che NON sono ammissibili. In figura 12.4 è disegnata la regione ammissibile S e 2 1 S I. Dunque arrotondare una soluzione non intera può non essere una buona strategia. Inoltre è bene sottolineare che l arrotondamento può essere computazionalmente oneroso. Infatti data una soluzione frazionaria x IR n, possono esistere 2 n vettori interi ottenuti arrotondando le componenti non intere di x al valore intero superiore o inferiore più prossimo, e non si vede con quale criterio si possa sceglierne uno quale soluzione di PLI. Inoltre molti (se non tutti) di questi 2 n vettori possono non essere ammissibili per PLI, e il problema di determinare un vettore a componenti intere, ammissibile per PLI, e vicino a x può essere, in generale, un problema di difficoltà paragonabile alla soluzione di PLI. Osserviamo però che uno stesso problema di PLI può essere descritto in modo equivalente in diversi modi. Esempio (continua) Consideriamo il problema dell esempio a cui aggiun- 181

187 Figura 12.4: Soluzione grafica Esempio giamo il vincolo x 1 1 min x 1 x 2 2x 1 + 5x 2 5 2x 1 2x 2 1 x 1 1 x 0, intero (12.7) La regione ammissibile S I è invariata, mentre la regione ammissibile e la soluzione ottima del suo rilassamento lineare cambia (vedi figura 12.5). Se consideriamo il problema min x 1 x 2 2x 1 + 5x 2 5 2x 1 2x 2 2 x 2 1 x 0, intero (12.8) otteniamo la regione ammissibile in Figura 12.6 e la soluzione del rilassamento lineare coincide con x I. Quest ultima rappresentazione ha quindi un interessante proprietà: la soluzione del problema rilassato coincide con la soluzione ottima intera. S tratta dunque di una formulazione ideale. 182

188 Figura 12.5: Soluzione grafica Esempio Naturalmente la formulazione ideale non è in genere conosciuta. Se lo fosse, il problema di PLI si potrebbe risolvere utilizzando un metodo per la PL che individua un vertice ottimo (ovvero con il metodo del simplesso). É peró possibile identificare dei problemi che godono di questa proprietá. In particolare diamo la seguente definzione: Definizione Un poliedro si dice interose tutti i suoi vertici sono interi Proprietà di interezza e totale unimodularità Allo scopo di ottenere una caratterizzazione dei poliedro interi, utilizziamo per semplicitá la formulazione di poliedro in forma standard P = {x IR n : Ax = b, x 0}. Ricordiamo la corrispondenza mostrata nel paragrafo tra vertici di un poliedro in forma standard e Soluzioni di Base Ammissibili (individuate dal metodo del simplesso), x B = B 1 b R m, x N = 0. Dunque vogliamo ottenee una condizione che garantisca che B 1 b sia intero per qualunque scelta della base B. Osserviamo preliminarmente che vale il seguente teorema: Teorema Se una matrice quadrata B con elementi interi ha determinante ±1, allora la sua inversa é intera 183

189 Figura 12.6: Soluzione grafica Esempio La dimostrazione é banale, ricordando la construzione della matrice inversa che é data dalla matrice aggiunta (intera se B é intera) diviso il determinante. Introduciamo la seguente definizione Definizione [2] Una matrice a componenti intere A (m n) di rango m si dice unimodulare se ogni sottomatrice quadrata m m non singolare di A ha determinante di valore 1, 1. Dunque possiamo affermare [2] Sia A una matrice (m n) a componenti intere. Allora condizione sufficiente affinché il poliedro P = {x IR n : Ax = b, x 0} abbia tutti i vertici interi, per ogni b intero, è che la matrice A sia unimodulare. Si dice invece che una matrice A é totalmente unimodulare se ogni sottomatrice quadrata di A ha determinante in { 1, 0, 1}. Teorema Sia A una matrice (m n) a componenti intere. Allora condizione sufficiente affinché il poliedro P = {x IR n : Ax b, x 0} 184

190 abbia tutti i vertici interi, per ogni b intero, è che la matrice A sia totalmente unimodulare. È quindi interessante poter individuare condizioni che garantiscano l unimodularità di una matrice a componenti intere A (m n). Una ovvia condizione necessaria per la totale unimodularità è che la matrice abbia tutti elementi a ij {0, 1, 1}. ( Non è però ) una condizione sufficiente, infatti basta scegliere banalmente una 1 1 matrice del tipo con determinante pari a Si può dare una condizione sufficiente di totale unimodularità [2]: Teorema Sia A una matrice (m n) con elementi a ij {0, 1, 1}. Se 1. ogni colonna abbia al più due elementi diversi da zero; 2. è possibile partizionare gli indici di riga in due sottoinsiemi Q 1 e Q 2 tali che (i) se la colonna j contiene due elementi a ij 0 e a kj 0 dello stesso segno allora i Q 1 e k Q 2 ; (ii) se la colonna j contiene due elementi a ij 0 e a kj 0 di segno opposto allora o i, k Q 1 oppure i, k Q 2 ; allora A è totalmente unimodulare. Esempio Verificare che la matrice che non soddisfa la condizione sufficiente, é totalmente unimodulare. Per matrici che hanno al piú due elementi diversi da zero per ogni colonna, la condizione 2 del teorema precedente diventa una condizione necessaria e sufficiente di totale unimodularità: Teorema Sia A una matrice (m n) con elementi a ij {0, 1, 1} e tale che ogni colonna abbia al più due elementi diversi da zero. Allora A è totalmente unimodulare se e solo se è possibile partizionare gli indici di riga in due sottoinsiemi Q 1 e Q 2 tali che: (i) se la colonna j contiene due elementi a ij 0 e a kj 0 dello stesso segno allora i Q 1 e k Q 2 ; (ii) se la colonna j contiene due elementi a ij 0 e a kj 0 di segno opposto allora o i, k Q 1 oppure i, k Q 2. Teorema Se una matrice A è totalmente unimodulare, lo sono anche le matrici ( ) ( ) A A ( ) ( ) A I A I I I 185

191 Esempio Dire se la seguente matrice è totalmente unimodulare (dimostrando l affermazione): Soluzione. La condizione necessaria è verificata, poiché gli elementi sono tutti 0, 1. Inoltre ogni colonna di A ha al più due elementi non nulli, quindi sono verificate le ipotesi del Teorema Costruiamo la partizione degli indici di riga. Se la riga 1 Q 1 allora la riga 2 Q 2, ma la riga 3 non può stare né in Q 1 per l elemento a 12 né in Q 2 per l elemento a 13. Quindi la matrice non è totalmente unimodulare. Esempio Dire se la seguente matrice è totalmente unimodulare dimostrando l affermazione Soluzione. Sono verificate le ipotesi del Teorema Esiste una partizione degli indici di riga, Q 1 = {1, 2, 3}, Q 2 = {4, 5, 6}, che soddisfa le condizioni (i) (ii), quindi la matrice è totalmente unimodulare. Esempio Verificare che la matrice del problema di assegnamento é totalmente unimodulare. Esempio Verificare che la matrice del problema di trasporto é totalmente unimodulare. Esempio Verificare che la matrice del problema di revenue management é totalmente unimodulare Tecniche di soluzione per problemi di PLI In forma del tutto generale un problema di PLI può essere scritto come min c T x Ax b 0 x U x intera (P LI) dove U è un vettore a n componenti che limita superiormente il valori che possono essere assunti dalle variabili. La presenza di questo vincolo implica che la regione ammissibile del problema PLI 186

192 è limitata. Questa assunzione semplificherà le considerazioni svolte in questo paragrafo. Essa è, peraltro, non limitativa, in quanto in ogni problema reale il valore assunto dalle componenti delle soluzioni ammissibili è sempre limitato superiormente da qualche costante. In questo paragrafo consideriamo alcune tecniche risolutive per problemi di PLI. In particolare, dopo alcune brevi considerazione sulla soluzione per enumerazione totale e sulla soluzione approssimata per arrotondamento di problemi di PLI, descriveremo una delle più note famiglie di algoritmi per la soluzione esatta di problemi di PLI: gli algoritmi di Branch and Bound. Prima di procedere vogliamo introdurre un concetto molto importante, quello di problema rilassato, che verrà ampiamento ripreso e utilizzato nel seguito. Dato il problema PLI si definisce suo rilassamento lineare (o problema rilassato associato) il seguente problema. min c T x Ax b 0 x U. (P R) Si tratta cioè di un problema di PL ottenuto eliminando dal problema PLI il vincolo di interezza. La regione di un Problema di PLI è ovviamente contenuta in quella del suo rilassamento PR (che è ottenuto, lo ripetiamo, eliminando un vincolo da PLI) e quindi ne segue che il valore ottimo di PR è sicuramente maggiore o uguale di quello di PLI. In particolare, se la soluzione ottima di PR è intera allora questa è anche la soluzione ottima di PLI La Tecnica del Branch and Bound Abbiamo già visto che una possibile, semplice tecnica di soluzione per PLI, purtroppo quasi mai utilizzabile in pratica, è l enumerazione totale. Il Branch and Bound (BB) fornisce, allora, una metodologia di ricerca della soluzione ottima che effettua una esplorazione parziale dell insieme delle soluzioni ammisibile. In particolare la funzione obiettivo viene calcolata per una sottoinsieme (piccolo) delle soluzioni ammissibili con la proprietà di contenere almeno una soluzione ottima. Descriviamo ora in maggior dettaglio i vari aspetti della procedura. Sia S (0) l insieme delle soluzioni ammissibili PLI. Una partizione di S (0) è una famiglia di sottoinsiemi (S (1),..., S (r) ), r 2 tale che: e S (i) S (j) = per ogni coppia 1 i < j r r S (i) = S (0) i=1 Evidentemente, la soluzione ottima del problema originario è data dal massimo tra i valori z (1) = c T x (1),..., z (r) = c T x (r) dove x (i) è la soluzione ottima del sottoproblema PLI i definito dal problema di minimizzare la funzione obiettivo del problema PLI sulla regione ammissibile S (i) (nel seguito, con un piccolo abuso di notazione, indicheremo spesso con S (i) sia la regione ammissibile sia il sottoproblema PLI i ). Se un certo sottoproblema PLI i risulta, a sua volta, di difficile soluzione si partiziona ulteriormente l insieme S (i) producendo nuovi sottoproblemi ed iterando la procedura fino a che il problema originario non risulti decomposto in problemi elementari di facile soluzione. Cerchiamo di chiarire la procedura con un esempio informale. Supponiamo di dover trovare la persona più giovane di un Ateneo. Risolvere questo problema confrontando le età di tutti gli studenti fra loro (enumerazione totale) può risultare in un processo troppo lungo. Si può allora 187

193 chiedere ai presidi di ogni facoltà qual è lo studente più giovane delle loro facoltà e scegliere il più giovane tra questi studenti. Abbiamo decomposto il problema originario in più sottoproblemi: la determinazione dello studente più giovane di ogni facoltà. In alcuni casi la risoluzione di questi sottoproblemi può essere agevole. In altri casi il preside può non essere in grado di fornire facilmente il nome dello studente più giovane della sua facoltà. In questo caso si può scomporre ulteriormente il problema. Per esempio, il preside può chiedere a tutti i direttori di Corso di Laurea di fornirgli il nome dello studente più giovane che frequenta l istituto stesso. Da questi egli potrà così risalire al nome dello studente più giovane della facoltà. E così via. È evidente che la procedura appena descritta non compie una totale enumerazione dell insieme S ed è computazionalmente efficiente solo se il numero dei sottoproblemi generati si mantiene estremamente limitato e quindi solo se la strategia di soluzione dei sottoproblemi è sufficientemente efficace. In generale però, risolvere un sottoproblema può essere altrettanto gravoso che risolvere il problema originario. È per questo che, in luogo della soluzione esatta del problema S (i) si preferisce calcolare un lower bound di z (i) e cioè un valore L (i) z (i). Tale valore viene poi confrontato con il miglior valore z (ad un certo passo della procedura) della funzione obiettivo calcolata in un punto ammissibile (ottimo corrente). Se il valore approssimato risulta non inferiore a quello dell ottimo corrente, ovvero se z L (i) z (i) si deduce che non esiste nell insieme S (i) un punto in cui la funzione obiettivo abbia un valore migliore di z. Un tale risultato ci permette di sospendere l esame dell insieme S (i) e di eliminarlo dalla lista dei sottoproblemi da risolvere. Per tornare all esempio informale precedente, supponiamo che il preside di una facoltà abbia comunicato che ha uno studente di età 17 anni e 3 mesi (ottimo corrente). Supponiamo anche che il preside di un altra facoltà, pur senza sapere esattamente qual è l età esatta del suo studente più giovane, sia riuscito ad avere la certezza, con mezzi solo a lui noti, che ogni studente della sua facoltà non è più giovane di 18 anni (lower bound). È evidente che è inutile fare lo sforzo di cercare di trovare l età esatta del più giovane studente della sua facoltà, perché comunque non sarà lo studente più giovane. Evidentemente la soluzione del problema originario sarà tanto più efficiente quanto migliori saranno i valori dei limiti inferiore ( lower bound ) ed a loro volta tali valori approssimeranno tanto meglio il valore ottimo del sottoproblema quanto più efficace sarà stata la decomposizione del problema originario. Di conseguenza l efficienza della tecnica del BB dipende essenzialmente dalla qualità delle due strategie che ne caratterizzano la struttura: (a) Strategia di Soluzione, ovvero la strategia per il calcolo di un valore che approssimi per eccesso (in un problema di massimo) il valore ottimo di un sottoproblema. (b) Strategia di Separazione, ovvero la strategia per la scelta della partizione dell insieme delle soluzioni ammissibili di un sottoproblema. È anche evidente che a seconda della strategia di soluzione e di quella di separazione adottate, lo schema generale appena descritto si concretizzerà in un algoritmo differente. Nel seguito di questo paragrafo descriveremo un possibile schema (semplificato) di BB che corrisponde a uno degli schemi di BB più utilizzati nella pratica dando al contempo maggiore sistematicità al metodo presentato. 188

194 Ricordiamo che vogliamo risolvere un problema di PLI della seguente forma min c T x Ax b 0 x U x intera (P LI) Questo problema, nel seguito sarà indicato anche come problema S (0). Nel corso del metodo considereremo dei sottoproblemi che hanno una struttura simile. Più precisamente considereremo sottoproblemi S (i) con la seguente struttura. min c T x Ax b l (i) x u (i) x intera, dove i vettori n dimensionali l (i) e u (i) sono calcolati dall algoritmo. Nel seguito indicheremo, inoltre, con x (i) e z (i) rispettivamente una soluzione ottima e il valore ottimo di S i. La strategia che proponiamo per calcolare un limite inferiore L (i) di z (i) è la seguente: dato il problema S (i), risolvere il suo rilassamento lineare. Indichiamo con x (i) la soluzione ottima del rilassamento lineare di S (i) e con L (i) il corrispondente valore ottimo. Per quanto visto precedentemente il valore ottimo L (i) così ottenuto costituisce un limite inferiore di z (i), inoltre il rilassamento lineare è facilmente risolubile con il metodo del simplesso. Dobbiamo ora descrivere un metodo per la separazione di un generico S (i). Supponiamo di aver risolto il rilassamento lineare di S (i) e sia x (i) la sua soluzione ottima e, come già detto, con U (i) il corrispondente valore ottimo. Se x (i) ha tutte componenti intere allora x (i) = x (i) e il problema non va separato. Se U (i) è minore o uguale all ottimo corrente, cioè al valore massimo della funzione obiettivo finora trovato, il problema non può dar origine ad una soluzione intera migliore di quella corrente e non è necessario separarlo per trovare la sua soluzione ottima intera. Supponiamo quindi che nessuno di questi due casi si sia verificato, e vediamo come seperare questo sottoproblema. Sia x (i) j una componente non intera del vettore x (i) (almeno una ne deve esistere), α j la sua parte intera inferiore (ossia il più grande intero minore o uguale a x (i) j ) e β j la sua parte intera superiore (ossia il più piccolo intero maggiore o uguale a x (i) j ). Ovviamente valgono le seguenti relazioni: α j < β j β j α j = 1. (S i ) Separiamo il problema S (i) nei seguenti due problemi e min min c T x Ax b (l (i) ) 1 x u (i) x intera, c T x Ax b l (i) x (u (i) ) 2 x intera, (l (i) ) 1 j = (u (i) ) 2 j = l (i) j β j u (i) j α j se i j se i = j se i j se i = j 189

195 Notiamo che è facile convincersi che l unione delle regioni ammissibili di questi due problemi dà la regione ammissibile del problema S (i), di modo tale che questa è in effetti una separazione del problema S (i) del tipo prima considerato. Per concludere vogliamo osservare che dobbiamo considerare un altro caso che finora non abbiamo menzionato. Nel risolvere il rilassamento del problema S (i) può accadere che la regione ammissibile del rilassamento risulti vuota. Siccome la regione ammissibile del problema S (i) è contenuta in quella del suo rilassamento, questo vuol dire che il problema S (i) ha regione ammissibile vuota, e quindi non c è bisogno di separarlo. Abbiamo ora tutti gli elementi per descrivere il metodo di B& B proposto. 1. Inizializzazione Inizialmente il problema S (0) = P LI è l unico problema candidato. La procedura inizia con l applicazione della strategia di soluzione ad S (0) ottenendo un primo lower bound U (0). Inoltre, viene calcolato un upper bound z per il problema S (0), cioè un valore sicuramente non inferiore a quello z della soluzione ottima. Tale valore viene usualmente ottenuto in corrispondenza ad una soluzione ammissibile x facile da individuare (ad es. mediante una semplice euristica). I valori x e z vengono successivamente aggiornati nel corso della procedura non appena vengono individuate soluzioni ammissibili per il problema originario con un valore più alto della funzione obiettivo. Se non è possibile individuare facilmente una soluzione ammissibile si può porre z =, mentre x viene, per il momento lasciato indefinito. Se l ottimo del problema rilassato x (0) appartiene all insieme S (0) il problema è risolto. Altrimenti è necessario applicare una strategia di separazione al problema S (0) ottenendo due nuovi problemi candidati S (1) ed S (2). Calcoliamo gli lower bound dei nuovi problemi ottenendo i valori U (1) ed U (2). Se S (1) (S (2) ) è vuoto allora ad U (1) (U (2) ) viene convezionalmente assegnato il valore (che vuol dire, in pratica, che il problema viene eliminato). 2. Passo generico dell algoritmo. Ad un generico passo dell algoritmo supponiamo di avere la lista L = {S (1),..., S (q) } dei sottoproblemi che non sono ancora stati partizionati (problemi terminali). Supponiamo inoltre che per ciascun sottoproblema S (i) sia stato calcolato l upper bound U (i). Illustriamo ora brevemente le possibili azioni dell algoritmo in un passo generico Chiusura dei sottoproblemi dominati dall ottimo corrente Se L (i) z, detto (z (i) ) il valore ottimo della funzione obiettivo per il problema S (i), abbiamo che: z (i) L (i) z e quindi che nessuna soluzione migliore di z può essere contenuta in S (i). In tal caso il problema S (i) può essere eliminato della lista dei problemi candidati e viene definito chiuso. Possiamo quindi immaginare che per tutti i problemi terminali superstiti (aperti) sia verificata la condizione U (i) > z. Se tutti i problemi terminali sono chiusi, l algoritmo termina e l ottimo corrente è una soluzione ottima del problema. Se, al contrario, la lista dei problemi terminali contiene almeno un problema aperto, si procede nel modo seguente: 2.2. Scelta del problema aperto da esaminare Esistono diverse strategie di scelta, tra queste le più usate sono le seguenti: 190

196 (1) Scelta del problema con il massimo lower bound. Tale scelta ha lo scopo di esaminare per primi quei problemi in cui è più probabile trovare una soluzione ottima. Infatti, se la strategia di soluzione produce buone soluzioni approssimate, a valori alti del lower bound corrisponderanno alti valori delle soluzioni ottime dei sottoproblemi. Pertanto, esaminando il sottoproblema aperto cui corrisponde il massimo valore del upper bound si avrà una maggiore probabilità di individuare la soluzione ottima. (2) Scelta con criterio di priorità LIFO (Last In First Out). In questo caso i sottoproblemi terminali sono gestiti dalla procedura secondo lo schema a stack. In particolare, il problema scelto è l ultimo problema generato nella fase di separazione Esame di un sottoproblema terminale Sia S (i) il problema scelto in accordo ad uno dei criteri presentati al punto 2.1 e sia L (i) l lower bound associato ad S (i). Inoltre, sia x (i) l ottimo del problema rilassato, cioè il punto che soddisfa L (i) = c T x (i). Abbiamo le seguenti possibilità: x (i) appartiene ad S (i) Se l ottimo del problema rilassato x (i) appartiene ad S (i) abbiamo che esso è ottimo anche per il sottoproblema S (i). Inoltre poiché il problema S (i) è aperto abbiamo che L (i) > z e quindi che x (i) è una soluzione ammissibile del problema originario con valore della funzione obiettivo (c T x (i) = L (i) ) migliore di z. Di conseguenza, possiamo porre x = x (i) e z = L (i). (aggiornamento dell ottimo corrente). In ogni caso il problema S (i) viene chiuso e si inizia il passo successivo x (i) non appartiene ad S (i) In tal caso si deve applicare la strategia di separazione precedentemente illustrata, produrre i due nuovi sottoproblemi ed aggiungerli alla lista dei problemi terminali, calcolare i loro upper bound, eliminare il problema S (i) dalla lista dei problemi terminali ed iniziare il passo successivo. ATTENZIONE: se invece di un problema di minimo si ha a che fare con un problema di massimizzazione, cioè max c T x Ax b 0 x U x intera Il valore della soluzione del problema rilassato costituisce un upper bound U e risulta z I U. Una qualunque soluzione ammissbile intera costituisce invece il lower bound Esempi Completiamo con degli esempi di applicazione del metodo appena descritto. Esempio 1. Sia dato il seguente problema di programmazione lineare a numeri interi 2 : (S (0) ) max 3x 1 + x 2 2 Ricordiamo che con Z si indica l insieme dei numeri interi 191

197 7x 1 + 2x x 1 + 2x x x 2 3 x 1, x 2 Z Il problema è un problema di massimizzazione, quindi le soluzioni dei problemi rilassati forniranno dei limiti superiori ( upper bounds ) al valore della soluzione ottima intera. Inoltre, il valore della funzione obiettivo calcolato in corrispondenza ad una soluzione ammissibile fornirà un limite inferiore ( lower bound ). La soluzione ottima x (0) del rilassamento lineare di S (0) è x (0) = (7/3, 17/6) e fornisce un upper bound pari a U (0) = z( x (0) ) = 59/6 = Se effettuiamo un semplice arrotondamento all intero inferiore delle componenti di x (0) otteniamo il vettore x T = (2, 2). Poichè tale vettore è ammissibile per S (0), possiamo porre l ottimo corrente pari ad x ed il primo lower bound al valore z( x) = 8. Non è possibile chiudere il problema S (0) in quanto la soluzione x non è intera e l upper bound è strettamente maggiore del lower bound. Il problema viene quindi inserito nella lista L dei problemi candidati. Viene selezionato un problema in L = {S (0) }. In particolare, viene estratto dalla lista il problema S (0). Si procede quindi alla separazione di S (0). Possiamo separare rispetto ad una qualsiasi delle variabili non intere, per semplicità decidiamo di separare rispetto alla variabile con indice più piccolo (x 1 ). A tale scopo, aggiungiamo ai vincoli della formulazione di S (0), i due vincoli x 1 3 (x 1 x 1 3 ) e x 1 2 (x 1 x 1 4 ), ottenendo i due problemi seguenti : (S (1) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 3 x 1, x 2 Z (S (2) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 3 x 1, x 2 Z 3 Ricordiamo che x 1 indica il più piccolo numero intero maggiore o uguale a x 1 4 Ricordiamo che x 1 indica il più grande numero intero minore o uguale a x 1 192

198 Il rilassamento lineare del problema S (1) ha soluzione x (1) = (2, 5/2) di valore U (1) = z( x (1) ) = 8.5. La soluzione del rilassamento lineare del problema S (2) è, invece, x (2) = (3, 1/2) di valore U (2) = z( x (2) ) = 9.5. Entrambi i problemi non sono eliminabili e vengono quindi inseriti nella lista L. Viene scelto un problema nella lista L = {S (1), S (2) } dei problemi candidati. In particolare esaminiamo il problema S 1 La prima componente di x (1) è intera mentre la seconda componente è frazionaria. Scegliamo quindi la variabile x 2 per effettuare la separazione. A tale scopo, aggiungiamo alla formulazione di S (1) i due vincoli x 2 2 e x 2 3. In tal modo, otteniamo o i due problemi seguenti : (S (3) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 2 x 1, x 2 Z (S (4) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 3 x 1, x 2 Z La soluzione del rilassamento lineare del problema S (3) è x (3) = (2, 2) ed ha valore U (3) = z( x (3) ) = 8. Il problema S (4), invece, non ha soluzioni ammissibili. Di conseguenza, poniamo U (4) =. È possibile chiudere sia il problema S (3) che il problema S (4). Il primo in quanto la soluzione del rilassamento lineare è intera, il secondo in quanto non ha soluzione ammissibili (ovvero poichè U (4) < z). Nessuno dei due viene quindi inserito nella lista L. Si osservi che, pur essendo x (3) una soluzione intera, non aggiorniamo l ottimo corrente in quanto x = x (3). Estraiamo dalla lista L = {S (2) } il problema S (2) (unico problema rimasto) ed effettuiamo la separazione rispetto alla variabile x (2) (infatti la seconda componente di x (2) è frazionaria). Dobbiamo aggiungere alla formulazione di S (2) i due vincoli x 2 0 e x 2 3. In tal modo, otteniamo i due problemi seguenti : (S (5) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x

199 3 x x 2 0 x 1, x 2 Z (S (6) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 3 x 1, x 2 Z La soluzione del rilassamento lineare del problema S (5) è x (5) = ( , 0) ed ha valore U (5) = z( x (5) ) = Il problema S (6), invece, non ha soluzioni ammissibili. Di conseguenza, poniamo U (6) =. Il problema S (6) viene chiuso in quanto non ha soluzione ammissibili, il problema S (5) non è eliminabile e va quindi inserito nella lista L. Infatti il suo valore ottimo è pari a , poiché tale valore è migliore di quello della soluzione intera trovata (ossia 8), il problema non è eliminabile (nella sua regione ammissibile potrebbe trovarsi una soluzione intera migliore di quella corrente). Nella lista L vi è ora solo il problema S 5, che viene quindi scelto. Viene effettuata la separazione rispetto alla variabile x 1. A tale scopo, si aggiungono alla formulazione di S (5) i due vincoli x 1 2 e x 1 4, ottenendo i due problemi: (S (7) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 0 x 1, x 2 Z (S (8) ) max 3x 1 + x 2 7x 1 + 2x x 1 + 2x x x 2 0 x 1, x 2 Z 194

200 La soluzione del rilassamento lineare del problema S (7) è x (7) = (3, 0) ed ha valore U (7) = z( x (7) ) = 9. Il problema S (8), invece, non ha soluzioni ammissibili. Di conseguenza, poniamo U (8) =. I problemi S (7) e S (8) possono essere chiusi: il primo in quanto la soluzione ottenuta è intera, il secondo in quanto non ha soluzione. La soluzione intera di S (7) è migliore di quella corrente e quindi la soluzione corrente viene aggiornata (si pone ˆx T = (3, 0)). La lista L è ora vuota, il procedimento quindi termina. La soluzione ottima è data dalla soluzione corrente, ossia dalla soluzione del problema S (7) : I vari passi della procedura di soluzione possono essere schematizzati utilizzando il cosiddetto Albero di Enumerazione riportato in figura In tale albero i nodi indicano i problemi mentre i rami stabiliscono le relazioni padre-figlio (generatore-generato) nel processo di generazione Figura 12.7: Albero di enumerazione. Esempio 2. Passiamo ora ad esaminare, più sinteticamente il secondo esempio. Sia dato il seguente problema di programmazione lineare a numeri interi. max x 1 + x 2 2x 1 + 5x x 1 3x x 1 (S (0) ) 0 x 2 x 1, x 2 Z Notiamo che in questo problema non sono esplicitamente presenti gli upper bound sule variabili. Essendo comunque la regione ammissibile del problema rilassato limitato, non è comunque necessario inserirli esplicitamente. È facile convincersi che nulla cambia nell applicazione dell algoritmo e nella sua validità. 195

201 Poniamo inizialmente z = e risolviamo il rilassamento lineare di S (0). Si ottiene U (0) = x (0) = ( 60 13, ). Essendo U (0) > z si separa rispetto alla variabile x 1. Si elimina S (0) dalla lista L, e vi si aggiungono i due nuovi problemi S 1 e S 2 individuati dai seguenti vincoli aggiuntivi. Si avrà pertanto L = {S 1, S 2 }. S 1 : x 1 4 S 2 : x 1 5. Si sceglie S 1 da L e si risolve il suo rilassamento. Si ottiene U 1 = 42 5 x 1 = 4 x 2 = 22 5 Essendo U 1 > z si elimina S 1 da L e vi si aggiungono, invece altri due problemi, S 3 e S 4, individuati dai seguenti vincoli aggiuntivi. Risulta pertanto L = {S 2, S 3, S 4 }. S 3 : x 1 4 x 2 4 S 4 : x 1 4 x 2 5. Si sceglie S 3 da L e si risolve il suo rilassamento. Si ottiene U 3 = 8 x 1 = 4 x 2 = 4 Essendo U 3 > z ed essendo intera la soluzione trovata, si pone z = U 3 = 8 x 1 = x 1 = 4 x 2 = x 2 = 4, e si elimina il problema S 3. Risulta a questo punto L = {S 2, S 4 }. Si sceglie S 4 da L e si risolve il suo rilassamento. Si ottiene U 4 = 15 2 x 1 = 5 2 x 2 = 5 Essendo U 4 < z si chiude S 4 e la lista diventa L = {S 2 }. Si sceglie S 2 dalla lista e si risolve il suo rilassamento. Si vede che non esistono soluzioni ammisibili. Si chiude S 2 e la lista L è vuota. La soluzione corrente è la soluzione ottima. z = 8 x 1 = 4 x 2 = Il problema del Knapsack Descriveremo ora in modo completo un algoritmo di Branch and Bound per la soluzione di un problema di Knapsack. In particolare, descriveremo la procedura per individuare un upper bound del problema e la strategia di separazione utilizzata. Il problema è il seguente: max c T x a T x b x i {0, 1}, i = 1,..., n 196

202 dove a e c sono vettori in IR n a componenti non negative e b > 0 è un numero reale. Questo problema ha l interessante proprietà che la soluzione del suo rilassamento lineare può essere ottenuta, senza usare il metodo del simplesso, nel modo seguente: 1. Si ordinano le variabili secondo i rapporti valore/ingombro decrescenti in modo tale che: c 1 a 1 c 2 a 2... c n a n 2. Si determina l indice h {1,..., n} tale che: (ponendo h = 0 se a 1 > b). h a i b i=1 h+1 a i > b i=1 3. La soluzione del rilassamento lineare del problema di knapsack sarà il vettore x così definito: x 1 =... = x h = 1 x h+2 =... = x n = 0 x h+1 = (b h i=1 a i) a h+1 Esempio Nell esempio, oltre alla strategia di calcolo del upper bound descritta nel 12.6, useremo una tecnica di separazione binaria sulla variabile frazionaria e sceglieremo il problema da esaminare in base alla strategia LIFO. Esempio Sia dato il seguente problema: risolvere con il metodo del Branch and Bound. (S 0 ) max 4x 1 + 4x 2 + 3x 3 + x 4 2x 1 + 3x 2 + 3x 3 + 2x 4 7 x {0, 1} n Osserviamo innanzitutto che gli indici delle variabili soddisfano le condizioni di ordinamento dei rapporti valore/ingombro. 1. Inizializzazione La soluzione ottima del rilassamento lineare è: 197

203 x 0 = [1, 1, 2 3, 0] Il valore corrispondente dell upper bound è U 0 = 10. Una soluzione ammissibile (ma non ottima) del problema è x = [1, 1, 0, 0], ottenuta arrotondando all intero inferiore le componenti di x 0. Il suo valore ( lower bound ) è z = 8 Poichè l ottimo rilassato non è intero (e quindi non appartiene a S 0 = S) dobbiamo separare il problema S 0. Poichè la componente ( x 0 ) 3 è frazionaria, scegliamo la variabile x 3 e la fissiamo ad 1 e 0 ottenendo, rispettivamente, i problemi S 1 ed S 2, le cui formulazioni sono: (S 1 ) max 4x 1 + 4x 2 + 3x 3 + x 4 2x 1 + 3x 2 + 2x 4 4 x {0, 1} n, x 3 = 1 (S 2 ) max 4x 1 + 4x 2 + 3x 3 + x 4 2x 1 + 3x 2 + 2x 4 7 x {0, 1} n, x 3 = 0 Calcoliamo, utilizzando la strategia sopra descritta, le soluzioni ottime dei problemi rilassati: x 1 = [1, 2 3, 1, 0], x 2 = [1, 1, 0, 1] I valori dei corrispondenti upper bounds saranno U 1 = 9. 6 ed U 2 = 9. La lista dei problemi terminali sarà L = {S 1, S 2 }. Passo 1. (1a) Chiusura dei problemi terminali dominati dall ottimo corrente Poichè U 1 > z e U 2 > z nessuno dei due problemi può essere chiuso. (1b) Scelta del problema (aperto) da esaminare Si adotta una strategia LIFO. Viene scelto il problema S 2. (1c) Esame del problema scelto Poichè x 2 appartiene ad S 2 (infatti è una soluzione intera) l ottimo corrente viene aggiornato. In particolare, si pone z = U 2 = 9 ed x = x 2 = [1, 1, 0, 1]. Il problema S 2 viene poi rimosso dalla lista dei problemi terminali che diviene L = {S 1 }. Passo 2. (2a) Chiusura dei problemi terminali dominati dall ottimo corrente. Poichè U 1 > z l unico problema nella lista non può essere chiuso. (2b) Scelta del problema (aperto) da esaminare. Ovviamente S

204 (2c) Esame del problema scelto Poichè x 1 non appartiene ad S 1 (infatti è una soluzione non intera) l ottimo corrente non viene aggiornato. Di conseguenza, il problema S 1 deve essere decomposto. Poichè la componente ( x 1 ) 2 è frazionaria, scegliamo la variabile x 2 e fissiamola a 0 ed 1 ottenendo i problemi S 3 ed S 4 le cui formulazioni sono: (S 3 ) max 4x 1 + 4x 2 + 3x 3 + x 4 2x 1 + 2x 4 4 x {0, 1} n, x 3 = 1, x 2 = 0 (S 4 ) max 4x 1 + 4x 2 + 3x 3 + x 4 2x 1 + 2x 4 1 x {0, 1} n, x 3 = 1, x 2 = 1 Calcoliamo le soluzioni ottime dei problemi rilassati: x 3 = [1, 0, 1, 1], x 4 = [ 1, 1, 1, 0] 2 I valori dei corrispondenti upper bound saranno U 3 = 8 ed U 4 = 9. La lista dei problemi terminali sarà L = {S 3, S 4 }. Passo 3. (3a) Chiusura dei problemi terminali dominati dall ottimo corrente. Poichè U i z per i = 3, 4 entrambi iproblemi possono essere chiusi. Di conseguenza la soluzione ottima è x = [1, 1, 0, 1] di valore z = 9. Esempio Risolvere il problema di knapsack dell esercizio , utilizzando il metodo del Branch and Bound utilizzando come strategia di scelta del problema da esaminare il criterio del massimo upper bound. 199

205 Capitolo 13 Uso di Excel per l analisi e soluzione di Modelli di Programmazione Matematica 13.1 Introduzione La soluzione grafica di problemi di ottimizzazione che abbiamo visto nel Capitolo 3 può essere utilizzata solo nel caso in cui il numero di variabili sia due. I problemi applicativi hanno normalmente più di due variabili. È necessario utilizzare sistemi di calcolo automatici per trattare sia grandi quantità di dati che di operazioni logico-aritmetiche. Esistono molti software per risolvere problemi di Programmazione Matematica a diversi livelli di complessità. Alcuni prodotti software integrano anche linguaggio di modellizzazione con il/i solutore/i in un unico pacchetto commerciale. Si tratta di prodotti di ottimizzazione comprensivi di tutto l ambiente di calcolo, cosiddetti sistemi di modellizzazione stand-alone che sono in grado di fornire l interfaccia completa tra i differenti livelli di formulazione, soluzione, e analisi della modellizzazione. I sistemi di tipo stand-alone tendono ad essere i più vantaggiosi a livello di costruzione di prototipo, quando il lavoro è incentrato sulla costruzione di un modello accettabile e nel dimostrare che l approccio è sufficientemente promettente per giustificare investimenti maggiori. In questo modo però si incoraggia fortemente (quando non è obbligato) l uso di un particolare solutore. Quindi è una scelta ragionevole in situazioni in cui la velocità e la versatilità non sono le questioni più importanti. Questo è spesso il caso di sistemi altamente specializzati, in cui la qualità dell interfaccia è l aspetto fondamentale e l insieme di problemi che il solutore deve trattare appartengono ad una classe relativamente stretta e ben definita. Rientrano in questa categoria alcuni dei più elementari linguaggi di modellizzazione così come i prodotti di ottimizzazione inseriti in programmi di foglio elettronico (spreadsheet). In questo capitolo utilizzeremo Microsoft c Office Excel 2003 e gli strumenti Scenario e Solutore ( L utilizzo di fogli elettronici per l analisi e la soluzione di un problema di ottimizzazione richiede alcuni passi fondamentali. 1. la creazione di un foglio elettronico che modelli il problema 200

206 2. identificare le variabili di decisione 3. identificare la funzione obiettivo e la cella che la contiene 4. rappresentare i vincoli e specificare le celle che li contengono 5. utilizzare il modello per analisi quantitativa. Le celle di una tabella excel sono individuate dalla posizione di colonna (indicata da una lettera dell alfabeto) e di riga (un numero) Uso di fogli elettronici per la descrizione di un modello matematico Ci sono diversi modi di organizzare un foglio elettronico per rappresentare un modello di programmazione matematica. In generale però è consigliabile seguire uno stesso schema di base che consente una immediata visualizzazione ed individuazione dei parametri e dei dati. In particolare dividiamo la costruzione del foglio elettronico in quattro sezioni: Dati di ingresso, Variabili di decisione, Funzione obiettivo, Vincoli. A titolo esemplificativo, consideriamo il semplice modello di capital budgeting dell esempio del capitolo 1, la cui formulazione matematica è: max (20x 1 + 5x x 3 ) 750x x x x i {0, 1} i = 1, 2, 3. Inserimento dati di ingresso. Si tratta di inserire in una tabella Excel i valori numerici che sono utilizzati nel modello. I dati non devono essere posti necessariamente in una posizione particolare nel foglio excel, ma una buona rappresentazione del modello divide il foglio di Dati dal foglio di Modello. Nel seguito, i dati si trovano su un foglio specifico, ma potrebbero anche essere inseriti nello stesso foglio in cui viene implementato il modello purché siano visibili e ben identificabili. In figura 15.1 è riportato il file Excel relativo all inserimento dei primi dati di Capital Budgeting. Per ciascun progetto 1,2,3 sono riportati i valori di investimento (celle B3, C3, D3), ovvero i valori dei coefficienti dei vincoli, e i guadagni (celle B4, C4, D4), ovvero i coefficienti della funzione obiettivo. Sono state incluse delle caselle di commento (le prime due righe e la prima colonna) che consentono di identificare facilmente di che tipo di dato si tratta (investimento/guadagno relativo al progetto 1/2/3). Se cambiano i dati (costi, guadagni), è necessario modificare questa parte del file Excel. È stato anche inserito il valore del dato relativo al budget (cella B6). Foglio del Modello. In figura 15.2 è riportato il file Excel relativo al modello matematico, che descriviamo in dettaglio. 201

207 Figura 13.1: Dati relativi al problema di Capital Budgeting. Celle variabili (Variabili di decisione). Le celle variabili rappresentano il valore attuale delle variabili di decisione del modello. Al momento dell utilizzo del solutore, queste celle sono considerate come incognite e in output contengono il valore determinato dal solutore (valore ottimo). Nel nostro esempio le variabili di decisione x 1, x 2, x 3 sono assegnate alle celle B3, C3, D3 del foglio Modello. È necessario assegnare un valore iniziale a queste celle per poterle utilizzare. Nel nostro esempio x 1 = 0=B3, x 2 = 0=C3, x 3 = 1=D3. Osserviamo che nell esempio di capital budgeting le variabili possono assumere solo valori interi (in particolare 0,1). In questa fase di rappresentazione del modello in una tabella excel, non è possibile dare indicazioni di questo tipo. È utile inserire delle celle di tipo descrittivo sopra le celle variabili. In questo caso, è stato indicato Progetto 1,Progetto 2, Progetto 3. Inoltre le celle variabili sono evidenziate con un colore azzurro (vedi figura 15.2). Il colore non ha alcun ruolo nel foglio elettronico se non stilistico. Evidenziare le celle (usando un colore diverso o con una linea di contorno più evidente), rende il foglio elettronico più semplice da leggere. Celle vincoli. Si tratta di inserire in alcune celle le formule che definiscono il left hand side (l.h.s.) dei vincoli. Il right hand side =r.h.s del vincolo DEVE essere un valore numerico e deve essere contenuto in un altra cella. Nel nostro esempio c è un unico vincolo di budget. Il valore del l.h.s., cioè la formula 8x 1 + 6x 2 + 5x 3, è inserito in cella B5. Il valore del l.h.s deve essere confrontato con il valore del r.h.s. è utile porre questi due valori vicini. La posizione naturale del valore di budget è nella cella D5 separata dalla B5 da una cella intermedia C5 che contiene il simbolo. Tale simbolo non ha alcuna funzione di 202

208 controllo, ma serve solo a rendere più leggibile il file.. Il valore in B5 è calcolato inserendo una funzione Excel. Si è utilizzata la funzione =MATR.SOMMA.PRODOTTO($B$3:$D$3;DATI!B3:D3) 1. Si osservi che la funzione utilizza i valori delle celle nell intervallo B3:D3 del foglio Modello e del foglio Dati. L utilizzo del simbolo $ utilizzando per indirizzare le celle variabili, ha una funzione utile quando è necessario replicare la funzione e verrà spiegato più avanti. Al solo scopo di mostrare alcune funzioni di Excel è stata inserita nella cella E5 una funzione logica che indica se il vincolo è soddisfato o violato. In particolare, si utilizza la funzione logica SE, che restituisce restituisce il valore ammissibile (vero) o non ammissibile (falso) in base alla differenza tra il valore delle celle D5 (budget) e B5 (spesa effettiva). La sintassi è: =SE(D5-B5 >= 0;"AMMISSIBILE";"NON AMMISSIBILE") Questa opzione può essere utile per una immediata visualizzazione dei risultati in un analisi di scenario. Prestare attenzione alla precisione con cui viene effettuata (la visualizzazione del contenuto della cella può avere una rappresentazione diversa da quella utilizzata per effettuare le operazioni). Cella obiettivo. La cella obiettivo contiene il valore della funzione obiettivo. Anche in questo caso è opportuno inserire delle celle di commento che aiutino nella visualizzazione. Nel nostro esempio si tratta di assegnare la formula 20x 1 + 5x x 3. Il valore della funzione obiettivo è assegnato alla cella B7 ed è dato dalla formula B7= MATR.SOMMA.PRODOTTO($B$3:$D$3;DATI!B4:D4) Si osservi che, possono essere modificati i valori dei dati, ottenendo immediatamente il nuovo valore del guadagno e dell investimento relativi alla scelta attuale delle variabili Analisi di scenario o What if..? analisi L uso di Excel come foglio elettronico per una descrizione del modello, può essere utilizzata per verificare l effetto della variazione di alcuni valori utilizzati nel modello sulle variabili di output. In molti casi può essere appropriato considerare gli effetti della variazione di un insieme di valori che insieme rappresentano un opzione alternativa circa le possibili decisioni future. Questo tipo di approccio è detto What if..? (letteralmente Che succede se...? ) e la sua flessibilità costituisce l aspetto che rende l uso di fogli elettronici un utile supporto alle decisioni. Non si tratta di utilizzare strumenti di ottimizzazione, ma solo di analizzare utilizzando uno strumento analitico l effetto di alcune decisioni consentendo eventualmente di scegliere tra le diverse opzioni quella ritenuta piuù appropriata, ma senza alcuna garanzia che si tratti della scelta ottima né di una sua approssimazione. Microsoft c Office Excel 2003 include nel Menuú Strumenti il tool Scenari che consente di effettuare un analisi di tipo What If memorizzando in modo permanente le combinazioni di dati 1 La sintassi della funzione è =MATR.SOMMA.PRODOTTO(Blocco1,Blocco2) e moltiplica ogni cella del Blocco1 e del Blocco2 e somma il risultato. I blocchi devono avere la stessa dimensione, cioè stesso numero di righe e stesso numero di colonne. Nella versione inglese, la funzione è =SUMPROD- UCT(Block1,Block2). 203

209 Figura 13.2: Tabella Excel relativa al problema di Capital Budgeting. di input che sono state utilizzate. Supporta anche la generazione automatica di un Riepilogo Scenari che realizza un confronto affiancando i risultati.[4] Il tool Scenari presenta alcune limitazioni pratiche. In particolare i valori delle variabili di input devono essere inserite nel box di dialogo per gli input di scenario (vedi la figura 15.5), violando una delle buone regole di utilizzo di modelli per cui i dati devono essere SEPARATI dal modello. Un altro aspetto da sottolineare è l utilizzo del termine Celle Variabili per definire le celle per cui l utente fornisce un valore e che dunque giocano effettivamente il ruolo di parametri. Vedremo più avanti che lo stesso nome Celle Variabili è utilizzato nel Solutore per indicare le celle che sono cambiate dal tool stesso. Esempio di Capital Budgeting La tabella costruita fino a questo punto consente di fare semplici analisi di possibili scenari, modificando manualmente il valore delle variabili di decisione nel foglio Modello (celle B3, C3, D3) oppure della variabili di dati nel foglio Dati (celle B3±D4, B6). Nel primo caso, modifica delle variabili di decisione, si tratta di una formalizzazione del modello esaustivo descritto nell esempio È ovvio che i possibili scenari possono essere troppi per poterli analizzare tutti anche nel caso in cui siano finiti come nell esempio di Capital Budgeting che stiamo analizzando. In figura 15.4 è riportato il foglio Riepilogo scenari generato da Excel. Sono stati generati 3 diversi scenari al variare dei valori delle variabili e come valori di output sono stati scelti 204

210 Figura 13.3: Costruzione di uno scenario per il problema di Capital Budgeting. l investimento e il profitto. Volendo utilizzare il tool Scenari per un analisi della variazione della soluzione al variare dei dati e utilizzare il Riepilogo Scenari, è necessario prevedere un foglio che contenga dati e modello contemporaneamente. In queste dispense si preferisce rinunciare a questa possibilità e mantenere separati Dati e Modello Uso di Excel-Solver per la soluzione del modello matematico Microsoft Excel dispone di una funzione tra i Componenti aggiuntivi (Add-In) che è chiamata Solutore (Solver) che consente di determinare la soluzione ottima di problemi di Programmazione matematica (PL, PLI, e alcuni classi particolari di PNL). La procedura di ottimizzazione utilizzata per la PL è il metodo del simplesso. Non entreremo affatto nel merito delle procedure utilizzate per la PNL e la PLI. [5] Installazione Solutore. Il solutore è parte integrante di Excel. Si trova la voce Solutore sotto il menù Strumenti (Tools). Nel caso la voce Solutore non compaia nel menù Strumenti, deve essere installato procedendo come segue (vedi anche figura a fine capitolo): 205

211 Figura 13.4: Costruzione di uno scenario per il problema di Capital Budgeting. 1. dalla voce del menù Strumenti selezionare la voce Componenti aggiuntivi 2. selezionare Componente aggiuntivo Solutore e cliccare OK. Nel caso la voce Componente aggiuntivo Solutore non compaia nemmeno sotto la voce Componenti aggiuntivi, significa che Excel non è stato installato completamente ed è necessario avere il programma di setup di Excel. Per installazione e l utilizzo di Excel Office 2007, si veda [6]. Impostazione del modello per il Solutore. Dalla voce Strumenti selezionare Solutore. A questo punto appare la finestra Parametri del Risolutore illustrata in Figura Si tratta della finestra principale del Risolutore ed è utilizzata per identificare gli elementi che costituiscono il modello. Nella parte in alto a sinistra della finestra compare l etichetta Imposta cella obiettivo e una cella che deve contenere l indirizzo della cella della funzione obiettivo. Questa cella può essere editata oppure riempita con il corretto valore semplicemente cliccando sulla cella corrispondente sul foglio elettronico (N.B. La finestra Parametri del Risolutore può essere spostata in modo da rendere visibili le celle del file). Una volta impostata la cella obiettivo è necessario specificare se si tratta di un problema di massimizzazione o di minimizzazione, selezionando il tasto Max o Min nella riga successiva. Le variabili di decisione devono essere specificate indicando nella cella etichettata con Cambiando le celle (By Changing Cells) l indirizzo delle celle variabili. Anche in questo caso è 206

212 Figura 13.5: Costruzione di uno scenario per il problema di Capital Budgeting. possibile scrivere direttamente nella cella o riempirla selezionando sul foglio elettronico le celle variabili. Un intervallo di celle può essere specificato, scrivendo il valore della prima ed ultima cella separati da due punti. Ulteriori variabili non contigue possono essere aggiunte separate da virgola. I vincoli devono essere elencati nella sottofinestra Vincoli: (Subject to the Constraints). Selezionando il tasto Aggiungi(Add) compare la finestra Aggiungi vincolo rappresentata in figura I vincoli possono essere inseriti uno alla volta. Questo procedimento può però essere molto lungo nel caso di problemi con molti vincoli. in alternativa si possono inserire più vincoli insieme se sono adiacenti e se hanno lo stesso vincolo relazionale (cioè, oppure =). Il l.h.s del vincolo deve essere inserito nella cella con etichetta Riferimento:. Successivamente cliccando il tasto si apre una tendina che consente di specificare il tipo di vincolo. Il r.h.s. dei vincoli deve essere inserito nella finestra con etichetta Vincolo:. Si può inserire il valore della cella appropriata semplicemente cliccando sulla cella corrispondente nel foglio Excel. N.B. Il r.h.s. del vincolo immesso nel solutore DEVE esser un valore numerico e quindi non deve contenere funzioni. Tipicamente se erroneamente si inserisce una funzione nel r.h.s., excel Solver interpreta il modello come Non Lineare e applica procedure di ottimizzazione diverse dal simplesso non arrivando a convergere al minimo. Tra le possibili tipologie di vincoli compaiono anche le opzioni int e bin. Servono rispettivamente a specificare che le variabili possono assumere solo valori interi o binari. In questo caso nel 207

213 Seleziona la funzione max o min come richiesto dal problema Specifica la cella che contiene il valore della funzione obiettivo Clicca qui per risolvere il modello Clicca qui per uscire senza risolvere il modello Clicca qui per specificare il tipo di modello e I parametri del risolutore In quest area sono elencati tutti i vincoli del modello Indica le celle che contengono le variabili Clicca qui per aggiungere un nuovo vincolo Seleziona un vincolo e clicca qui per modificarlo Seleziona un vincolo e clicca qui per eliminarlo Figura 13.6: Finestra Parametri del Risolutore. campo Riferimento: devono essere inserite le variabili interessate, mentre il campo Vincolo: rimane vuoto. Nel nostro esempio le variabili sono binarie; questo vincolo può essere specificato in modo diretto indicando che le celle B7,C7,D7 sono binarie, oppure imponendo alle variabili la coppia di vincoli B7,C7,D7 0, B7,C7,D7 1 e specificando che si tratta di variabili intere. In Figura 15.8 è illustrata questa procedura. Notiamo che i vincoli di non negatività possono anche essere omessi in questa fase di specifica del modello; in questo caso devono però essere specificati tra le Opzioni del Solutore (vedi paragrafo successivo). Prima della soluzione del modello è necessario selezionare il tasto Opzioni sulla destra della finestra Parametri del Risolutore. Nel caso si stia risolvendo un problema di Programmazione Lineare (o di Programmazione Lineare Intera) è necessario selezionare l opzione Presupponi il modello lineare nella finestra Opzioni del Risolutore. È anche possibile specificare qui che le variabili sono non negative, se non è già stato specificato esplicitamente tra i vincoli del modello, selezionando l opzione Presupponi non negativo. Vedi la Figura 15.8 per i dettagli. A questo punto, uscendo dalla finestra con il tasto OK, l attuale impostazione delle opzioni del Solutore è salvata insieme con il foglio Excel e ne diventa parte integrante Soluzione di un modello di PL o PLI. Una volta definiti i parametri del Risolutore e settati i valori nelle Opzioni, si può tentare di risolvere il problema pigiando il tasto Risolvi (Solve). Quando il Solutore ha terminato il calcolo della soluzione ottima, compare la finestra Risultati del Solutore rappresentata in Figura Leggere i risultati di ottimizzazione Il messaggio in alto indica se il solutore è stato 208

214 Specifica la/e cella/e che contengono il l.h.s. del/dei vincolo/i Clicca qui per selezionare l espressione logica appropriata Specifica la/e cella/e che contengono il r.h.s. del/dei vincolo/i Clicca qui per definire l ultimo vincolo e ritornare alla finestra Parametri del Risolutore Clicca qui per tornare alla finestra Parametri del Risolutore senza aggiungere vincoli Microsoft Excel Help system Clicca qui per definire tutti eccetto l ultimo vincolo e ritornare alla Finestra Parametri del Risolutore Figura 13.7: Finestra Aggiungi Vincolo. in grado o meno di determinare la soluzione ottima del modello. Qualora non sia stato possibile determinare la soluzione ottima, è possibile cambiare alcune delle opzioni nella finestra Opzioni del Solutore per cercare di migliorare le prestazioni dell algoritmo. In particolare, si possono cambiare i valori di tempo massimo, iterazioni, approssimazione, tolleranza, convergenza che stabiliscono i termini per cui l algoritmo utilizzato dal Solutore si ferma. Cliccando il tasto OK, si torna al foglio Excel. Si verifica che il valore di alcune celle è stato modificato. In particolare le celle di decisione contengono il valore della soluzione (ottima) determinata dal Solutore, e la cella obiettivo contiene il corrispondente valore della funzione obiettivo. Anche il valore del l.h.s dei vincoli è calcolato utilizzando il valore corrente delle variabili di decisione. Cambiando i dati del modello, la soluzione ottima non viene automaticamente aggiornata. È quindi necessario far risolvere nuovamente il problema. La tabella Excel per il problema di capital Budgeting risolto è riportata in Figura Osserviamo che abbiamo risolto un problema di PLI. Excel-Solver è in grado di risolvere problemi di PLI di piccole dimensioni. Quando il numero di variabili è troppo alto, la determinazione della soluzione ottima, può richiedere troppo tempo o non convergere affatto Ulteriori informazioni fornite dal Solutore Tutti i software di PL forniscono un numero di informazioni aggiuntive oltre al valore ottimo 209

215 Parametri per algoritmo Seleziona questa opzione se le funzioni che definiscono vincoli e obiettivo sono lineari m Seleziona questa opzione se le variabili Sono vincolate ad essere non negative e non e` gia` stato specificato nei vincoli Parametri per modelli non lineari Figura 13.8: Opzioni del risolutore. delle variabili di decisione e della funzione obiettivo. Il Solver di Microsoft Excel produce tre fogli opzionali che sono: Rapporto valori, Rapporto sensibilità e Rapporto limiti. Da notare che il Rapporto sensibilità e il Rapporto limiti sono privi di significato per problemi a variabili intere, come sarà chiaro più avanti. Per questo motivo, illustreremo i risultati dei Rapporti non più per il problema di Capital budgeting, ma per il problema di Programmazione Lineare di allocazione ottima descritto nel Paragrafo Il modello matematico è max 7x x 2 x 1 + x x 1 + 2x x x 1 0, x 2 0 (13.1) relativo all allocazione ottima di due risorse e la sua soluzione con metodo grafico è stata determinata nel Esempio Una possibile rappresentazione in una tabella Excel è riportata in Impostando il modello nel solutore si determina la soluzione ottima. Nella tabella Excel, i valori iniziali delle celle variabili sono stati posti a (5, 6) T e la soluzione ottima è x (500, 250) T. I tre Rapporti possono essere richiesti una volta che il Solutore ha trovato la soluzione ottima del problema di PL. La richiesta deve essere fatta dalla finestra Risultato del Solutore (vedi Figura 15.9), selezionando nella parte in altro a destra il rapporto che si desidera generare. 210

216 Questo messaggio specifica se il Solutore ha trovato o no la soluzione ottima Selezionare il rapporto che si desidera generare Questo bottone specifica al Solutore se deve o non memorizzare il valore ottimo delle variabili e generare i rapporti selezionati nella finestra in alto a destra Annulla il risultato del Solutore e ripristina i valori originali nel foglio Excel Torna al foglio Excel Figura 13.9: Finestra Risultato del Solutore. Rapporto valori Il Rapporto valori per il problema di Allocazione ottima (15.1) è riportato in figura Il Rapporto valori è diviso in tre sezioni: funzione obiettivo, celle variabili, vincoli. Per quanto riguarda le prime sue sezioni, sono riportati i valori iniziali e i valori ottenuti dal Solutore. Nella sezione dedicata ai vincoli, per ogni vincolo oltre al valore del l.h.s. e alla relativa formula (in formato excel) fornisce indicazioni sullo stato. In particolare lo stato di un vincolo può essere Vincolante o Non Vincolante. Si intende che il vincolo è rispettivamente attivo (ovvero soddisfatto all uguaglianza) o non attivo (ovvero soddisfatto con la disuguaglianza stretta) nella soluzione ottima determinata dal Solutore. L ultima colonna della sezione dedicata ai vincoli Tolleranza è la differenza (slack) tra il valore del l.h.s e il valore del r.h.s.. Questa informazione è di interesse quando i vincoli si riferiscono ad una risorsa limitata (come nel caso dell esempio di allocazione ottima delle risorse). In questo caso infatti la Tolleranza indica quanta della risorsa disponibile non è stata utilizzata. Nell esempio 15.1, all ottimo sono attivi i vincoli x 1 + x 2 750, x 1 + 2x , mentre il vincolo x relativo alla disponibilità di preparato 3 è non attivo. Il valore della Tolleranza=150 che è la differenza tra la disponibilità di preparato 3 (=400) e la quantità utilizzata (=250). È ovvio che la soluzione ottima del problema (15.1) rimane invariata se la quantità disponibile di preparato 3 viene aumentata o ridotta fino al valore 250. Rapporto sensibilità e prezzi ombra L analisi di senibilità si occupa di valutare come la soluzione ottima di un problema di PL cambia al variare dei dati che definiscono l istanza 211

217 Figura 13.10: Risultato del Solutore per il problema di Capital budgeting. del problema sotto studio. Abbiamo affrontato questo problema nel paragrafo Qui ci limitiamo a descrivere il foglio prodotto dal Solver di Microsoft Excel. Il Rapporto sensibilità è generato da Excel su richiesta. Il file generato per il problema di allocazione ottima di risorse in è in figura Il rapporto è diviso in due parti. Nella parte superiore per ogni cella variabile è riportato il valor e della soluzione ottima. Se una variabile è nulla, significa che non è vantaggioso produrla. La colonna Costo ridotto di questa attività indica quanto maggiore dovrebbe essere il profitto per unità relativo a questa variabile affinché sia inserita nella soluzione ottima ad un valore non nullo. Se il costo ridotto relativo alla variabile x i è negativo pari a γ i, questo significa che il profitto relativo a quella variabile deve aumentare da c i (valore indicato in tabella nella colonna Coefficiente oggettivo) a c i + γ i perché esista una soluzione ottima con x i > 0. Le colonne aumento e decremento ammissibile corrispondono alla variazione in aumento o diminuzione per c i per cui la soluzione rimane ottima. D atra parte se una variabile è già positiva all ottimo, le colonne Incremento/Decremento consentito indicano quanto deve variare in più o in meno, il profitto relativo a quella cella variabile affinché la soluzione data non sia più ottima. Ad esempio nel problema di allocazione ottima di risorse in 2.4.1, la cella variabile $B$9 che corrisponde alla produzione di Colorante di tipo 1, l attuale coefficiente della funzione obiettivo è 7, mentre Incremento e Decremento consentiti sono rispettivamente 3 e 2. Questo significa che se il coefficiente c 1 della funzione obiettivo varia nell intervallo [5, 10] i cui estremi corrispondono 212

218 Figura 13.11: Tabella Excel relativa al problema di allocazione di risorse. a 7 2 e 7 + 3, la soluzione ottima rimane invariata. Se invece il coefficiente c 1 viene modificato ad un valore al di fuori dell intervallo [5, 10] la soluzione ottima cambia. Per sapere come cambia la soluzione è necessario risolvere nuovamente il modello con il Solutore. Il valore dell Incremento e Decremento consentiti può essere anche pari a 1.E + 30 (= ) intendendo in questo modo una valore grande a piacere. Si intende che il valore di profitto unitario puàumentare o diminuire senza limiti e la soluzione ottima non cambierà. Nella parte inferiore del Rapporto di sensibilità, ci sono tante righe quanti sono i vincoli (esclusi eventuali vincoli di limitazione inferiore e superiore delle variabili e in vincoli di non negatività). Per ogni vincolo nella colonna Valore finale è riportato il valore del l.h.s nella soluzione ottima, e il valore del r.h.s. nella colonna Vincolo a destra. Naturalmente se i valori del l.h.s. e r.h.s. coincidono significa che il vincolo è attivo nella soluzione ottima (vedi anche il Rapporto Valori). Un vincolo attivo sta ad indicare una risorsa utilizzata completamente, fino al limite massimo della sua disponibilità. Per queste risorse si può valutare se e quando può essere conveniente acquisire una maggiore quantità di risorsa. La colonna Prezzo ombra indica i valori dei prezzi ombra relativi a quella risorsa (vedi anche il paragrafo ). Nella tabella in figura relativa al problema di allocazione ottima di risorse 2.4.1, il prezzo ombra relativo al primo vincolo (corrispondente alla risorsa Preparato 1 ) è 4. Questo significa che ciascuna unità aggiuntiva di Preparato 1 al di sopra delle 750 già disponibili consente di aggiungere 4 al profitto totale. Naturalmente questa analisi è valida solo entro certi limiti espressi nelle colonne Incremento consentito e Decremento consentito. Nel caso del Preparato 1 questi limiti sono 213

219 Microsoft Excel 10.0 Rapporto valori Foglio di lavoro: [allocazione.xls]allocazione ottima di risorse Data di creazione: 28/04/ Cella obiettivo (Max) Cella Nome Valori originali Valore finale $B$19 profitto max Celle variabili Cella Nome Valori originali Valore finale $B$9 variabili di decisione colorante $C$9 variabili di decisione colorante Vincoli Cella Nome Valore della cella Formula Stato Tolleranza $B$14 preparato 1 utilizzato 750 $B$14<=$D$14 Vincolante 0 $B$15 preparato 2 utilizzato 1000 $B$15<=$D$15 Vincolante 0 $B$16 preparato 3 utilizzato 250 $B$16<=$D$16 Non vincolante 150 Figura 13.12: Rapporto Valori per il problema di allocazione ottima di risorse in e 150 rispettivamente. Questo significa che ogni unità aggiunta fino al massimo di 250 produce un incremento del profitto di 4 per unità, e ogni unità sottratta fino ad un massimo di 150 produce una diminuzione di profitto di 4 per unità. Al di fuori di questo range non è possibile utilizzare i prezzi ombra per prevedere cosa succede. L unico modo per verificare come si modifica la soluzione è di far risolvere nuovamente il modello con i nuovi dati. L analisi dei prezzi ombra è identica per ciascun vincolo attivo. Per i vincoli non attivi il valore del prezzo ombra è ovviamente nullo. Questo è sensato dal punto di vista economico; difatti poiché la risorsa non è stata utilizzata completamente (è inn eccesso) non è conveniente acquisire una maggiore quantità. IN questo caso l Incremento consentito è infinito, perché il prezzo ombra rimane nullo qualunque sia la quanità aggiuntiva. Il decremento consentito è però limitato (nel nostro esempio a 150), perché un eccessiva riduzione della risorsa può portarla ad essere vincolante. Il decremento massimo consentito è pari esattamente al valore di Tolleranza relativo al vincolo riportato nel Rapporto Valori. È importante ricordare che nell analisi che abbiamo fatto, è stato modificato un solo input alla volta.per sapere cosa succede modificando più input alla volta è necessario utilizzare il Solutore. 214

220 550 aumento di P3 a x * =(500,250) x * diminuzione di P3 a 250 (a) Aumento di risorsa Preparato 3 fino a 550 (b) Diminuzione di risorsa Preparato 3 fino a 250 Figura 13.13: Interpretazione grafica del cambiamento del valore della risorsa prepapato 3 del problema in Linee guida nell uso del Rapporto di sensibilità 1. Nella sezione relativa alle Celle variabili se una variabile è attualmente nulla, il suo costo ridotto indica quanto più vantaggiosa (ad esempio minor costo o maggior profitto) deve essere il suo coefficiente nella funzione obiettivo in modo che tale variabile risulti positiva nella soluzione ottima. 2. Nella sezione relativa alle Celle variabili se sono presenti dei vincoli di limitazione superiore o inferiore su una variabile, il suo costo ridotto indica quanto più svantaggiosa (ad esempio maggior costo o minor profitto) deve essere il suo coefficiente nella funzione obiettivo in modo che il valore di tale variabile sia diminuito. 3. Nella sezione relativa ai Vincoli, il valore del prezzo ombra indica di quanto aumenterebbe il valore della funzione obiettivo (per un problema di massimizzazione) per un incremento unitario del r.h.s. del vincolo corrispondente. Rapporto limiti 215

221 Microsoft Excel 10.0 Rapporto sensibilità Foglio di lavoro: [allocazione.xls]allocazione ottima di risorse Data di creazione: 28/04/ Celle variabili Valore ridotto oggettivo consentito consentito Cella Nome finale Costo Coefficiente Incremento Decremento $B$9 variabili di decisione colorante $C$9 variabili di decisione colorante Vincoli Valore ombra Vincolo consentito consentito Cella Nome finale Prezzo a destra Incremento Decremento $B$14 preparato 1 utilizzato $B$15 preparato 2 utilizzato $B$16 preparato 3 utilizzato E Figura 13.14: Rapporto Sensibilità per il problema di allocazione ottima di risorse in Il Rapporto limiti produce informazioni poco interessanti già presenti negli altri Rapporti. Non verranno discusse affatto. 216

222 Microsoft Excel 10.0 Rapporto limiti Foglio di lavoro: [allocazione.xls]rapporto limiti 1 Data di creazione: 28/04/ Obiettivo Cella Nome Valore $B$19 profitto max 6000 Variabile Limite Risultato Limite Risultato Cella Nome Valore inferiore obiettivo superiore obiettivo $B$9 variabili di decisione colorante $C$9 variabili di decisione colorante , , Figura 13.15: Rapporto Limiti per il problema di allocazione ottima di risorse in

223 Figura 13.16: Installazione del solutore in Excel. 218

Management Sanitario. Modulo di Ricerca Operativa 2 a lezione: un problema di assegnamento

Management Sanitario. Modulo di Ricerca Operativa 2 a lezione: un problema di assegnamento Management Sanitario per il corso di Laurea Magistrale SCIENZE RIABILITATIVE DELLE PROFESSIONI SANITARIE Modulo di Ricerca Operativa 2 a lezione: un problema di assegnamento Prof. Laura Palagi http://www.dis.uniroma1.it/

Dettagli

Introduzione alla Ricerca Operativa. Cos è la Ricerca Operativa? Modellazione di problemi decisionali Fasi di uno studio di RO Applicazioni della RO

Introduzione alla Ricerca Operativa. Cos è la Ricerca Operativa? Modellazione di problemi decisionali Fasi di uno studio di RO Applicazioni della RO Introduzione alla Ricerca Operativa Cos è la Ricerca Operativa? Modellazione di problemi decisionali Fasi di uno studio di RO Applicazioni della RO Cos è la Ricerca Operativa? La Ricerca Operativa è la

Dettagli

La Programmazione Matematica

La Programmazione Matematica Capitolo La Programmazione Matematica All interno della Ricerca Operativa, un ruolo di fondamentale importanza è svolto dalla Programmazione Matematica che è la disciplina che ha per oggetto lo studio

Dettagli

I Modelli della Ricerca Operativa

I Modelli della Ricerca Operativa Capitolo 1 I Modelli della Ricerca Operativa 1.1 L approccio modellistico Il termine modello è di solito usato per indicare una costruzione artificiale realizzata per evidenziare proprietà specifiche di

Dettagli

Anno Accademico Appunti dalle lezioni di RICERCA OPERATIVA. F. Facchinei S. Lucidi M. Roma

Anno Accademico Appunti dalle lezioni di RICERCA OPERATIVA. F. Facchinei S. Lucidi M. Roma Facoltà di Ingegneria Anno Accademico 2007 08 Appunti dalle lezioni di RICERCA OPERATIVA F. Facchinei S. Lucidi M. Roma Dipartimento di Informatica e Sistemistica A. Ruberti Corsi di Laurea in INGEGNERIA

Dettagli

anno accademico LEZIONI DI RICERCA OPERATIVA S. Lucidi M. Roma

anno accademico LEZIONI DI RICERCA OPERATIVA S. Lucidi M. Roma UNIVERSITÀ di ROMA LA SAPIENZA Corso di Laurea in Ingegneria Informatica Corso di Laurea in Ingegneria Gestionale anno accademico 2001 2002 LEZIONI DI RICERCA OPERATIVA S. Lucidi M. Roma Dipartimento di

Dettagli

3.3 FORMULAZIONE DEL MODELLO E CONDIZIONI DI

3.3 FORMULAZIONE DEL MODELLO E CONDIZIONI DI 3.3 FORMULAZIONE DEL MODELLO E CONDIZIONI DI ESISTENZA DI UN PUNTO DI OTTIMO VINCOLATO Il problema di ottimizzazione vincolata introdotto nel paragrafo precedente può essere formulato nel modo seguente:

Dettagli

Lezioni di Ricerca Operativa

Lezioni di Ricerca Operativa Lezioni di Ricerca Operativa Massimo Paolucci Dipartimento di Informatica, Sistemistica e Telematica (DIST) Università di Genova paolucci@dist.unige.it Anno accademico 2000/2001 La Ricerca Operativa (Operation

Dettagli

Ricerca Operativa. Docenti. 1. Introduzione

Ricerca Operativa. Docenti. 1. Introduzione Ricerca Operativa 1. Introduzione Docenti Luigi De Giovanni - Giacomo Zambelli Dipartimento di Matematica Pura e Applicata (Torre Archimede) Tel. 049 827 1349 / 1348 email: luigi - giacomo @math.unipd.it

Dettagli

Modelli e Metodi per la Simulazione (MMS)

Modelli e Metodi per la Simulazione (MMS) Modelli e Metodi per la Simulazione (MMS) adacher@dia.uniroma3.it Programma La simulazione ad eventi discreti, è una metodologia fondamentale per la valutazione delle prestazioni di sistemi complessi (di

Dettagli

Appendice A: un esempio di scelta del mix ottimo di produzione in presenza di vincoli 19

Appendice A: un esempio di scelta del mix ottimo di produzione in presenza di vincoli 19 14 18-12-07 19:04 Pagina 411 Le decisioni di breve termine fra alternative diverse 411 i minori costi differenziali, almeno nella misura in cui la dimensione di costo è la più importante. Sebbene i costi

Dettagli

LA RICERCA OPERATIVA. Richiami storici

LA RICERCA OPERATIVA. Richiami storici LA RICERCA OPERATIVA La ricerca operativa si occupa delle tecniche e dei metodi che sono di supporto alle decisioni in campo economico ed organizzativo. La ricerca operativa ha lo scopo di individuare

Dettagli

Ricerca operativa. Prof.ssa Nicolina Tocci

Ricerca operativa. Prof.ssa Nicolina Tocci Ricerca operativa Teoria delle decisioni Introduzione Uno dei fenomeni caratteristici di questo secolo è la rapida espansione delle organizzazioni umane, sia nelle loro dimensioni sia nella loro complessità.

Dettagli

Matematica Computazionale(6cfu) Ottimizzazione(8cfu) (a.a , lez.1)

Matematica Computazionale(6cfu) Ottimizzazione(8cfu) (a.a , lez.1) Docente: Marco Gaviano (e-mail:gaviano@unica.it) Corso di Laurea in Infomatica Corso di Laurea in Matematica Matematica Computazionale(6cfu) Ottimizzazione(8cfu) (a.a. 2013-14, lez.1) 1 Matematica Computazionale,

Dettagli

Ricerca Operativa. Docente. 1. Introduzione

Ricerca Operativa. Docente. 1. Introduzione Ricerca Operativa 1. Introduzione Docente Luigi De Giovanni Dipartimento di Matematica Pura e Applicata (Torre Archimede) uff. 427 Tel. 049 827 1349 email: luigi@math.unipd.it www.math.unipd.it/~luigi

Dettagli

Problemi di Flusso: Il modello del Trasporto

Problemi di Flusso: Il modello del Trasporto Problemi di Flusso: Il modello del rasporto Andrea Scozzari a.a. 2014-2015 April 27, 2015 Andrea Scozzari (a.a. 2014-2015) Problemi di Flusso: Il modello del rasporto April 27, 2015 1 / 25 Problemi su

Dettagli

Introduzione alla ricerca operativa Problemi e modelli

Introduzione alla ricerca operativa Problemi e modelli Problemi e modelli TFA Anno Accademico 2012-13 La metodologia della matematica applicata Problema reale Denizione del modello matematico Algoritmo risolutivo Analisi dei risultati Il problema reale Reperimento

Dettagli

Corso di Laurea in Ingegneria Gestionale. Anno Accademico Appunti dalle lezioni di. Introduzione ai Modelli di Programmazione Matematica

Corso di Laurea in Ingegneria Gestionale. Anno Accademico Appunti dalle lezioni di. Introduzione ai Modelli di Programmazione Matematica Corso di Laurea in Ingegneria Gestionale Anno Accademico 2010 2011 Appunti dalle lezioni di Introduzione ai Modelli di Programmazione Matematica S. Lucidi M. Roma Dipartimento di Informatica e Sistemistica

Dettagli

La dualità nella Programmazione Lineare

La dualità nella Programmazione Lineare Capitolo 3 La dualità nella Programmazione Lineare 3.1 Teoria della dualità Esercizio 3.1.1 Scrivere il problema duale del seguente problema di Programmazione Lineare: min x 1 x 2 + x 3 2x 1 +3x 2 3 x

Dettagli

Introduzione. Capitolo 1. 1.1 Breve storia della Ricerca Operativa

Introduzione. Capitolo 1. 1.1 Breve storia della Ricerca Operativa Capitolo Introduzione La Ricerca Operativa è una disciplina relativamente giovane. Il termine Ricerca Operativa è stato coniato in ambito militare verso la fine degli anni 3 e deriva dal termine inglese

Dettagli

Soluzione grafica di problemi PM in 2 variabili

Soluzione grafica di problemi PM in 2 variabili Capitolo 4 Soluzione grafica di problemi PM in 2 variabili In questo paragrafo si vuole fornire una interpretazione geometrica di un problema di Programmazione matematica. In particolare, quando un problema

Dettagli

Introduzione alla Ricerca Operativa

Introduzione alla Ricerca Operativa Introduzione alla Ricerca Operativa p. 1/31 Introduzione alla Ricerca Operativa Mariantonia Cotronei Facoltà di Ingegneria Università degli Studi Mediterranea di Reggio Calabria Introduzione alla Ricerca

Dettagli

Simulazione. D.E.I.S. Università di Bologna DEISNet

Simulazione. D.E.I.S. Università di Bologna DEISNet Simulazione D.E.I.S. Università di Bologna DEISNet http://deisnet.deis.unibo.it/ Introduzione Per valutare le prestazioni di un sistema esistono due approcci sostanzialmente differenti Analisi si basa

Dettagli

5.4.5 Struttura dell algoritmo ed esempi

5.4.5 Struttura dell algoritmo ed esempi CAPITOLO 5. IL METODO DEL SIMPLESSO 6 5.4.5 Struttura dell algoritmo ed esempi Come abbiamo già ampiamente osservato, la fase II del metodo del simplesso, a partire da una soluzione di base ammissibile,

Dettagli

Appunti su Indipendenza Lineare di Vettori

Appunti su Indipendenza Lineare di Vettori Appunti su Indipendenza Lineare di Vettori Claudia Fassino a.a. Queste dispense, relative a una parte del corso di Matematica Computazionale (Laurea in Informatica), rappresentano solo un aiuto per lo

Dettagli

PROBLEMI DI SCELTA dipendenti da due variabili d azione

PROBLEMI DI SCELTA dipendenti da due variabili d azione prof. Guida PROBLEMI DI SCELTA dipendenti da due variabili d azione in un problema di programmazione lineare, si ricorda che la funzione obiettivo z=f(x,y)=ax+by+c assume il suo valore massimo (o minimo)

Dettagli

Modelli di Ottimizzazione: definizione formale

Modelli di Ottimizzazione: definizione formale Modelli di Ottimizzazione: definizione formale Insieme delle possibili alternative Un criterio di ottimizzazione Soluzione ammissibile (Feasible) x appartiene ad un insieme F f: F funzione obiettivo finito

Dettagli

Metodi e Modelli per l Ottimizzazione Combinatoria Ripasso sulla Programmazione Lineare e il metodo del Simplesso (parte I)

Metodi e Modelli per l Ottimizzazione Combinatoria Ripasso sulla Programmazione Lineare e il metodo del Simplesso (parte I) Metodi e Modelli per l Ottimizzazione Combinatoria Ripasso sulla Programmazione Lineare e il metodo del Simplesso (parte I) Luigi De Giovanni Giacomo Zambelli 1 Problemi di programmazione lineare Un problema

Dettagli

Introduzione al Calcolo Scientifico

Introduzione al Calcolo Scientifico Introduzione al Calcolo Scientifico Francesca Mazzia Dipartimento di Matematica Università di Bari Francesca Mazzia (Univ. Bari) Introduzione al Calcolo Scientifico 1 / 14 Calcolo Scientifico Insieme degli

Dettagli

Corso di Matematica per la Chimica

Corso di Matematica per la Chimica Corso di Matematica per la Chimica Dott.ssa Maria Carmela De Bonis Dipartimento di Matematica, Informatica e Economia Università della Basilicata a.a. 2014-15 Introduzione La MATEMATICA è uno strumento

Dettagli

Flusso a Costo Minimo

Flusso a Costo Minimo Sapienza Università di Roma - Dipartimento di Ingegneria Informatica, Automatica e Gestionale Flusso a Costo Minimo Docente: Renato Bruni bruni@dis.uniroma.it Corso di: Ottimizzazione Combinatoria Dal

Dettagli

ESERCIZI MATEMATICA GENERALE - Canale III

ESERCIZI MATEMATICA GENERALE - Canale III ESERCIZI MATEMATICA GENERALE - Canale III Vettori Prof. A. Fabretti 1 A.A. 009/010 1 Dati in R i vettori v = (1,,, u = (,, 1 e w = (,, calcolare: a la combinazione lineare u + v + 4 w b il prodotto scalare

Dettagli

Corso di Calcolo Numerico

Corso di Calcolo Numerico Corso di Calcolo Numerico Dott.ssa M.C. De Bonis Università degli Studi della Basilicata, Potenza Facoltà di Ingegneria Corso di Laurea in Ingegneria Meccanica Risoluzione di Equazioni Algebriche Le equazioni

Dettagli

Programmazione Lineare Intera: Piani di Taglio

Programmazione Lineare Intera: Piani di Taglio Programmazione Lineare Intera: Piani di Taglio Andrea Scozzari a.a. 2014-2015 April 22, 2015 Andrea Scozzari (a.a. 2014-2015) Programmazione Lineare Intera: Piani di Taglio April 22, 2015 1 / 23 Programmazione

Dettagli

Dispense del corso RICERCA OPERATIVA. per i corsi di Laurea in Ingegneria BTRR e MMER. a cura di Laura Palagi. www.dis.uniroma1.

Dispense del corso RICERCA OPERATIVA. per i corsi di Laurea in Ingegneria BTRR e MMER. a cura di Laura Palagi. www.dis.uniroma1. Dispense del corso RICERCA OPERATIVA per i corsi di Laurea in Ingegneria BTRR e MMER a cura di Laura Palagi www.dis.uniroma1.it/~ palagi 12 Dicembre 2011 teoremi/dimostrazioni non in programma 1. dimostrazione

Dettagli

Modelli di Ottimizzazione

Modelli di Ottimizzazione Capitolo 2 Modelli di Ottimizzazione 2.1 Introduzione In questo capitolo ci occuperemo più nel dettaglio di quei particolari modelli matematici noti come Modelli di Ottimizzazione che rivestono un ruolo

Dettagli

Ricerca Operativa. Docente. 1. Introduzione

Ricerca Operativa. Docente. 1. Introduzione 1 Ricerca Operativa 1. Introduzione Docente Luigi De Giovanni Dipartimento di Matematica (Torre Archimede) uff. 427 Tel. 049 827 1349 email: luigi@math.unipd.it www.math.unipd.it/~luigi Ricevimento: giovedì,

Dettagli

2.6 Calcolo degli equilibri di Nash

2.6 Calcolo degli equilibri di Nash 92 2 Giochi non Cooperativi Per queste estensioni di giochi non finiti si possono provare risultati analoghi a quelli visti per i giochi finiti. Rimandiamo alla bibliografia per uno studio più approfondito

Dettagli

Matematica per le Applicazioni Economiche I (M-P)

Matematica per le Applicazioni Economiche I (M-P) Matematica per le Applicazioni Economiche I (M-P) Corsi di Laurea in Economia Aziendale, Economia e Commercio, a.a. 06-7 Esercizi su Calcolo Differenziale. Per la seguente funzione, dato 0, si utilizzi

Dettagli

Esercitazione n o 6 per il corso di Ricerca Operativa

Esercitazione n o 6 per il corso di Ricerca Operativa Esercitazione n o 6 per il corso di Ricerca Operativa Il problema è stato tratto dal libro C. Mannino, L.Palagi, M. Roma. Complementi ed esercizi di Ricerca Operativa, Edizioni Ingegneria 2000, 1998, ISBN:

Dettagli

M. Marra Appunti delle Lezioni di Ricerca Operativa Problemi e metodi di ottimizzazione PROBLEMI E METODI DI OTTIMIZZAZIONE

M. Marra Appunti delle Lezioni di Ricerca Operativa Problemi e metodi di ottimizzazione PROBLEMI E METODI DI OTTIMIZZAZIONE CAPITOLO I PROBLEMI E METODI DI OTTIMIZZAZIONE 1. Componenti di base Tutti i problemi di ottimizzazione dipendono da tre componenti di base: le variabili del problema, la funzione obiettivo ed i vincoli.

Dettagli

Area di Istruzione Generale Attività e Insegnamenti Generali. Disciplina: MATEMATICA

Area di Istruzione Generale Attività e Insegnamenti Generali. Disciplina: MATEMATICA Area di Istruzione Generale Attività e Insegnamenti Generali Disciplina: MATEMATICA PRIMO BIENNIO Padroneggiare le tecniche e le procedure del calcolo aritmetico ed algebrico e saperle applicare in contesti

Dettagli

Laboratorio. Ricerca Operativa

Laboratorio. Ricerca Operativa Facoltà di Ingegneria dell Informazione, Informatica e Statistica Corso di Laurea in Ingegneria Gestionale Appunti dalle lezioni del corso di Laboratorio di Ricerca Operativa Massimo Roma Dipartimento

Dettagli

COME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI

COME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI COME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI In questa Appendice, mostreremo come un impresa possa individuare la sua combinazione di minimo costo dei fattori produttivi attraverso il calcolo

Dettagli

Segmentazione del mercato tramite menù di contratti nel settore del software

Segmentazione del mercato tramite menù di contratti nel settore del software Segmentazione del mercato tramite menù di contratti nel settore del software La segmentazione del mercato basata su differenze qualitative di prodotto è diffusa nel settore del software. Questa consiste

Dettagli

LEZIONE N. 6 - PARTE 1 - Introduzione

LEZIONE N. 6 - PARTE 1 - Introduzione LEZIONE N. 6 PROGRAMMAZIONE LINEARE IN MARKAL, SOLUZIONE DEI PROBLEMI DI PROGRAMMAZIONE LINEARE CON: IL METODO GRAFICO ED IL METODO DEL SIMPLESSO. PROPRIETÀ DELLA DUALITÀ ED ESEMPI DI SOLUZIONE DEL PROBLEMA

Dettagli

Algoritmo di Branch & Bound

Algoritmo di Branch & Bound Sapienza Università di Roma - Dipartimento di Ingegneria Informatica, Automatica e Gestionale Algoritmo di Branch & Bound Docente: Renato Bruni bruni@dis.uniroma.it Corso di: Ottimizzazione Combinatoria

Dettagli

Ist. di economia, Corso di Laurea in Ing. Gestionale, I canale (A-L), A.A Prof. R. Sestini SCHEMA DELLE LEZIONI DELLA QUINTA SETTIMANA

Ist. di economia, Corso di Laurea in Ing. Gestionale, I canale (A-L), A.A Prof. R. Sestini SCHEMA DELLE LEZIONI DELLA QUINTA SETTIMANA Ist. di economia, Corso di Laurea in Ing. Gestionale, I canale (A-L), A.A. 2014-2015. Prof. R. Sestini SCHEMA DELLE LEZIONI DELLA QUINTA SETTIMANA TEORIA DELL IMPRESA Il modello di comportamento dell impresa

Dettagli

Corso di Modelli e Algoritmi della Logistica

Corso di Modelli e Algoritmi della Logistica Corso di Modelli e Algoritmi della Logistica Modelli e Algoritmi della Logistica Prof. Antonio Sassano Dipartimento di Informatica e Sistemistica Universita di Roma La Sapienza Roma 1 - Ottobre - 2003

Dettagli

RICERCA OPERATIVA. Tema d esame del 04/03/2008 (Simulazione)

RICERCA OPERATIVA. Tema d esame del 04/03/2008 (Simulazione) RICERCA OPERATIVA Tema d esame del 04/03/2008 (Simulazione) COGNOME: NOME: MATRICOLA:. Una nota azienda automobilistica produce due modelli di auto (un utilitaria e una berlina), che rivende con un guadagno

Dettagli

ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE ELENA DI SAVOIA PIERO CALAMANDREI BARI. ISTITUTO TECNOLOGICO CHIMICO Ambientale e Sanitario

ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE ELENA DI SAVOIA PIERO CALAMANDREI BARI. ISTITUTO TECNOLOGICO CHIMICO Ambientale e Sanitario ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE ELENA DI SAVOIA PIERO CALAMANDREI BARI ISTITUTO TECNOLOGICO CHIMICO Ambientale e Sanitario DIPARTIMENTO MATEMATICO-INFORMATICO anno scolastico 2013/2014 Testo

Dettagli

Argomento 7. Studio di funzione

Argomento 7. Studio di funzione Argomento 7 Studio di funzione Studiare una funzione significa ottenere, mediante strumenti analitici (iti, derivate, ecc.) informazioni utili a disegnare un grafico qualitativo della funzione data. I

Dettagli

Introduzione alla RO - Parte II

Introduzione alla RO - Parte II Introduzione alla RO - Parte II Andrea Scozzari a.a. 2013-2014 March 7, 2014 Andrea Scozzari (a.a. 2013-2014) Introduzione alla RO - Parte II March 7, 2014 1 / 18 Problema della pianificazione del personale:

Dettagli

Metodi e Modelli per l Ottimizzazione Combinatoria Cover inequalities

Metodi e Modelli per l Ottimizzazione Combinatoria Cover inequalities Metodi e Modelli per l Ottimizzazione Combinatoria Cover inequalities L. De Giovanni M. Di Summa In questa lezione introdurremo una classe di disuguaglianze, dette cover inequalities, che permettono di

Dettagli

Esercizi svolti di Programmazione Lineare. a cura di Laura Scrimali Dipartimento di Matematica e Informatica Università di Catania

Esercizi svolti di Programmazione Lineare. a cura di Laura Scrimali Dipartimento di Matematica e Informatica Università di Catania Esercizi svolti di Programmazione Lineare a cura di Laura Scrimali Dipartimento di Matematica e Informatica Università di Catania Formulazione matematica e risoluzione grafica Esercizio Una pasticceria

Dettagli

Programmazione Lineare: problema del trasporto Ing. Valerio Lacagnina

Programmazione Lineare: problema del trasporto Ing. Valerio Lacagnina Problemi di trasporto Consideriamo un problema di programmazione lineare con una struttura matematica particolare. Si può utilizzare, per risolverlo, il metodo del simplesso ma è possibile realizzare una

Dettagli

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara Sistemi lineari Lorenzo Pareschi Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara http://utenti.unife.it/lorenzo.pareschi/ lorenzo.pareschi@unife.it Lorenzo Pareschi (Univ. Ferrara)

Dettagli

NOTE DI MATEMATICA APPLICATA ALL ECONOMIA

NOTE DI MATEMATICA APPLICATA ALL ECONOMIA NOTE DI MATEMATICA APPLICATA ALL ECONOMIA «[ ] lo scopo dell analisi infinitesimale è quello di fare acquisire strumenti di calcolo atti alla ricerca ottimale di funzioni vincolate, soprattutto di natura

Dettagli

Esercizi di ottimizzazione vincolata

Esercizi di ottimizzazione vincolata Esercizi di ottimizzazione vincolata A. Agnetis, P. Detti Esercizi svolti 1 Dato il seguente problema di ottimizzazione vincolata max x 1 + x 2 x 1 4x 2 3 x 1 + x 2 2 0 x 1 0 studiare l esistenza di punti

Dettagli

FONDAMENTI DI RICERCA OPERATIVA D / E

FONDAMENTI DI RICERCA OPERATIVA D / E Ingegneria Informatica e Ingegneria Matematica FONDAMENTI DI RICERCA OPERATIVA D / E Edoardo Amaldi DEI - Politecnico di Milano amaldi@elet.polimi.it Sito web: http://home.dei.polimi.it/amaldi/fro-de-08-09.html

Dettagli

NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE

NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE ROBERTO GIAMBÒ 1. DEFINIZIONI E PRIME PROPRIETÀ In queste note saranno presentate alcune proprietà principali delle funzioni convesse di una variabile

Dettagli

OTTIMIZZAZIONE LINEARE MULTICRITERIO

OTTIMIZZAZIONE LINEARE MULTICRITERIO OTTIMIZZAZIONE LINEARE MULTICRITERIO NOTAZIONE Siano x ed y vettori di R n indicati estesamente con x x x x 1 Μ i Μ n, y y1 Μ yi Μ y n e si ponga N = {1,2,, n}. Scriveremo allora: x y ( x è diverso da

Dettagli

PROGRAMMAZIONE DISCIPLINARE ISTITUTO TECNICO MATEMATICA. Competenze da conseguire alla fine del IV anno relativamente all asse culturale:

PROGRAMMAZIONE DISCIPLINARE ISTITUTO TECNICO MATEMATICA. Competenze da conseguire alla fine del IV anno relativamente all asse culturale: PROGRAMMAZIONE DISCIPLINARE PROGRAMMAZIONE DISCIPLINARE ISTITUTO TECNICO MATEMATICA Competenze da conseguire alla fine del IV anno relativamente all asse culturale: C O M P E T E N Z E ASSE DEI LINGUAGGI

Dettagli

10 - Applicazioni del calcolo differenziale

10 - Applicazioni del calcolo differenziale Università degli Studi di Palermo Facoltà di Economia CdS Sviuppo Economico e Cooperazione Internazionale Appunti del corso di Matematica 10 - Applicazioni del calcolo differenziale Anno Accademico 2015/2016

Dettagli

Programmazione Lineare

Programmazione Lineare Programmazione Lineare Andrea Scozzari a.a. 2012-2013 March 14, 2013 Andrea Scozzari (a.a. 2012-2013) Programmazione Lineare March 14, 2013 1 / 18 Metodo del Simplesso Dato un problema di PL in forma standard

Dettagli

percorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione

percorso 4 Estensione on line lezione 2 I fattori della produzione e le forme di mercato La produttività La produzione Estensione on line percorso 4 I fattori della produzione e le forme di mercato lezione 2 a produzione a produttività Una volta reperiti i fattori produttivi necessari l imprenditore dovrà decidere come

Dettagli

LA STRUTTURA DEI PROBLEMI DI OTTIMIZZAZIONE. L'ipotesi di razionalità implica che un decisore cerchi di

LA STRUTTURA DEI PROBLEMI DI OTTIMIZZAZIONE. L'ipotesi di razionalità implica che un decisore cerchi di LA STRUTTURA DEI PROBLEMI DI OTTIMIZZAZIONE L'ipotesi di razionalità implica che un decisore cerchi di individuare la migliore tra tutte le alternative a sua disposizione. Problemi di ottimizzazione =

Dettagli

Ricerca Operativa definizione data dall O.R.S.A. : (Operations Research Society of America)

Ricerca Operativa definizione data dall O.R.S.A. : (Operations Research Society of America) Ricerca Operativa definizione data dall O.R.S.A. : (Operations Research Society of America) "È il procedimento della scienza moderna di fronte ai complessi problemi di scelta che sorgono nella direzione

Dettagli

LEZIONE 3. a + b + 2c + e = 1 b + d + g = 0 3b + f + 3g = 2. a b c d e f g

LEZIONE 3. a + b + 2c + e = 1 b + d + g = 0 3b + f + 3g = 2. a b c d e f g LEZIONE 3 3.. Matrici fortemente ridotte per righe. Nella precedente lezione abbiamo introdotto la nozione di soluzione di un sistema di equazioni lineari. In questa lezione ci poniamo il problema di descrivere

Dettagli

LA PROGRAMMAZIONE MATEMATICA (p.m.)

LA PROGRAMMAZIONE MATEMATICA (p.m.) LA PROGRAMMAZIONE MATEMATICA (p.m.) Un problema di programmazione matematica è un problema di ottimizzazione riconducibile alla seguente espressione generale: ricercare i valori delle variabili x 1, x

Dettagli

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Dettagli

PROGRAMMAZIONE LINEARE E DUALITA'

PROGRAMMAZIONE LINEARE E DUALITA' PROGRAMMAZIONE LINEARE E DUALITA' 1) Dati i punti di R 2 (1, 2), (1, 4), (2, 3), (3, 5), (4, 1), (4, 2), (5, 5), (6, 2), (6, 5). Determinare graficamente: A - L'involucro convesso di tali punti. B - Quali

Dettagli

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III) Derivazione numerica Introduzione al calcolo numerico Il calcolo della derivata di una funzione in un punto implica un processo al limite che può solo essere approssimato da un calcolatore. Supponiamo

Dettagli

Istituto d Istruzione Secondaria Superiore M.BARTOLO. A cura del Prof S. Giannitto

Istituto d Istruzione Secondaria Superiore M.BARTOLO. A cura del Prof S. Giannitto Istituto d Istruzione Secondaria Superiore M.BARTOLO PACHINO (SR) APPUNTI DI SISTEMI AUTOMATICI 3 ANNO I SISTEMI DI CONTROLLO A cura del Prof S. Giannitto SISTEMI DI CONTROLLO Cosa si intende per sistema

Dettagli

Introduzione soft alla matematica per l economia e la finanza. Marta Cardin, Paola Ferretti, Stefania Funari

Introduzione soft alla matematica per l economia e la finanza. Marta Cardin, Paola Ferretti, Stefania Funari Introduzione soft alla matematica per l economia e la finanza Marta Cardin, Paola Ferretti, Stefania Funari Capitolo Sistemi di equazioni lineari.8 Il Teorema di Cramer Si consideri un generico sistema

Dettagli

Allegati dpr 89/2010 e d.m. 211/2010

Allegati dpr 89/2010 e d.m. 211/2010 DIPARTIMENTO MATEMATICA INDIRIZZO Servizi per l enogastronomia e l ospitalità alberghiera Programmazione disciplinare condivisa PRIMO BIENNIO Allegati dpr 89/2010 e d.m. 211/2010 DISCIPLINA MATEMATICA

Dettagli

Programmazione disciplinare per competenze (Rif.to ALLEGATI del DPR 15 marzo 2010 n. 89)

Programmazione disciplinare per competenze (Rif.to ALLEGATI del DPR 15 marzo 2010 n. 89) Programmazione disciplinare per competenze (Rif.to ALLEGATI del DPR 15 marzo 2010 n. 89) Secondo biennio Indirizzo: IPSSAR Disciplina: MATEMATICA 1. 1 Asse culturale: matematico 1. utilizzare il linguaggio

Dettagli

L allocazione ottima delle commesse in contesti multi-aziendali

L allocazione ottima delle commesse in contesti multi-aziendali L allocazione ottima delle commesse in contesti multi-aziendali Maria Silvia Pini Resp. accademico: Prof.ssa Francesca Rossi Università di Padova Attività FSE DGR 1102/2010 La gestione dell informazione

Dettagli

Queste note (attualmente, e probabilmente per un bel po ) sono altamente provvisorie e (molto probabilmente) non prive di errori.

Queste note (attualmente, e probabilmente per un bel po ) sono altamente provvisorie e (molto probabilmente) non prive di errori. ËÁËÌ ÅÁ ÈÁ ÆÁ ½ Queste note attualmente e probabilmente per un bel po ) sono altamente provvisorie e molto probabilmente) non prive di errori 41 Sistemi 2D Come abbiamo già detto tipicamente è impossibile

Dettagli

Universita degli Studi di Siena

Universita degli Studi di Siena Universita degli Studi di Siena Facolta di Ingegneria Dispense del corso di Sistemi di Supporto alle Decisioni I L algoritmo per la risoluzione di problemi di programmazione dinamica Chiara Mocenni Corso

Dettagli

Sviluppo di programmi

Sviluppo di programmi Sviluppo di programmi Per la costruzione di un programma conviene: 1. condurre un analisi del problema da risolvere 2. elaborare un algoritmo della soluzione rappresentato in un linguaggio adatto alla

Dettagli

Metodi & Modelli per le Scelte Economiche

Metodi & Modelli per le Scelte Economiche Metodi & Modelli per le Scelte Economiche [domande di teoria utilizzate in passato per la prova scritta le soluzioni NON vengono fornite, occorrerà quindi verificare la esattezza delle diverse possibili

Dettagli

PROGRAMMAZIONE DIDATTICA DI MATEMATICA PER LA CLASSE IV A. a.s Indirizzo odontotecnico

PROGRAMMAZIONE DIDATTICA DI MATEMATICA PER LA CLASSE IV A. a.s Indirizzo odontotecnico I.P.S.S.S E. DE AMICIS - ROMA PROGRAMMAZIONE DIDATTICA DI MATEMATICA PER LA CLASSE IV A a.s. 2014-2015 Indirizzo odontotecnico Docente : Prof. Paolo Bruschi FINALITA EDUCATIVE Vengono proposte le seguenti

Dettagli

LEZIONE 2. ( ) a 1 x 1 + a 2 x a n x n = b, ove a j, b R sono fissati.

LEZIONE 2. ( ) a 1 x 1 + a 2 x a n x n = b, ove a j, b R sono fissati. LEZIONE 2 2 Sistemi di equazioni lineari Definizione 2 Un equazione lineare nelle n incognite x, x 2,, x n a coefficienti reali, è un equazione della forma (2 a x + a 2 x 2 + + a n x n = b, ove a j, b

Dettagli

Teoria della Programmazione Lineare Intera

Teoria della Programmazione Lineare Intera 0 Teoria della Programmazione Lineare Intera 0. INTRODUZIONE Come visto precedentemente, molti problemi particolarmente importanti dal punto di vista applicativo sono riconducibili alla soluzione di un

Dettagli

Possibile applicazione

Possibile applicazione p. 1/4 Assegnamento Siano dati due insiemi A e B entrambi di cardinalità n. Ad ogni coppia (a i,b j ) A B è associato un valore d ij 0 che misura la "incompatibilità" tra a i e b j, anche interpretabile

Dettagli

RENDITE. Ricerca del tasso di una rendita

RENDITE. Ricerca del tasso di una rendita RENDITE Ricerca del tasso di una rendita Un problema che si presenta spesso nelle applicazioni è quello di calcolare il tasso di interesse associato a una rendita quando siano note le altre grandezze 1

Dettagli

La simulazione è l'imitazione di un processo o di un sistema reale per un

La simulazione è l'imitazione di un processo o di un sistema reale per un 1 2 La simulazione è l'imitazione di un processo o di un sistema reale per un determinato periodo di tempo. La simulazione è l'imitazione di un processo o di un sistema reale per un determinato periodo

Dettagli

Problema. Equazioni non lineari. Metodo grafico. Teorema. Cercare la soluzione di

Problema. Equazioni non lineari. Metodo grafico. Teorema. Cercare la soluzione di Problema Cercare la soluzione di Equazioni non lineari dove Se è soluzione dell equazione, cioè allora si dice RADICE o ZERO della funzione Metodo grafico Graficamente si tratta di individuare l intersezione

Dettagli

Il Concetto Intuitivo di Calcolatore. Esercizio. I Problemi e la loro Soluzione. (esempio)

Il Concetto Intuitivo di Calcolatore. Esercizio. I Problemi e la loro Soluzione. (esempio) Il Concetto Intuitivo di Calcolatore Elementi di Informatica e Programmazione Ingegneria Gestionale Università degli Studi di Brescia Docente: Prof. Alfonso Gerevini Variabile di uscita Classe di domande

Dettagli

Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone

Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone Sintesi Sequenziale Sincrona Sintesi Comportamentale di reti Sequenziali Sincrone Il problema dell assegnamento degli stati versione del 9/1/03 Sintesi: Assegnamento degli stati La riduzione del numero

Dettagli

Corso di Laurea Specialistica in Ingegneria Meccanica e Ingegneria Energetica Progetto numerico al calcolatore

Corso di Laurea Specialistica in Ingegneria Meccanica e Ingegneria Energetica Progetto numerico al calcolatore Corso di Laurea Specialistica in Ingegneria Meccanica e Ingegneria Energetica Progetto numerico al calcolatore Soluzione di un sistema non lineare con la Regula Falsi generalizzata per la determinazione

Dettagli

Ricerca Operativa. Ricerca Operativa p. 1/6

Ricerca Operativa. Ricerca Operativa p. 1/6 Ricerca Operativa Ricerca Operativa p. 1/6 Ricerca Operativa Disciplina basata sulla modellizzazione e la risoluzione tramite strumenti automatici di problemi di decisione complessi. In tali problemi la

Dettagli

Complementi di Analisi Matematica Ia. Carlo Bardaro

Complementi di Analisi Matematica Ia. Carlo Bardaro Complementi di Analisi Matematica Ia Carlo Bardaro Capitolo 1 Elementi di topologia della retta reale 1.1 Intorni, punti di accumulazione e insiemi chiusi Sia x 0 IR un fissato punto di IR. Chiameremo

Dettagli

Ricerca Operativa A.A. 2007/ Introduzione

Ricerca Operativa A.A. 2007/ Introduzione Ricerca Operativa A.A. 2007/2008 1. Introduzione Docente Luigi De Giovanni Dipartimento di Matematica Pura e Applicata (Torre Archimede) uff. 419 Tel. 049 827 1349 email: luigi@math.unipd.it www.math.unipd.it/~luigi

Dettagli

04 - Logica delle dimostrazioni

04 - Logica delle dimostrazioni Università degli Studi di Palermo Facoltà di Economia CdS Sviluppo Economico e Cooperazione Internazionale Appunti del corso di Matematica 04 - Logica delle dimostrazioni Anno Accademico 013/014 D. Provenzano,

Dettagli

Prerequisiti didattici

Prerequisiti didattici Università degli Studi di Ferrara 2014-2015 Corso TFA - A048 Matematica applicata Didattica della matematica applicata all economia e alla finanza 1 aprile 2015 Appunti di didattica della matematica applicata

Dettagli

Massimi e minimi vincolati

Massimi e minimi vincolati Massimi e minimi vincolati Data una funzione G C 1 (D), dove D è un aperto di R 2, sappiamo bene dove andare a cercare gli eventuali punti di massimo e minimo relativi. Una condizione necessaria affinché

Dettagli

Introduzione al Metodo del Simplesso. 1 Soluzioni di base e problemi in forma standard

Introduzione al Metodo del Simplesso. 1 Soluzioni di base e problemi in forma standard Introduzione al Metodo del Simplesso Giacomo Zambelli 1 Soluzioni di base e problemi in forma standard Consideriamo il seguente problema di programmazione lineare (PL), relativo all esempio di produzione

Dettagli

Corso di Laurea Ingegneria Civile

Corso di Laurea Ingegneria Civile Corso di Laurea Ingegneria Civile Presentazione del corso di Fondamenti di Informatica Dm. 270 6 cfu Carla Limongelli Marzo 2010 1 Benvenuti!!! 2 Docenti del corso Prof. Carla Limongelli limongel@dia.uniroma3.it

Dettagli