Esercizi su ottimizzazione vincolata

Documenti analoghi
Esercizi di ottimizzazione vincolata

Massimi e minimi vincolati

Massimi e minimi vincolati

Note sulle funzioni convesse/concave

Programmazione Lineare

Geometria della programmazione lineare

COME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI

Il metodo del simplesso

NOTE SULLE FUNZIONI CONVESSE DI UNA VARIABILE REALE

2.6 Calcolo degli equilibri di Nash

Corso di Laurea in Chimica e Tecnologia Farmaceutiche Matematica con Elementi di Informatica COMPITO 19 Febbraio 2016

Rilassamento Lagrangiano

Metodi e Modelli per l Ottimizzazione Combinatoria Ripasso sulla Programmazione Lineare e il metodo del Simplesso (parte I)

Parte V: Rilassamento Lagrangiano

Ricerca Operativa. G. Liuzzi. Lunedí 20 Aprile 2015

Estremi. 5. Determinare le dimensioni di una scatola rettangolare di volume v assegnato, che abbia la superficie minima.

Appunti sul corso di Complementi di Matematica mod. Analisi prof. B.Bacchelli - a.a. 2010/2011.

Problemi lineari equivalenti

1) Applicando la definizione di derivata, calcolare la derivata in x = 0 delle funzioni: c) x + 1 d)x sin x.

Introduzione al Metodo del Simplesso. 1 Soluzioni di base e problemi in forma standard

Massimi e minimi relativi in R n

Massimo e minimo limite di successioni

Introduzione alla programmazione lineare

Estremi vincolati, Teorema del Dini.

Rilassamento Lagrangiano

Soluzione grafica di problemi PM in 2 variabili

Appunti su Indipendenza Lineare di Vettori

Il modello duale. Capitolo settimo. Introduzione

Calcolo Numerico con elementi di programmazione

SOTTOSPAZI E OPERAZIONI IN SPAZI DIVERSI DA R n

Teorema delle Funzioni Implicite

Esercitazione n 6. Esercizio 1: Determinare i punti di massimo e minimo relativo delle seguenti funzioni: (b)f(x, y) = 4y 4 16x 2 y + x

Equazioni esponenziali e logaritmi

a) Determinare il dominio, i limiti agli estremi del dominio e gli eventuali asintoti di f. Determinare inoltre gli zeri di f e studiarne il segno.

Metodi per la risoluzione di sistemi lineari

LUISS Laurea specialistica in Economia e Finanza Anno Accademico 2010/2011

4.11 Massimi e minimi relativi per funzioni di più variabili

Programmazione Non Lineare Ottimizzazione vincolata

Corso di Matematica Applicata A.A

Esercitazione di Analisi Matematica II

RETTE E PIANI. ove h R. Determinare i valori di h per cui (1) r h e α sono incidenti ed, in tal caso, determinare l angolo ϑ h da essi formato;

Matematica Finanziaria 29 novembre 2000

Capitolo 3: Ottimizzazione non vincolata parte III. E. Amaldi DEI, Politecnico di Milano

Domande d esame. Ricerca Operativa. G. Liuzzi. Giovedí 14 Maggio Istituto di Analisi dei Sistemi ed Informatica IASI - CNR

Le derivate parziali

RICERCA OPERATIVA. Tema d esame del 04/03/2008 (Simulazione)

1 Ampliamento del piano e coordinate omogenee

Sviluppi e derivate delle funzioni elementari

Soluzione dei Problemi di Programmazione Lineare

Figura 1: 1) Si scriva la formulazione del problema come problema di PLI (con un numero minimo di vincoli) e la matrice dei vincoli.

( ) le colonne della matrice dei coefficienti, con. , risulta A 3 = A 1 + 4A 2 + 4A 5, A 4 = A 1 + A 2,

2. ALGORITMO DEL SIMPLESSO

RETTE E PIANI NELLO SPAZIO

5.3 Metodo dei piani di taglio

Risoluzione di sistemi lineari sparsi e di grandi dimensioni

Esercizi svolti sugli integrali

FONDAMENTI DI ALGEBRA LINEARE E GEOMETRIA

Introduzione al Metodo agli Elementi Finiti (FEM) (x, y) Γ Tale formulazione viene detta Formulazione forte del problema.

ANALISI B alcuni esercizi proposti

Funzioni derivabili (V. Casarino)

Il teorema di Lagrange e la formula di Taylor

ANALISI MATEMATICA PER IL CdL IN INFORMATICA ESERCIZI SULLE DISEQUAZIONI

FUNZIONI E INSIEMI DI DEFINIZIONE

SISTEMI LINEARI MATRICI E SISTEMI 1

FUNZIONI. }, oppure la

Risposta La curva r è regolare a tratti per via di quanto succede della sua rappresentazione parametrica nel punto t = 1: pur riuscendo

Massimi e minimi assoluti vincolati: esercizi svolti

COMPITO DI RICERCA OPERATIVA. max x 1 + x 2 x 1 2x 2 + x 3 = 4 x 1 x 2 x 3 = 3 x 2 + 2x 3 = 1 x 1, x 2, x 3 0

Esercizio 1. Esercizio 2

Possibile applicazione

1 Definizione del problema di massimo. La forma standard 1

Laurea in Informatica e Tecnologie per la Produzione del Software Corso di Analisi Matematica Successioni e loro limiti

SISTEMI LINEARI: APPROFONDIMENTI ED ESEMPI

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)

Macchine parallele M 1 M 2 M 3 J 1 J 2 LAVORI J 3 J 4

Problemi, istanze, soluzioni

FUNZIONI ELEMENTARI, DISEQUAZIONI, NUMERI REALI, PRINCIPIO DI INDUZIONE Esercizi risolti

Esercizi di Ricerca Operativa I

Disequazioni di secondo grado

Appendice A: un esempio di scelta del mix ottimo di produzione in presenza di vincoli 19

I. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.

INTERPOLAZIONE. Introduzione

Analisi Matematica II Corso di Ingegneria Gestionale Compito del f(x, y) = e (x3 +x) y

Programmazione Lineare Intera. Programmazione Lineare Intera p. 1/4

4.3 Esempio metodo del simplesso

Amplificatori in classe A con accoppiamento capacitivo

L ALGORITMO DEL SIMPLESSO REVISIONATO

TEMI D ESAME DI ANALISI MATEMATICA I

Svolgimento degli esercizi del Capitolo 1

Esercizi svolti di Programmazione Lineare. a cura di Laura Scrimali Dipartimento di Matematica e Informatica Università di Catania

MATEMATICA CORSO A II COMPITINO (Tema 1) 5 Aprile 2013

Il teorema di Rouché-Capelli

Universita degli Studi di Ancona - Facolta di Ingegneria Laurea in Ing. Elettronica (VO) Ing. Informatica e Automatica - Ing. delle Telecomunicazioni

Funzioni implicite - Esercizi svolti

Prerequisiti per seguire il corso

Corso di Geometria BIAR, BSIR Esercizi 2: soluzioni

Funzioni. iniettiva se x y = f (x) f (y) o, equivalentemente, f (x) = f (y) = x = y

Raccolta di esercizi svolti sulle condizioni di Kuhn Tucker

Disequazioni - ulteriori esercizi proposti 1

LA PROGRAMMAZIONE MATEMATICA (p.m.)

Transcript:

Esercizi su ottimizzazione vincolata 1. Rispondere alle seguenti domande (a) Quando un vincolo di disuguaglianza è detto attivo? (b) Cosa è l insieme delle soluzioni ammissibili? Gli algoritmi di ricerca dell ottimo mantengono sempre l ammissibilità delle soluzioni progressivamente individuate? (c) Cosa è un punto di regolarità? (d) Che relazione geometrica impongono le condizioni di KKT tra l antigradiente della funzione da minimizzare e i gradienti dei vincoli nei punti di minimo? (e) Verificare che il punto x = (0, 0) è di minimo per il problema {min z = x, x 3 x 6 1} anche se non soddisfa le condizioni di KKT poiché non regolare. (f) Quale è l idea base dell algoritmo del sequential quadratic programming (SQP)? (g) SQP converge globalmente? E con che velocità? (h) Quali difficoltà si possono incontrare nell applicazione dell algoritmo SQP? Come quest ultime possono essere aggirate? (i) Quale è l idea base dell algoritmo del gradiente condizionato? Con che velocità converge? (j) Quale è l idea base dell algoritmo della proiezione del gradiente? (k) Quale è l idea base degli algoritmi che gestiscono i vincoli con funzioni di penalità? (l) Cosa sono le funzioni di penalità sequenziali esterne? Che vantaggi e svantaggi presentano? Perché gli ottimi non sempre vengono calcolati per k più piccoli possibili? (m) Quale è l idea base degli algoritmi che gestiscono i vincoli con funzioni barriera? Questi algoritmi possono essere applicati in presenza di vincoli di uguaglianza? (n) Quali sono le tipiche funzioni barriera? Può la soluzione fornita da un algoritmo barriera essere inammissibile? (o) È possibile stimare la qualità della soluzione ottenuta al passo kmo di un algoritmo barriera in termini della differenza percentuale tra il valore di f(x k ) e di f(x )? (p) Per un generico problema di programmazione non lineare {min z = f(x), g i (x) 0 i = 1,..., m, h i (x) = 0 i = 1,..., n} si definisca funzione duale di Lagrange (o semplicemente funzione duale) G = R m+p R come il minimo valore della Lagrangiana su x, i.e., per ogni λ R m, λ 0, ν R p, ( ) m p G(λ, ν) = inf L(x, λ, ν) = inf f(x) + λ i g i (x) + ν i h i (x) x x Si osservi che fissati λ e ν il calcolo di g(λ, ν) è un problema di ottimizzazione non vincolata. i) Si dimostri che per ogni λ 0 e ν la funzione duale di Lagrange fornisce un limite inferiore al valore ottimo della funzione obiettivo, G(λ, ν) z. i=1 i=1 1

ii) Si generalizzi il teorema di dualità debole della programmazione lineare al caso della programmazione non lineare. (q) Provare che le condizioni di KKT applicate ad un problema di programmazione lineare conducono alla formulazione del problema duale. (r) Scrivere le condizioni di KKT applicate ad un problema di programmazione quadratica {min z = 1 xt Qx + b T x + c, Ax b, x 0}, dove Q 0. Proporre un algoritmo derivato dalla Fase I del simplesso per trovare le soluzioni per le condizioni di KKT. (s) Scrivere la funzione duale di un problema di programmazione quadratica {min z = x t Qx, Ax b}, dove Q 0. (t) Le Condizioni di Slater affermano che se un problema di programmazione non lineare (detto primale) è convesso e strettamente ammissibile, i.e., esiste x X tale che g i (x) < 0 per i = 1,..., m, allora vale la dualità forte, il duality gap tra il problema primale e il corrispondente problema duale (vedi soluzione Es. (1p)) è uguale a zero, i.e., i due problemi hanno lo stesso valore della soluzione ottima. Determinare in che casi vale certamente la dualità forte per la programmazione lineare e la programmazione quadratica.. Scrivere le condizioni di KKT per i seguenti problemi di minimizzazione. (a) {min z = x 3 1(x + 3), x 1 0, x 0, x 1 + x 1}. (b) {min z = x 1 e (x 1 +8x )/100, 1 x 1 + x 4}. (c) {min z = e 5x1 sin(x 1 x ), (x 1 3) + x = 4}. (d) {min z = x 1+5x x 1 +x 1x +x +1, x 1 0, x 0, x 1 + x = 1}. (e) {min z = (x 1 + x ) ln(x 1 + 3x + x 3 ), 1 x 3 4 x 1 x }. 3. Verificare la regolarità dei punti dati rispetto ai vincoli. (a) Vincoli x 1 x 0, x 1 + (x 1) 1. Punto x = (0, 0). (b) Vincoli x 1 + x = 1, x 0, x 1 1, x 1. Punto x = (1, 0). (c) Vincoli x 1 + x = 1, x 0, x 1 1, x 1. Punto x = (1, 0, 0). (d) Vincoli x cos(x 1 ) 0, x 1, x 1 0 x 1 π. Punto x = (π, 1). (e) Vincoli x 1 + x + x 3 = 3, x + 3x 3 5, x 1 + 3x + 4x 3 8. Punto x = (1, 1, 1). (f) Vincoli x 1 + x 1, x 1 + (x 1) 1). Punto x = (0, 0). 4. Determinare le terne/coppie di KKT per i seguenti problemi. Quando sia possibile determinare anche la natura dei punti x (a) {min z = x 1 x 4, x 1 + x = 1}.

(b) {min z = x 1x + x 1 + x, x 1 + x = 1, x 1 0}. (c) {min z = e (x 1 +8x )/100, (x 1 ) + x 1}. (d) {min z = 3x 1+x x 1 +x, 1 x 1, 1 x }. (e) {min z = x 3 1 + x 1 x + x, (x 1 ) + x 1}. (f) {min z = x 3 1(x + 3), x 1 0, x 0, x 1 + x 1}. 5. Determinare le funzioni di penalità sequenziali esterne P (x, ) e i punti in cui P (x, ) = 0 in funzione del coefficiente di penalità. (Si noti che questi esercizi presentano sempre un solo vincolo di uguaglianza in modo da essere risolvibili a mano, ma ovviamente il metodo delle funzioni di penalità sequenziali esterne si applica anche con più vincoli e anche con vincoli di disuguaglianza (vedi un seguito Es. 8) (a) {min z = x 1 x 4, x 1 + x = 1}. (b) {min z = x 1 + 8x, x 1 + x = 3}. (c) {min z = 3x 4 1 + x, x 1 + x = 1}. (d) {min z = x 1 + x 1 x, x 1 x = 1}. (e) {min z = x 1 (x + 3), x 1 + x = 1}. 6. Riformulare i seguenti problemi con funzioni di penalità sequenziali esterne P (x, ). (a) {min z = x 1 x 4, x 1 + x = 1, x 1 0, x 0}. (b) {min z = x 1x + x 1 + x, x 1 + x = 1, x 1 0}. (c) {min z = e (x 1 +8x )/100, (x 1 ) + x 1}. (d) {min z = 3x 1+x x 1+x, 1 x 1, 1 x }. (e) {min z = x 3 1 + x 1 x + x, x 1 + x 4, x 1 x 1}. (f) {min z = x 3 1(x + 3), x 1 0, x 0, x 1 + x 1}. 7. Riformulare i seguenti problemi con funzioni barriere logaritmiche. (a) {min z = x 1 x 4, x 1 + x 1, x 1 0, x 0}. (b) {min z = x 1x + x 1 + x, x 1 + x 1, x 1 0}. (c) {min z = e (x 1 +8x )/100, (x 1 ) + x 1}. (d) {min z = 3x1+x x 1 +x, 1 x 1, 1 x }. (e) {min z = x 3 1 + x 1 x + x, x 1 + x 4, x 1 x 1}. (f) {min z = x 3 1(x + 3), x 1 0, x 0, x 1 + x 1}. 8. Riformulare i seguenti problemi con funzioni di penalità sequenziali esterne P (x, ), determinare la soluzione ottima di P (x, ) in funzione di calcolandone il limite quando tende a zero 3

(a) {min z = x 1 + x + 3x 3, x 1 x = 1, x + x 3 = 0}. (b) {min z = x 1 x + x 3, x = 1, x 1 + x + x 3 = 1}. (c) {min z = x 1 + x + x 1 x, x 1 + x 1, x 1 x = 1}. (d) {min z = x 1 5x 1 + x, x 1 + x 5, x 1 x = 0}. (e) {min z = x 1 + x 8x 1 4x, 1 x 1 1}. (f) {min z = x 1 + x x 1 8x, x 1 1, x 1 + x 0}. (g) {min z = x 3 3, x 1 x x 3 = 1, x + x 3 = 0}. (h) {min z = x 1 x, x 1, x 1 + x = 1}. 9. Riformulare i seguenti problemi con funzioni barriera logaritmiche P (x, ) quindi: i) determinare la soluzione ottima di P (x, ) in funzione di calcolandone il limite quando tende a zero; ii) stimare l errore che si compie quando = 0.0001 e confrontare il valore ottenuto con l errore vero. (a) {min z = x 1 5x 1 + x, x 1 + x 5}. (b) {min z = x 1 + x, x 1 + 4x 1}. (c) {min z = x 1 + x 4x 1 x, x 1 + 4x 1}. (d) {min z = x 1 + x 4x 1 x, x 1 1, x 1}. (e) {min z = x 1 + 5x, x 1 + x 5, x 1}. (f) {min z = x 1 x + x 1, x 1 1, x 1}. Risposte agli esercizi Es. 1 Per questo esercizio sono riportate solo le risposte agli esercizi che non possono essere trovate banalmente sui lucidi. (1e) Il vincolo x 3 x 6 1 è equivalente a x 0, quindi z = 0, che si ottiene per (0, 0). La condizione di KKT x L(x 1, x, λ) = f(x 1, x ) + λ g(x 1, x ) = 0 non viene però soddisfatta da (0, 0), infatti L(x1,x,λ) x = 1 3λx = 0 è falsa in x = 0. È immediato verificare che lo jacobiano dell unico vincolo in (0, 0) è nullo e quindi ha rango 0 invece del rango 1 come richiesto in questo caso affinché (0, 0) sia di regolarità. (1p) i) Sia data una qualunque coppia di vettori (λ, ν), con λ 0 e sia x la soluzione ottima del problema di programmazione non lineare. Poiché λ i 0, g i (x ) 0 e h i (x ) = 0 si ha che z = f(x ) f(x ) + inf x ( m λ i g i (x ) + i=1 f(x) + p ν i h i (x ) i=1 m λ i g i (x) + i=1 ) p ν i h i (x) = G(λ, ν) i=1 4

ii) Al punto precedente si è visto che G(λ, ν) è un limite inferiore per z. Si determina ora quale è il miglior limite inferiore ottenibile con la funzione lagrangiana duale. Si deve risolvere il problema Lagrangiano duale: max w = G(λ, ν) λ,ν λ 0 (Incidentalmente si osservi che il problema lagrangiano duale è sempre un problema convesso anche se il problema primale non lo è. Si può verificare infatti banalmente che G(λ, ν) è convesso.) Il Teorema di Dualità debole per la programmazione non lineare quindi può essere enunciato come segue Teorema Sia w la soluzione ottima del problema Lagrangiano duale e z la soluzione del problema primale, allora vale w z Conseguentemente: Se il problema primale è non limitato inferiormente, z =, il duale è inammissibile e viceversa. La differenza z w è detta duality gap. (1q) Si consideri il seguente problema di PL in forma standard min x z = c T x (1a) Ax = b (1b) x 0 (1c) Sia x la soluzione ottima di tale problema e sia z il valore assunto dalla funzione obiettivo in x. La funzione Lagrangiana L : R n R m R n R assume la forma L(x, λ, ν) = c T x λ T x + ν T (Ax b) = b T ν + (c + A T ν λ) T x, () dove λ i 0 è il moltiplicatore di Lagrange associato all imo vincolo di disuguaglianza (1c); analogamente è ν j il moltiplicatore di Lagrange associato all jmo vincolo di uguaglianza (1b). Si cerchi il minimo di L(x, λ, ν) per ogni fissata coppia di vettori (λ, ν) ottenendo la cosiddetta funzione lagrangiana duale G(λ, ν) = inf L(x, λ, ν) = x bt ν + inf (c + x AT ν λ) T x. È immediato verificare che G(λ, ν) L(x, λ, ν) = c T x λ T x z per qualunque valore di (λ, ν), con λ 0. Si determini ora la coppia di vettori (λ, ν) per cui sia massimo il valore di G(λ, ν). Si affronti cioè quello che è chiamato problema lagrangiano duale. 5

Affinchè la lagrangiana duale sia limitata inferiormente in x, deve valere la condizione c+a T ν λ = 0. Infatti, in generale vale che b T ν c + A T ν λ = 0 G(λ, ν) = altrimenti Il problema lagrangiano duale diventa quindi max w = G(λ, ν) = λ,ν λ 0 b T ν se c + A T ν λ = 0 altrimenti Si è soliti esplicitare i vincoli del problema duale in modo da ottenere il seguente problema equivalente max λ,ν w = bt ν c + A T ν λ = 0 λ 0 che può essere semplicemente riscritto (ponendo ν = y) come max w = b T y y A T y c (1r) Le condizioni di KKT risultano essere Qx + A T ν λ = c Ax = b λ i x i = 0 i x, λ 0 Si osserva che essendo x, λ 0 le condizioni λ i x i = 0 possono essere riscritte come un unica condizione i λ ix i = 0 cioè, in forma vettoriale, λx = 0. Trovare delle soluzioni per le condizioni di KKT consiste nel determinare quindi una soluzione ammissibile del seguente problema (detto di programmazione complementare) che è lineare a meno del vincolo λx = 0 Qx + A T ν λ = c Ax = b λx = 0 x, λ 0 6

Al fine di risolvere il problema precedente si può utilizzare un algoritmo simile alla fase I del simplesso. Si considera il problema min z = i y i + j u j Qx + A T ν λ + y = c Ax + u = b λx = 0 x, λ, y, u 0 Una prima soluzione ammissibile di questo problema di minimizzazione è u = b, si noti che possiamo sempre supporre b 0, y i = min{0, c i }, λ i = min{0, c i }. Si procede quindi come con simplesso fino a trovare la soluzione ottima z = 0 con y = 0, u = 0, che quindi definisce dei valori di x, λ e ν ammissibili per le condizioni di KKT. Si noti che il vincolo λx = 0 è soddisfatto dalla condizione iniziale in quanto x = 0. Ad ogni passo del simplesso si mantiene il rispetto del vincolo λx = 0 considerando tra le possibili variabili λ i o x i candidate ad entrare in base solo quelle per cui la corrispondente variabile complementare, rispettivamente x i o λ i, non sia già in base. Si può provare che, se Q 0, si riesce sempre a trovare una variabile da fare entrare in base, nel rispetto delle restrizioni precedenti, fino a quando non si ottiene z = 0. (1s) La funzione lagrangiana del problema considerato risulta essere risulta L(x, λ) = x T Qx + λ T (Ax b). Se Q 0, la condizione x L(x, λ) = 0 restituisce x = ( 1 )Q 1 A T λ, quindi il problema duale è max G(λ) = 1 4 λt AQ 1 A T λ b T λ λ 0 Che può essere risolto all ottimo con algoritmi a barriera in tempo polinomiale. (1t) Il duality gap è certamente nullo per i problemi di programmazione lineare strettamente ammissibili. Infatti ai suddetti problemi si possono sempre applicare le condizioni di Slater poiché sono convessi. Le condizioni di Slater si possono anche applicare ai problemi di programmazione quadratica strettamente ammissibili a condizione che la funzione obiettivo f(x) = 1 xt Ax + b t + c sia caratterizzata da una matrice A semidefinita positiva. Es. (a) x 1 0 x 0 x 1 + x 1 7

λ 1, λ, λ 3 0 λ 1 x 1 = 0 λ x = 0 λ 3 (x 1 + x 1) = 0 3x 1(x + 3) λ 1 + λ 3 x 1 = 0 x 3 1 λ + λ 3 x = 0 (b) x 1 + x 4 x 1 + x 1 λ 1, λ 0 λ 1 (x 1 + x 4) = 0 λ (x 1 + x 1) = 0 e (x1 +8x )/100 + 1 50 x 1e (x 1 +8x )/100 + λ 1 x 1 λ x 1 = 0 4 5 x 1x e (x 1 +8x )/100 + λ 1 x λ x = 0 (c) (x 1 3) + x = 4 5e 5x1 sin(x 1 x ) + x e 5x1 cos(x 1 x ) + ν 1 (x 1 3) = 0 x 1 e 5x1 cos(x 1 x ) + ν 1 x = 0 (d) x 1 0 x 0 x 1 + x = 1 λ 1, λ 0 λ 1 x 1 = 0 λ x = 0 x 1 10x 1 x 4x + 1 (x 1 + x 1x + x + λ 1 + ν 1 1) = 0 4x 1 x 1 x 5x + 1 (x 1 + x 1x + x + 1) λ + ν 1 = 0 (e) x 3 1 8

x 1 + x + x 3 4 0 λ 1, λ 0 λ 1 x 3 = 0 λ (x 1 + x + x 3 4) = 0 ln(x 1 + 3x + x 3 ) + x 1 + x 1 x x 1 + 3x + x + λ x 1 = 0 3 ln(x 1 + 3x + x 3 ) + 6x 1 + 6x x 1 + 3x + x + λ x = 0 3 x 1 + x x 1 + 3x + x λ 1 + λ = 0 3 Es. 3 (3a) Un punto x è regolare se lo jacobiano dei vincoli attivi in x ha rango massimo quando calcolato in x. Entrambe i vincoli del problema sono attivi in (0, 0). J(0, 0) = x 1 1 x 1 (x 1) (0,0) = 0 1 0 Poiché rank(j(0, 0)) = 1 < il punto (0, 0) non è regolare. (3b) Solo i primi tre vincoli del problema sono attivi in (1, 0). 1 1 J(1, 0) = 0 1 1 0 Poiché rank(j(1, 0)) = il punto (1, 0) è regolare. (3c) Solo i primi tre vincoli del problema sono attivi in (1, 0, 0). 1 1 0 J(1, 0, 0) = 0 1 0 1 0 0 Poiché rank(j(1, 0, 0)) = < 3 il punto (1, 0, 0) non è regolare. NOTA. Si noti come i vincoli e la funzione obiettivo di questo problema sono gli stessi del problema precedente ma sono definiti in uno spazio di dimensione maggiore dove non soddisfano la condizione di qualificazione. (3d) Solo il primo e il secondo vincolo del problema sono attivi in (π, 1). J(π, 1) = 0 1 0 1 Poiché rank(j(π, 1)) = 1 < il punto (π, 1) non è regolare. 9

(3e) Tutti i vincoli del problema sono attivi in (1, 1, 1). 1 1 1 J(1, 1, 1) = 0 3 1 3 4 Poiché rank(j(1, 1, 1)) = < 3 il punto (1, 1, 1) non è regolare. (3f) Solo il secondo vincolo del problema è attivo in (0, 0). J(0, 0) = [0, ] Es. 4 Poiché rank(j(0, 0)) = 1 il punto (0, 0) è regolare. (4a) Le coppie di KKT ((x 1, x ), ν ) sono (( 1, 0), 1), ((1, 0), 1), ((0, 1), ), ((0, 1), ). Le ultime due terne soddisfano anche le condizioni di secondo ordine di KKT. Si consideri ad esempio il punto x = (0, 1). L hessiana risulta essere xx L((0, 1), ) = 6 0, le uniche direzioni 0 8 ammissibili sono s = (ξ, 0) per qualunque ξ. Poiché (ξ, 0) 6 0 ξ = 6ξ possiamo 0 8 0 concludere che x = (0, 1) è un minimo. (4b) L unica terna di KKT è ((x 1, x ), λ, ν ) = ((0, 1), 1, ) e corrisponde ad un minimo. (4c) Per risolvere il problema conviene preliminarmente osservare che la funzione da ottimizzare è una funzione composta la cui funzione esterna è crescente. Invece di minimizzare z = e (x 1 +8x )/100 si può equivalentemente minimizzare la funzione w = (x 1+8x ) giungendo a condizioni di KKT più trattabili in quanto non comprendenti funzioni esponenziali. L unica coppia di KKT che soddisfi la condizione λ 0 è ((1, 0), 1) e corrisponde ad un minimo, infatti xx L((1, 0), 1) 0. (4d) L unica coppia di KKT che soddisfa le condizioni λ i 0 è ((1, ), ( 9, 0, 0, 1 9 )) e corrisponde ad un minimo, ma questa sua natura non è dimostrabile tramite le condizioni di KKT di secondo ordine. (4e) L unica coppia di KKT che soddisfi le condizioni λ i 0 è ((1, 0), 3 ) e corrisponde ad un minimo, infatti xx L((1, 0), 3 ) 0. (4f) Sono coppie di KKT tutti i punti ((0, x ), (0, 0, 0)) che corrispondono a minimi. La natura di questi punti però non è dimostrabile tramite le condizioni di KKT di secondo ordine. Es. 5 (5a) I punti in cui P (x, ) = 0 sono (0, 0), (0, ± 1 1 ), (±, 0). Si osservi che per 0 gli ultimi quattro punti tendono ai massimi e minimi della funzione vincolata. Per qualunque rimane però sempre il punto (0,0) che non è ammissibile per il problema vincolato originale. 10

Es. 6 Es. 7 Es. 8 (5b) L unico punto in cui P (x, ) = 0 è ( 4 9+8, 3 9+8 ). (5c) I punti in cui P (x, ) = 0 sono (± 1 3, 3 3 ), (0, 1 ). (5d) L unico punto in cui P (x, ) = 0 è (0, 0). Si osservi che in per questo problema il metodo delle funzioni di penalità sequenziali esterne fallisce perchè individua sempre un punto che non è ammissibile per il problema originale nemmeno per 0. (5e) L unico punto in cui P (x, ) = 0 è ( 8 4+, 4+3 4+ ). (6a) {min P (x, ) = x 1 x 4 + (x 1 +x 1) +max { x 1,0}+max { x,0} } (6b) {min P (x, ) = x 1x + x 1 + x + (x 1+x 1) +max {x 1,0} } (6c) {min P (x, ) = e (x 1 +8x )/100 + max {(x 1 ) +x 1,0} } (6d) {min P (x, ) = 3x1+x x 1+x + max { x 1 +1,0}+max {x 1,0}+max { x +1,0}+max {x,0} } (6e) {min P (x, ) = x 3 1 + x 1 x + x + max {x 1 +x 4,0}+max { x 1x +1,0} } (6f) {min P (x, ) = x 3 1(x + 3) + max {x 1 +x 1,0}+max { x 1,0}+max { x,0} } (7a) {min P (x, ) = x 1 x 4 ( ln{ x 1 x + 1} + ln{x 1 } + ln{x } ) (7b) {min P (x, ) = x 1x + x 1 + x (ln{x 1 + x 1} + ln{ x 1 }) (7c) {min P (x, ) = e (x 1 +8x )/100 ( ln{ (x 1 ) x + 1} ) (7d) {min P (x, ) = 3x1+x x 1+x (ln{x 1 1} + ln{ x 1 + } + ln{x 1} + ln{ x + }) (7e) {min P (x, ) = x 3 1 + x 1 x + x ( ln{ x 1 x + 4} + ln{x 1 x 1} ) (7f) {min P (x, ) = x 3 1(x + 3) ( ln{ x 1 x + 1} + ln{x 1 } + ln{x } ) (8a) Ponendo x P (x, ) = 0 si ottiene x 1 x = 6x 4x 1 x + 4x 3 + x 3 = (x + x 3 ) = 3 da cui si ottiene il punto di minimo x () = ( 4 +3, 1, ) (, 1, 1) (8b) Ponendo x P (x, ) = 0 si ottiene 1 + x 1 + x 1 + x + x 3 = 0 + x 1 ( + )x + x 3 = 0 1 + x 1 + x + x 3 + x 3 = 0 da cui si ottiene il punto di minimo x () = ( +, (1+) 11 +, + ) (0, 1, 0).

(8c) P (x, ) = x 1 + x + x 1 x + max {0, (x 1 + x 1)} + (x 1 x 1) NOTA. In questo esercizio e nei seguenti, dato che si cercano i minimi di P (x, ) in modo analitico, si partiziona lo spazio di definizione di P (x, ) in sottoinsiemi. Tali sottoinsiemi sono definiti per tenere conto della differente struttura che assume P (x, ) nei vari punti dello spazio, i.e., per tenere conto di quale argomento delle componenti max {.,.} risulta dominare. Gli algoritmi numerici di ricerca del minimo non hanno ovviamente bisogno di eseguire questa suddivisione. Essi infatti a ogni passo campionano P (x, ) (o il suo gradiente) per conoscerne il valore numerico ma non hanno bisogno di conoscerne l espressione analitica. Studio di P (x, ) per x 1 + x 1 implica x P (x, ) = x 1 + x + (x1 x 1) x 1 + x (x 1 x 1) (1 + )x 1 + ( + )x = ( + )x 1 + (1 + )x = Da cui si ottiene il punto di minimo x () = ( 4+, 4+ ) ( 1, 1 ). Si noti in particolare che, per piccolo, x () soddisfa anche il vincolo di disuguaglianza. Studio di P (x, ) per x 1 + x 1. NOTA. La funzione P (x, ) va studiata su tutto l insieme R, in quanto il metodo delle funzioni di penalità trasforma un problema di ottimizzazione vincolata in un problema di ottimizzazione non vincolata. implica x P (x, ) = x 1 + x + (x 1 x 1)+(x 1 +x 1) x 1 + x + (x1 x 1)+(x1+x 1) ( + )x 1 + x = 4 x 1 + ( + )x = 0 8(+) Da cui si ottiene il punto x () = ( 16+16+3, 16+16+3 ) che non va considerato in quanto non soddisfa la condizione x 1 + x 1 rispetto alla quale si stava studiando x P (x, ) = 0. 4 (8d) P (x, ) = x 1 5x 1 + x + max {0, (5 x1 x)} + (x1 x) 1

Studio di P (x, ) per x 1 + x 5 implica x P (x, ) = 5 + x 1 + (x 1 x ) 1 (x 1 x ) (1 + )x 1 x = 5 x 1 + x = Da cui si ottiene il punto x () = (, 4 ) che non va considerato in quanto non soddisfa la condizione x 1 + x 5 rispetto alla quale si stava studiando x P (x, ) = 0 Studio di P (x, ) per x 1 + x 5. implica x P (x, ) = 5 + x 1 + (5 x1 x)+(x1 x) 1 (5 x1 x)+(x1 x) x 1 = 5 4x = 10 Da cui si ottiene il seguente punto di minimo x () = ( 5, 10 4 ) ( 5, 5 ). (8e) P (x, ) = x 1 + x 8x 1 4x + max {0, ( 1 x1)} + max {0, (x1 1)} Studio di P (x, ) per x 1 1 implica x P (x, ) = 8 + x 1 + ( 1+x1) 4 + x (1 + )x 1 = 1 + 4 x = Da cui si ottiene il punto di minimo x () = ( 1+4 1+, ) (1, ). Studio di P (x, ) per 1 x 1 1. x P (x, ) = 8 + x 1 4 + x 13

implica il punto x () = (4, ) che non va considerato in quanto non soddisfa la condizione 1 x 1 1 rispetto alla quale si stava studiando x P (x, ) = 0. Studio di P (x, ) per x 1 1 x P (x, ) = 8 + x 1 + (1+x 1) 4 + x implica (1 + )x 1 = 1 + 4 x = Da cui si ottiene il punto x () = ( 1+4 1+, ) che non va considerato in quanto non soddisfa la condizione x 1 1 rispetto alla quale si stava studiando x P (x, ) = 0. (8f) P (x, ) = x 1 + x x 1 8x + max {0, (x1 1)} + max {0, ( x1 + x )} Studio di P (x, ) per x 1 1 e x1 + x 0. x P (x, ) = + x 1 8 + 4x implica il punto x () = (1, ) che non va considerato in quanto non soddisfa la condizione x 1 + x 0 rispetto alla quale si stava studiando x P (x, ) = 0 Studio di P (x, ) per x 1 1 e x 1 + x 0 implica x P (x, ) = + x 1 ( x 1+x ) 8 + 4x + ( x 1+x ) (1 + )x 1 x = x1 + (1 + )x = 4 Da cui si ottiene il punto x () = ( 5+ 3+, 5+4 3+ condizione x 1 1 rispetto alla quale si stava studiando x P (x, ) = 0. ). che non va considerato in quanto non soddisfa la Studio di P (x, ) per x 1 1 e x 1 + x 0 x P (x, ) = + x 1 + +x1 8 + 4x 14

implica il punto x () = (1, ) che non va considerato in quanto non soddisfa la condizione x 1 + x 0 rispetto alla quale si stava studiando x P (x, ) = 0 Studio di P (x, ) per x 1 1 e x 1 + x 0 implica x P (x, ) = + x 1 + ( 1+x1) ( x1+x) 8 + 4x + ( x1+x) ( + )x 1 x = 1 + x 1 + (1 + )x = 4 Da cui si ottiene il punto di minimo x () = ( 1+7+ 1+5+, 1+9+4 1+5+ ) (1, 1). (8g) Ponendo x P (x, ) = 0 si ottiene x x 3 ( 1 + x 1 x x 3 ) = 0 x + x 3 + x 1 x 3 ( 1 + x 1 x x 3 ) = 0 ( 1 + x 1 )x + x 1x x 3 + x 3 ( + 3x 3 ) = 0 da cui sono punti stazionari x = (t, 0, 0) per qualunque t R oppure x = (1, 0, ) (1, 0, ). Si noti che nessuno dei punti stazionari soddisfa i vincoli nemmeno per. La funzione z(x) non ha minimo nell insieme di ammissibilità, è infatti illimitata inferiormente. (8h) P (x, ) = x 1 x + max {0, (1 x )} + ( 1 + x 1 + x ) x P (x, ) = Studio di P (x, ) per x 1 x 1 + ( 1+x1+x) x + (1 x)1{x 1}+( 1+x1+x) x P (x, ) = 0 implica (1 + )x 1 + x = 1 x 1 + (1 )x = 1 Da cui si ottiene il punto x () = ( 1, 1 ) che non va considerato in quanto non soddisfa la condizione x 1 rispetto alla quale si stava studiando x P (x, ) = 0. Studio di P (x, ) per x 1 x P (x, ) = 0 15

implica (1 + )x 1 + x = 1 x 1 ( + )x = Da cui si ottiene il punto x () = ( 1+ 1+, 1+ ) (0, 1). che non va considerato in quanto non soddisfa la condizione x 1 rispetto alla quale si stava studiando x P (x, ) = 0. Non esistono punti in cui x P (x, ) = 0. La funzione z(x) non ha minimo nell insieme di ammissibilità, è infatti illimitata inferiormente. Si noti in particolare che x () tende a un punto ammissibile ma tale punto è un massimo. Es. 9 (9a) Imponendo P (x, ) = x 1 5x 1 + x ln(x1 + x 5) 5 + x1 x P (x, ) = x1+x 5 1 x1+x 5 si ottiene il punto di minimo x () = (3, +) (3, ). Essendoci un solo vincolo di disuguaglianza, l errore è limitato superiormente da. Per = 0.0001 si ottiene quindi z(x ()) z(x ) 0.0001. L errore reale è z(x ()) z(x ) = 0.0001. NOTA. Si osservi che in questi esercizi è possibile calcolare l errore reale perché si può determinare il valore esatto del minimo. Nei casi pratici questo in generale non avviene e ci si accontenta della stima. (9b) P (x, ) = x 1 + x ln(1 x 1 4x ) Imponendo x P (x, ) = 1 + x 1 1 x 1 4x + 8x 1 x 1 4x si ottiene x () = ( +, + 4 ) (, 4 ) oppure x () = ( + +, + + 4 ) (, 4 ). Il punto (, 4 ) è il minimo assoluto che giace sul vincolo. Il punto x () viola le condizioni di esistenza del logaritmo usato nella funzione barriera e quindi viola anche il vincolo associato. Poiché il punto x () si trova oltre la barriera, esso non deve essere considerato. NOTA. Il punto x () non verrebbe determinato dagli algoritmi numerici poiché essi partono da un punto iniziale all interno dell insieme di ammissibilità e non riescono a superare le barriere. Essendoci un solo vincolo di disuguaglianza, l errore è limitato superiormente da. Per = 0.0001 si ottiene quindi z(x ()) z(x ) 0.0001. L errore reale è z(x ()) z(x ) = 0.0000999965. 16

(9c) P (x, ) = x 1 + x 4x 1 x ln(1 x 1 4x ) Imponendo x P (x, ) = 4 + x 1 + 1 + 4x + 1 x 1 4x 4 1 x 1 4x si ottiene x () = ( 34 4+18 18, 1 4 4+18 36 ) ( 16 9, 7 36 ) oppure x () = ( 34+ 4+18 18, 1+4 4+18 36 ) (, 1 4 ). Il punto (, 1 4 ) è il minimo assoluto che NON giace sul vincolo. Il punto x () viola le condizioni di esistenza del logaritmo usato nella funzione barriera. Essendoci un solo vincolo di disuguaglianza, l errore è limitato superiormente da. Per = 0.0001 si ottiene quindi z(x ()) z(x ) 0.0001. L errore reale è z(x ()) z(x ) = 5.6373 10 9. (9d) P (x, ) = x 1 + x 4x 1 x (ln(1 x 1 ) + ln(1 x )) Imponendo x P (x, ) = 4 + x 1 + 1 + 4x + 1 x 1 1 x si ottiene x () = ( 3 1+, 5 9+16 8 ) (1, 1 4 ) oppure x () = ( 3+ 1+, 5 9+16 8 ) oppure x () = ( 3 1+, 5+ 9+16 8 ) oppure x () = ( 3+ 1+, 5+ 9+16 8 ). Il punto (1, 1 4 ) è il minimo assoluto che giace sul primo vincolo. condizioni di esistenza di almeno uno dei logaritmi usati nelle funzioni barriera. I rimanenti punti violano le Essendoci due vincoli di disuguaglianza, l errore è limitato superiormente da. Per = 0.0001 si ottiene quindi z(x ()) z(x ) 0.000. L errore reale è z(x ()) z(x ) = 0.0000999997. NOTA. Il problema poteva essere risolto ancora più facilmente se si osservava che esso era decomponibile. Sia le differenti componenti della funzione obiettivo che i due vincoli sono funzioni di una sola variabile, quindi {min z = x 1 + x 4x 1 x, x 1 1, x 1} = = {min z 1 = x 1 4x 1, x 1 1} + {min z = x x, x 1}. (9e) P (x, ) = x 1 + 5x (ln(x 1 + x 5) + ln(x + 1)) Imponendo x P (x, ) = 1 x 1+x 5 5 x +1 x 1 +x 5 si ottiene x () = ( 3(8+) 4, 4+ 4 ) (6, 1) Il punto (6, 1) è il minimo assoluto che giace sull intersezione tra i vincoli. 17

Essendoci due vincoli di disuguaglianza, l errore è limitato superiormente da. Per = 0.0001 si ottiene quindi z(x ()) z(x ) 0.000. L errore reale è z(x ()) z(x ) = 0.000. (9f) P (x, ) = x 1 x + x 1 (ln(x 1 1) + ln(x 1)) Imponendo x P (x, ) = 1 + x x 1 x 1 1 x 1 si ottiene x () = ( 1+ 1+, 1 + ) (1, 1) oppure x () = ( 1 1+, 1 + ) Il punto (1, 1) è il minimo assoluto che giace sull intersezione tra i vincoli. Il punto x () viola le condizioni di esistenza dei logaritmi usati nelle funzioni barriera. Essendoci due vincoli di disuguaglianza, l errore è limitato superiormente da. Per = 0.0001 si ottiene quindi z(x ()) z(x ) 0.000. L errore reale è z(x ()) z(x ) = 0.000199995. 18