forked from viqizevic/SQP-vs.-Semismooth-Newton
-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathseq_quad_prog.m
252 lines (249 loc) · 6.31 KB
/
seq_quad_prog.m
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
% Function: [x,fval,it,X] = seq_quad_prog (f, gradf, hessf,
% A, b, G, r, x0, itmax, tol)
%
% Attempt to solve the problem
%
% min f(x)
% x
%
% subject to
%
% A*x = b
% G*x <= r
%
% using the sequential quadratic programming method.
%
% f : The name of the objective function f : R^n -> R.
% gradf : The name of the function that returns the gradient of f.
% hessf : The name of the function that returns the hessian matrix of f.
% A : A matrix with dimension m x n for the linear equality contraints.
% b : A vector with m elements for the linear equality contraints.
% G : A matrix with dimension p x n for the linear inequality constraints.
% r : A vector with p elements for the linear inequality constraints.
% x0 : The start point for the algorithm.
% itmax : The maximal number of iterations allowed.
% tol : The bound needed for the stop criteria.
%
function [x,fval,it,X] = seq_quad_prog(f,gradf,hessf,A,b,G,r,x0,itmax,tol)
it = 0;
[p,n] = size(G);
n = length(x0);
x = x0;
X(1,:) = x';
stop = false;
while( ~stop )
% solve the problem:
% min 0.5*d'*hessf(x)*d + gradf(x)'*d
% d
% subject to: G*x + G*d <= r
Q = feval(hessf,x);
q = feval(gradf,x);
rd = [];
if (p ~= 0)
rd = r-G*x;
end
z = zeros(n,1);
[d, it2] = aktive_mengen_methode(Q,q,A,b,G,rd,z,tol,itmax);
if( max(abs(d)) < tol )
stop = true; % => x is the solution
else
x = x + d;
it = it + 1;
X(it+1,:) = x';
end
% If there are too many iterations
if (it >= itmax)
stop = true;
end
end
fval = feval(f,x);
end
function [x, it] = aktive_mengen_methode(Q,q,A,b,G,r,x0,tol,itmax)
% Funktion: [x, it] = aktive_mengen_methode(Q,q,A,b,G,r,x0,tol,itmax)
%
% Aktive-Mengen-Methode fuer
% (QLU) min f(x) := 0.5*x'*Q*x + q'*x
% x
% mit Nebenbedingung A*x = b und G*x <= r
% (Quadratisches Problem mit linearen Ungleichungsrestriktionen)
%
% Q sei eine symmetriche nxn-Matrix, q aus R^n.
% A sei eine mxn-Matrix, m <= n, b aus R^m.
% G sei eine pxn-Matrix, r aus R^p.
% x0 sei der Startpunkt, wobei x0 die Nebenbedingungen erfuellt.
% tol sei die Toleranz fuer das Abbruchskriterium.
% itmax sei die maximale Anzahl von Iterationen.
k = 0;
x_k = x0;
m = length(b);
p = length(r);
while true
k = k+1;
% Bilde die Matrix G_k := [g_j'], wobei j aus J_k.
% J_k := { 1<=j<=p | (g_j)'*x_k = r_j }
% die Indexmenge der in x_k aktiven Ungleichungsrestriktionen.
%
l = 1;
G_k = [];
for j=1:p
if ( G(j,:)*x_k == r(j) )
G_k(l,:) = G(j,:);
l = l+1;
end
end
B_k = [A; G_k];
[m_k,n_k] = size(B_k);
z = zeros(m_k,1);
% TODO: Was ist wenn m_k > n_k ?
% Loese das Problem (QLG)_k
% min 0.5*d'*Q*d + (Q*x_k+q)'*d
% x
% mit Nebenbedingung B_k = 0
%
[d_k,v_k] = nullraum_verfahren(Q,(Q*x_k+q),B_k,z);
if ~isempty(v_k)
lambda_k = v_k(1:m,1);
miu_k = v_k(m+1:m_k);
else
miu_k = [];
end
if norm(d_k) < tol
% Falls d_k = 0 und miu_k >= 0 : STOP
%
miu_nicht_negative = true;
p_k = length(miu_k);
for j=1:p_k
if miu_k(j) < 0
miu_nicht_negative = false;
end
end
if miu_nicht_negative
break;
end
% Falls d_k = 0 und es existiert j, so dass miu_k(j) < 0
% Dann Inaktivierungsschritt.
%
% Bestimme j_min, so dass miu_k(j_min) das Minimum in miu ist.
j_min = 1;
min_elem = miu_k(1);
for j=2:p_k
if miu_k(j) < min_elem
j_min = j;
min_elem = miu_k(j);
end
end
% Streiche in G_k die Zeile mit dem Index j_min
H_k = [];
H_k(1:j_min-1,:) = G_k(1:j_min-1,:);
H_k(j_min:p_k-1,:) = G_k(j_min+1:p_k,:);
G_k = H_k;
% Loese wieder das Problem (QLG)_k
B_k = [A; G_k];
[m_k,n_k] = size(B_k);
z = zeros(m_k,1);
% min 0.5*d'*Q*d + (Q*x_k+q)'*d
% x
% mit Nebenbedingung B_k = 0
[d_k,v_k] = nullraum_verfahren(Q,(Q*x_k+q),B_k,z);
k = k+1;
% Nun ist d_k ungleich 0
end
% Berechne Scrittweite sigma_k.
%
% Bestimme I_k := { j=1,...,p | (g_j)'*x_k < r_j und (g_j)'*d_k > 0 }
l = 1;
I_k = [];
for j=1:p
if ( (r(j) > G(j,:)*x_k) && (G(j,:)*d_k > 0) )
I_k = [I_k; j];
l = l+1;
end
end
% tao_k := min { (r_j - (g_j)'*x_k) / ((g_j)'*d_k) | j aus I_k}
% falls I_k nicht leer, sonst +infty
% sigma_k := min { 1, tao_k }
if length(I_k) == 0
sigma_k = 1;
else
l = length(I_k);
j = I_k(1);
tao_k = (r(j) - G(j,:)*x_k) / (G(j,:)*d_k);
for t=2:l
j = I_k(t);
tao_k = min(tao_k, ((r(j)-G(j,:)*x_k)/(G(j,:)*d_k)));
end
sigma_k = min(1,tao_k);
end
% Setze x_{k+1} := x_k + sigma_k*d_k und k = k+1.
%
x_k = x_k + sigma_k*d_k;
if k >= itmax
break;
end
end
x = x_k;
it = k;
end
% Funktion: [x, lambda] = nullraum_verfahren(Q,q,A,b)
%
% Nullraum-Verfahren fuer
% (QLG) min f(x) := 0.5*x'*Q*x + q'*x
% x
% mit Nebenbedingung A*x = b
% (Quadratisches Problem mit linearen Gleichungsrestriktionen)
%
% Dabei sei Q eine symmetriche nxn-Matrix, q aus R^n,
% A eine mxn-Matrix, m <= n, b aus R^m.
% A habe vollen Rang.
% Und es gilt: d'*Q*d >= alpha*||d||^2 fuer alle d aus kern(A)
% Dann hat das Problem (QLG) eine eindeutig bestimmte Loesung.
% (Siehe Satz 5.4.13, Walter Alt: Nichtlineare Optimierung, Vieweg, 2002)
%
function [x,lambda] = nullraum_verfahren(Q,q,A,b)
if ( isempty(A) || isempty(b) )
x = -Q\q;
lambda = [];
return
end
[m,n] = size(A);
% Berechne die QR-Zerlegung von A'
%
[P, S] = qr(A'); % Die Funktion qr gibt P und S zurueck, wobei A' = P*S
H = P'; % Diese H erfuellt H*A' = S
R = S(1:m,1:m); % Diese R erfuellt H*A = [R; 0]
% Berechne h := -H*q und [h1; h2] := h, wobei h1 aus R^m
%
h = -H*q;
h1 = h(1:m,1);
h2 = h(m+1:n,1);
% Berechne B := H*Q*H' und
% [ ]
% [ B11 B12 ]
% [ ] := B, wobei B11 eine mxm-Matrix
% [ B21 B22 ]
% [ ]
%
B = H * Q * H';
B11 = B(1:m,1:m);
B12 = B(1:m,m+1:n);
B21 = B(m+1:n,1:m);
B22 = B(m+1:n,m+1:n);
% Berechne x_y Loesung von R'*x_y = b
% und x_z Loesung von B22*x_z = h2 - B21*x_y
%
x_y = R'\b;
if ~isempty(B22)
x_z = B22\(h2-B21*x_y);
else
x_z = [];
end
% Berechne die Loesung x := H'*[x_y; x_z]
% und lambda Loesung von R*lambda = h1 - B11*x_y - B12*x_z
%
x = H'*[x_y; x_z];
if ~isempty(x_z)
lambda = R\(h1-B11*x_y-B12*x_z);
else
lambda = R\(h1-B11*x_y);
end
end