Approssimazione minimax
In questo capitolo studieremo l’approssimazione in norma \|\cdot\|_\infty di funzioni continue mediante polinomi. Per quanto visto in precedenza, questa norma non è indotta da nessun prodotto scalare, quindi non possiamo utilizzare la teoria sviluppata per l’approssimazione in norma \|\cdot\|_2.
Approssimazione minimax polinomiale
Sia f \in C[a, b] e n \in \mathbb{N}. Un polinomio p_n^* \in \mathcal{P}_n si dice di migliore approssimazione minimax (o uniforme) se vale che:
\|f - p_n^*\|_\infty = \min_{p \in \mathcal{P}_n} \|f - p\|_\infty
Sappiamo già per quanto visto in precedenza che l’insieme delle soluzioni è convesso.
Inoltre, sia \delta_n^* := \|f - p_n^*\|_\infty. Sappiamo già che la successione (\delta_n^*)_n è non crescente e vedremo che \delta_n^* \to 0 per n \to \infty.
Vorremmo inoltre dimostrare il seguente teorema:
§ Teorema (Equioscillazione di Chebyshev). Sia f \in C[a, b]. Un polinomio p \in \mathcal{P}_n è il polinomio di migliore approssimazione minimax se e solo se la funzione resto r(x) = f(x) - p(x) ha almeno n+2 punti di equioscillazione. Inoltre, il polinomio di migliore approssimazione è unico.
Per arrivarci, ci servono alcuni risultati intermedi che passano dalla teoria dei punti di equioscillazione e degli insiemi alternanti.
§ Teorema (de la Vallée-Poussin). Sia f \in C[a, b], p \in \mathcal{P}_n un polinomio qualunque e supponiamo che esistano n+2 punti a \le x_0 < x_1 < \dots < x_{n+1} \le b tali che:
f(x_i) - p(x_i) = (-1)^i d_i, \quad i = 0, \dots, n+1
con tutti i d_i \neq 0 e tutti dello stesso segno (ovvero il resto f(x) - p(x) oscilla tra i punti x_i). Allora vale che:
\min_{i = 0, \dots, n+1} |d_i| \le \delta_n^*
Dimostrazione.
Supponiamo senza perdita di generalità che tutti i d_i > 0.
Per assurdo, supponiamo che \min_i |d_i| > \delta_n^*.
Ricordiamo che \delta_n^* = \inf_{q \in \mathcal{P}_n} \|f - q\|_\infty. Poiché l’immagine della funzione q \mapsto \|f - q\|_\infty è [\delta_n^*, +\infty), possiamo considerare un polinomio q \in \mathcal{P}_n tale che:
\delta_n^* \le \|f - q\|_\infty < \min_i d_i
Sia s(x) := p(x) - q(x) un polinomio di grado al più n. Valutiamolo nei punti x_i:
\begin{aligned}
s(x_i) &= p(x_i) - q(x_i) \\
&= (f(x_i) - q(x_i)) - (f(x_i) - p(x_i)) \\
&= (f(x_i) - q(x_i)) - (-1)^i d_i
\end{aligned}
Analizziamo il segno di s(x_i) ricordando che \|f - q\|_\infty < d_i per cui valutando in x_i abbiamo che |f(x_i) - q(x_i)| < d_i per ogni i:
-
Se
iè pari:s(x_i) = (f(x_i) - q(x_i)) - d_i < 0 -
Se
iè dispari:s(x_i) = (f(x_i) - q(x_i)) + d_i > 0
Quindi s(x) è un polinomio di grado \le n che assume n+2 segni alternati, il che implica che abbia almeno n+1 cambi di segno e quindi almeno n+1 zeri.
L’unico polinomio di grado \le n con n+1 zeri è il polinomio nullo, quindi s \equiv 0. Ma questo è assurdo poiché s(x_i) \neq 0. \square
§ Definizione. Siano f \in C[a, b] e p \in \mathcal{P}_n. Diciamo che i punti x_0, \dots, x_k con a \le x_0 < \dots < x_k \le b sono di equioscillazione per la funzione resto r(x) = f(x) - p(x) se per ogni i:
r(x_i) = (-1)^i d, \quad \text{con } |d| = \|r\|_\infty
L’insieme \mathcal A = \{x_0, \dots, x_k\} è detto alternante.
§ Proposizione. Sia \mathcal A un insieme alternante per f e p con f \neq p. Allora \mathcal A ha cardinalità finita.
Dimostrazione.
Poiché r(x) = f(x) - p(x) è continua su un compatto [a, b], è uniformemente continua. Per cui per d = \|f - p\|_\infty > 0, esiste \eta > 0 tale che \forall x, y \in [a, b] con |x - y| \le \eta si ha |r(x) - r(y)| \le d.
Siano ora x_i e x_{i+1} sono due punti consecutivi in \mathcal A, allora per la proprietà di equioscillazione |r(x_i) - r(x_{i+1})| = 2d e 2d > d quindi usando la contronominale ottenuta dall’uniforme continuità, abbiamo che |x_i - x_{i+1}| > \eta.
Quindi in \mathcal A non possono esserci più di (b-a)/\eta punti, ovvero il numero di punti di equioscillazione è finito. \square
§ Definizione. Se x \in [a, b] è tale che r(x) = \|f - p\|_\infty, x si dice punto superiore. Se invece r(x) = -\|f - p\|_\infty, x si dice punto inferiore.
Osserviamo che i punti superiori e inferiori non sono necessariamente in numero finito, in quanto potremmo avere ad esempio un intero intervallo costante in cui il resto assume il valore massimo/minimo.
§ Teorema (Equioscillazione di Chebyshev pt.1). Sia f \in C[a, b].
-
Un polinomio
p \in \mathcal{P}_nè il polinomio di migliore approssimazione minimax se e solo se la funzione restor(x) = f(x) - p(x)ha almenon+2punti di equioscillazione. -
Inoltre, il polinomio di migliore approssimazione è unico.
Dimostrazione.
-
Consideriamo due casi:
-
Se
f \in \mathcal{P}_n, alloraf = pe\|f - p\|_\infty = 0. Il resto èr \equiv 0, che ha infiniti (e quindi\ge n+2) punti di equioscillazione. Viceversa, serha\ge n+2punti di equioscillazione ed è un polinomio di grado\le n, allorarcambia segnon+1volte, il che implicar \equiv 0. -
Se
f \notin \mathcal{P}_n, allora\delta^* = \|f - p\|_\infty > 0.-
\boxed{\Leftarrow}Segue direttamente dal Teorema di de la Vallée-Poussin: se esistonon+2puntix_itali cher(x_i) = (-1)^i dcon|d| = \|r\|_\infty, allora\|f - p\|_\infty = |d| \le \delta^*, quindi\|f - p\|_\infty = \delta^*. -
\boxed{\Rightarrow}Vedremo questo più avanti.
-
-
-
Vediamo l’unicità. Siano
p, \tilde{p} \in \mathcal{P}_ndue polinomi di migliore approssimazione. Poiché l’insieme dei polinomi di migliore approssimazione è convesso, ancheq = (p + \tilde{p}) / 2è un polinomio di migliore approssimazione. Per quanto dimostrato sopra,qdeve avere almenon+2punti di equioscillazione.Sia
yuno di questi punti. Allora:\begin{aligned} \delta_n^* &= |f(y) - q(y)| \\ &= \left| \frac{1}{2}(f(y) - p(y)) + \frac{1}{2}(f(y) - \tilde{p}(y)) \right| \\ &\le \frac{1}{2}|f(y) - p(y)| + \frac{1}{2}|f(y) - \tilde{p}(y)| \\ &\le \frac{1}{2}\delta_n^* + \frac{1}{2}\delta_n^* = \delta_n^* \end{aligned}Quindi devono valere tutte uguaglianze, il che implica
f(y) - p(y) = f(y) - \tilde{p}(y), ovverop(y) = \tilde{p}(y).Poiché questo vale per ogni punto di equioscillazione
ydiq, e tali punti sono almenon+2, i polinomipe\tilde{p}coincidono su almenon+2punti. Essendo di grado\le n, concludiamo chep = \tilde{p}.\square
Osservazione. Sia p \in \mathcal{P}_n il polinomio di migliore approssimazione per f. Poiché r(x) ha almeno n+2 punti di equioscillazione in cui cambia segno, essa ha almeno n+1 zeri in (a, b), diciamo \xi_1, \dots, \xi_{n+1}. Quindi p può essere visto come un polinomio che interpola f nei punti \xi_i.
Vediamo ora come se la funzione f è sufficientemente regolare, possiamo garantire l’esistenza di esattamente n+2 punti di equioscillazione per il polinomio di migliore approssimazione.
§ Proposizione. Sia f \in C^{n+1}[a, b] tale che f^{(n+1)}(x) \neq 0 per ogni x \in [a, b]. Allora il polinomio di migliore approssimazione p \in \mathcal{P}_n ha esattamente n+2 punti di equioscillazione (di cui i due estremi sono a e b).
La funzione resto r(x) è detta allora funzione standard.
Dimostrazione.
Sia k il numero di punti di equioscillazione nell’intervallo (a, b), avendo tolto gli estremi vorremmo vedere che k = n.
Supponiamo per assurdo k > n. In ogni punto di equioscillazione interno, la derivata r'(x) deve annullarsi (essendo punti di estremo). Quindi r'(x) ha almeno k > n zeri in (a, b).
Per il teorema di Rolle, la derivata seconda r''(x) avrà almeno k-1 > n-1 zeri in (a, b).
Procedendo per induzione, la derivata (n+1)-esima r^{(n+1)}(x) si annullerebbe in almeno k-n \ge 1 punti in (a, b).
Tuttavia, r^{(n+1)}(x) = f^{(n+1)}(x) - p^{(n+1)}(x) = f^{(n+1)}(x), poiché p \in \mathcal{P}_n.
Ma per ipotesi f^{(n+1)}(x) \neq 0, il che è un assurdo. \square
§ Teorema. Sia f \in C[a, b]. Per l’approssimazione minimax vale \delta_n^* \to 0 per n \to \infty (ovvero vale la proprietà di buona approssimazione).
Dimostrazione. Vogliamo dimostrare che
\forall \varepsilon > 0, \exists \bar{n} \text{ t.c. } \forall n > \bar{n}, \delta_n^* \le \varepsilon
Dato \varepsilon > 0, per il teorema di Weierstrass esiste m \in \mathbb{N} e q_m \in \mathcal{P}_m tale che \|f - q_m\|_\infty \le \varepsilon.
Inoltre sappiamo che dato m esiste un unico p_m^* polinomio di migliore approssimazione di grado m (per unicità), tale che \delta_m^* = \|f - p_m^*\|_\infty, allora essendo p_m^* il polinomio di migliore approssimazione di grado m:
\delta_m^* = \|f - p_m^*\|_\infty \le \|f - q_m\|_\infty \le \varepsilon
Per la monotonia di (\delta_n^*)_n ne segue che \forall n \ge m, \delta_n^* \le \delta_m^* \le \varepsilon. \square
Velocità di convergenza
§ Teorema (Jackson). Sia f \in C^k[a, b]. Allora esiste una costante \gamma (che non dipende da n) tale che:
\delta_n^* \le \frac{\gamma \|f^{(k)}\|_\infty}{n^k}
Insiemi alternanti sezionati
§ Definizione. Un insieme alternante sezionato \mathcal{A} è un insieme alternante \{x_0, \dots, x_k\} associato ad un insieme di intervalli \{I_0, \dots, I_k\} (dette sezioni) tali che:
-
Ogni
I_jè un intervallo chiuso non banale contenuto in[a, b]. -
Gli intervalli
\{I_0, \dots, I_k\}formano una partizione di[a, b], ovvero\bigcup_{j=0}^k I_j = [a, b]e gli interni sono disgiunti (I_i \cap I_jpuò essere al più un punto comune). -
x_i \in I_iper ognii. -
Se
x_iè un punto superiore, allora l’intervalloI_inon contiene punti inferiori. -
Se
x_iè un punto inferiore, allora l’intervalloI_inon contiene punti superiori.
Esempio. Consideriamo la funzione resto rappresentata nel grafico seguente:
Nell’esempio, l’insieme \{a, x_1, x_2, x_3\} è alternante ma non sezionato (poiché tra a e x_1 ci sono altri punti di estremo), mentre l’insieme \{a, \tilde{x}, \bar{x}, x_1, x_2, x_3\} è alternante e sezionato.
§ Teorema. Sia \mathcal A un insieme alternante per r(x). Allora esiste un insieme \mathcal A' alternante e sezionato tale che \mathcal A \subseteq \mathcal A'.
Osservazione. Siano f \in C[a, b], p \in \mathcal{P}_n, \delta = \|f - p\|_\infty > 0 e \mathcal{A} un insieme alternante sezionato per r(x) = f(x) - p(x):
-
Se
I_jè una sezione inferiore (ovverox_jè un punto di minimo), allora\forall x \in I_jsi ha-\delta \le r(x) \le \delta. Poichér(x)è continua suI_jche è chiuso, essa ammette massimo inI_j. Per definizione di sezione inferiore,I_jnon contiene punti di massimo, quindi esiste\varepsilon_j > 0tale che:-\delta \le r(x) \le \delta - \varepsilon_j \quad \forall x \in I_j -
Analogamente, se
I_jè una sezione superiore (ovverox_jè un punto di massimo), esiste\varepsilon_j > 0tale che:-\delta + \varepsilon_j \le r(x) \le \delta \quad \forall x \in I_j
§ Lemma. Nelle ipotesi precedenti, esiste \varepsilon > 0 tale che per ogni i = 0, \dots, k:
- Se
I_iè una sezione inferiore, allora-\delta \le r(x) \le \delta - \varepsilonper ognix \in I_i. - Se
I_iè una sezione superiore, allora-\delta + \varepsilon \le r(x) \le \deltaper ognix \in I_i.
Dimostrazione.
Basta scegliere \varepsilon = \min_{j=0, \dots, k} \varepsilon_j. Poiché l’insieme delle sezioni è finito, il minimo di valori strettamente positivi è ancora strettamente positivo. \square
§ Teorema. Siano f \in C[a, b], p \in \mathcal{P}_n e \delta = \|f - p\|_\infty > 0. Sia \mathcal{A} = \{x_0, \dots, x_k\} un insieme alternante sezionato per il resto r(x) = f(x) - p(x). Se k \le n, allora esiste un polinomio q \in \mathcal{P}_k \subseteq \mathcal{P}_n tale che:
\|f - (p + q)\|_\infty < \delta
Dimostrazione.
-
Caso
k \ge 1: Siano\xi_1, \dots, \xi_ki punti di separazione tra le sezioniI_0, \dots, I_k, ovveroI_0 = [a, \xi_1], I_1 = [\xi_1, \xi_2], \dots, I_k = [\xi_k, b]e definiamo il polinomio:
s(x) := \prod_{i=1}^k (x - \xi_i) \in \mathcal{P}_kOsserviamo che
s(x)ha segno costante all’interno di ogni sezioneI_j. Senza perdita di generalità, assumiamo ches(x) > 0sulle sezioni superiori es(x) < 0sulle sezioni inferiori.Dato
\varepsilon > 0dal lemma precedente, riscaliamos(x)definendoq(x) := \gamma s(x)con\gamma > 0sufficientemente piccolo tale che\|q\|_\infty < \varepsilon.Verifichiamo che
\forall x \in [a, b]si ha|f(x) - (p(x) + q(x))| = |r(x) - q(x)| < \delta:-
Sia
x \in I_juna sezione inferiore. Allora-\delta \le r(x) \le \delta - \varepsiloneq(x) < 0con|q(x)| < \varepsilon.Sommando
-q(x) > 0ar(x), abbiamor(x) - q(x) > r(x) \ge -\delta(il limite inferiore non viene superato). Inoltrer(x) - q(x) < (\delta - \varepsilon) + \varepsilon = \delta.Quindi
-\delta < r(x) - q(x) < \delta.In breve, abbiamo che
0 < -q(x) < \varepsilone-\delta \le r(x) \le \delta - \varepsilonimplica:-\delta < r(x) - q(x) < \delta -
Il ragionamento è analogo per le sezioni superiori.
-
Se
x = \xi_i(uno zero diq),xnon può essere un punto di equioscillazione (che sono interni alle sezioni o agli estremi di[a, b]ma non punti di separazione tra sezioni di segno opposto per definizione di insieme sezionato), quindi|r(x)| < \deltae|r(x) - q(x)| = |r(x)| < \delta.
-
-
Caso
k = 0: C’è un solo punto di equioscillazionex_0, quindi un’unica sezioneI_0 = [a, b]. Basta scegliereq(x) \equiv \gammaoq(x) \equiv -\gammaa seconda chex_0sia un punto di massimo o di minimo.
In tutti i casi abbiamo trovato un polinomio p + q \in \mathcal{P}_n che approssima f meglio di p. \square
Completamento del Teorema di Equioscillazione
Possiamo ora completare la dimostrazione del Teorema di Equioscillazione di Chebyshev.
§ Teorema (Equioscillazione di Chebyshev pt.2). Sia f \in C[a, b]. Un polinomio p \in \mathcal{P}_n è il polinomio di migliore approssimazione minimax se e solo se la funzione resto r(x) = f(x) - p(x) ha almeno n+2 punti di equioscillazione.
Dimostrazione.
\boxed{\Rightarrow} Sia p \in \mathcal{P}_n il polinomio di migliore approssimazione uniforme di f. Supponiamo per assurdo che il resto r(x) = f(x) - p(x) abbia un insieme alternante che possiamo estendere ad un insieme alternante sezionato \mathcal A = \{x_0, \dots, x_k\} con k+1 < n+2, ovvero k \le n.
Per il Teorema di miglioramento dell’approssimazione, esiste un polinomio q \in \mathcal{P}_k \subseteq \mathcal{P}_n tale che:
\|f - (p + q)\|_\infty < \|f - p\|_\infty
Questo contraddice l’ipotesi che p sia il polinomio di migliore approssimazione in \mathcal{P}_n. Pertanto deve essere k \ge n+1, ovvero devono esserci almeno n+2 punti di equioscillazione. \square
§ Teorema (Stima dell’errore minimax). Sia f \in C^{n+1}[a, b] tale che f^{(n+1)}(x) \neq 0 per ogni x \in [a, b] e siano m, M tali che 0 < m \le |f^{(n+1)}(x)| \le M su [a, b]. Allora la migliore approssimazione uniforme \delta_n^* soddisfa:
\frac{m (b - a)^{n+1}}{2^{2n+1} (n+1)!} \le \delta_n^* \le \frac{M (b - a)^{n+1}}{2^{2n+1} (n+1)!}
Dimostrazione.
Senza perdita di generalità, assumiamo [a, b] = [-1, 1]. Per cui la tesi diventa:
\frac{m}{2^n (n+1)!} \le \delta_n^* \le \frac{M}{2^n (n+1)!}
Sia T_{n+1}(x) il polinomio di Chebyshev di prima specie e t_{n+1}(x) := T_{n+1}(x)/2^n il corrispondente polinomio monico di grado n+1. Ricordiamo che \|t_{n+1}\|_\infty = \min_{p \in \mathcal{P}_{n+1} \text{ monico}} \|p\|_\infty = 1/2^n.
Sia p_n il polinomio di migliore approssimazione minimax di f. Sappiamo che esso può essere visto come un polinomio che interpola f in n+1 punti \xi_0, \dots, \xi_n in cui il resto r_n(x) = f(x) - p_n(x) si annulla.
Usando la formula del resto per l’interpolazione polinomiale:
r_n(x) = f(x) - p_n(x) = \prod_{j=0}^{n} (x - \xi_j) \frac{f^{(n+1)}(\eta)}{(n+1)!} =: s(x) \frac{f^{(n+1)}(\eta)}{(n+1)!}
con \eta \in (-1, 1) e s(x) \in \mathcal{P}_{n+1} polinomio monico.
-
Limite inferiore: Poiché
s(x)è un polinomio monico di gradon+1, si ha\|s\|_\infty \ge 1/2^n. Siayun punto tale che|s(y)| = \|s\|_\infty. Allora:\delta_n^* = \|r_n\|_\infty \ge |r_n(y)| = |s(y)| \frac{|f^{(n+1)}(\eta)|}{(n+1)!} \ge \frac{1}{2^n} \frac{m}{(n+1)!} -
Limite superiore: Possiamo scrivere
s(x) = r_n(x) \frac{(n+1)!}{f^{(n+1)}(\eta)}. Poichéf^{(n+1)}è continua e mai nulla in[-1, 1], essa ha segno costante. Pertantos(x)er_n(x)hanno lo stesso segno (modulo il segno dif^{(n+1)}). Segue che:|s(x)| = |r_n(x)| \frac{(n+1)!}{|f^{(n+1)}(\eta)|} \ge \frac{|r_n(x)| (n+1)!}{M}Supponiamo per assurdo che
\delta_n^* > \frac{M}{2^n (n+1)!}. Sianox_iglin+2punti di equioscillazione dir_n(x), allora|r_n(x_i)| = \delta_n^*e:|s(x_i)| \ge \frac{|r_n(x_i)| (n+1)!}{M} = \frac{\delta_n^* (n+1)!}{M} > \frac{M}{2^n (n+1)!} \frac{(n+1)!}{M} = \frac{1}{2^n}Quindi
s(x)assume in glix_ivalori in modulo strettamente maggiori di1/2^ncon segni alterni. Consideriamo il polinomioh = s - t_{n+1}. Poiché siaschet_{n+1}sono polinomi monici di gradon+1, il loro grado è al piùn. Tuttavia, dato che|s(x_i)| > |t_{n+1}(x_i)|per ogniies(x_i)ha segni alterni,h(x_i)deve avere lo stesso segno dis(x_i). Quindihcambia segno almenon+1volte in[a, b], il che implica chehabbia almenon+1zeri. Essendo\deg(h) \le n, deve essereh \equiv 0, ovveros = t_{n+1}. Ma questo è assurdo poiché\|s\|_\infty > 1/2^nmentre\|t_{n+1}\|_\infty = 1/2^n.\square
Algoritmo di Remez
È un metodo iterativo che serve per trovare il polinomio di migliore approssimazione minimax p_n^*(x).
Siano f \in C[a, b] e n \in \mathbb{N}. Ad ogni iterazione k, l’algoritmo determina un insieme di punti:
a \le x_0^{(k)} < x_1^{(k)} < \dots < x_{n+1}^{(k)} \le b
che approssimano i punti di equioscillazione, e un polinomio p^{(k)}(x) \in \mathcal{P}_n che approssima p_n^*(x).
La scelta iniziale dei punti di equioscillazione è arbitraria, ma solitamente si scelgono i nodi di Chebyshev riscalati su [a, b] (punti di massimo/minimo di T_{n+1}(x)):
x_i^{(0)} = \frac{b-a}{2} \cos \left( \frac{(n+1-i)\pi}{n+1} \right) + \frac{a+b}{2}
All’iterazione k-esima, disponendo dei punti \{x_i^{(k)}\}:
- Sia
q^{(k)}(x) \in \mathcal{P}_{n+1}il polinomio che interpolafnei punti\{x_i^{(k)}\}, ovveroq^{(k)}(x_i^{(k)}) = f(x_i^{(k)})peri = 0, \dots, n+1. - Sia
s^{(k)}(x) \in \mathcal{P}_{n+1}il polinomio tale ches^{(k)}(x_i^{(k)}) = (-1)^iperi = 0, \dots, n+1. - Definiamo
d^{(k)}come il rapporto tra i coefficienti di grado massimo diq^{(k)}es^{(k)}, in modo chep^{(k)} := q^{(k)} - d^{(k)}s^{(k)}sia un polinomio di grado al piùn.
Il resto r^{(k)}(x) = f(x) - p^{(k)}(x) valutato nei punti dell’iterazione corrente vale:
\begin{aligned}
r^{(k)}(x_i^{(k)}) &= f(x_i^{(k)}) - p^{(k)}(x_i^{(k)}) \\
&= f(x_i^{(k)}) - (q^{(k)}(x_i^{(k)}) - d^{(k)}s^{(k)}(x_i^{(k)})) \\
&= f(x_i^{(k)}) - f(x_i^{(k)}) + d^{(k)}(-1)^i \\
&= (-1)^i d^{(k)} \neq 0
\end{aligned}
Se i punti x_i^{(k)} sono i punti di massimo/minimo locale per r^{(k)}, l’algoritmo termina. Altrimenti, si definiscono i nuovi punti x_i^{(k+1)} come gli estremanti locali di r^{(k)}(x), assicurandosi che r^{(k)}(x_i^{(k+1)}) abbia lo stesso segno di r^{(k)}(x_i^{(k)}) (possono esserci più di n+2 punti).
Criteri di arresto
Si possono utilizzare diversi criteri di arresto:
- Distanza tra i polinomi
p^{(k)}ep^{(k+1)}sufficientemente piccola. - Vicinanza tra i vettori dei punti
(x_i^{(k)})e(x_i^{(k+1)}). - Basato sui residui: siano
m = \min_i |r^{(k)}(x_i^{(k+1)})|eM = \max_i |r^{(k)}(x_i^{(k+1)})|. Idealmente vorremmoM/m \approx 1, quindi:\left| \frac{M}{m} - 1 \right| < \varepsilon
§ Teorema (Convergenza di Remez). Siano f \in C[a, b], n \in \mathbb{N}. Siano \{x_i^{(k)}\} e p^{(k)} i punti e i polinomi generati dall’algoritmo di Remez, p^* il polinomio di migliore approssimazione minimax e x_i^* i suoi punti di equioscillazione. Allora:
\lim_{k \to \infty} \|p^{(k)} - p^*\|_\infty = 0(convergenza dei polinomi).- Se
f \in C^2[a, b],r_n^*è una funzione standard e(r_n^*)''(x_i^*) \neq 0per ognii, allora la convergenza è quadratica. Ovvero, posto\delta_n^{(k)} = \|f - p^{(k)}\|_\infty, esiste\gamma > 0tale che:\frac{\delta_n^{(k+1)} - \delta_n^*}{(\delta_n^{(k)} - \delta_n^*)^2} \le \gamma
Approssimazione quasi-minimax
L’idea è di usare serie di Chebyshev troncate. Vogliamo prendere:
f(x) \approx \sum_{i=0}^n c_i T_i(x) \in \mathcal{P}_n
dove la notazione \sum' indica che il primo coefficiente è moltiplicato per 1/2. I coefficienti sono dati da:
c_n = \int_{-1}^{+1} \frac{f(s) T_n(s)}{\sqrt{1 - s^2}} \mathrm ds
Si dimostra che la serie troncata C_n soddisfa:
\delta_n^* \le \|f - C_n\|_\infty \le 4 \left( 1 + \frac{1}{\pi^2} \log n \right) \delta_n^*
e che se f è lipschitziana, allora \lim_{n \to \infty} \|f - C_n\|_\infty = 0.
Inoltre, se f \in C^k[a, b], allora |c_j| \le K/j^k per una qualche costante K > 0. Se i coefficienti |c_j| decadono rapidamente, allora f - C_n = \sum_{j > n} c_j T_j e il termine dominante è l’(n+1)-esimo:
f(x) - C_n(x) \approx c_{n+1} T_{n+1}(x)
Poiché c_{n+1} T_{n+1}(x) ha n+2 punti di equioscillazione, C_n(x) sarà molto vicino al polinomio di migliore approssimazione.
Se r(x) \approx c_{n+1} T_{n+1}(x), avremo che negli zeri di T_{n+1} il resto r(x) \approx 0. Tali zeri sono:
\xi_i = \cos \left( \frac{(2i + 1) \pi}{2(n + 1)} \right)
Definiamo I_n \in \mathcal{P}_n come il polinomio di interpolazione di f nei nodi di Chebyshev \xi_i. Dalla formula del resto dell’interpolazione per f \in C^{n+1}:
f(x) - I_n(x) = \prod_{i=0}^n (x - \xi_i) \frac{f^{(n+1)}(\zeta)}{(n+1)!}, \quad \zeta \in (-1, 1)
\|f - I_n\|_\infty \le \frac{\|f^{(n+1)}\|_\infty}{(n+1)!} \left\| \prod_{i=0}^n (x - \xi_i) \right\|_\infty
L’errore è minimizzato scegliendo come nodi le radici del polinomio di Chebyshev normalizzato.
Approssimazione minimax razionale
Sia f \in C[a, b] e m, n \in \mathbb{N}. Sia \mathcal{R}_{m,n} l’insieme delle funzioni razionali di tipo (m, n), ovvero:
\mathcal{R}_{m,n} = \left\{ s(x) = \frac{p(x)}{q(x)} : p \in \mathcal{P}_m, q \in \mathcal{P}_n, q(x) \neq 0 \text{ in } [a, b] \right\}
Diciamo che s^* \in \mathcal{R}_{m,n} è di migliore approssimazione minimax razionale se e solo se:
\|f - s^*\|_\infty = \min_{s \in \mathcal{R}_{m,n}} \|f - s\|_\infty
§ Teorema.
- Una funzione razionale
s = p/q \in \mathcal{R}_{m,n}(ridotta ai minimi termini) è di migliore approssimazione se e solo se la funzione restor(x) = f(x) - s(x)ha almenom + n - d + 2punti di equioscillazione, doved = \min \{ m - \deg(p), n - \deg(q) \}è il difetto disin\mathcal{R}_{m,n}. - La funzione razionale di migliore approssimazione minimax esiste ed è unica.
Osservazione. Esiste una versione dell’algoritmo di Remez adattata per il caso razionale.