Approssimazione minimax

In questo capitolo studieremo l’approssimazione in norma \|\cdot\|_\infty di funzioni continue mediante polinomi. Per quanto visto in precedenza, questa norma non è indotta da nessun prodotto scalare, quindi non possiamo utilizzare la teoria sviluppata per l’approssimazione in norma \|\cdot\|_2.

Approssimazione minimax polinomiale

Sia f \in C[a, b] e n \in \mathbb{N}. Un polinomio p_n^* \in \mathcal{P}_n si dice di migliore approssimazione minimax (o uniforme) se vale che:

\|f - p_n^*\|_\infty = \min_{p \in \mathcal{P}_n} \|f - p\|_\infty

Sappiamo già per quanto visto in precedenza che l’insieme delle soluzioni è convesso. Inoltre, sia \delta_n^* := \|f - p_n^*\|_\infty. Sappiamo già che la successione (\delta_n^*)_n è non crescente e vedremo che \delta_n^* \to 0 per n \to \infty.

Vorremmo inoltre dimostrare il seguente teorema:

§ Teorema (Equioscillazione di Chebyshev). Sia f \in C[a, b]. Un polinomio p \in \mathcal{P}_n è il polinomio di migliore approssimazione minimax se e solo se la funzione resto r(x) = f(x) - p(x) ha almeno n+2 punti di equioscillazione. Inoltre, il polinomio di migliore approssimazione è unico.

Per arrivarci, ci servono alcuni risultati intermedi che passano dalla teoria dei punti di equioscillazione e degli insiemi alternanti.

§ Teorema (de la Vallée-Poussin). Sia f \in C[a, b], p \in \mathcal{P}_n un polinomio qualunque e supponiamo che esistano n+2 punti a \le x_0 < x_1 < \dots < x_{n+1} \le b tali che:

f(x_i) - p(x_i) = (-1)^i d_i, \quad i = 0, \dots, n+1

con tutti i d_i \neq 0 e tutti dello stesso segno (ovvero il resto f(x) - p(x) oscilla tra i punti x_i). Allora vale che:

\min_{i = 0, \dots, n+1} |d_i| \le \delta_n^*

Dimostrazione.

Supponiamo senza perdita di generalità che tutti i d_i > 0.

Per assurdo, supponiamo che \min_i |d_i| > \delta_n^*. Ricordiamo che \delta_n^* = \inf_{q \in \mathcal{P}_n} \|f - q\|_\infty. Poiché l’immagine della funzione q \mapsto \|f - q\|_\infty è [\delta_n^*, +\infty), possiamo considerare un polinomio q \in \mathcal{P}_n tale che:

\delta_n^* \le \|f - q\|_\infty < \min_i d_i

Sia s(x) := p(x) - q(x) un polinomio di grado al più n. Valutiamolo nei punti x_i:

\begin{aligned}
s(x_i) &= p(x_i) - q(x_i) \\
&= (f(x_i) - q(x_i)) - (f(x_i) - p(x_i)) \\
&= (f(x_i) - q(x_i)) - (-1)^i d_i
\end{aligned}

Analizziamo il segno di s(x_i) ricordando che \|f - q\|_\infty < d_i per cui valutando in x_i abbiamo che |f(x_i) - q(x_i)| < d_i per ogni i:

  • Se i è pari: s(x_i) = (f(x_i) - q(x_i)) - d_i < 0

  • Se i è dispari: s(x_i) = (f(x_i) - q(x_i)) + d_i > 0

Quindi s(x) è un polinomio di grado \le n che assume n+2 segni alternati, il che implica che abbia almeno n+1 cambi di segno e quindi almeno n+1 zeri.

L’unico polinomio di grado \le n con n+1 zeri è il polinomio nullo, quindi s \equiv 0. Ma questo è assurdo poiché s(x_i) \neq 0. \square

§ Definizione. Siano f \in C[a, b] e p \in \mathcal{P}_n. Diciamo che i punti x_0, \dots, x_k con a \le x_0 < \dots < x_k \le b sono di equioscillazione per la funzione resto r(x) = f(x) - p(x) se per ogni i:

r(x_i) = (-1)^i d, \quad \text{con } |d| = \|r\|_\infty

L’insieme \mathcal A = \{x_0, \dots, x_k\} è detto alternante.

§ Proposizione. Sia \mathcal A un insieme alternante per f e p con f \neq p. Allora \mathcal A ha cardinalità finita.

Dimostrazione.

Poiché r(x) = f(x) - p(x) è continua su un compatto [a, b], è uniformemente continua. Per cui per d = \|f - p\|_\infty > 0, esiste \eta > 0 tale che \forall x, y \in [a, b] con |x - y| \le \eta si ha |r(x) - r(y)| \le d.

Siano ora x_i e x_{i+1} sono due punti consecutivi in \mathcal A, allora per la proprietà di equioscillazione |r(x_i) - r(x_{i+1})| = 2d e 2d > d quindi usando la contronominale ottenuta dall’uniforme continuità, abbiamo che |x_i - x_{i+1}| > \eta.

Quindi in \mathcal A non possono esserci più di (b-a)/\eta punti, ovvero il numero di punti di equioscillazione è finito. \square

§ Definizione. Se x \in [a, b] è tale che r(x) = \|f - p\|_\infty, x si dice punto superiore. Se invece r(x) = -\|f - p\|_\infty, x si dice punto inferiore.

Osserviamo che i punti superiori e inferiori non sono necessariamente in numero finito, in quanto potremmo avere ad esempio un intero intervallo costante in cui il resto assume il valore massimo/minimo.

§ Teorema (Equioscillazione di Chebyshev pt.1). Sia f \in C[a, b].

  1. Un polinomio p \in \mathcal{P}_n è il polinomio di migliore approssimazione minimax se e solo se la funzione resto r(x) = f(x) - p(x) ha almeno n+2 punti di equioscillazione.

  2. Inoltre, il polinomio di migliore approssimazione è unico.

Dimostrazione.

  1. Consideriamo due casi:

    • Se f \in \mathcal{P}_n, allora f = p e \|f - p\|_\infty = 0. Il resto è r \equiv 0, che ha infiniti (e quindi \ge n+2) punti di equioscillazione. Viceversa, se r ha \ge n+2 punti di equioscillazione ed è un polinomio di grado \le n, allora r cambia segno n+1 volte, il che implica r \equiv 0.

    • Se f \notin \mathcal{P}_n, allora \delta^* = \|f - p\|_\infty > 0.

      • \boxed{\Leftarrow} Segue direttamente dal Teorema di de la Vallée-Poussin: se esistono n+2 punti x_i tali che r(x_i) = (-1)^i d con |d| = \|r\|_\infty, allora \|f - p\|_\infty = |d| \le \delta^*, quindi \|f - p\|_\infty = \delta^*.

      • \boxed{\Rightarrow} Vedremo questo più avanti.

  2. Vediamo l’unicità. Siano p, \tilde{p} \in \mathcal{P}_n due polinomi di migliore approssimazione. Poiché l’insieme dei polinomi di migliore approssimazione è convesso, anche q = (p + \tilde{p}) / 2 è un polinomio di migliore approssimazione. Per quanto dimostrato sopra, q deve avere almeno n+2 punti di equioscillazione.

    Sia y uno di questi punti. Allora:

    \begin{aligned}
    \delta_n^* &= |f(y) - q(y)| \\
    &= \left| \frac{1}{2}(f(y) - p(y)) + \frac{1}{2}(f(y) - \tilde{p}(y)) \right| \\
    &\le \frac{1}{2}|f(y) - p(y)| + \frac{1}{2}|f(y) - \tilde{p}(y)| \\
    &\le \frac{1}{2}\delta_n^* + \frac{1}{2}\delta_n^* = \delta_n^*
    \end{aligned}

    Quindi devono valere tutte uguaglianze, il che implica f(y) - p(y) = f(y) - \tilde{p}(y), ovvero p(y) = \tilde{p}(y).

    Poiché questo vale per ogni punto di equioscillazione y di q, e tali punti sono almeno n+2, i polinomi p e \tilde{p} coincidono su almeno n+2 punti. Essendo di grado \le n, concludiamo che p = \tilde{p}. \square

Osservazione. Sia p \in \mathcal{P}_n il polinomio di migliore approssimazione per f. Poiché r(x) ha almeno n+2 punti di equioscillazione in cui cambia segno, essa ha almeno n+1 zeri in (a, b), diciamo \xi_1, \dots, \xi_{n+1}. Quindi p può essere visto come un polinomio che interpola f nei punti \xi_i.

Vediamo ora come se la funzione f è sufficientemente regolare, possiamo garantire l’esistenza di esattamente n+2 punti di equioscillazione per il polinomio di migliore approssimazione.

§ Proposizione. Sia f \in C^{n+1}[a, b] tale che f^{(n+1)}(x) \neq 0 per ogni x \in [a, b]. Allora il polinomio di migliore approssimazione p \in \mathcal{P}_n ha esattamente n+2 punti di equioscillazione (di cui i due estremi sono a e b).

La funzione resto r(x) è detta allora funzione standard.

Dimostrazione.

Sia k il numero di punti di equioscillazione nell’intervallo (a, b), avendo tolto gli estremi vorremmo vedere che k = n.

Supponiamo per assurdo k > n. In ogni punto di equioscillazione interno, la derivata r'(x) deve annullarsi (essendo punti di estremo). Quindi r'(x) ha almeno k > n zeri in (a, b).

Per il teorema di Rolle, la derivata seconda r''(x) avrà almeno k-1 > n-1 zeri in (a, b).

Procedendo per induzione, la derivata (n+1)-esima r^{(n+1)}(x) si annullerebbe in almeno k-n \ge 1 punti in (a, b). Tuttavia, r^{(n+1)}(x) = f^{(n+1)}(x) - p^{(n+1)}(x) = f^{(n+1)}(x), poiché p \in \mathcal{P}_n. Ma per ipotesi f^{(n+1)}(x) \neq 0, il che è un assurdo. \square

§ Teorema. Sia f \in C[a, b]. Per l’approssimazione minimax vale \delta_n^* \to 0 per n \to \infty (ovvero vale la proprietà di buona approssimazione).

Dimostrazione. Vogliamo dimostrare che

\forall \varepsilon > 0, \exists \bar{n} \text{ t.c. } \forall n > \bar{n}, \delta_n^* \le \varepsilon

Dato \varepsilon > 0, per il teorema di Weierstrass esiste m \in \mathbb{N} e q_m \in \mathcal{P}_m tale che \|f - q_m\|_\infty \le \varepsilon.

Inoltre sappiamo che dato m esiste un unico p_m^* polinomio di migliore approssimazione di grado m (per unicità), tale che \delta_m^* = \|f - p_m^*\|_\infty, allora essendo p_m^* il polinomio di migliore approssimazione di grado m:

\delta_m^* = \|f - p_m^*\|_\infty \le \|f - q_m\|_\infty \le \varepsilon

Per la monotonia di (\delta_n^*)_n ne segue che \forall n \ge m, \delta_n^* \le \delta_m^* \le \varepsilon. \square

Velocità di convergenza

§ Teorema (Jackson). Sia f \in C^k[a, b]. Allora esiste una costante \gamma (che non dipende da n) tale che:

\delta_n^* \le \frac{\gamma \|f^{(k)}\|_\infty}{n^k}

Insiemi alternanti sezionati

§ Definizione. Un insieme alternante sezionato \mathcal{A} è un insieme alternante \{x_0, \dots, x_k\} associato ad un insieme di intervalli \{I_0, \dots, I_k\} (dette sezioni) tali che:

  • Ogni I_j è un intervallo chiuso non banale contenuto in [a, b].

  • Gli intervalli \{I_0, \dots, I_k\} formano una partizione di [a, b], ovvero \bigcup_{j=0}^k I_j = [a, b] e gli interni sono disgiunti (I_i \cap I_j può essere al più un punto comune).

  • x_i \in I_i per ogni i.

  • Se x_i è un punto superiore, allora l’intervallo I_i non contiene punti inferiori.

  • Se x_i è un punto inferiore, allora l’intervallo I_i non contiene punti superiori.

Esempio. Consideriamo la funzione resto rappresentata nel grafico seguente:

Example of sectioned alternating set

Nell’esempio, l’insieme \{a, x_1, x_2, x_3\} è alternante ma non sezionato (poiché tra a e x_1 ci sono altri punti di estremo), mentre l’insieme \{a, \tilde{x}, \bar{x}, x_1, x_2, x_3\} è alternante e sezionato.

§ Teorema. Sia \mathcal A un insieme alternante per r(x). Allora esiste un insieme \mathcal A' alternante e sezionato tale che \mathcal A \subseteq \mathcal A'.

Osservazione. Siano f \in C[a, b], p \in \mathcal{P}_n, \delta = \|f - p\|_\infty > 0 e \mathcal{A} un insieme alternante sezionato per r(x) = f(x) - p(x):

  • Se I_j è una sezione inferiore (ovvero x_j è un punto di minimo), allora \forall x \in I_j si ha -\delta \le r(x) \le \delta. Poiché r(x) è continua su I_j che è chiuso, essa ammette massimo in I_j. Per definizione di sezione inferiore, I_j non contiene punti di massimo, quindi esiste \varepsilon_j > 0 tale che:

    -\delta \le r(x) \le \delta - \varepsilon_j \quad \forall x \in I_j
  • Analogamente, se I_j è una sezione superiore (ovvero x_j è un punto di massimo), esiste \varepsilon_j > 0 tale che:

    -\delta + \varepsilon_j \le r(x) \le \delta \quad \forall x \in I_j

§ Lemma. Nelle ipotesi precedenti, esiste \varepsilon > 0 tale che per ogni i = 0, \dots, k:

  • Se I_i è una sezione inferiore, allora -\delta \le r(x) \le \delta - \varepsilon per ogni x \in I_i.
  • Se I_i è una sezione superiore, allora -\delta + \varepsilon \le r(x) \le \delta per ogni x \in I_i.

Dimostrazione.

Basta scegliere \varepsilon = \min_{j=0, \dots, k} \varepsilon_j. Poiché l’insieme delle sezioni è finito, il minimo di valori strettamente positivi è ancora strettamente positivo. \square

§ Teorema. Siano f \in C[a, b], p \in \mathcal{P}_n e \delta = \|f - p\|_\infty > 0. Sia \mathcal{A} = \{x_0, \dots, x_k\} un insieme alternante sezionato per il resto r(x) = f(x) - p(x). Se k \le n, allora esiste un polinomio q \in \mathcal{P}_k \subseteq \mathcal{P}_n tale che:

\|f - (p + q)\|_\infty < \delta

Dimostrazione.

  • Caso k \ge 1: Siano \xi_1, \dots, \xi_k i punti di separazione tra le sezioni I_0, \dots, I_k, ovvero

    I_0 = [a, \xi_1], I_1 = [\xi_1, \xi_2], \dots, I_k = [\xi_k, b]

    e definiamo il polinomio:

    s(x) := \prod_{i=1}^k (x - \xi_i) \in \mathcal{P}_k

    Osserviamo che s(x) ha segno costante all’interno di ogni sezione I_j. Senza perdita di generalità, assumiamo che s(x) > 0 sulle sezioni superiori e s(x) < 0 sulle sezioni inferiori.

    Dato \varepsilon > 0 dal lemma precedente, riscaliamo s(x) definendo q(x) := \gamma s(x) con \gamma > 0 sufficientemente piccolo tale che \|q\|_\infty < \varepsilon.

    Verifichiamo che \forall x \in [a, b] si ha |f(x) - (p(x) + q(x))| = |r(x) - q(x)| < \delta:

    • Sia x \in I_j una sezione inferiore. Allora -\delta \le r(x) \le \delta - \varepsilon e q(x) < 0 con |q(x)| < \varepsilon.

      Sommando -q(x) > 0 a r(x), abbiamo r(x) - q(x) > r(x) \ge -\delta (il limite inferiore non viene superato). Inoltre r(x) - q(x) < (\delta - \varepsilon) + \varepsilon = \delta.

      Quindi -\delta < r(x) - q(x) < \delta.

      In breve, abbiamo che 0 < -q(x) < \varepsilon e -\delta \le r(x) \le \delta - \varepsilon implica:

      -\delta < r(x) - q(x) < \delta
    • Il ragionamento è analogo per le sezioni superiori.

    • Se x = \xi_i (uno zero di q), x non può essere un punto di equioscillazione (che sono interni alle sezioni o agli estremi di [a, b] ma non punti di separazione tra sezioni di segno opposto per definizione di insieme sezionato), quindi |r(x)| < \delta e |r(x) - q(x)| = |r(x)| < \delta.

  • Caso k = 0: C’è un solo punto di equioscillazione x_0, quindi un’unica sezione I_0 = [a, b]. Basta scegliere q(x) \equiv \gamma o q(x) \equiv -\gamma a seconda che x_0 sia un punto di massimo o di minimo.

In tutti i casi abbiamo trovato un polinomio p + q \in \mathcal{P}_n che approssima f meglio di p. \square

Completamento del Teorema di Equioscillazione

Possiamo ora completare la dimostrazione del Teorema di Equioscillazione di Chebyshev.

§ Teorema (Equioscillazione di Chebyshev pt.2). Sia f \in C[a, b]. Un polinomio p \in \mathcal{P}_n è il polinomio di migliore approssimazione minimax se e solo se la funzione resto r(x) = f(x) - p(x) ha almeno n+2 punti di equioscillazione.

Dimostrazione.

\boxed{\Rightarrow} Sia p \in \mathcal{P}_n il polinomio di migliore approssimazione uniforme di f. Supponiamo per assurdo che il resto r(x) = f(x) - p(x) abbia un insieme alternante che possiamo estendere ad un insieme alternante sezionato \mathcal A = \{x_0, \dots, x_k\} con k+1 < n+2, ovvero k \le n. Per il Teorema di miglioramento dell’approssimazione, esiste un polinomio q \in \mathcal{P}_k \subseteq \mathcal{P}_n tale che:

\|f - (p + q)\|_\infty < \|f - p\|_\infty

Questo contraddice l’ipotesi che p sia il polinomio di migliore approssimazione in \mathcal{P}_n. Pertanto deve essere k \ge n+1, ovvero devono esserci almeno n+2 punti di equioscillazione. \square

§ Teorema (Stima dell’errore minimax). Sia f \in C^{n+1}[a, b] tale che f^{(n+1)}(x) \neq 0 per ogni x \in [a, b] e siano m, M tali che 0 < m \le |f^{(n+1)}(x)| \le M su [a, b]. Allora la migliore approssimazione uniforme \delta_n^* soddisfa:

\frac{m (b - a)^{n+1}}{2^{2n+1} (n+1)!} \le \delta_n^* \le \frac{M (b - a)^{n+1}}{2^{2n+1} (n+1)!}

Dimostrazione.

Senza perdita di generalità, assumiamo [a, b] = [-1, 1]. Per cui la tesi diventa:

\frac{m}{2^n (n+1)!} \le \delta_n^* \le \frac{M}{2^n (n+1)!}

Sia T_{n+1}(x) il polinomio di Chebyshev di prima specie e t_{n+1}(x) := T_{n+1}(x)/2^n il corrispondente polinomio monico di grado n+1. Ricordiamo che \|t_{n+1}\|_\infty = \min_{p \in \mathcal{P}_{n+1} \text{ monico}} \|p\|_\infty = 1/2^n.

Sia p_n il polinomio di migliore approssimazione minimax di f. Sappiamo che esso può essere visto come un polinomio che interpola f in n+1 punti \xi_0, \dots, \xi_n in cui il resto r_n(x) = f(x) - p_n(x) si annulla.

Usando la formula del resto per l’interpolazione polinomiale:

r_n(x) = f(x) - p_n(x) = \prod_{j=0}^{n} (x - \xi_j) \frac{f^{(n+1)}(\eta)}{(n+1)!} =: s(x) \frac{f^{(n+1)}(\eta)}{(n+1)!}

con \eta \in (-1, 1) e s(x) \in \mathcal{P}_{n+1} polinomio monico.

  1. Limite inferiore: Poiché s(x) è un polinomio monico di grado n+1, si ha \|s\|_\infty \ge 1/2^n. Sia y un punto tale che |s(y)| = \|s\|_\infty. Allora:

    \delta_n^* = \|r_n\|_\infty \ge |r_n(y)| = |s(y)| \frac{|f^{(n+1)}(\eta)|}{(n+1)!} \ge \frac{1}{2^n} \frac{m}{(n+1)!}
  2. Limite superiore: Possiamo scrivere s(x) = r_n(x) \frac{(n+1)!}{f^{(n+1)}(\eta)}. Poiché f^{(n+1)} è continua e mai nulla in [-1, 1], essa ha segno costante. Pertanto s(x) e r_n(x) hanno lo stesso segno (modulo il segno di f^{(n+1)}). Segue che:

    |s(x)| = |r_n(x)| \frac{(n+1)!}{|f^{(n+1)}(\eta)|} \ge \frac{|r_n(x)| (n+1)!}{M}

    Supponiamo per assurdo che \delta_n^* > \frac{M}{2^n (n+1)!}. Siano x_i gli n+2 punti di equioscillazione di r_n(x), allora |r_n(x_i)| = \delta_n^* e:

    |s(x_i)| \ge \frac{|r_n(x_i)| (n+1)!}{M} = \frac{\delta_n^* (n+1)!}{M} > \frac{M}{2^n (n+1)!} \frac{(n+1)!}{M} = \frac{1}{2^n}

    Quindi s(x) assume in gli x_i valori in modulo strettamente maggiori di 1/2^n con segni alterni. Consideriamo il polinomio h = s - t_{n+1}. Poiché sia s che t_{n+1} sono polinomi monici di grado n+1, il loro grado è al più n. Tuttavia, dato che |s(x_i)| > |t_{n+1}(x_i)| per ogni i e s(x_i) ha segni alterni, h(x_i) deve avere lo stesso segno di s(x_i). Quindi h cambia segno almeno n+1 volte in [a, b], il che implica che h abbia almeno n+1 zeri. Essendo \deg(h) \le n, deve essere h \equiv 0, ovvero s = t_{n+1}. Ma questo è assurdo poiché \|s\|_\infty > 1/2^n mentre \|t_{n+1}\|_\infty = 1/2^n. \square

Algoritmo di Remez

È un metodo iterativo che serve per trovare il polinomio di migliore approssimazione minimax p_n^*(x).

Siano f \in C[a, b] e n \in \mathbb{N}. Ad ogni iterazione k, l’algoritmo determina un insieme di punti:

a \le x_0^{(k)} < x_1^{(k)} < \dots < x_{n+1}^{(k)} \le b

che approssimano i punti di equioscillazione, e un polinomio p^{(k)}(x) \in \mathcal{P}_n che approssima p_n^*(x).

La scelta iniziale dei punti di equioscillazione è arbitraria, ma solitamente si scelgono i nodi di Chebyshev riscalati su [a, b] (punti di massimo/minimo di T_{n+1}(x)):

x_i^{(0)} = \frac{b-a}{2} \cos \left( \frac{(n+1-i)\pi}{n+1} \right) + \frac{a+b}{2}

All’iterazione k-esima, disponendo dei punti \{x_i^{(k)}\}:

  1. Sia q^{(k)}(x) \in \mathcal{P}_{n+1} il polinomio che interpola f nei punti \{x_i^{(k)}\}, ovvero q^{(k)}(x_i^{(k)}) = f(x_i^{(k)}) per i = 0, \dots, n+1.
  2. Sia s^{(k)}(x) \in \mathcal{P}_{n+1} il polinomio tale che s^{(k)}(x_i^{(k)}) = (-1)^i per i = 0, \dots, n+1.
  3. Definiamo d^{(k)} come il rapporto tra i coefficienti di grado massimo di q^{(k)} e s^{(k)}, in modo che p^{(k)} := q^{(k)} - d^{(k)}s^{(k)} sia un polinomio di grado al più n.

Il resto r^{(k)}(x) = f(x) - p^{(k)}(x) valutato nei punti dell’iterazione corrente vale:

\begin{aligned}
r^{(k)}(x_i^{(k)}) &= f(x_i^{(k)}) - p^{(k)}(x_i^{(k)}) \\
&= f(x_i^{(k)}) - (q^{(k)}(x_i^{(k)}) - d^{(k)}s^{(k)}(x_i^{(k)})) \\
&= f(x_i^{(k)}) - f(x_i^{(k)}) + d^{(k)}(-1)^i \\
&= (-1)^i d^{(k)} \neq 0
\end{aligned}

Se i punti x_i^{(k)} sono i punti di massimo/minimo locale per r^{(k)}, l’algoritmo termina. Altrimenti, si definiscono i nuovi punti x_i^{(k+1)} come gli estremanti locali di r^{(k)}(x), assicurandosi che r^{(k)}(x_i^{(k+1)}) abbia lo stesso segno di r^{(k)}(x_i^{(k)}) (possono esserci più di n+2 punti).

Criteri di arresto

Si possono utilizzare diversi criteri di arresto:

  • Distanza tra i polinomi p^{(k)} e p^{(k+1)} sufficientemente piccola.
  • Vicinanza tra i vettori dei punti (x_i^{(k)}) e (x_i^{(k+1)}).
  • Basato sui residui: siano m = \min_i |r^{(k)}(x_i^{(k+1)})| e M = \max_i |r^{(k)}(x_i^{(k+1)})|. Idealmente vorremmo M/m \approx 1, quindi:
    \left| \frac{M}{m} - 1 \right| < \varepsilon

§ Teorema (Convergenza di Remez). Siano f \in C[a, b], n \in \mathbb{N}. Siano \{x_i^{(k)}\} e p^{(k)} i punti e i polinomi generati dall’algoritmo di Remez, p^* il polinomio di migliore approssimazione minimax e x_i^* i suoi punti di equioscillazione. Allora:

  1. \lim_{k \to \infty} \|p^{(k)} - p^*\|_\infty = 0 (convergenza dei polinomi).
  2. Se f \in C^2[a, b], r_n^* è una funzione standard e (r_n^*)''(x_i^*) \neq 0 per ogni i, allora la convergenza è quadratica. Ovvero, posto \delta_n^{(k)} = \|f - p^{(k)}\|_\infty, esiste \gamma > 0 tale che:
    \frac{\delta_n^{(k+1)} - \delta_n^*}{(\delta_n^{(k)} - \delta_n^*)^2} \le \gamma

Approssimazione quasi-minimax

L’idea è di usare serie di Chebyshev troncate. Vogliamo prendere:

f(x) \approx \sum_{i=0}^n c_i T_i(x) \in \mathcal{P}_n

dove la notazione \sum' indica che il primo coefficiente è moltiplicato per 1/2. I coefficienti sono dati da:

c_n = \int_{-1}^{+1} \frac{f(s) T_n(s)}{\sqrt{1 - s^2}} \mathrm ds

Si dimostra che la serie troncata C_n soddisfa:

\delta_n^* \le \|f - C_n\|_\infty \le 4 \left( 1 + \frac{1}{\pi^2} \log n \right) \delta_n^*

e che se f è lipschitziana, allora \lim_{n \to \infty} \|f - C_n\|_\infty = 0.

Inoltre, se f \in C^k[a, b], allora |c_j| \le K/j^k per una qualche costante K > 0. Se i coefficienti |c_j| decadono rapidamente, allora f - C_n = \sum_{j > n} c_j T_j e il termine dominante è l’(n+1)-esimo:

f(x) - C_n(x) \approx c_{n+1} T_{n+1}(x)

Poiché c_{n+1} T_{n+1}(x) ha n+2 punti di equioscillazione, C_n(x) sarà molto vicino al polinomio di migliore approssimazione.

Se r(x) \approx c_{n+1} T_{n+1}(x), avremo che negli zeri di T_{n+1} il resto r(x) \approx 0. Tali zeri sono:

\xi_i = \cos \left( \frac{(2i + 1) \pi}{2(n + 1)} \right)

Definiamo I_n \in \mathcal{P}_n come il polinomio di interpolazione di f nei nodi di Chebyshev \xi_i. Dalla formula del resto dell’interpolazione per f \in C^{n+1}:

f(x) - I_n(x) = \prod_{i=0}^n (x - \xi_i) \frac{f^{(n+1)}(\zeta)}{(n+1)!}, \quad \zeta \in (-1, 1)
\|f - I_n\|_\infty \le \frac{\|f^{(n+1)}\|_\infty}{(n+1)!} \left\| \prod_{i=0}^n (x - \xi_i) \right\|_\infty

L’errore è minimizzato scegliendo come nodi le radici del polinomio di Chebyshev normalizzato.

Approssimazione minimax razionale

Sia f \in C[a, b] e m, n \in \mathbb{N}. Sia \mathcal{R}_{m,n} l’insieme delle funzioni razionali di tipo (m, n), ovvero:

\mathcal{R}_{m,n} = \left\{ s(x) = \frac{p(x)}{q(x)} : p \in \mathcal{P}_m, q \in \mathcal{P}_n, q(x) \neq 0 \text{ in } [a, b] \right\}

Diciamo che s^* \in \mathcal{R}_{m,n} è di migliore approssimazione minimax razionale se e solo se:

\|f - s^*\|_\infty = \min_{s \in \mathcal{R}_{m,n}} \|f - s\|_\infty

§ Teorema.

  1. Una funzione razionale s = p/q \in \mathcal{R}_{m,n} (ridotta ai minimi termini) è di migliore approssimazione se e solo se la funzione resto r(x) = f(x) - s(x) ha almeno m + n - d + 2 punti di equioscillazione, dove d = \min \{ m - \deg(p), n - \deg(q) \} è il difetto di s in \mathcal{R}_{m,n}.
  2. La funzione razionale di migliore approssimazione minimax esiste ed è unica.

Osservazione. Esiste una versione dell’algoritmo di Remez adattata per il caso razionale.