next up previous contents
Next: Algumas formas indeterminadas - Up: A Derivada Previous: O Teorema do valor

A diferencial e a fórmula de Taylor

Nesta seção vamos considerar o problema de fazer estimativas, isto é, aproximações. O conceito de diferencial tem aqui um papel muito importante.
Em nossas considerações sobre a velocidade em um movimento retilíneo de um ponto dado por x=s(t), no início do capítulo, observavamos que, ao se mover da posição s(t1) para s(t2), a velocidade média v é definida por

\begin{displaymath}v=\frac{s(t_2)-s(t_1)}{t_2-t_1}.
\end{displaymath}

A velocidade média é a taxa (razão) de variação da posição s(t) em relação à variação do tempo t no intervalo [t1,t2]. A velocidade v0 em um instnte t0 (isto é, a derivada de s(t) em t=t0) é essa taxa no instante t0. A derivada tem o mesmo papel no estudo de processos em que uma grandeza qualquer evolui com o tempo, ou com alguma outra variável não temporal. Esses processos trazem em si o natural interesse pela taxa de variação da dita grandeza (variável dependente) com relação ao tempo, ou à outra variável (independente) em questão. Assim, em ecologia, a taxa de crescimento ou declínio de uma espécie; em economia, o custo marginal de produção de alguma mercadoria (isto é, a taxa de variação do custo com respeito à quantidade produzida) são alguns exemplos onde a derivada está presente.

Fixemo-nos no exemplo da velocidade. Se conhecermos a velocidade v0, num instante t0 e quizermos determinar aproximadamente a posição s(t), para t ``muito próximo'' de t0, é natural assumirmos v(t)=v0 constante e estimarmos $s(t)\approx s(t_0)+v_0(t-t_0)$. Ao fazer isso estamos assumindo que se s(t) variasse linearmente com t numa vizinhança de t0 desvreveria um movimento próximo do movimento real.


Como as funções lineares têm boas propriedades e, portanto, são em geral mais fáceis de estudar, em muitos casos convém aproximar uma função qualquer, y=f(x), por uma função linear, mesmo que essa aproximação seja acurada somente numa vizinhança de um ponto x=a.

Sejamos mais precisos. Uma função linear é uma função $\ell:\mathbb R\to\mathbb R$ da forma $\ell(x)=kx$, para todo $x\in\mathbb R$, onde $k\in\mathbb R$ é uma constante. Portanto, o gráfico da função linear $\ell$ é uma reta passando pela origem, dada pela equção y=kx. Seja $f:(b,c)\to\mathbb R$ uma função qualquer. Se $a\in(c,d)$ é fixado, queremos esclarecer o que entendemos por aproximar f por uma função linear $\ell$ numa vizinhança de a. Isto significa adotar o seguinte procedimento (veja a Figura 3.18):

1.
Introduzimos novas coordenadas $(\xi,\eta)$ no plano, definidas pelas relações $x=a+\xi$, $y=f(a)+\eta$ (a origem $(\xi,\eta) =
(0,0)$ do novo sistema de coordenadas corresponde ao ponto (a,f(a)) do gráfico da função f)
2.
Numa vizinhança da origem do plano $(\xi,\eta)$, substituímos o gráfico de f pelo gráfico de uma função linear $\eta=k\,\xi$. Isto é, denotando $x=a+\Delta x$, substituímos $f(a+\Delta x)$ por $f(a)+k\,\Delta x$ (vale dizer, aproximamos por $f(a)+k\,\Delta x$ o valor $f(a+\Delta x)$).
Como se trata de aproximar a função f, é óbvio que em geral estamos cometendo um erro (erro absoluto: $\vert f(a+\Delta x)-(f(a)+k\,\Delta x)\vert$). Essa aproximação só é conveniente quando o erro relativo,

\begin{displaymath}\frac{\vert f(a+\Delta x)-(f(a)+k\,\Delta x)\vert}{\vert\Delta x\vert},
\end{displaymath}

tende a zero, com $\Delta x\to0$. Isto é, quando existe $k\in\mathbb R$ tal que

\begin{displaymath}\lim_{\Delta x\to0}\left\vert\frac{f(a+\Delta x)-f(a)-k\,\Delta x}{\Delta x}\right\vert = 0,
\end{displaymath}

ou seja,

\begin{displaymath}\lim_{\Delta x\to0}\frac{f(a+\Delta x)-f(a)}{\Delta x}=k,
\end{displaymath}

mas isto equivale a dizer que k=f'(a). Assim, podemos concluir que o processo de aproximação descrito aqui (comumente referido como um processo de linearização) só é executável quando f é diferenciável em a.

Neste caso colocamos a seguinte definição:

Definição 3.4.1   A função linear

 \begin{displaymath}
\xi=\Delta x\;\; \mapsto\;\; \eta=dy:= f'(a)\Delta x.
\end{displaymath} (3.14)

é chamada a diferencial de f no ponto a e denotada por df(a) ou, simplesmente, dy.

Temos então a estimativa

\begin{displaymath}f(x)=f(a+\Delta x)\approx f(a)+dy=f(a)+f'(a)\Delta x.
\end{displaymath}

Como se vê na Figura 3.18, aproximamos o acréscimo real $\Delta y$ pelo acréscimo linear $dy=f'(a)\,dx$.

Exemplo 3.4.1 (1)   Uma caixa cúbica tem a aresta medindo x=4cm, com um erro máximo de 0,05cm. Qual o erro máximo no volume V da caixa?

Essa estimativa pode ser feita da seguinte forma: Se a aresta varia de x para x+dx, a variação $\Delta V$ do volume é $\Delta V = (x+dx)^3 - x^3$.

Como $\Delta V\approx dV$, lembrando que V'=3x2, obtemos:

dV = 3x2dx

e, para x=4 e $dx=\pm0,05$, obtemos finalmente:

\begin{displaymath}dV=3\cdot16\cdot(\pm0,05)=\pm2,4,
\end{displaymath}

que é, em cm3, o maior erro possível no volume.

(2) Estime de quanto variou o lado de um quadrado, se sua área variou de $16\, m^2$ para $16,1\, m^2$. Exprimindo o lado y do quadrado em termos de sua área x,

\begin{displaymath}y=\sqrt x.
\end{displaymath}

Considerando x = 16 e um incremento dx = 0,1, o incremento dy no lado do quadrado pode ser estimado como segue:

\begin{displaymath}dy\approx y'\, dx=\frac1{2\sqrt{16}}0,1=0,0125.
\end{displaymath}

Ou seja, o lado do quadrado variou de $0,0125\,m$.

Se quizermos aproximações mais acuradas, teremos de abrir mão de que elas sejam lineares. Antes de prosseguirmos, notemos que se f for diferenciável em a denotarmos dx=x-a e $\Delta y=f(x)-f(a)$, a Definição implica

 \begin{displaymath}
f(x)\approx f(a)+f'(a)(x-a).
\end{displaymath} (3.15)

Note que o segundo membro de (3.17) é um polinônio em x-a de grau 1, P1(x), que coincide com f no ponto a e cuja derivada coincide com a derivada de f no ponto a.

Se f for diferenciável até ordem 2 em a, podemos aproximar f, por um polinômio em x-a de grau 2, P2(x), de modo que P2(a)=f(a), P'2(a)=f'(a) e P''2(a)=f''(a). Este polinômio só pode ser

 
P2(x):=f(a)+f'(a)(x-a)+(1/2)f''(a)(x-a)2. (3.16)

De fato, a expressão geral de um polinômio em x-a de grau 2 é P2(x)=a1+a2(x-a)+a3(x-a)2, logo P2(a)=a1 e suas derivadas até ordem 2 em a são: P'2(a)=a2 e P''2(a)=2a3. Impondo as condições requeridas sobre P2(x), obtemos a1=f(a), a2=f'(a) e 2a3=f''(a), portanto, P2(x) tem a expressão dada em (3.18).

É intuitivo que P2(x) seja uma melhor aproximação de f(x), pois além de coincidir com f em a, juntamente com sua derivada, as derivadas de ordem 2 em a também cincidem, portanto, f e P2 têm o mesmo caráter de convexidade em a.

Mais geralmente, para qualquer $n=1,2,\ldots$, se $f:I\to\mathbb R$ tiver todas as derivadas até ordem n em um ponto a de um intervalo aberto I, o único polinômio em x-a de grau n que coincide com f em a, juntamente com todas as suas derivadas até ordem n, é


 \begin{gather}
P_n(x)=f(a)+f'(a)(x-a)+\frac1{2!}f''(a)(x-a)^2+\\
\ldots+\frac1{n!}f^{(n)}(a)(x-a)^n,
\end{gather}
como pode ser verificado pelo leitor por aplicações sucessivas dos argumentos acima ou, melhor, por uma aplicação do princípio de indução finita.

Definição 3.4.2   O polinômio Pn dado em (3.19) é chamado Polinômio de Taylor de ordem n de f, em torno de a.

A discussão que se segue mostrará que a aproximação de uma função $f\in C^{n+1}$ é tão mais acurada quanto maior for n.

Suponhamos $f\in C^{n+1}$ num intervalo aberto I, $a\in I$.

Ao se aproximar f pelo seu polinômio de Taylor de ordem n, em torno de a, comete-se um erro En(x) definido por En(x):=f(x)-Pn(x), para x numa vizinhança de a, ou seja:

 \begin{displaymath}
f(x)=f(a)+f'(a)(x-a)+\ldots
+\frac1{n!}f^{(n)}(a)(x-a)^n+E_n(x).
\end{displaymath} (3.17)

Nosso objetivo agora é obter uma estimativa para En(x). Para chegarmos a ela precisamos do seguinte resultado, que será útil também na seção seguinte.

Teorema 3.4.1 (Teorema de Cauchy)   Sejam f e g funções contínuas em [a,b] e diferenciáveis em (a,b), então existe c em (a,b) tal que

 \begin{displaymath}
\left[f(b)-f(a)\right]g'(c)=\left[g(b)-g(a)\right]f'(c).
\end{displaymath} (3.18)

Prova. Definindo

\begin{displaymath}r(x):=\left[f(b)-f(a)\right]g(x)-\left[g(b)-g(a)\right]f(x),
\end{displaymath}

verificamos que r é uma função contínua em [a,b] e diferenciável em (a,b). Ainda mais,

r(a)=f(b)g(a)-g(b)f(a)=r(b),

logo, pelo Teorema de Rolle, existe $c\in(a,b)$ tal que r'(c)=0, ou seja,

\begin{displaymath}\left[f(b)-f(a)\right]g'(c)-\left[g(b)-g(a)\right]f'(c)=0.
\end{displaymath}

Observação 3.4.1   O Teorema de Cauchy é uma extensão do Teorema do Valor Médio, pois este corresponde a considerar o caso particular g(x)=x no Teorema de Cauchy.

Voltemos agora à questão de estimar o erro En(x). De acordo com a relação (3.21), En(x) é uma função de classe Cn+1 numa vizinhança de a. Mais ainda,

 \begin{displaymath}
E_n(a)=E'_n(a)=\ldots=E^{(n)}_n(a)=0,\qquad
E^{(n+1)}_n(x)=f^{(n+1)}(x)
\end{displaymath} (3.19)

nessa vizinhança.

Vamos precisar do seguinte fato: se h(x):=(x-a)n+1,

 \begin{displaymath}
h(a)=h'(a)=\ldots=h^{(n)}(a)=0,\qquad h^{(n+1)}(x)=(n+1)!.
\end{displaymath} (3.20)

Como (3.23) e (3.24) implicam En(a)=h(a)=0, podemos escrever, para $x\ne a$:

\begin{displaymath}\frac{E_n(x)}{h(x)}=\frac{E_n(x)-E_n(a)}{h(x)-h(a)}.
\end{displaymath}

De acordo com o Teorema de Cauchy, existe $\sigma_1$, entre x e a de modo que

\begin{displaymath}[E_n(x)-E_n(a)]h'(\sigma_1)=[h(x)-h(a)]E'_n(\sigma_1)],
\end{displaymath}

logo,

 \begin{displaymath}
\frac{E_n(x)}{h(x)}=\frac{E'_n(\sigma_1)}{h'(\sigma_1)}
\end{displaymath} (3.21)

e, observando que (3.23) e (3.24) implicam E'n(a)=h'(a), a Equação (3.25) pode ser re-escrita:

\begin{displaymath}\frac{E_n(x)}{h(x)}=\frac{E'_n(\sigma_1)-E'_n(a)}{h'(\sigma_1)-h'(a)}.
\end{displaymath}

Assim, decorre novamente do Teorema de Cauchy de maneira inteiramente análoga a existência de um número $\sigma_2$, entre $\sigma_1$ e a, tal que

 \begin{displaymath}
\frac{E_n(x)}{h(x)}=\frac{E''_n(\sigma_2)}{h''(\sigma_2)}.
\end{displaymath} (3.22)

Pelas igualdades (3.23), (3.24), obtemos,

\begin{displaymath}\frac{E_n(x)}{h(x)}=\frac{E''_n(\sigma_2)-E''_n(a)}
{h''(\sigma_2)-h''(a)}.
\end{displaymath}

Aplicando sucessivamente esses argumentos, chegamos por fim, à existência de um número $\sigma$, entre x e a, de modo que

 \begin{displaymath}
\frac{E_n(x)}{h(x)}=\frac{E^{(n+1)}_n(\sigma)}{h^{(n+1)}(\sigma)}.
\end{displaymath} (3.23)

Como, de acordo com (3.23) e (3.24),

\begin{displaymath}E^{(n+1)}_n(\sigma)=f^{(n+1)}(\sigma)\quad \text{e}\quad h^{(n+1)}(\sigma)=(n+1)!,
\end{displaymath}

temos, substituindo h(x) e esses valores em (3.27):

 \begin{displaymath}
E_n(x)=\frac1{(n+1)!}{f^{(n+1)}(\sigma)}(x-a)^{n+1}
\end{displaymath} (3.24)

e, conhecendo-se uma cota superior para |f(n+1)|, a relação (3.28) fornece uma estimativa para o erro En(x). Na verdade, como estamos assumindo $f\in C^{n+1}$ no intervalo aberto I, podemos nos restingir a uma vizinhança $(a-\delta,a+\delta)$ tal que o intervalo fechado $J=[a-\delta,a+\delta]$ esteja contido em I. Como f(n+1) é uma função contínua no intervalo fechado J, sabemos que ela é limitada em J. Assim, existe uma constante positiva L tal que $\vert f^{(n+1)}(\sigma)\vert\le L$, para todo $\sigma$ entre x e a. A Equação (3.28) implica

\begin{displaymath}\lim_{x\to a}\frac{E_n(x)}{(x-a)^n}=0,
\end{displaymath}

isto é, En(x) tende a zero mais rapidamente do que (x-a)n, quando $x\to a$. Esta propriedade é expressa pela notação

\begin{displaymath}E_n(x)=o\bigl((x-a)^n\bigr),\quad\text{com } x\to a.
\end{displaymath}

A discussão precedente nada mais é do que uma prova do seguinte importante Teorema de Taylor:

Teorema 3.4.2 (Fórmula de Taylor)   Sejam f uma função de classe Cn+1 num intervalo aberto I e $a\in I$. Então, para cada x numa vizinhança de a, existe $\sigma=a+\theta(x-a),\quad 0<\theta<1$, de modo que

 \begin{gather}
f(x)=f(a)+f'(a)(x-a)+\ldots+\frac1{n!}f^{(n)}(a)(x-a)^n+\\
+\frac1{(n+1)!}f^{(n+1)}(\sigma)(x-a)^{n+1}.
\end{gather}

A expressão do erro, ou resto, En(x), dada em (3.28) é atribuida a Lagrange, por isso a expressão (3.29) é comumente referida como Fórmula de Taylor, com resto de Lagrange, em torno de a.

Quando a=0, a fórmula (3.29) recebe o nome de Fórmula de Maclaurin.

Exemplo 3.4.2 (1)   Dado o polinômio P(x)=x4-3x3+5x2-1, sua expressão em termos de potências de (x-2) coincide com o polinômio de Taylor de grau 4 em torno de x=2, que pode ser obtido da seguinte forma (Veja o exercício 14):

Como $P(2)=11,\ P'(2)=6,\ P''(2)=12,\ P'''(2)=30,\ P^{(4)}(2)=24$, temos,

x4-3x3+5x2-1 = 11+6(x-2)+6(x-2)2+5(x-2)3+(x-2)4.

Neste caso, o resto de Lagrange é, obviamente, nulo e a aproximação vale em toda a reta.

(2) Vamos obter uma estimativa para $\cos61^0$ a partir do valor conhecido de $\cos 60^0$ e do polinômio de Taylor de grau dois de $\cos x$, em torno de $\pi/3$.

Sendo $f(x)=\cos x$, $f'(x)=-\text{sen}\ x$, $f''(x)=-\cos x$ e $f'''(x)=-\text{sen}\ x$, o polinômio (3.19) com n=2, em torno de $\pi/3$ é

\begin{displaymath}P(x)=\frac12-\frac{\sqrt3}2\left(x-\frac\pi3\right)-\frac{(1/2)}{2!}
\left(x-\frac\pi3\right)^2.
\end{displaymath}

Desta forma, fazendo $x=\pi/3 + \pi/180$ que, em graus, corresponde a 610, obtemos a estimativa

\begin{displaymath}\cos 61^0\approx\frac12-\left(\frac{\sqrt3}2\right)
\left(\f...
...right)-\frac14\left(\frac\pi{180}\right)^2
\approx 0,484481.
\end{displaymath}

Além disso, o resto de Lagrange pode ser estimado da seguinte forma:

\begin{displaymath}\vert R_2(61^0)\vert=\left\vert\frac{\text{sen}\ \sigma}{3!}
\left(x-\frac\pi3\right)^3\right\vert
\end{displaymath}

e, como $x=\pi/3 + \pi/180$, $\vert\text{sen}\ \sigma\vert\le 1$, obtemos, finalmente:

\begin{displaymath}\vert R_2(61^0)\vert\le\left\vert\frac1{3!}\left(\frac\pi{180}\right)^3\right\vert
\le10^{-6}.
\end{displaymath}

Conluimos que $\cos 61^0 \approx 0,484481$, com uma precisão de cinco casas decimais.


next up previous contents
Next: Algumas formas indeterminadas - Up: A Derivada Previous: O Teorema do valor
Placido Zoega Taboas
2000-04-02