1 Introdução
Resumo

Este trabalho apresenta um método direto e de alta acurácia para resolver equações diferenciais ordinárias, em particular a equação de Schrödinger em uma dimensão, através da substituição direta de uma solução em série de potências para obter um sistema puramente algébrico contendo as relações de recorrência entre os coeficientes da série. De posse dessas relações de recorrência, e conhecendo a forma exata da equação diferencial, é possível construir uma rotina extremamente simples, usando somente operações aritméticas básicas em um processo de refinamento iterativo, para encontrar soluções de altíssima acurácia a um custo muito reduzido de recursos de máquina. No caso da equação de Schrödinger, os autovalores de energia podem ser estimados por um método simples, e a estimativa pode ser facilmente refinada com o uso das relações de recorrência até que se alcance a tolerância especificada, o que permite encontrar funções de onda de alta acurácia mesmo para problemas com campos externos intensos e estados com número quântico alto. Nesta monografia, o método é brevemente descrito e, em seguida, utilizado para resolver alguns problemas simples em mecânica quântica em uma dimensão.

Palavras-chave: equação de Schrödinger, equações diferenciais, relações de recorrência, solução exata, série de potências.

Resolvendo a equação de Schrödinger através da

substituição direta da série de potências

Fábio E. R. Campolim111fabio.campolim@ufabc.edu.br

Nanosciences and Advanced Materials Postgraduate Program

Universidade Federal do ABC (UFABC)

Av. dos Estados, 5001, 09.210-580 Santo André, São Paulo, Brazil

(25 de Agosto, 2014)

Abstract

This work presents a direct and highly accurate method to solve ordinary differential equations, in particular the Schrödinger equation in one dimension, through the direct substitution of a power series solution to obtain a purely algebraical system containing the recurrence relations among the series coefficients. With these recurrence relations at hand, and knowing the exact form of the differential equation, it is possible to build an extremely simple routine, using only basic arithmetic operations in an iterative refining process to find solutions of very high accuracy at a very low cost of machine resources. In the case of the Schrödinger equation the energy eigenvalues may be estimated by a very simple method, an this estimate may be easily refined using the recurrence relations until the specified tolerance has been reached, which allows one to find high accuracy wavefunctions even for problems with intense external fields and states with very high quantum numbers. In this monograph, the method is briefly described and then used to solve some simple problems in quantum mechanics in one dimension.

Keywords: Schrödinger equation, differential equations, recurrence relations, exact solution, power series.

1 Introdução

Desde que Erwin Schrödinger publicou sua famosa equação para a função de onda da mecânica quântica há 88 anos atrás [1], uma miríade de métodos matemáticos foram desenvolvidos para solucionar essa equação para os mais diversos sistemas físicos envolvendo átomos e moléculas e, de fato, todas as ciências dos materiais encontram imensa utilidade em ferramentas que implementam esses métodos. Não é à toa que uma grande quantidade de recursos é destinada atualmente à pesquisa nessa área de simulação computacional, pois hoje há uma verdadeira ‘corrida armamentista’ mundial por métodos mais rápidos e acurados de solução de problemas de muitos corpos em mecânica quântica. A empreitada rendeu, por exemplo, os prêmios Nobel de química para [2] Robert S. Mulliken em 1966, Rudolph Marcus em 1992, Walter Kohn e John Pople em 1998 e, mais recentemente, o de 2013 a M. Karplus, M. Levitt e A. Warshel, sem falar em todas as patentes e produtos de software de altíssimo valor comercial. É que o chamado experimento in silico de sistemas atomísticos é de grande auxílio no desenvolvimento de medicamentos, combustíveis, novos materiais e até no estudo das origens da vida, entre tantos outros assuntos de grande importância [3, 4]. Simulando o comportamento de átomos e moléculas em computadores somos capazes de reduzir imensamente o custo e o risco da pesquisa e também de ampliar as possibilidades de investigação como antes não era possível. Capacidade esta que carrega a promessa de valiosas melhorias de vida para a sociedade em tantas e diversas áreas.

Esta monografia apresenta a solução da equação de Schrödinger através da substituição direta de uma série de potências para obter um sistema de relações de recorrência entre os coeficientes da série que é puramente algébrico. A solução de qualquer equação diferencial ordinária é dada diretamente pela relação de recorrência mestre quando os coeficientes da equação são conhecidos e analíticos, de modo que, quando esses coeficientes são expandidos em série obtém-se um sistema simples e direto, que pode ser trivialmente implementado em um programa de computador e que nos dá a solução da equação diferencial com acurácia arbitrária, limitada somente pela precisão numérica das rotinas implementadas e pelos recursos de máquina disponíveis. A implementação numérica envolve somente operações aritméticas simples para encontrar os coeficientes da solução, não necessitando qualquer procedimento adicional de integração, derivação ou inversão de matrizes e, portanto, é muito rápida mesmo quando essa solução possui uma quantidade muito grande de termos. Para a equação de Schrödinger, a autoenergia da solução deve ser previamente estimada, e então as relações de recorrência podem ser utilizadas para refinar essa autoenergia, à qualquer acurácia que se queira.

Para demonstração do conceito, o método é aplicado a problemas simples de mecânica quântica envolvendo uma partícula em uma dimensão. Importa mencionar que não é a intenção do presente trabalho formular e analisar o método no sentido matemático mais formal e rigoroso, e sim a aplicação prática do método para encontrar soluções de alta acurácia para a equação de Schrödinger, obviamente sem prejuízo das devidas caracterizações numéricas.

2 A série de potências

Um conceito muito importante que permeia diversas áreas da matemática como a aproximação de funções, a interpolação, a regressão, a solução de equações diferenciais e/ou integrais e até mesmo a aprendizagem supervisionada de máquina, é o teorema da aproximação de Weierstrass que diz que toda função real e contínua de uma variável e limitada em um intervalo fechado pode ser aproximada no intervalo de maneira uniforme e com acurácia arbitrária por um polinômio que, aliás, é único. De modo mais geral, toda função contínua por partes no intervalo pode ser aproximada com acurácia arbitrária por uma combinação linear de funções de um conjunto de base completo [5]. Na verdade, essa é a própria definição de conjunto completo: um dado conjunto de funções é dito completo se a norma uniforme do erro da aproximação tende a zero quando o número de funções de base na combinação linear tende a infinito.

Seja uma função aproximante , real e de uma variável , escrita em termos de um conjunto de funções de base, no presente caso um polinômio,

(1)

onde os coeficientes são os parâmetros ajustáveis da solução e é o grau do polinômio, de modo que quando , a solução se torna a série de potências. Seja também uma função alvo , real e de uma variável, contínua em , que deve ser aproximada por , então o erro pontual da aproximação é uma função real dada por

(2)

Com essa definição podemos construir a norma da função erro,

(3)

e, em particular, quando ,

(4)

temos o erro quadrático médio, ou norma euclidiana do erro, e quando ,

(5)

temos a norma uniforme, notando que a convergência pela norma uniforme é sempre mais forte que a convergência de qualquer norma com finito, em particular, a convergência pela norma uniforme implica em convergência pela média quadrática, contudo o contrário não é necessariamente verdade. A definição de conjunto completo surge então da situação limite em que o polinômio possui infinitos termos, e a norma uniforme do erro com respeito ao intervalo é exatamente igual a zero222 O mesmo resultado também vale para a norma com respeito a uma função peso multiplicada ao integrando [5].,

(6)

Na aproximação de funções, se a função alvo é analítica, como muitas das funções de onda dos problemas de interesse em mecânica quântica, então pode ser expandida em série de Taylor, por exemplo, em torno de , chamada de série de Maclaurin, e os coeficientes da série de potências são dados simplesmente por , onde é a -ésima derivada da função alvo calculada na origem [5]. Ainda mais, na solução de equações diferenciais sabemos, pelo teorema de Fuchs, que sempre se pode encontrar uma solução em série de potências para a equação diferencial, desde que a expansão seja em torno de um ponto ordinário ou no máximo uma singularidade regular, o que é sempre satisfeito em problemas de mecânica quântica [5].

O ponto chave é que a função de onda de qualquer partícula física em um problema realista de mecânica quântica sempre estará quase toda confinada a uma determinada região limitada do espaço, decaindo a zero exponencialmente ou mais rápido desde ali até o infinito. Por exemplo [6, 7], uma partícula ligada a um poço quadrado de potencial tem função de onda oscilatória dentro do poço, e exponencial decrescente para além da borda do poço (seção 4.2). O mesmo ocorre com um elétron ligado a um átomo, a função de onda do elétron pode oscilar na região em torno do núcleo, mas sempre decai exponencialmente para além da borda do átomo. Para uma partícula ligada em um potencial quadrático, pode-se argumentar, o decaimento da solução é gaussiano mas, em uma situação realista, o potencial quadrático nunca se estende até o infinito, após certa distância o aparato termina e, no espaço livre, o decaimento da função de onda é novamente exponencial. Mesmo quando uma partícula é livre, ela não se estende de fato como uma onda plana até o infinito, há sempre um ‘pacote’ de ondas definindo uma região de extensão principal da partícula, por exemplo, um envelope gaussiano333 A densidade de probabilidade de uma partícula não é necessariamente um só ‘pacote’, na mecânica quântica uma mesma partícula pode estar distribuída em diversos pacotes distintos no espaço. Por exemplo, uma partícula que tunela entre dois poços de potencial adjacentes, criando neles oscilações distintas, e portanto números quânticos distintos. Outro exemplo é a conversão paramétrica, onde um fóton incidente em um cristal muito especial é convertido em dois pacotes de onda distintos viajando em direções distintas, espacialmente separados, mas que são quânticamente correlacionados [8] como um par EPR (Einstein-Podolsky-Rosen), ou seja, formam um estado de ‘dois-fóton’ (two-photon state em inglês), propositalmente violando a flexão de número no nome para indicar um par correlacionado. Em todos os casos, a função de onda decai a zero no infinito exponencialmente ou mais rápido.. O decaimento exponencial da função de onda garante a mais importante condição de contorno dos problemas em mecânica quântica, que a função de onda seja nula no infinito [5],

(7)

Essas características físicas da solução nos trazem dois benefícios imediatos na análise. O primeiro é que o comportamento assintótico de decaimento exponencial da função de onda garante que o raio de convergência da série de potências seja sempre infinito em qualquer problema realista,

(8)

de modo que a série de potências sempre converge em todo o domínio da coordenada [5], . As funções de onda que aproximaremos são as soluções dos problemas arquetípicos em mecânica quântica, e são todas funções suaves, infinitamente diferenciáveis, que oscilam em uma determinada região espacial e depois passam suavemente a um decaimento exponencial para além dessa região. O segundo benefício é que sempre podemos encontrar uma região espacial limitada, aqui denominada região da fração principal da partícula, que contenha a vasta maioria da densidade de probabilidade da função de onda, e que pode substituir o domínio em todos os cálculos pertinentes e para todos os efeitos práticos, nos permitindo trabalhar numericamente, como veremos na seção seguinte.

De qualquer maneira, a condição (6) nos diz que o erro da aproximação no intervalo tende a zero monotonicamente quando o número de termos do aproximante tende a infinito, de modo que, na prática, calcula-se termos até que uma determinada tolerância especificada seja atingida. Assim, se pretendemos obter uma solução com um determinado critério de tolerância, então haverá sempre um número de termos mínimo que satisfaz esse critério. O polinômio de menor grau que satisfaz a aproximação de norma no intervalo definido dentro da tolerância especificada , , é por vezes denominado polinômio minimax [9] ou, mais genericamente, aproximante minimax para um conjunto completo qualquer.

Uma característica importante da série de Maclaurin é que os primeiros coeficientes da série tratam de aproximar a função na região próxima ao ponto , enquanto que os coeficientes de índices mais altos ajustam regiões progressivamente mais distantes da origem444 É sempre uma boa idéia ter as distribuições de carga aproximadamente centralizadas na origem de modo a equalizar os erros dentro do intervalo.. Assim, o tamanho do intervalo em que a aproximação satisfaz ao critério de tolerância tende crescer monotonicamente quando se aumenta o número de termos da série, e os maiores erros tendem a se acumular nos extremos do intervalo. Uma vantagem disso é que, sob determinadas circunstâncias, como no decaimento exponencial, o erro pontual máximo ocorrerá sempre em um dos dois extremos do intervalo, e então a norma uniforme do erro é igual ao maior valor entre e .

Importa notar também que um polinômio de grau finito só pode aproximar com um mínimo de qualidade um certo intervalo finito da função alvo e, para além desse intervalo, o polinômio se torna um péssimo aproximante, certamente divergindo ao infinito em ambos os lados, simplesmente porque o termo acaba dominando a soma. Assim, o intervalo aproximante de máximo comprimento que, para um dado polinômio de grau , atende à tolerância especificada será denominado intervalo maximin, sendo nulo se o polinômio não atende à tolerância especificada em qualquer intervalo porque seu grau é insuficiente. Em outras palavras, o intervalo maximin é o intervalo em que a aproximação pelo polinômio é válida dentro de um determinado critério de tolerância. Então, com a devida diligência, deve ser possível encontrar um polinômio aproximante com um número mínimo de termos dentro de um intervalo máximo , ou seja, a aproximação de um polinômio minimax em um intervalo maximin, que contenha toda a fração principal da densidade de probabilidade da partícula, e no qual todos os cálculos são, para todos os efeitos práticos, equivalentes aos cálculos feitos com a série infinita sobre todo o domínio da coordenada.

Uma consequência da ligação entre o número de termos do polinômio minimax e o tamanho do intervalo maximin é que podemos definir uma região de ‘domínio’ para cada termo da série de Maclaurin, que é simplesmente a região adicionada ao intervalo maximin a cada incremento de N. Quando, por exemplo, a série aproxima uma função seno é necessário um polinômio de grau 7 para aproximar bem 1 período da onda, um de grau 17 para aproximar bem 2 períodos, um de grau 23 para aproximar bem 3 períodos, um de grau 33 para aproximar bem 4 períodos, e assim por diante de modo que, próximo à origem, cada período exige em média 4 termos para ser descrito, ou seja, a região de ‘domínio’ de cada termo é de aproximadamente em média. Contudo, podemos notar que o polinômio de grau 87 já não aproxima bem os 11 períodos e, portanto, a região de ‘domínio’ de cada termo da série do seno deve decrescer com , de modo que cada período extra se torna cada vez mais difícil de aproximar.

Já no decaimento exponencial, a região de domínio de cada termo aparenta ser aproximadamente constante com , cada termo aproxima por volta de em unidades da coordenada, e podemos então esperar em nossa vantagem que a fração principal da partícula sempre poderá ser aproximada por um número relativamente restrito de coeficientes.

Convenientemente, as soluções que queremos aproximar oscilam em uma certa região e depois apresentam decaimento exponencial nos extremos do domínio da coordenada, e então o tamanho do intervalo maximin cresce linearmente com o grau do polinômio aproximante, e o limite onde esse intervalo vai a infinito é obtido de brinde quando se faz . Desse modo, na prática basta simplesmente aumentar o número de termos do polinômio, calculando o intervalo maximin a cada termo, até atingir o grau onde os dois critérios sejam simultaneamente atendidos, que a norma uniforme se torne inferior à tolerância , e que o intervalo maximin contenha todo o intervalo da fração principal, de acordo com uma medida específica que será descrita à frente.

Uma maneira simples para calcular o intervalo maximin de um polinômio com um determinado grau é determinar os pontos onde o erro descola do zero nas regiões e , ou seja, o primeiro local onde a partir do zero. Por exemplo, para encontrar o ponto na região onde o erro descola do zero, podemos usar uma rotina numérica para encontrar o zero de uma função como usando a origem como estimativa inicial. O primeiro coeficiente da série, , faz o erro na origem ir a zero, de modo que e , e o termo exponencial garante que e, portanto, garante que a rotina vá buscar o zero na região , já que o termo é mal condicionado na origem. A rotina deve então convergir rapidamente para o zero no extremo do intervalo , onde o erro é o máximo tolerado . Do mesmo modo, o ponto onde o erro descola do zero na região pode ser encontrado buscando o zero de , também usando a origem como estimativa inicial.

3 Substituição direta na equação diferencial

Seja uma equação diferencial ordinária de segundo grau e linear escrita na forma

(9)

onde é a solução exata da equação (função alvo), e as funções , e são reais, sendo que é um termo de fonte que torna a equação homogênea quando nulo555 O método aqui apresentado também pode ser aplicado para resolver equações e sistemas de equações diferenciais não-homogêneas, não-lineares, de graus mais altos, e em um número maior de variáveis independentes, bastando para isso tomar os polinômios e medidas apropriados.. Com relação às equações homogêneas, sabe-se que possuem duas e somente duas soluções independentes [5]. Ainda mais, se adicionalmente à equação homogênea são impostas condições de contorno, pode haver uma multiplicidade de soluções não-triviais para o problema, e dizemos então que o problema é um problema de autovalores.

Agora, substituindo o aproximante (1) na equação diferencial (9) temos que esta não é mais identicamente nula e devemos substituir o lado direito pelo erro pontual,

(10)

de modo que (6) ainda vale, agora no contexto de que o aumento do número de termos do aproximante diminui monotonicamente o erro da solução da equação diferencial, tornando exata a solução por série no intervalo selecionado quando .

O uso da solução polinomial (1) torna trivial o cálculo das derivadas primeira e segunda em (10),

(11)
(12)

e, em particular, para a série de potências ,

(13)
(14)
(15)

de modo que, substituindo as expressões (13) a (15) em (9), a equação diferencial é transformada em uma equação puramente algébrica e exata que lhe é completamente equivalente666 A substituição direta da solução por série de potências guarda semelhança com o método de Frobenius utilizado em análise local[10], mas aqui a aplicação é mais direta, pois não requer o uso de equações indiciais. Além disso, ao contrário da solução de Hylleraas [11, 12] que emprega um polinômio multiplicado por uma exponencial, começar diretamente com a série de potências torna muito mais simples o cálculo das integrais das normas e valores esperados, entre outras vantagens descritas adiante.. Ainda mais, as funções , e podem ser expandidas em séries de potência, deixando ao final uma equação algébrica dada puramente pela combinação linear das funções de base .

Por exemplo, a equação de Schrödinger independente do tempo para uma partícula em uma dimensão tem a forma e ,

(16)

Se, além da solução, também a função é expandida em uma série de potências,

(17)

onde são os coeficientes de , então a equação (16) se torna simplesmente

(18)

que, recombinando os termos, fica

(19)

Agora, da análise da unicidade das séries de potência [5], sabemos que os coeficientes de cada potência de do lado esquerdo de (19) devem se anular individualmente, de modo que obtemos a relação de recorrência,

(20)

que, dados os coeficientes da função arbitrária, e dados os coeficientes independentes e , que chamaremos de sementes, determina todos os coeficientes da solução a partir de . As sementes e são escolhidas de modo a satisfazer condições de contorno, de simetria e/ou de normalização do problema. A solução mais geral tem e , mas é possível obter as duas soluções independentes do problema, por exemplo, anulando cada semente individualmente. Quando se faz e obtemos a solução que cruza o zero no ponto zero, e fazendo e obtemos a outra solução777 Para equações diferenciais de grau maiores que o segundo, o número de sementes e, portanto, de soluções independentes, é igual ao grau da equação, por exemplo, o termo de terceiro grau leva a uma relação de recorrência para , deixando independentes os coeficientes , e ..

Para resolver uma equação diferencial homogênea mais geral, tomando em (9), temos

(21)

que pode ser resolvida do mesmo modo que (16), tomando uma expansão em série para ,

(22)

onde são os coeficientes de , de modo que a equação (21) pode ser escrita na forma

(23)

e pela unicidade, novamente, obtemos a relação de recorrência

(24)

que, dados os coeficientes das funções e arbitrárias, e dadas as duas sementes, determina todos os coeficientes da solução de (21) a partir de , notando que valem exatamente as mesmas considerações feitas acima para (20) a respeito de sementes e soluções independentes.

Aqui vale a pena dedicar um momento de reflexão sobre a relação (24). Essa relação de recorrência é de fato tão especial que, juntamente com as sementes e as expressões para e , contém toda a informação necessária para resolver qualquer equação diferencial ordinária homogênea de interesse físico com uma acurácia arbitrária e, ainda mais, permite a implementação de uma rotina de aritmética simples para calcular a solução termo a termo, progressivamente um após o outro até que se atinja a tolerância especificada.

Por fim, para resolver a equação diferencial ordinária heterogênea (9), basta tomar a expansão de em série,

(25)

e, procedendo analogamente ao que foi feito para a equação homogênea, temos

(26)

que, diferentemente da relação da equação homogênea (24), pode gerar uma solução não-trivial mesmo quando as duas sementes são nulas, e , se os coeficientes estiverem disponíveis. Essa terceira solução para a equação heterogênea é chamada de solução particular [5], e sabemos que a solução mais geral da equação heterogênea é dada por uma combinação linear da solução particular com as duas soluções independentes da respectiva equação homogênea.

A equação (26) sumariza diversos aspectos da matemática de equações diferenciais ordinárias, como a ligação entre a independência de soluções e a independência dos coeficientes semente, e ainda possibilita que se use um método prático, direto, puramente algébrico e iterativo para encontrar uma solução com acurácia arbitrária em um dado intervalo finito para qualquer equação diferencial ordinária homogênea ou heterogênea com , e conhecidas e físicas.

A equação (26) será denominada relação de recorrência mestre para equações diferenciais ordinárias de segundo grau.

4 Resolvendo a equação de Schrödinger

Nesta seção a relação de recorrência mestre para a equação de Schrödinger é obtida e aplicada a problemas simples em uma dimensão.

4.1 A equação de Schrödinger para uma partícula em 1-D

A equação de Schrödinger independente do tempo para uma partícula de massa em uma coordenada pode ser obtida da respectiva equação dependente do tempo nos casos em que o potencial é invariante no tempo usando a separação de variáveis [6], o que resulta na forma

(27)

onde o hamiltoniano é dado pela soma dos operadores energia cinética e potencial , , o operador energia cinética para a partícula é , onde o operador momento linear é dado por , é a constante de Planck dividida por , o operador energia potencial pode ser substituído por uma simples função da coordenada, , é o autovalor de energia, e é a autofunção, ou função de onda, em uma coordenada e independente do tempo, que é um campo escalar complexo de quadrado integrável construído para fornecer a descrição mais completa possível do estado quântico de um sistema.

Isto é, para sistemas que estão nos chamados estados puros, a função de onda contém a informação para descrever o sistema completamente, tornando possível obter as medidas observáveis do cálculo dos valores esperados dos operadores correspondentes888 Mesmo quando o sistema não está em um estado puro, i.e., está em uma mistura estatística, construir a matriz densidade ainda requer as funções de onda dos estados puros.. A propriedade de quadrado integrável de garante que a norma e outros valores esperados mantenham-se finitos e, portanto, físicos. Além disso, para problemas em uma dimensão podemos tomar o campo puramente real, sem perda de generalidade [6].

A interpretação mais aceita para a função de onda é a interpretação estatística dada por Born, que diz que é a probabilidade de encontrar a partícula entre e . Para satisfazer a interpretação estatística, a norma quadrática da função de onda deve, a qualquer tempo, ser igual à um999 Em situações em que a norma da função de onda não é conservada, e.g., em processos dissipativos, ainda é possível recorrer ao formalismo da matriz densidade, talvez especificando um reservatório acoplado ao sistema de interesse.,

(28)

É fácil ver da equação (27) que se é uma solução complexa então o produto de por uma constante complexa também é, de modo que é sempre possível normalizar uma solução, multiplicando-a por um número real para fazê-la obedecer à condição de normalização (28). Além disso, ainda sobra uma fase arbitrária, e dizemos que a função de onda é definida exceto por uma fase global. De posse da função de onda normalizada, torna-se possível obter o valor esperado de uma variável observável tomando

(29)

onde é um operador hermitiano, o que faz de um valor real, e para obter o desvio padrão basta tomar .

De fato, na mecânica quântica, todos os objetos são uma onda, isto é, a matéria, a carga e todas as outras propriedades dessas partículas se comportam como ondas, são ondas de matéria e carga distribuídas no espaço e, como tais, apresentam todas as características naturais das ondas, assim também como algumas outras características muito particulares da mecânica quântica das ondas de matéria. Dessa natureza ondulatória da função de onda surge o importantíssimo princípio de incerteza de Heisenberg, que permeia toda a natureza limitando a quantidade de informação que podemos extrair a respeito das propriedades das partículas. Por exemplo, as variáveis posição e momento são quantidades canonicamente conjugadas, de modo que os operadores posição e momento não comutam, , o que obriga os desvios padrão de medidas do momento e da posição a obedecerem a , ou seja, não é possível conhecer com precisão arbitrária simultaneamente o momento e a posição da partícula. Isso é simplesmente uma propriedade das ondas, as funções de onda nos espaços das coordenadas e dos momentos são pares da transformada de Fourier, com um fator de transformação , de modo que, quanto mais localizado o pacote de ondas estiver no espaço das coordenadas, mais ele estará disperso no espaço dos momentos, e vice-versa.

Uma visão esclarecedora a respeito do significado físico da função de onda vem do teorema de Hellmann-Feynman que, em tradução livre do artigo do Feynman de 1939 [13], diz:

A força em qualquer núcleo (considerado fixo) em qualquer sistema de núcleos e elétrons é simplesmente a força eletrostática clássica exercida no núcleo em questão pelos outros núcleos e pelas distribuições de densidade de carga dos elétrons.

Essa interpretaçao é de fato tão concreta que a maioria dos métodos modernos para cálculos quânticos, como métodos Hartree-Fock e pós-Hartree-Fock, interpretam a densidade para todos os efeitos práticos como sendo a própria distribuição espacial de carga de uma partícula de carga . E, de modo similar, pode ser interpretado como a distribuição de massa da partícula.

Agora, usando a solução polinomial (1) fica fácil calcular a densidade de probabilidade,

(30)

mas, quando a série é finita, as integrais em (28) e (29) devem ser calculadas sobre um intervalo finito que contenha a vasta maioria da densidade de probabilidade, o intervalo da fração principal como discutido acima, e então, para um observável qualquer, escrevemos o pseudo valor esperado

(31)

de modo que, no limite onde o intervalo vai a infinito, e , e simultaneamente o polinômio se torna uma série com , o pseudo valor esperado se torna o valor esperado exato .

Afortunadamente, como mencionado acima, à medida que aumentamos o número de termos do polinômio, vai aumentando monotonicamente o tamanho do intervalo em que aproxima a solução dentro da tolerância especificada, e o polinômio vai progressivamente ‘aderindo’ à solução a partir de . Primeiro adere ao bojo central da densidade de probabilidade e depois vai aderindo às regiões mais distantes onde a densidade é praticamente zero e vai decaindo exponencialmente para ambos os lados. Assim, sempre deve ser possível encontrar um intervalo maximin que contenha a fração principal da partícula e no qual um polinômio minimax aproxima muito bem as funções de onda que são soluções da equação de Schrödinger (27), de modo que todas as integrais do tipo (29) podem ser aproximadas com acurácia arbitrária por integrais do tipo (31). Na prática, dada a expansão em série da função da equação (16), dadas duas sementes à escolha e dada uma tolerância para o erro da aproximação, podemos então calcular os coeficientes a partir de usando (20), e a cada termo podemos determinar o intervalo maximin do polinômio, notando que a função erro dada por (10) é praticamente nula dentro desse intervalo e depois diverge rapidamente para fora dele, conforme discutido acima. Então, o critério para determinar se o intervalo aproximante contém a fração principal da função de onda pode ser estabelecido especificando que a diferença relativa entre os valores esperados calculados em duas iterações subsequentes deve ser menor que a tolerância,

(32)

O melhor da série de potências é que ela torna trivial resolver analiticamente as integrais das normas e dos valores esperados, obtendo uma expressão algébrica para (31), de modo que seu cálculo numérico também deve ser praticamente imediato. Por exemplo, o pseudo valor esperado do operador posição assume a forma simples

(33)

e de maneira análoga para todos os outros operadores relevantes.

Podemos obter uma boa estimativa para o intervalo que contém a fração principal da função de onda observando a convergência da solução no infinito. Suponhamos que o comportamento assintótico é um decaimento exponencial, como acontece com os estados ligados do poço quadrado de potencial finito, de modo que para , onde . A fração do valor esperado que cai fora do intervalo da fração principal, ou seja, a fração residual do valor esperado, é dada por

(34)

Supondo, por simplicidade, que o intervalo é simétrico, , que o valor esperado é a norma, ou seja, o operador é a identidade , e supondo também que as constantes de decaimento para a direita e para a esquerda são idênticas, então a fração residual fica

(35)

Assim, o erro no cálculo da norma cometido ao excluir a fração residual descresce exponencialmente com o tamanho do intervalo , e podemos usar (35) com um critério de tolerância como para obter uma expressão direta para a estimativa do tamanho do intervalo da fração principal,

(36)

considerando obviamente que a tolerância deve ser para que o logarítmo resulte em um valor negativo, e o tamanho do intervalo seja um valor positivo. Se tomamos outro operador, por exemplo o operador energia cinética , o valor da fração residual em (35) será multiplicado por um fator , de modo que a estimativa (36) é uma boa estimativa inicial para o intervalo da fração principal no cálculo do valor esperado de qualquer operador, lembrando que, dado o problema concreto, sempre é possível estabelecer um bom intervalo para cada operador individualmente, ou simplesmente um intervalo que seja extenso o suficiente para aproximar bem todos os operadores.

Então, usando a série de Maclaurin para aproximar o comportamento de decaimento exponencial das funções de onda de interesse, o intervalo de domínio de cada termo do polinômio aumenta linearmente com e, ainda, a componente da fração residual dos valores esperados decai exponencialmente com o tamanho do intervalo. Assim, deve ser possível encontrar uma solução acuradíssima para um vasto intervalo da coordenada e, mesmo que a série contenha dezenas, centenas de milhares de coeficientes, deve ser possível calcular qualquer valor esperado de modo praticamente imediato nos computadores modernos.

Agora, fazendo as substituições competentes em (27), obtemos

(37)

que é equivalente a tomarmos a equação (16) com a função

(38)

e, se expandirmos em série de potências,

(39)

pela unicidade das séries temos que os coeficientes da função são dados diretamente por e para , levando à relação de recorrência mestre para a equação de Schrödinger,

(40)

A função pode ser identificada com o quadrado do número de onda da função de onda no ponto . Mais especificamente, a relação entre o momento da partícula e as propriedades da onda associada é dada pela relação de de Broglie,

(41)

Ou seja, quando a energia potencial varia no espaço então o momento da partícula e consequentemente seu comprimento de onda também variam. Em regiões do espaço onde a energia potencial é baixa, a energia cinética é alta e o momento linear é alto, portanto o comprimento de onda é baixo, e vice-versa. Em uma configuração espacial de potencial com características múltiplas, não necessariamente contínuas, a frequência da função de onda muda de modo suave para acompanhar cada característica particular.

Quanto ao potencial , este é em geral conhecido, podemos usar termos coulombianos, acoplamento spin-órbita, correções relativísticas, entre outros de acordo com as características do problema mas, infelizmente, não conhecemos a priori a função porque a energia é uma constante global desconhecida, de modo que nem sempre é possível usar a equação (40) diretamente. É necessário, então, analisar mais detalhadamente o problema de se encontrar os autovalores de energia.

Para uma partícula em mecânica quântica há sempre duas possibilidades, ou a partícula é livre ou está em um estado ligado. Podemos fazer a distinção mais claramente definindo prima facie um referencial absoluto de energia considerando que, em todo problema realista de mecânica quântica, o potencial deve ir a zero no infinito. O espaço muito além do sistema de estudo deve ser sempre livre para todos os fins práticos, ou seja, sem qualquer potencial, como acontece em qualquer sistema realista de átomos e moléculas. Com essa convenção, temos diretamente que a partícula é livre quando , e quando a partícula está ligada a algum tipo de poço de potencial, por exemplo, um elétron no campo elétrico produzido por um núcleo atômico, ou um átomo preso em um potencial anarmônico de uma rede cristalina. Importa notar que, para um estado ligado, na região espacial em que a energia da partícula é maior que a energia potencial, a solução apresenta comportamento oscilatório e é chamada de região classicamente permitida e, por outro lado, na região em que a energia da partícula é menor que a energia potencial, a densidade de probabilidade decai a zero exponencialmente até o infinito, e é chamada região classicamente proibida.

Agora, se a partícula é livre, então a energia pode ser qualquer dentro de um contínuo de valores, o usuário pode escolher livremente de acordo com o objetivo de sua pesquisa, por exemplo um estudo de espalhamento, e então usar a equação (40) para obter a solução direta e com acurácia arbitrária.

Por outro lado, se a partícula está em um estado ligado, a solução somente tem caráter físico para determinados valores discretos de , e se a energia escolhida não for um desses valores quantizados permitidos então a solução obtida de (40) não será física. Mais especificamente, para os estados ligados, podemos saber se uma dada energia leva a uma solução física analisando a solução no infinito, equação (7), se ela não vai a zero no infinito então ela não é física [5].

Assim, quando se trata de encontrar os autovalores discretos de uma partícula ligada a um poço de potencial, tendo em mente a condição (7), então o problema agora pode ser formulado da seguinte maneira: encontrar o intervalo maximim que contenha toda a fração principal da função de onda, que para todos os efeitos numéricos torna os pseudo valores esperados em valores esperados, e no qual um polinômio minimax aproxima a solução dentro da tolerância especificada, e em uma configuração de energia que minimiza a função de onda nos extremos do intervalo.

Dentro do esquema que está sendo apresentado, podemos pensar em uma diversidade de métodos para encontrar todos os autovalores discretos de energia para um dado potencial, apesar dessa informação não estar explicitamente codificada na equação de Schrödinger. Por exemplo, uma possibilidade é tomar um grau do polinômio bem alto, de modo que o intervalo de aproximação seja bem amplo, e então varrer os valores de energia desde a energia mínima do poço até a energia da sua borda mais baixa, calculando (40) e buscando pelos valores de que minimizam a solução nos extremos do intervalo. Esse método é bastante simples de ser implementado e deve funcionar de modo muito eficiente, ao menos para problemas em uma dimensão. Contudo, como veremos no capítulo seguinte, há um método ainda mais simples e mais direto de obter uma excelente estimativa para todos os autovalores de qualquer problema envolvendo um ou múltiplos poços de potencial, e depois ainda é possível refinar esses autovalores a uma acurácia arbitrária.

Cabe aqui nesta seção um último comentário de ordem prática, sobre o cálculo numérico da série de potências. Os coeficientes da expansão em série de uma função com decaimento exponencial como são proporcionais a e, portanto, rapidamente se tornam números muito pequenos com o aumento do índice, o que pode acabar gerando underflow numérico se a precisão do tipo é fixa101010 Uma alternativa é usar rotinas de precisão arbitrária, mas essas são mais lentas que as rotinas usuais, e provavelmente seria muito difícil usá-las com um bom método de minimização numérica.. Por exemplo, com o tipo numérico de ponto flutuante de precisão dupla (64 bits), podemos representar números com expoentes de até 308, de modo que somente são representáveis os fatoriais de 170 ou menores. Para evitar o underflow numérico no cálculo da expansão de , basta rearranjar os termos da expansão de seguinte maneira

(42)

de modo que, calculando o produtos das frações , a magnitude dos termos intermediários fica sempre muito menor do que calculando e dividindo por . Agora, quando precisamos tratar de fato com coeficientes muito pequenos, por exemplo, em uma rotina de minimização numérica, uma maneira simples é escrever o coeficiente como um produto de dois coeficientes, por exemplo, . De maneira mais geral, qualquer coeficiente pode ser escrito como uma produtória de coeficientes componentes, , de modo que sempre é possível calcular a série em alguma forma de produtórias do tipo (42) sem gerar underflow. Mesmo quando a produtória dos coeficientes não contém o mesmo número de termos que é sempre possível combinar ou dividir coeficientes de modo que ambas as produtórias possuam o mesmo número de termos, e então a divisão entre as produtórias pode ser escrita como a produtória da divisão dos termos como na forma (42), mantendo portanto sob controle a magnitude dos termos intermediários. A função de onda é, em todos os casos, uma função contínua e limitada, oscilando em certa região do espaço e passando de maneira suave a um comportamento exponencial decrescente, ainda que o potencial apresente descontinuidades, de modo que nada de fato diverge.

Agora, sabendo que a função de onda apresenta, por exemplo, decaimento exponencial decrescente em , podemos escrever a solução polinomial (1) de maneira mais bem informada fatorando esse comportamento exponencial, por exemplo, aplicando a transformação ,

(43)

de modo que o valor de , que tende a ficar muito pequeno com , é multiplicado por um outro valor, , que tende a ficar muito grande. Na prática, o valor de usado na transformação de coeficientes pode ser estimado calculando a razão entre dois coeficientes da série para índices altos, já que no decaimento exponencial cada coeficiente é proporcional ao anterior por um fator , mais especificamente, para . O valor de não precisa ser o valor exato do coeficiente real de decaimento, de fato, usar o valor exato em (43) é a melhor fatoração, mas quando é somente uma boa estimativa da constante de decaimento, ainda assim deve ser possível encontrar uma boa fatoração, ao menos uma que retarde o underflow numérico em muitos e muitos coeficientes da série. Além disso, nesse esquema de fatoramento, a constante pode ser facilmente obtida dos coeficientes fatorados , já que a razão entre dois coeficientes subsequentes tende a um, e então para . O fato mais importante é que sempre podemos construir algum tipo de fatoração de comportamento que torna a série mais enxuta, e inclusive é possível trabalhar com mais de um fatoramento por solução, por exemplo, podemos manter uma fatoração para e outra para , enquanto o centro da distribuição usa os coeficientes não fatorados . E, além do mais, a fatoração também pode ser aprimorada à medida que se calcula os coeficientes da série, e se torna possível determinar com maior acurácia a constante de decaimento.

Nas seções seguintes será demonstrada a aplicação direta da relação de recorrência mestre da equação de Schrödinger (40) para alguns problemas simples e de solução bem conhecida na mecânica quântica, para ilustrar o conceito da solução por série de potências. Estes são os problemas arquetípicos em mecânica quântica em uma dimensão para os quais a energia exata dos estados pode ser obtida trivialmente, de modo que é possível usar a relação de recorrência mestre diretamente.

No capítulo seguinte trataremos de problemas um pouco mais complicados, onde inicialmente podemos contar somente com uma boa estimativa da energia dos estados, sendo necessário aplicar um processo de refinamento posterior dos autovalores de energia que utilizará como guia a relação de recorrência mestre.

4.2 O poço quadrado de potencial

Nesta seção, para efeito de demonstração, a relação de recorrência mestre para a equação de Schrödinger (40) é aplicada de modo direto para resolver os problemas dos poços quadrados de potencial finito e infinito, levando às conhecidas soluções senóides e exponenciais [6]. As derivações apresentadas nesta seção e nas seguintes, através da construção de uma solução a partir da relação de recorrência mestre para a equação de Schrödinger, são derivações simples e fundamentais e, como tal, tem também seu interesse educacional.

O poço quadrado infinito é uma idealização do problema onde as paredes são perfeitamente reflexivas e, por convenção, para o poço simetricamente centrado na origem e de largura , tomamos o potencial

(44)

de modo que, em todos os casos, , e há somente estados ligados. Assim, nessa versão idealizada, a função de onda é nula fora do poço e oscilatória dentro dele, uma combinação linear de seno e cosseno, sendo que as energias permitidas são obtidas impondo as condições de contorno nas bordas do poço onde a função de onda deve ser nula, . Como rotina, o número de onda dentro do poço é definido por , e a condição de contorno impõe que a extensão do poço seja um múltiplo inteiro de , de modo que , onde o inteiro é o número quântico, que diz quantas excitações há nos modos de vibração da partícula dentro do poço. A energia pode então ser diretamente obtida combinando essas condições, , e é proporcional ao quadrado do número de excitações.

Agora, tomando em (40) temos que

(45)

e, redefinindo as sementes em termos de duas constantes reais e , obtemos a solução mais completa na forma

(46)

que pode ser expressa simplesmente como combinação linear de seno e cosseno,

(47)

de modo que fazendo obtemos a solução anti-simétrica, que atende à condição de contorno para par, e fazendo obtemos a solução simétrica, que atende à condição de contorno para ímpar. Em ambos os casos, as constantes de normalização e são facilmente calculadas da condição de normalização da função de onda (28), resultando em .

No caso do poço quadrado finito, simetricamente centrado na origem, de largura e profundidade , a função potencial é dada por

(48)

onde e, para uma partícula ligada, , de modo que na região a solução é oscilatória, e na região a solução é exponencial decaindo a zero no infinito para ambos os lados. Neste caso, a solução tradicional é, assim como o potencial, construída por partes e portanto não é analítica, e as energias permitidas são obtidas impondo-se a continuidade da solução e sua primeira derivada nas bordas do poço . Dentro do poço finito, e define-se o número de onda como , e então as soluções são obtidas do mesmo modo que (47). Fora do poço, e define-se o número de onda como .

Agora, tomando em (40), e notando que agora é um valor positivo, temos que para ,

(49)

e, novamente, redefinindo as sementes em termos de duas constantes reais e , obtemos a solução mais completa na forma

(50)

que, por exemplo, tomando , nos dá a solução exponencial crescente para

(51)

e, tomando , nos dá a solução exponencial decrescente para

(52)

Os autovalores do problema do poço quadrado finito de potencial são mais difíceis de se obter que os autovalores do poço quadrado infinito, pois parte da função de onda ’vaza’ para fora do poço, ou seja, parte da energia da onda tunela através da parede do poço, de modo que o comprimento da onda dentro do poço sofre uma pequena dilatação que pode chegar até . Para os estados de menor energia, o decaimento exponencial na região classicamente proibida é forte porque é alto, então a solução oscilatória dentro do poço tem seu comprimento de onda ligeiramente dilatado para fazer com que a inclinação da onda ao atravessar a borda do poço seja justamente a mesma dada pelo início do decaimento fortemente exponencial. Para os estados de energia mais alta, é menor e o decaimento exponencial é mais suave, há uma maior penetração da densidade de probabilidade da partícula na região classicamente proibida, e portanto a onda dentro do poço perde mais energia, e seu comprimento de onda tem que ser mais fortemente dilatado para atender à inclinação desse decaimento exponencial mais suave ao atravessar a borda do poço. Os autovalores podem ser encontrados impondo a continuidade da função de onda e sua derivada na borda do poço levando às bem conhecidas equações transcendentais para a energia, para a solução simétrica, e para a solução anti-simétrica. Do gráfico dessas equações [6] é facil notar que, para os estados de menor energia, é muito próximo de um múltiplo de , ou seja, , ficando ligeiramente abaixo desse valor e, então, com o aumento do número de excitações , a diferença de para vai aumentando, até o limite do estado ligado de maior energia do poço onde pode perder no máximo , ou seja, , ficando na prática sempre um pouco acima desse valor.

4.3 O potencial linear

Nesta seção a relação de recorrência mestre para a equação de Schrödinger é aplicada para resolver diretamente o problema do potencial linear, levando à forma exata conhecida, as funções de Airy [6].

Um potencial linear, por exemplo aquele experimentado por uma partícula de carga em um campo elétrico externo constante , pode ser escrito na forma

(53)

de modo que e para . Notando que neste problema idealizado o potencial não tem estados ligados, que portanto a energia pode assumir qualquer valor dentro de um contínuo de valores permitidos e dado que, neste caso em particular, um deslocamento de energia significa simplesmente que a função de onda é deslocada linearmente na coordenada sem deformação, então podemos tomar sem perda de generalidade. Com essa convenção, temos que, para , a solução deve ser oscilatória na região , e na região deve decair a zero no infinito mais rápido que a exponencial, e vice-versa para .

Agora, calculando (40) para temos que pois . Já para , definindo111111 O procedimento é o mesmo para . , tomando o potencial em (40), e com , temos que

(54)

onde é um número positivo. Para temos que , para temos , para temos já que , para temos que , e assim por diante, de modo que, redefinindo as sementes em termos de duas constantes reais e , obtemos a solução mais completa na forma

(55)

que é justamente a forma das funções de Airy Ai e Bi [10],

(56)

Sabemos que a função Bi diverge em , então a escolha particular das sementes que leva a uma solução física neste caso é dada por e .

Referências

  • [1] E. Schrödinger, An Undulatory Theory of the Mechanics of Atoms and Molecules. The Physical Review, 28 (1926), 1049–1070.
  • [2] The official web site of the nobel prize. <http://nobelprize.org>, página acessada em 09/08/2014.
  • [3] Crossing length scales. Editorial, Nature Materials, 12 (2013), 1079.
  • [4] X. Deupi, Molecular dynamics: A stitch in time. Nature Chemistry, 6 (2014), 7–8.
  • [5] G. B. Arfken, H. J. Weber, Mathematical Methods for Physicists. 5 edition, Harcourt/Academic Press (2001).
  • [6] D. J. Griffiths, Introduction to quantum mechanics. Prentice Hall, New Jersey (1995).
  • [7] C. Cohen-Tannoudji, B. Diu, F. Laloe, Quantum Mechanics. Hermann e John Wiley & Sons, Paris, França (1992).
  • [8] D. M. Greenberger, M. Horne, A. Zeilinger, Bell theorem without inequalities for two particles. I. Efficient detectors. Physical Review A, 78 (2008), 022110.
  • [9] E. W. Weisstein, Minimax Polynomial. From MathWorld – A Wolfram Web Resource. <http://mathworld.wolfram.com/MinimaxPolynomial.html>, página acessada em 06/08/2014.
  • [10] C. M. Bender, S. A. Orszag, Advanced mathematical methods for scientists and engineers. McGraw-Hill (1978).
  • [11] M. B. Ruiz, Hylleraas Method for Many-Electron Atoms. I. The Hamiltonian. International Journal of Quantum Chemistry, 101 (2005), 246–260.
  • [12] J. Rychlewski, J. Komasa, Explicitly correlated functions in variational calculations. Em J. Rychlewski (ed.), Explicitly correlated wave functions in chemistry and physics. Theory and applications. Kluwer Academic Publishers, Dordrecht, Países Baixos (2003).
  • [13] R. P. Feynman, Forces in Molecules. Physical Review, 56 (1939), 340–343.
Comments 0
Request Comment
You are adding the first comment!
How to quickly get a good reply:
  • Give credit where it’s due by listing out the positive aspects of a paper before getting into which changes should be made.
  • Be specific in your critique, and provide supporting evidence with appropriate references to substantiate general statements.
  • Your comment should inspire ideas to flow and help the author improves the paper.

The better we are at sharing our knowledge with each other, the faster we move forward.
""
The feedback must be of minimum 40 characters and the title a minimum of 5 characters
   
Add comment
Cancel
Loading ...
361100
This is a comment super asjknd jkasnjk adsnkj
Upvote
Downvote
""
The feedback must be of minumum 40 characters
The feedback must be of minumum 40 characters
Submit
Cancel

You are asking your first question!
How to quickly get a good answer:
  • Keep your question short and to the point
  • Check for grammar or spelling errors.
  • Phrase it like a question
Test
Test description