338 75 82MB
Portuguese Pages 155 Year 2000
PROCESSAMENTO ADAPTATIVO DESINAIS
621.3822 A143p
N.Cham. 621.3822 A143p Autor: Abrantes, Sílvio A. Título: Processamento adaptativode sina
miNonmm 13844513
Ac. 72916
PROCESSAMENTO ADAPTATIVO DE SINAIS
UNIVERSIDADE FEDERAL DO
CEARA
SÍLVIO A. ABRANTES
PROCESSAMENTO ADAPTATIVO DE SINAIS
SERVIÇO DE EDUCAÇÃO E BOLSAS FUNDAÇÃO CALOUSTE GULBENKIAN UNIVERSIDADE FEDERAL DDOCEEA RÁ Biblioteca de Ciências a Ta
Prefácio
Senti duas motivações para escrever este livro. A primeira, mais imediata, derivou do facto de há alguns anosleccionar as matérias aqui apresentadas no curso de Engenharia Electrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto e sentir alguma premência em redigir um texto integrado, com princípio, meio e fim, que aproveitasse as diversas notas e apontamentos que fui desenvolvendo. A outra motivação, mais latente e difusa mas de alcance porventura mais profundo, foi surgindo paradoxalmente antes da primeira: que eu tenha conhecimento, não existe no mercado nenhuma publicação em língua portuguesa que aborde o processamento adaptativo. Este facto foi um incentivo adicional estimulante para que pusesse mãos à obra. Assim, este livro destina-se prioritariamente a alunos universitários dos países de língua portuguesa. Será também de utilidade para engenheiros que em formação pós-graduada queiram actualizar os seus conhecimentostécnicos na área. O processamento adaptativo de sinais é um tema de crescente importância hoje em dia, dada a multiplicidade de situações em que pode ser aplicado e tendo em conta os consideráveis avanços tecnológicos que se têm verificado nos últimos anos nos processadores digitais de sinal. Podemosdizer, sem receio de falhar, que qualquer sistema de telecomunicaçõs medianamente avançado beneficia do processamento adaptativo em maior ou menor grau, nomeadamente sob a forma de filtros igualizadores de canal. Um assunto tão vasto como este, com aplicações tão diversas, pode ser abordado de variadas maneiras. Dada a minha formação, é o ponto de vista das “telecomunicações” que sobressai, embora tenha tido a preocupação de não descurar demasiado outras áreas. Reservados todos os direitos de acordo com lei
E Edição da FUNDAÇÃO CALOUSTE GULBENKIAN Av. de Berna | Lisboa 2000 ISBN - 972:31-0896-8 DEP. LEGAL- 160358/01
O livro está dividido em sete capítulos. No primeiro faz-se uma breve introdução ao processamento adaptativo com a ajuda de numerosos exemplos de aplicação. O capítulo seguinte, por sua vez, serve de antecâmara aos que lhe sucedem. Nele são feitas algumas revisões de natureza matemática, necessárias para a exposição subsequente. São também referidas brevemente as estruturas e as famílias de algoritmos adaptativos que mais tarde serão expostas com mais profundidade.
UNIVERSIDADE FEDERAL DO CEARÁ Biblioteca da Ciânnriae a Torna
Os capítulos 3, 4 e 5 constituem, por assim dizer o núcleo do livro. No
capítulo 3 é estudado o algoritmo teórico mais importante de todos, o algoritmo do gradiente, tão importante que o seu conceito deu origem aos mais usados algoritmos práticos, cujo máximo expoente de popularidade é o algoritmo LMS. Este e outros “filhos” são o tema do capítulo 4.
No capítulo 5 é feita a abordagemda outra família importante de algoritmos adaptativos, afamília dos “mínimos quadrados”, com ênfase nas técnicas recursivas e suas versões rápidas, como o chamado algoritmo “fast Kalman'”.
Os dois últimos capítulos, 6 e 7, apresentam cada um uma aplicação do processamento adaptativo em telecomunicações:a igualização e o cancelamento de eco. O capítulo 6 aborda pormenorizadamente a primeira aplicação nos seus vários modos de funcionamento, com ou sem auxílio de sinais de treino, e através de várias estruturas de implementação (igualizadores lineares, FSE e DFE). No capítulo 7 é o cancelamento de eco que é estudado nas suas especificidades, não só quando o objectivo é eliminarecoslineares mas também quando existem não-linearidades no sistema.
ou problemas, a incluir no fim de cada capítulo de uma futura edição. Para todos estes efeitos poderei ser contactado na Faculdade de Engenharia da Universidade do Porto ou por correio electrónico nos endereços sam Qinescn.pt ou sam Ofe.up.pt. Em resumo, espera-se que esta publicação contribua, à sua medida, para uma maior divulgação das técnicas de processamento adaptativo, tão correntes por tão necessárias na actualidade.
Porto, Setembro de 1997 Sílvio Abrantes
No fim do livro encontra-se uma extensa lista de referências bibliográficas citadas no texto. É uma boa fonte de informação para quem desejar aprofundar os
assuntos expostos.
A teoria apresentada nos diversos capítulos é complementada com exemplos para confirmação de resultados ou para consolidação e revisão dos temas analisados. Uma chamada de atençãofinal: este texto não é nem exaustivo nem definitivo. A população-alvo que pretendo atingir não necessita de uma obra enciclopédica e alguns temas, inegavelmente interessantes, saem fora do âmbito desejado e tiveram de ser excluídos. É por esse motivo que neste livro não são apresentados algoritmos com estruturas “lattice” ou outras que não as transversais não-recursivas (os
conhecidos filtros FIR). Limito-me, de facto, a utilizar estas últimas, excepto num pequeno caso específico do cancelamento de eco. A mesma razão levou-me a excluir da exposição as questões da precisão finita em implementações digitais, bem como o processamento no domínio das frequências, de utilização muito mais reduzida quando comparada com o processamento no domínio dos tempos, o único considerado aqui.
Não sendo definitivo, este livro será revisto e melhorado (espera-se...) quando se achar oportuno. As sugestões de aperfeiçoamento ou os comentários que a leitura suscitar são bem-vindos, tal como o são sugestões ou ideias para exercícios
UNIVERSIDADE FEDERAL DO CEARA
1. INTRODUÇÃOE APLICAÇÕES Introdução ao processamento adaptativo Classes de processamento adaptativo Exemplos de aplicações
1.1. Introdução ao processamento adaptativo Este livro trata de filtros. Filtros adaptativos. Encontramosfiltros nas mais variadas situações. Todos conhecem osfiltros de
café, feitos de papel, os filtros de ar e de óleo usados nos automóveis, os filtros solares
para uso nas praias ou materiais para isolamento acústico. O objectivo é sempre o mesmo, do ponto de vista conceptual: queremos que o filtro impeça a propagação de algo indesejável, seja isso impurezas, raios ultra-violetas ou ruído sonoro.
Os filtros eléctricos partilham com os exemplos anteriores alguns atributos comuns: os sinais eléctricos que aplicamos na entradados filtros vão ser alterados em algumas das suas características. Podemos, por exemplo, usar um filtro para retirar de um sinal eléctrico alguns dos seus harmónicos. Ou imagine-se termos um sinal útil de tal modo imerso em ruído que não o “vemos” (é tudo “nevoeiro”, parece. . ). Um filtro poderá servir para diminuir o nível de ruído e assim se poder observar ou usar o sinal, agora mais limpo.
O comportamento de um filtro deverá ser avaliado, para sabermos se a filtragem está a ser eficaz ou não. Muitas vezes servimo-nos de certas características estatísticas dos sinais e ruídos em presença (como a média ou a variância) para fazermos essa avaliação. Assim, o objectivo da filtragem poderá ser, por exemplo, a minimização de um erro, definido como diferença entre uma resposta desejada e a saída do filtro, ou a minimização da média dos quadrados dessa diferença — O chamadoerro quadrático médio.
Tendo entradas estacionárias, ao filtro com o qual se consegue minimizar O erro quadrático médio dá-se o nome defiltro de Wiener. Diz-se então que este filtro é óptimo no sentido quadrático médio. A representação gráfica do erro quadrático HAVRDCINANE CENEDA! DNOCEARÁ
13
12
médio em função dos parâmetros do filtro dá-se o nome desuperfície de “performance” do erro e o ponto mais baixo dessa superfície corresponde à solução de Wiener. Se o sinal ou ruído tiver características não-estacionárias já não poderemos usar filtros de Wiener. Nesse caso precisamos de usar filtros cujas características ou parâmetros variem no tempo, acompanhando automaticamente as variações da entrada. É este o objectivo do processamento adaptativo: condicionar sinais de modo a atingir gradualmente determinados objectivos, como os atrás indicados. Os filtros usados em processamento adaptativo são quase sempre filtros digitais. Os seus coeficientes são variáveis no tempo e o modo como variam depende do algoritmo adaptativo escolhido. Um filtro adaptativo é, pois, um filtro capaz de auto-aprendizagem: à medida que o tempo decorre o filtro vai ajustando as suas características de modo que o seu comportamento seja o desejável. Osfiltros digitais trabalham com sinais amostrados no tempo. Por esse motivo não iremos considerar sinais em tempo contínuo mas sempre sinais em tempo discreto. Isto não é de forma nenhuma uma limitação porque sabemos que podemos representar um sinal em tempo contínuo com a suficiente fidelidade simplesmente através de amostras suas colhidas a um ritmo de acordo com o que recomenda o teorema da amostragem, isto é, com uma frequência de amostragem que seja superior ao dobro da maior frequência do sinal. O ajuste das características do filtro, isto é, o modo como o condicionamento dos sinais é feito, poderá ser realizado tendo em conta o sinal de entrada e outros
dados “de entrada”. Estaremos então na presença de um esquema em anel aberto (open-loop) [Widrow85] como o indicado na Fig. 1.1, onde a informação obtida a partir de medidas das características da entrada é aplicada a uma fórmula ou algoritmo, sendo o resultado usado para ajustar o sistema adaptativo. Podemos,no entanto, usar também o sinal de saída do filtro para o monitorizar
podem ser algo como informações acerca do “ambiente” do sistema adaptativo, ou uma versão desejada do sinal de saída. Toda esta informação vai permitir optimizar o desempenho do sistema.
Sinal
de €—
Entrada
a
Processadorde /
à
Outros dados
Fig.1.1. Adaptação em anel aberto.
Tendo mais vantagens, os esquemas em anel fechado serão os únicos que vamos considerar daqui para diante. Sinal
de
ú
0-4 processador
Entrada
/
Esquema em anel aberto
;
Esquema em anel fechado
No esquema em anel fechado (Fig. 1.2) temos em conta não só as características da entrada mas também as características da saída e outros dados, que
Sinal
> de
Saída
Algoritmo de
Adaptação
Cálculo D
|
Saída
Algoritmo de a Adaptação
e lhe ajustar as características. Desta maneira dispomos de mais informação do que a que tínhamos em anel aberto. A este novo esquema chamamos esquema em anel fechado (closed-loop): Processamento adaptativo
Sinal
de nho esempenho
o Outros dos
Fig. 1.2. Adaptação em anel fechado.
Tal como os filtros convencionais de parâmetros fixos, também os filtros adaptativos podem ser classificados como lineares e não-lineares. Dizemos que um filtro (convencional) é linear se a sua saída for uma função linear das observações
14
aplicadas à entrada. Se assim não for o filtro é não-linear. À primeira vista qualquer filtro adaptativo seria não-linear, visto que os seus parâmetros dependem dos dados de entrada e variam de iteração para iteração (não obedecendo ao princípio da sobreposição). Mesmo assim podemos fazer a distinção entre um filtro adaptativo linear e um filtro adaptativo não-linear. Diremos então que “um filtro adaptativo é linear se a estimativa da resposta desejada é calculada adaptativamente, na saída,
como uma combinação linear do conjunto disponível de observações aplicadas à entrada do filtro” [Haykin96]. Não sendo assim, o filtro adaptativo é não-linear. Em qualquer caso estes filtros, ao contrário dos convencionais, são variantes no tempo,
obviamente.
1.2. Classes de processamento adaptativo Apesar da diversidade de aplicações podemos considerar um esquema adaptativo genérico como da Fig. 1.3. O elemento fundamental é o processador, um filtro digital com um númerofinito de pesos, ou coeficientes, variáveis de uma forma
adaptativa. Esses pesos são ajustados repetidamente, em intervalos regulares, de acordo com um algoritmo (adaptativo) de maneira a optimizar um determinado critério de qualidade relacionado com um erro de estimaçãoe. Este erro é a diferença entre uma resposta desejada, d, e a saída do processador, y. Em resumo, além do filtro adaptativo, devemos ter sempre um sinal de entrada, uma resposta desejada e um erro.
Teremos, então, em esquema: Filtros
foi
à
à
Filtros de parâmetrosfixos
d (resposta desejada)
A
x (entrada)
Filtros adaptativos
O Processador
/
Filtros lineares
Filtros não-lineares
Filtros lineares
Filtros não-lineares
Teremos ocasião de encontrar filtros adaptativos dos dois tipos nas restantes páginas deste livro, sendo os lineares sem dúvida os mais vulgares. As áreas de aplicação do processamento adaptativo de sinais são muito diversas. Eis uma pequenalista com as áreas mais evidentes: º
telecomunicações (HF, feixes de microondas, espalhamento de espectro (“spread
y (saída)
e (erro)
Algoritmo
Adaptativo
Fig. 1.3. Esquema adaptativo genérico.
O critério de qualidade é normalmente designado por função de custo. Consoante a aplicação, a função de custo usada pode ser o valor absoluto do erro, o seu quadrado, a média dos seus quadrados (erro quadrático médio) ou uma outra função do erro. A Fig. 1.4 apresenta três exemplos de funções de custo.
e
lel
f(e)
spectrum”), telefonia, etc.);
*
geofísica;
*
processamento de dados sísmicos;
º
análise de dados biomédicos (electrocardiografia, por exemplo);
º*
processamento de sinais de áudio, vídeo, radar e sonar;
º
controlo de máquinas industriais.
se
Fig. 1.4. Exemplos de funções de custo.
HNIVERSINANE CEDEDL nes nrana
16
17
A evolução da função de custo ao longo do tempo é uma indicação das qualidades de aprendizagem do algoritmo adapta tivo. A sua representação gráfica chama-se, por isso, curva de aprendizagem. A Fig. 1.5 apresenta um exemplo.
Classes e aplicações do processamento adaptativo
eb Erro quadrático médio
|
po
i ã Identificação de sistemas
Predição adaptativa
:
20-
e codificação de voz
15
e estimação espectral e detecção e branqueamento
à
e Igualização de canais de comunicação e Controlo adaptativo
e processamento de voz
inai
e desconvolução « projecto de filtros digitais (síntese defiltros IIR)
pç e ADPCM
de ruído ento EE ' o pesa a 'º Ecancelam * eleelectrocar
ómi e ciências sociais e económicas iológi e sistemas biológicos i e controlo adaptativo o
projecto
E
;
jo
lterações
E
o
e geofísica
e
titros
aa celamento ei
Igualização
igitais (síntese
e
cancelamento
iitros
no e modelização de canais de comunicação com “multipath”
dos
lobos
laterais
dos
"e extracção de sinusóides de pequena amplitude em ruído de banda larga
Fig. 1.5. A curva de aprendizagem.
À função de custo mais usada é sem dúvid a oerro quadrático médio. Podemos apontar duas razões para isso: 1) é fácil obter algoritmos adaptativos a partir do erro quadrático médio, como veremos; 2) norm almente o verdadeiro objectivo do processamento adaptativo é satisfeito quan do o erro quadrático é pequeno!.
.
5
Predição adaptativa;
*
Identificação de sistemas (ou modelização adaptativa directa); Igualização (ou modelização adaptativa inver sa); Cancelamentode interferências.
º *
o que
e pa
a em cada um
a) Predição
Instalação
b) Identificação de sistemas
O esquema seguinte apresenta algumas das aplicações do processamento adaptativo distribuídas pelas quatro grand es classes precedentes. 'Por exemplo, na igualização de canais de comunicação o que efectivamente se pretende é reduzir a interferência intersimbólica. Isso conseg ue-se se se reduzir o erro quadrático médio.
]
dos casos.
As diversas aplicações, embora distintas, poderão enquadrar-se em quatro grandes classes de filtragem adaptativa consoante a configuração do sistema adaptativo e o objectivo a atingir: *
.
2O
artigo
de C. Richard Johnson, Jr, “Yetstill more on the interaction of adaptive filtering, entao
eol” IEEE Signal Processing Magazine, Março de 1995, faz uma Esmia ça E E actualizada, do processamento desinal e do controlo e estimação, com algu aplicações em telecomunicações.
UNIVERSIDADEFEDERAL DO CEARÁ
19
18
Nesta classe de aplicações a resposta desejada é a saída da “Instalação” a modelizar.
Atraso
são
Instalação
Z
|
A
Processador Japtativo
+
a
-
-— (2)
alaca
al c) Igualização
sm
primária
PR
entrada
A
x
Processador
d) Cancelamento
Adaptativo
de referência
Fig. 1.6. As quatro classes de processamento adaptativo: a) Predição adaptativa; b) Identificação de sistemas; c) Igualização; d) Cancelamento de interferências.
1.2.1. Predição adaptativa De acordo com a Fig. 1.6a, com base num sinal x, que é uma versão atrasada do sinal corrente s, o processador tenta obter uma saída y que se aproxime de d (que é igual a s), minimizando assim e. Por outras palavras, o processador tenta “prever” o sinal de entrada corrente, s. Note-se que o sinal corrente é também a resposta desejada. A predição adaptativa é usada, por exemplo, na codificação de voz, na estimação espectral, na detecção e branqueamento de sinais e em PCM diferencial adaptativo (ADPCM) [Widrow85] [Cowan85]. 1.2.2. Identificação de sistemas (modelização)
A Fig. 1.6b apresenta uma configuração utilizada para identificar, ou modelizar, sistemas desconhecidos, como a caixa preta? designada na figura por “Instalação”. Neste caso o processador tenta “emular” a função de transferência da Instalação. De facto, sendo a entrada s aplicada simultaneamente à caixa preta e ao processador, se a saída deste, y, for aproximadamente igual à saída da Instalação, d,
então o processador estará a comportar-se aproximadamente como a Instalação. 3
Oubranca.
A identificação de sistemas é usada para modelizar “instalações” em que se conhece a entrada e a saída. Certos estudos de vibrações em sistemas mecânicos recorrem a esta técnica e também se encontram aplicações nas ciências sociais e económicas, em sistemas biológicos, em sistemas de controlo adaptativo, no projecto de filtros digitais (síntese de filtros FIR), em geofísica (modelização do solo), na modelização de canais de comunicação com “multipath”, etc. [Widrow85].
1.2.3. Igualização adaptativa
Na igualização procede-se a uma modelização inversa da anterior, como se mostra na Fig. 1.6c. O processador está agora em série com a “Instalação”. Se esta for, por exemplo, um canal de “comunicações (que introduz atraso), então o processador tenta recuperar uma versão atrasada do sinal s, o qual foi alterado quer pelas características variáveis do canal quer por ruído aditivo. A resposta desejada é umaversão atrasada do sinal de entrada da “Instalação”. Após convergência a função de transferência do processador é o inverso da função de transferência do canal. Além dá igualização de canais de comunicações, a modelização adaptativa inversa é aplicada, por exemplo, no controlo adaptativo, no processamento de voz, na desconvolução (por exemplo, em sismologia) e no projecto de filtros digitais (na síntese de filtros IIR) [Widrow85].
1.2.4. Cancelamento de interferências
A Fig. 1.6d apresenta uma configuração usada para cancelar interferências, entradas: na entrada primária o sinal s está corroído por ruído n e na duas com referência n' é uma versão distorcida mas correlacionada com n. de entrada O processador tenta aproximar y de n de modo que, após convergência, a saída do sistema, e, é aproximadamente iguala e=s+n-— n=s, isto é, sinal sem ruído.
A entrada primária (sinal + ruído) é a resposta desejada dofiltro adaptativo.
Na Fig. 1.7 é apresentada uma configuração usada numa aplicação de acústica e que é idêntica à da Fig. 1.6d.
20
Cancelador adaptativo de ruído
Sinal
Db
|
s+n |I
+
| |
=
É
Estimativa do ruído
| | Fonte de Ruído
DE
Fo
Adaptativo
/
Entrada de |
ao
e
Fonte de energia sísmica
sitema
| | | | | | | | | |
[
Referência |
a
Later meia fase puta fe a rei E]
Fonte de
E RAR Ro ]
Fig. 1.7. Cancelamento de ruído.
Como o próprio nome deixa antever, o cancelamento adaptativo de interferências é usado para cancelar ruído e eco em sinais de voz e de dados, em electrocardiografia*, no cancelamento dos lobos laterais dos diagrama s de radiação de antenas e na extracção de sinusóides de pequena amplitude em ruído de banda larga (“adaptive line enhancement”) [Widrow75] [Widrow85].
1.3. Exemplos de aplicações Nesta Secção são apresentados alguns exemplos concretos de aplicação do processamento adaptativo”.
1.3.1. Modelização da resposta impulsional do subsolo A Geologia também beneficia do uso de técnicas adaptativas. A Fig. 1.8 mostra comose pode determinar a resposta impulsional do subsolo recorrendoa estas técnicas, mediante a utilização de sensores (geofones) e de equipamento que produza ondas sísmicas (um compressor, dinamite, etc.). Este gera ondas que, devido às características
particulares do solo (camadas estratificadas, jazidas minerais, petróleo, água, etc.), são recebidas em instantes diferentes nos geofones. Este procedimento, conjugad o com o filtro adaptativo da figura, permite medir a resposta impulsional entre a fonte de energia e o geofone e assim formar uma “imagem” do subsolo que é útil na prospecç ão mineira de recursosnaturais (“estaremos em cima de um lençol de petróleo?”). * Comono caso dos batimentos cardíacos fetais perturbados pelo batimento cardíaco materno. * Algunsdos exemplos foram extraídos dolivro “Adaptive Signal Processing”, de B. Widrow e S. Stearns, Prentice-Hall, 1985 [Widrow85]. Os exemplos de cancelamento podem ser encontrados em [Widrow75] e o exemplo de comunicações troposféricas em [reichler87].
Superfície da Terra Camada 1 Camada 2 Camada 3 Camada 4
Fig. 1.8. Procedimento para determinar a resposta impulsional do solo.
Na Fig. 1.9 é apresentada uma resposta impulsional de subsolo. O efeito das diferentes reflexões é visível nos picos da resposta.
Á Resposta impulsional
Entrada
Filtro Adaptativo)
Saída
A IP = Tempo
Fig. 1.9. Resposta impulsional do subsolo usando a técnica adaptativa da Fig. 1.8.
1.3.2. Igualização adaptativa de canais de comunicação A Fig. 1.10 ilustra o fenómeno de multipath que ocorre em muitas situações; neste caso trata-se de um sistema de comunicações troposférico apresentado em [Treichler87]. Como se mostra na figura, existem diversos trajectos que o sinal percorre desde o emissor até ao receptor, devidos ao atravessamento de zonas da
atmosfera com diferentes índices de refracção.
23
22
ps Turbulência
Ondas APStadas pela turbulência troposférica
como este está em série com o igualizador a função de tranferência global passa a ter uma amplitude constante, comose pretendia. O filtro transversal está pormenorizado na Fig. 1.12, onde T representa o intervalo de amostragem da comunicação.
o
POGEIN E
,
EE RR | Emissor Emissor
|
Es
Troposférico
|
|
piso E
4
E
E
7
|
|
Receptor
nedo
asa
200 - 600km
coeficientes
Fig. 1.10. Um sistema de comunicações troposférico
Este canal de comunicação tem, portanto, características variáveis no tempo | e o seu efeito prejudicial é combatido com um igualizador adaptativo, representado na Fig. 1.11 pelo filtro “inverso”. O papel deste filtro é o de daqui a chamada interferência intersimbólica, que comoo próprio nome indica, consiste na influência que os sucessivos símbolos de informação de uma transmissão digital têm uns nos outros, influência que é perniciosa na medida em queo receptor, nessa situação, tem mais dificuldade em reconhecer ou identificar os símbolos e terão sido Fa pelo emissor. Para que não haja interferência intersimbólica à entrada do desmodulador teoricamente o conjunto canal+igualizador deve ter uma funçã transferência de módulo constante. ER
Transmitido E
Sinal
Recebido.
igualizado
Canal de
Igualizador
ou Filtro Inverso
Desmodulador TESS
| Avaliação | — — — — — 3] de | qualidade [ea
Fig. 1.12. O igualizador como filtro transversal FIR.
Para além dos canais atmosféricos, os filtros adaptativos são também usados para igualizar cabos coaxiais, pares entrançados delinhas telefónicas ou outras linhas de transmissão que necessitem de igualização. Sendo adaptativo, o filtro ajusta automaticamente as suas características a diferentes comprimentos de cabos. 1.3.3. Cancelamento de interferências em electromedicina
Siinal
propagação troposférico
|
ps mag |
T+
Selecção de
Sinal -
|
|
Ivalizador q
|
|
Desmodulad E
Fig. 1.11. Emprego de um filtro “inverso” para igualizar o canal troposférico.
e Neste exemplo o igualizador é simplesmente um filtro transversal FIR com coe icientes que variam no tempo de tal maneira quea sua função de transferência se vai progressivamente aproximando do inverso da função de transferência do canal: 2
O processamento adaptativo encontra aplicações muito úteis em electromedicina. Por exemplo, veja-se como se pode proceder para eliminar a influência da frequência da redeeléctrica (50 Hz) no funcionamento de equipamento de instrumentação médica, como o usado em exames electrocardiográficos. Em electrocardiografia faz-se a representação de descargas eléctricas cardíacas captadas por eléctrodos convenientemente colocados no peito dos pacientes. Ora acontece queos valores dos impulsos eléctricos envolvidos são muito baixos e nem sempre o percurso do coração até ao sensor apresenta boa condutividade, havendo necessidade de melhorar a resistência de contacto da pele com o eléctrodo através do uso, por exemplo, de gel para adaptação de índices de refracção. Em circunstâncias tão desfavoráveis qualquer interferência exterior, mesmo ínfima, é um grande obstáculo à correcta representação eléctrica dos sinais
24 cardíacos e à sua interpretação pelos médicos. Uma destas interfer ências provém das tomadas de corrente na parede, pois os fios dos aparelhos, actuand o como antenas, captam o sinaltde S0Hz da rede eléctrica. Para então reduzir o efeito deste ruído é conveniente usar um esquema adaptativo (veja-se a Fig. 1.7) no qual a entrada de referência, que é só interferência, provém de uma tomada na parede e a entrada primária, que contém sinal útil mas também ruído, provém do peito do paciente, como na Fig. 1.13. Ao filtro adaptativo basta ter dois coeficie ntes que forneçam os dois graus de liberdade necessários ao cancelamento de uma sinusóide pura: um coeficiente para a sua amplitude e outro para a sua fase.
o
*
Adaptativo
A
Sinal de
Cancelador] de eco
erro
Receptor dd Modem
ZDe s
Fig. 1.14. Cancelamento de eco na linha telefónica.
Datomada de corrente (50 Hz)
Dá Processador
Emissor do Modem
[7
E = s
e
ECG
Rs
paciente
Fig. 1.13. Cancelamento da frequência de rede em electrocardiografi a.
Desta maneira o sinal de erro, que é o sinal de entrada do aparelho de electrocardiografia, fica gradualmente mais “limpo” do sinal de 50Hz indesejável. Do mesmo modo, se se desejar ouvir o batimento cardíaco de um feto no
ventre da mãe, pode colocar-se um eléctrodo sobre o abdóme n da mãe (constituindo o sinal primário) e outro sobre o seu tórax (sinal de referência), sendo assim possível destrinçar melhor o batimento cardíaco do feto do da mãe, que é naturalmente muito mais intenso. 1.3.4. Cancelamento de eco na linha telefónica
Natransmissão de voz ou dados nalinha telefónica o sinal remoto que chega ao receptor local vem misturado com ecos (ondas reflectidas) devido a factores como a desadaptação de impedâncias em conversores ou transfo rmadores ditos híbridos. Os ecos deverão ser eliminados, ou cancelados, para que o sinal proveniente do emissor remoto:chegue aoreceptor local em boas condições. Para isso usam-se filtros adaptativos designados por canceladores de eco [Weins tein77] [Sondhi80], colocados em paralelo com o percurso de eco dos híbridos com o fim de o modelizar, como se mostra na Fig. 1.14. Por outras palavras, a função de transferência do cancelador de eco deve convergir para a função de transfe rência do percurso de eco para queo sinal de erro seja evanescente.
1.3.5. Supressão de ruído em cabinas de avião As cabinas dos aviões são algo ruidosas, em parte devido ao ruído das turbinas. Ora é possível tornar o ambiente do avião mais silencioso se se usar mi esquema idêntico ao da Fig. 1.7. Um microfone colocado no Extenion capta o ruído dos motores do avião, ruído que constitui a entrada de referência do circuito. A
entrada primária é obtida no interior do avião através de pes outro microfone, que capta o ambiente sonoro da cabina, ambiente que inclui pita de fundo de origem exterior correlacionado com o do outro microfone. E esse ruído de fundo que se quer “abafar”. Com software adequado e um conjunto de altifalantes a produzir sons que replicam o ruído exterior em oposição de fase é possível aumentar o conforto auditivo da viagem [Texas Instruments96]. Esquema idêntico ss pode considerar na comunicação do avião para a torre de controlo: aí a entrada primária é a voz do piloto mais o ruído ambiente do “cockpit”. Nos capítulos seguintes vamos apresentar as técnicas e os algoritmos adaptativos usados nas diversas classes e aplicações mencionadas.
26
1.4 Resumo
ES 2. ESTRUTURAS, ALGORITMOS E DEFINIÇÕ
Neste capítulo fez-se a apresentação do processamento adaptativo como método utilizável em diversas ciências, depois de terem sido feitas algumas considerações de ordem genérica sobrefiltros, incluindo o filtro de Wiener. Consoante a aplicação, viu-se comoas diversas situações se podem inscrever em quatro grandes áreas do processamento adaptativo: predição, identificação de sistemas, igualização e cancelamento de interferências. O capítulo terminou com a apresentação de vários exemplos de aplicações onde o processamento adaptativo tem sido usado com sucesso.
Estruturas de filtros adaptativos Famílias de algoritmos adaptativos Algo sobre matrizes Definições para uso futuro Resumo
21. Estruturas defiltros adaptativos rados no tempo a uma Os sinais que vamos encontrar são sinais amost ser discreto, em vez de contínuo, e cadência regular, bem definida. O tempo passa à ua passamos a ter um conjunto de em substituição de uma forma de onda contín subsequentemente. amostras (ou números, afinal) que vão ser processadas digital. A diferençaestá O processador adaptativo assume a forma de um filtro Os coeficientes têm que s, em em que, ao contrário dosfiltros digitais convencionai , à medida que tempo variáveis no valores fixos, aqui os valores dos coeficientes são decorre o processo de adaptação. tomar a forma recursiva ou Sendo um filtro digital, um filtro adaptativo pode os filtros nela baseados têm uma não-recursiva. Esta é a mais vulgarmente usada e denominadosfiltros FIR, de serem (daí resposta impulsional cuja duração é finita no instante discreto n está y(n), Finite Impulse Response). A saída destes filtros, diferenças às ão relacionada com a sua entrada, x(n), através da equaç N-1
ym)= Sen-k),
(2.1)
k=0
filtro FIR. onde cy representa os N coeficientes, ou pesos, do
ta impulsional do filtro, mas Dadaa forma da Eq. 2.1 cy acaba por ser a respos
poderemos concluí-lo de outra maneira:
29
28
Por definição a função de transferência H(z) de um filtro é igual à razão entre a transformada em z da saída, Y(z), e a transformada em z da entrada, X(z); é também a transformada em z da resposta impulsional amostrada, hp:
rd Wo4
H(2) Xe”re .
(2.2)
Comoa função de transferência correspondente à Eg. 2.1 é N-1
H(z) = * ser
b) Filtro “lattice“ Fig. 2.1. Estruturas não-recursivas
(2.3)
k=0
concluímos que os valores doscoeficientes cy de um filtro FIR representam a própria resposta impulsional dofiltro.
E
de duração infinita — Infinite A estrutura recursiva possui uma resposta impulsional 2.2 na sua forma canónica Impulse Response (IIR) — e é apresentada na Fig. [Oppenheim83].
É possível realizar um filtro de resposta impulsional finita através de diferentes estruturas; as mais usadas são as estruturas transversal e “lattice”,
apresentadas na Fig. 2.1. A estrutura transversal é a realização directa da Eg. 2.1. A estrutura “lattice” é uma realização equivalente, composta de vários andares idênticos. Os seus coeficientes km chamam-se coeficientes de reflexão ou coeficientes PARCOR
(“partial correlation”).
Fig. 2.2. Estrutura recursiva (filtro TR).
a) Filtro transversal.
é idêntica à estrutura Esta estrutura é composta de duas secções: uma is de entrada e saída Ossina o. não-recursiva e a outra é uma malha de realimentaçã estão relacionados através de
30 N-1
M
k=0
k=1
y(n) = > apx(n— k)- 3 beoXkn-k)
(2.4)
EE e X(2) 1+B(z)' N-1 k=0
É
No método dos mínimos quadrados (ou LS, de “least squares”), a apresentar no Capítulo 5, a estimativa da função de custo (o erro quadrático) é obtida a partir dos dados disponíveis num dado instante, tratados de forma recursiva e normalmente
M
e B(z)= Sof, dando origem ao esquema equivak=1
lente da Fig. 2.3. Substituindo os valores de A(z) e B(z) obtemos então a função de transferência expressa em função dos M pólos by e dos N zerosay:
H(7)
= 20 + az + digtecenirdã]ND (2) = 5 5 STE l+bjz+byz“+...+byz
Entrada
e método do gradiente. Estes não são os únicos métodos possíveis. Uma alternativa recente usa algoritmos genéticos nafiltragem adaptativa com filtros IIR [Ng96].
a que corresponde uma função detransferência
em que A(z) = 3 az
e método dos mínimos quadrados
(2.5)
Saída
enquadrados numa janela rectangular com memória. A este método chama-se, por isso, método dos mínimos quadrados recursivos, ou RLS (“recursive least squares”); uma variante do método usa uma janela exponencial negativa em vez duma janela rectangular, para esquecer o passado mais rapidamente, o que é conveniente quando o sinal de entrada não é estacionário. No método do gradiente! a actualização de parâmetros faz-se recorrendo ao gradiente do erro quadrático médio. O método será apresentado no Capítulo 3. Na prática usam-se algoritmos simplificados que iremos ver no Capítulo 4. Os métodos de mínimos quadrados apresentam grande complexidade computacional mas são rápidos a convergir; pelo contrário, os algoritmos baseados no método do gradiente são computacionalmente pouco complexos e extremamente robustos, permitindo implementações simples, mas a convergência dos coeficientes do filtro adaptativo é mais lenta que nos outros métodos referidos. Antes de apresentarmos estes métodos precisamos de recordar alguns conceitos da Álgebra Linear e estabelecer algumas definições prévias.
Fig. 2.3. Filtro IIR equivalente aofiltro da Fig. 2.2.
Se o filtro não tiver malha de realimentação (B(z) = 0) a estrutura deixa de ser recursiva e a resposta impulsional passa a ter uma duração finita. Daqui para a frente iremosusar exclusivamente filtros transversais FIR porque são os mais vulgarmente usados, dada a sua simplicidade relativa.
2.2. Famílias de algoritmos adaptativos A minimização da função de custo recorre normalmente a um de dois métodos:
2.3. Algo sobre matrizes Nos próximos capítulos estaremos em contacto permanente com operações sobre vectores e matrizes. É a hora de fazermos uma breve revisão de algumas definições e propriedades [Luís85].
2.3.1. Matriz inversa
Uma matriz A tem inversa, AÍ, se esta for tal que AA -T,
'Naliteratura anglófona este método é também designado por method of steepest descent, que poderemos traduzir por método da descida mais íngreme.
33
32
E condição necessária e suficiente de existência de inversa que o determinante de A seja diferente de zero. Uma matriz invertível denomina-se matriz regular. Se não for invertível diz-se singular.
à
1-3)
3-5j
4
ida
1+3;
2
-S-j
2+j
8-4;
3+5)
—5+j
2
13
10+5j
4
2-j
13
2
-Tj
2-2j
8+4j
10-5j
Tj
2
2.3.2. Transconjugação A matriz transconjugada de A, designada por AHéa que se obtém daquela por transposição e conjugação dos seus elementos. Por exemplo, a transconjugada de
2 A=|1-2;
3
3+3j
1
2
1-3;
Diz-se que uma matriz é uma matriz de Toeplitz se os elementos da diagonal principal forem iguais e se os elementos das outras “diagonais” paralelas também forem iguais. Se quiséssemos recorrer a uma analogia cromática em que cada elemento fosse representado por uma cor, uma matriz de Toeplitz seria uma matriz às riscas (oblíquas). A matriz seguinte é uma matriz de Toeplitz:
2+j
6j] for um vector, o seu vector
2
bÉ =
elementosreais é, obrigatoriamente, uma matriz simétrica.
2.3.4. Matriz de Toeplitz
é a matriz
Do mesmo modo, seb=[2 transconjugado é
é um exemplo de uma matriz hermiteana complexa. Uma matriz hermiteana de
2.3.5. Valores próprios e vectores próprios
1+3;
A cada matriz quadrada A, de dimensões NxN, podemos associar um conjunto de N valores escalares Ajo chamados valores próprios. A cada valor próprio A; está associado um vector Q;, chamado vector próprio.
2-j -6j
Os valores próprios da matriz A determinam-se resolvendo a equação 2.3.3. Matriz hermiteana
homogénea
Uma matriz A é hermiteana se for igual à sua matriz transconjugada,
“AH
.
o.
A=A“. Os elementos da diagonal principal de A são necessariamente reais.
A matriz
(2.6)
[A-21]Q;-0
Nesta equação À é umavariável escalar, I é a matriz identidade NxN, Q ; é um vector coluna Nx1 e 0 é um vector nulo Nx1. A equação tem soluções não triviais
para À e Q; se e só se o determinante det[A — AT] = JA — Al) for nulo: JA -AI|= 0
cs bl LEA
(2.7)
UNIVERSIDADE FEDERAL DO CEARÁ
34
35
Esta é a equação característica de A, afinal um sistema de N equações a N incógnitas cujas soluções, À,, À,,..., À, , são os valores próprios de A. Correspondendo a cada hj existe pelo menos uma solução vectorial da Eg. 2.7 determinada a partir da
associada aos chamados modos naturais de alguns algoritmos. Q é uma matriz ortonormal, o que quer dizer que o produto pela sua transconjugada é a matriz identidade,
Eq. 2.6 ou, o que é o mesmo, a partir de
AQ; =2;Q;.
(2.8)
Esta equação diz-nos que o produto da matriz A por um dos seus vectores próprios Q); é um vector proporcional a Q;, mantendo portanto a mesma orientação. Por outras palavras, em vez de multiplicarmos o vector Q;por uma matriz basta multiplicá-lo por um escalar.
(2.11)
Q”Q-I, e portanto a sua inversa é igual à sua transconjugada,
(2.12)
q! -qr.
A suacoluna de ordem j (Q;) é o vector próprio de A associado ao valor próprio dj Cada Q; tem comprimento unitário e é ortogonal a cada um dos outros vectores
Desenvolvendo a Eq. 2.8 para j=0,1,..., N-1 obtemos
próprios, devido à ortonormalidade de Q: t
QUQ,=ôj AO
OQ. Qua]-[0
Qu
Na equaçãoanterior Ô;; representa o delta de Kronecker,
que podemos compactar em AQ=QA.
(2.9)
1
i=j
óy=lo
izj
Se na Eg. 2.9 multiplicarmos à direita por Q1 obteremos finalmente a chamada forma normal de A
Em (2.9) A é a matriz diagonal dos valores próprios de A,
o
Ao
0
0
o
4
0
o
0
Ay
ij=01,..,N-1
A=QAQ”!- Q4Q”,
(2.13)
equivalente a
(2.10)
Q'AQ-QUAQ-A,
(2.14)
obtida multiplicando (2.9) à esquerda.
é Q-[9
Das
On] é a matriz dos vectores próprios de A, também
denominada matriz modal de A porque, como veremos na altura própria, está
Ao quociente entre o maior e o menor valor próprio chama-se disparidade de valores próprios, D:
36
D = Amax
(2.15)
Amin
A multiplicação de uma matriz quadrada NxN por um vector Nxl origina um novo vector Nx1. No caso geral este novo vector tem uma direcção e um comprimento diferentes do original. Há ocasiões em que, todavia, o novo vector tem a mesma direcção ou o mesmo comprimento. Já encontrámos antes a primeira dessas situações, em que o produto dava origem a um vector com a mesma orientação: se uma matriz quadrada for multiplicada por um dos seus vectores próprios o vector resultante é colinear com ele e o seu comprimento é proporcional ao valor próprio correspondente (veja-se a Eq. 2.8 a este propósito). E quando é que o vector resultante tem o mesmo comprimento, masdirecção diferente? É quando o multiplicamos por uma matriz ortonormal, como Q. De facto, se considerarmos um vector Nx1 arbitrário, V, e o multiplicarmos por Q obtendo V' = QV, a norma
1) Determine as matrizes de valores próprios e de vectores próprios de B.
2) Use o vector V= [1
R.: 1) Determinação de valores e vectores próprios. Os valores próprios de B são obtidos a partir da equação de 2º grau
dei[B 1] bos
c
s
-s
€
| = |
cos 0
senô
-sen6
cos6
| ,
A=
(2.16)
í
o vector ao qual foi aplicada esta matriz diz-se que sofreu uma rotação de Jacobi, ou rotação de Givens? [Haykin96]. O ângulo de rotação é 0, medido no sentido dos ponteiros do relógio. Como o comprimento não foi alterado diz-se queas rotações de Givens preservam o comprimento. E
1. Exemplo de cálculo de valores e vectores próprios
R
.
P.: Considere a matriz quadrada real B =
0,5
0,25
0,25
0,5
.
? Naliteratura de Processamento Adaptativo usa-se mais o segundo termo (rotação de Givens).
0,25
0,5- à
3 =1/-1+0,1875=0
cuja solução é
IviIÊ = vv -=(qv)! qv=vZQrov=vYIv=|v
O = |
0,5-A =|
e
quadrática deste é igual à norma quadrática de V:
No caso particular de uma matriz quadrada real e ortonormal de dimensões 2x2, dada por
2 para ilustrar uma rotação de Givens.
0,25
=
0,75
A=
0,25
0
0
0,75
Os valores próprios obtidos são positivos e a disparidade vale
Os vectorés próprios podem ser calculados através de BQj = À; Qj ou de [B - NIQj= 0. Fazendo as contas determinamos
Q=
doo
Ho
IJ
1
0,25
0,25
doo
ne
0,25
go1
o
doo
== |
doi
q
|
1 — constante
>]
No -0,25
0,25
0,25
-0,25|
Io
[gn
=0
o qu
=
c2
co — constante
c2
T . Vamos normalizar a matriz Q (de modo que QQ" =T):
38
00” =|
q
GQ
2 2; la = ci [+04 +Cc o Eh
lo
Daqui se tira que cj =
c
2
2
=ci i +c|
“ef +
ci +c3
1 = VZ pelo que,finalmente,
O comprimento é ||QVI| = 5 , igual ao comprimento de V, portanto,
prevíramos. Uma representação gráfica mostraria que efectivamente houve uma rotação de 45º no sentido dos ponteiros do
como
relógio.
O
2.3.6. Traço de uma matriz quadrada
Repare-se que os vectores próprios de B são ortogonais (produt o
Os elementos principais de uma matriz quadrada são os elementos da ua diagonal principal. O traço de uma matriz quadrada A, designado por tr[A], é simplesmente a soma dos elementos principais da matriz. Assim, sendo
interno nulo):
YO, = %Wo hot Ih =1-1=0 Repare-se ainda que o produto da matriz B por um dos seus vectore s próprios origina um novo vector com a mesma direcção e cujo comprimento vem multiplicado pelo valor próprio correspondente . Tomemos como exemplo Q,. Se o multiplicarmos por B (à direita) é de
aq
2
A=|:a21
a22
an1
ana
0,25
“2
2) Rotação de Givens
A matriz modal Q apresenta a mesmaforma da matriz de Givens, O, da
Eg. 2.16, com
arecos(g99 ) = arecos(1/V2 ) = 45º. Logo, qualquer vectorreal que for multiplicado por esta matriz será rodado de 45º e mantém o seu comprimento. É fácil de o confirmar com o vector real
V-[1
4ia é
q2N
...
|
.
aNN
N
asnel o 0sha]
1/2)
MN
o seu traço é
prever queo resultado seja 1/0; = 0,750:
BO, - | 0,5
nã 5
2:
vz lia)
( 2.17)
tr[A] = 3 aii i=1
Por exemplo, o traço da matriz
2 A=-|6 2
1/4 4 6 2 4
é tr[A]=2-4+4=2. O traço de uma matriz é também igual à soma dos seus valores próprios, N-l
mAl= SA;
(2.18)
j=0
UNIVERSIDADE FEDERALD CEARA Pihlintara da Ciênciac a Tarn
MIA
40
41
Os valores próprios da matriz do exem plo são Ag =4,075+ j2,736, AM =4,075- ;2,736 e À2 =-6,15, conf irmando a Eq. 2.18.
* O traço é negativo, t]A]0.
2.3.7. Característica de uma matriz
H
Chama-se característica? de uma matri z A, designada por r(A), ao núme ro máximo delinhas ou colunas que
são linearmente independentes.
O número de linhas linearmente independ entes é igual ao número
semidefinida positiva, ou definida / não-negativa, i j se e sóÓ se v"Av=>0, qualqu er que seja v,e vZAv=0 com algum v=0.
de colunas linearmente independentes; é indif erente, portanto, definir a caracterís tica da matriz à custa das linhas ou das colunas.
e A característica de A vale r(A)0.
Uma matriz quadrada A, de dimensõe s categorias:
NxN, classifica-se em cinco
* definida positiva, se e sóse v/Ay > O, qualquer que seja v=0,emque v éum vector Nx1.
º À característica de A vale rA)=N.
* Todos os valores próprios de A são positivos.
r(A) valores próprios são positivos e os restantes N-r(A) são nulos.
* O determinante é nulo, det[A|=0. H
e semidefinida negativa, ; see sóÓ se v“Av0.
* O determinante é nulo, det[AJ=0.
* definida negativa, se e só se vZAy < O, qualquer que seja v = 0. º A característica de A vale r(A)=N .
* Todos os valores próprios são negat ivos. * Em inglês a característica de uma matriz é designada por rank.
H º indefinida, se e só se vHAv>0 para algum v,e v/Av(n) e os processos x(n) e 9,(n) são não-correlacionados, então R é igual à soma da matriz de autocorrelação
Mas d(n) é também a entrada do canal de comunicações:
x(n)=d(n)-byx(n-1) ou x(n)+ byx(n— D)=d(n), com bj = 0,65.
de x(n) com a matriz de autocorrelação de 9,(n): R=R, +R,. 2
Ora R,=E = tm)
x(n)x(n 1)
Hode(o 1) . Prova-se! que x2(n-1)
Observando a figura anterior vemos que a saída do canal, x(n), pode ser obtida aplicando o ruído 9 (n) a um filtro de 2º ordem com função de transferência
H(e) = Hi(2)Ho(2) = (1
1
40,577] TÁ -0, 6501) - 1-0,1571-0,32572
apresentada na figura seguinte. A respectiva equação as diferenç as é
x(n)+asx(n-1)+agx(n-2) = 9 (n)
com
aa = -0,15
aq = -0,325 N
Logo, ! Ver “Adaptive Filter Theory”, S. Haykin, Prentice-Hall, 1991, 2.º Ed., Sec. 2.9.
59
1,4 0,22
0,22 1,4 |
e =1,588-2[1,257
Como &,(n) é ruído branco com média nula e variância of = 01,
com amostras não-correlacionadas, então R, = [o R=R,+R; =
1,5
0,22
0,22
1,5
0,|: Portanto,
-0,69]
Cc
j
c
|+[co
a]
15
0,220
0,22
15
2 - 1,588 -2,514 cy +1,38 cy +0,44c9c) + 1,5 (cô2 +c7)
A Fig. 3.4 mostra as curvas de nível da superfície de “performance”. 4) Filtro de Wiener
Osvalores próprios desta matriz são Ag = 1,28 e A =1,72, pelo que
Os coeficientes óptimos do filtro, no sentido da minimização do erro
quadrático médio, são a solução da equação de Wiener-Hopf, Rc,p; =P. Substituindo valores:
a disparidade vale D=1,34. Quanto ao vector p podemosescrever:
1,5
o
E[d(nJu(n)] = Efa(n) v2(n) + x(n)]h = E[d(n) vo (n)]+ Eld(n)x(n)]0
= Elfx(n) +byx(n-1)De(n ) = E? (n))+ by E[x(n)x(n - 1)] 1,40
0,22
isto é, E[d(n)u(n)|=1,4+0,22by = 1,257.
0,22
s| Ciopt
=
|-0,69
0,9254
Coopt
1,257
COopt
=>
Crop
=
|-0,5957
Seria fácil de' confirmar que, sem ruído aditivo no canal, Copt =[1
-0,657, de modo que o produto da função de
transferência H>(z) pela função de transferência do filtro de Wiener
seria unitário, como era de esperar.
A
Da mesma maneira Eld(n)u(n - 1)] =0,22+1,4bj = -0,69, logo 1,257 —0,69 | 3) Superfície de "performance"
E = [a?(n) |- 2pTc+clRc
cá Substituindo valores:
|lc
10
Fig. 3.4. Curvas de nível da superfície de “performance”
-
F
60
5) Erro quadrático médio mínimo
Emin = E[d(n)]-p7op = 1,588 [1,257 -0,69]
0,9254 —0,5957
61
=
TA
E — Emin = 3 2;[(€- copo) Q;|
= 0,0138
2
/=
(3.8)
À diferença entre o vector de coeficientes c e o valor óptimo Copt Vamos
| i 3.4 confirma estes resultados. A Fig.
chamar vector de erro dos coeficientes, ce:
L]
|
3.2. A superfície de “performance”
|
.
Vamos aprofundar a análise da superfície de “performance”. Iremos chegar à conclusão que esta muito depende das características do sinal de entrada. De facto, veremos que a matriz de autocorrelação de entrada, R, é o principal factor condicionante da forma da superfície. E habitual definir novos vectores e introduzir uma mudança de eixos. Os nossos pontos de partida são as equações 3.2 e 3.6, aqui repetidas:
c=€-Cop Convém definir um segundo novo vector
T |
T
(3.10)
v=0 €.=Q (€-Cop)
Chegamos então a
= emin + 6.7 (QAQT e, = z E T To. Emin +(Q' e,)' AQ" e, =
e = Eld?(n)]-2e"p+ cTRe >
(3.9)
mn I
[1
311 (3.11)
T
= Emin tV Av
E
Emin = Hd (m]-p Copt Ao contrário das equações 3.7 e 3.8, esta expressão não tem termos cruzados,
o = de emin à primeira : Se subtrairmos a equação e nos desembaraçarmos do
como se vê na equação seguinte: E
vector p usando a equação de Wiener-Hopf, Rcp; =P» obtemos
NA o
.
ly.
E=EmintV AVv=Emin+ 3 A; Iv;l
(3.12)
j=0
coeficientes a superfície de de um filtro com. apenas dois Nocaso particular — ; “performance” é representada pela expressão quadrática
E — Emin = cTRe - (Ze — Copr)” Re opt T =c FR R(c- Copt) E —(c- Copt) RCop
Ê
=(c-Copi) Re-(c- Copt)' RCopr =
T
=(C-Cop) R(C-Cop;) NI Como R=QAQ” = 3 A;Q105 , então j=0
E= Ein th vida VÊ2
(3.13)
(3.7)
Para um valorfixo de e a Eq. 3.13 representa umaelipse centrada na origem,
com semieixos de comprimentos (e -emin)/Ão e (e - Emin)/A
situados
ao longo doseixos dos v, e dos vj, respectivamente. Se considerarmos diferentes valores de £ obteremos um conjunto de elipses concêntricas. Se A = Aq, as curvas são circunferências.
63
62
Concluimos que as curvas de nível da superfície de “performance” serão tanto mais excêntricas quanto maior for a disparidade de valores próprios da matriz R, como se mostra na Fig. 3.6 com três exemplos de curvas de nível. A Eq. 3.10 corresponde a uma rotação do sistema de eixos de cp. O que fizemos de facto foi: em primeiro lugar (Eq. '3.9) procedemos a uma translação de eixos, passando de um sistema de coordenadas cujos eixos são os elementos de c para um sistema de coordenadas cujos eixos são os elementos de cg; em segundo lugar (Eq. 3.10) rodámosos eixos cp e obtivemosos eixos v. Sendo N=2, por exemplo,
os dois eixos vo9V; são representados respectivamente pelos vectores unitários No =[1
o” e N;=[0
mM, cada um deles correspondendo a um valor
próprio da matriz R. As suas coordenadas no “velho” sistema de eixos c,oc,j São Fig. 3.5. Os três sistemas de eixos, €, Cp € V.
Ioo
Co = QNo = Qo = dn q
E
isto é, os eixos das elipses, dispostos segundo Ny e Ny, são iguais aos vectores próprios de R. A Fig. 3.5 procura ilustrar a situação apresentando em conjunto ostrês sistemas de eixos. O ângulo O vale, portanto, arc cosqoo. O caso N=2 é apenas um caso particular: as considerações sobre os eixos aplicam-se a qualquer dimensão N. Um caso em que todos os valores próprios são iguais ocorre quando a sequência do sinal de entrada a(n) é estatisticamente independente (sinal branco). Nesse caso a matriz de autocorrelação de entrada R é diagonal, com todos os
e curvas de 3. Exemplo: Erro quadrático médio, disparidade nível
cie de Na Fig. 3.6 são apresentadas curvas de nível da superfí valores aos s ondente corresp vov1: € “performance” nos planos cocq da tabela seguinte. Dados
Matriz R
elementos da diagonal iguais à variância do sinal: R = oil (e A; = o2 » para j=0, 1, ..., N-1). As curvas de nível serão circunferências concêntricas.
Caso a)
Caso b)
Caso c)
2
0,1
2
1
2
1,5
os
2
1
2
Lô
2
7
7
7
8
8
8
Eld2(n)]
54
42
42
Disparidade D
1,1
3
7
Vector p
OCEA) FEDERALD UNIVERSItecDAa DE icenciogie de Ciências = Biblio
64
Nota-se bem que quanto maior é a disparidade mais as linhas
Il
isométricas da superfície de “performance” são excêntricas. No primeiro exemplo a disparidade está próxima do valor mínimo, 1, e as curvas de nível são “quase” circunferências, o que já não acontece nos outros dois exemplos, em que as disparidades são mais elevadas.
0.5
=
o
a
O
1 a
1
o
Emin = E[d(m)|-pTcop =0,17
o
;
No caso a) podemos obter as seguintes expressões e valores:
J
c) Disparidade D = 7. Fig. 3. 6. Disparidade e curvas de nível.
SEO
2
4 E
Razão entre eixos das elipses, no plano vov7: -0.5
0
0.5
1
E-Emin do
3.6a) Disparidade D = 1.1.
|
E — Emin
A 1,05 Ag
Ai
No caso b) temos: Emin * 4
w
2 g=4+ vê +3V7
o
C41
= 1,73 Razão entre eixos, no plano vov4 : 3
o a
Re qro
4 10
e no caso c), finalmente:
Emin = 8,86 E =8,86+0,5v9 +3,5VI Razão entre eixos, no plano vov7 : N7 = 2,65
3.6b) Disparidade D = 3.
SQAMEANVIM Ot
2
E =EmintÃo vê +A) vZ =0,17+1,9v9+2,1v]
-0.5
66
67
A expressão do erro quadrático médio em função dos coeficientes c
expresso de outra forma. De facto, como e(n) = d(n) — c7 (n) a(n) e podendo nós
contém termos cruzados. Usemos a Eg. 3.8 para o comprovar no caso
b), para o qual
Con;
=
2
A=
trocar os operadores E e à dada a sualinearidade, obteremos
es)
0
3
)j de(n) o: 9e?(n) = Fl2 de(n) 9ELe? (n)] E [e(m)a(n 0 ge(n) V(n) = El = dead o) |
1 3.15)
2I1/1
Assim, a Eq. 3.14 pode ser reescrita como
De facto, depois dos desenvolvimentos chegaríamos a
e(n + 1) = e(n) + 2uE[e(n)a(n)]
(GRADIENTE)
E = Emin +Ão [e - Cop)” Qo Ef +A [e = ep” Qi| =
= 4+(206 +0,2c9cy + 207 +8,6c0 — 22,4c1 + 27,2)
(3.16)
O erro quadrático médio e(n) = Ele? (n)] varia com o tempo — no fim de contas o objectivo é minimizá-lo. Isto significa que o erro de estimação e(n) não é
A simplicidade da equação em função de v,
E=4+ vê +3v2, é
estacionário.
notável quando comparada com a que acabámos de obter. [1]
3.3.1. A descorrelação entre o erro e o vector de entrada
No fundo da superfície de “performance” o gradiente é nulo e e(n) = Cop; -
3.3. O algoritmo do gradiente
Então podemos concluir que, quando e(n) = e opt * O erro e(n) e os sinais de entrada
Como atingir Copt sem efectuar as operações da Eq. 3.5, que implicam
calcular o vector p e a matriz R e seu inverso? Uma maneira é fazer como já se esboçou anteriormente: os coeficientes do filtro deverão ser ajustados iterativamente de forma a descer-se pela superfície de “performance” abaixo, subtraindo ao valor anterior de c um termo proporcional ao gradiente. A equação de actualização respectiva resume o algoritmo do gradiente:
não são correlacionados, porque, da Eq. 3.15,
V(n) = -2Ele(n)a(n)] = 0
(se e(n) = Copr)
(3.17)
Esta conclusão, que também se aplica aos filtros de Wiener, é uma
manifestação do chamado Princípio da Ortogonalidade [Haykin96] [Honig84].
e(n+D)=e(n)-uV(n)
(3.14)
3.4. Modos naturais e convergência A constante q é uma constante de proporcionalidade positiva, chamada passo de adaptação, de que depende o desempenho do algoritmo, como veremos. O gradiente da Eq. 3.4, que agora se passa a designar por V(n), pode ser ? O vector c passará a ser designado por e(n) para evidenciar que os seus elementos variam no tempo.
3.4.1. Modosnaturais
A análise do desempenhoe da convergência do algoritmo recorre ao vector de erro dos coeficientes e ao vector v(n). Comecemos por subtrair Copt à ambos os membros da Eq. 3.14, tendo em conta a Eg. 3.4:
ET
68
69
e(n + 1) -— Copt = (1- 2uR)c(n) +2up-— e opt
-(1-28Rfe(m) -cop|
(3.18)
A solução da Eg. 3.18 é
e(n)- Cop; = (1-24R)"fe(0)-c,,,|
(3.19)
Para qualquer matriz A verifica-se (QAQ!)* = QA*Q”!. Como QQT-=T e
R=QAQ-I=QAQT , então
(1-2uR)” =(QQ” -2uQAQ” " -[Q(I-24A)QTT =QA-2UA)" QT
A equação matricial 3.23 representa um sistema de N equações
voln) vi(n)
[(1-2uAo) 0
vn(1)
0
j=01,..,N-1
(3.25)
O elemento vj(m) é o j-ésimo modo natural do algoritmo do gradiente. Para que o algoritmo convirja os modosnaturais deverão diminuir à medida que n cresce,
Teremosentão
quer dizer,
(3.20)
lim vj (n) = 0. Então deverá ser sempre, para cada um dos N modos
n>0%0
naturais de convergência,
-2uAjl Hopt -
(n) = e(n)- 8,86 = 2,25x 0,92" 42,89 x 0,37”
u> Uopr
| A primeira exponencial, 2,25 x 0,92", corresponde ao modo natura M: de natural do valor próprio Ag, O menor, e a segunda ao modo
4=0,025
u=0,1
H=0,25
H=0,265
A0=0,5 — 2,25x0,9"
ro
0,975
0,90
0,75
Hr
0,74
0,825
0,30
-0,75
a -3,5 — 2,89x0,32
To
-0,86
39,50
9,49
3,48
Tj
3,25
520
0,83
348
Tmse,0
6,38
19,75
4,15
1,74
Tmse,1
1,62
2,60
0,42
1,74
vo(20)
3,19
13113
0,2866
0,0090
vi(20)
0,0061
-0,0235
0
0,0038
co(20)
0,0463
2,0534
1,3455
1,1519
c1(20)
1,1799
2,1990
2,9402
3,1392
s(20)
3,1713
9,7188
8,8982
8,8572
-
8,8647
9,73%
0,46%
0,001%
0,08%
Emin
2n
Tomando o caso de |J=0,1 como exemplo o erro quadrático médio em excesso vale
Eexc
1
Uopt
3.48:
2
Tabela 3.1 Valores obtidos nos exemplos
Tere
e(n)= Emin + VO(O)Ão (1 24A0)7” + vi (0)M (1 247) 2
A Tabela seguinte agrupa os resultados mais relevantes associados aos
PE Rs
Os valores da última linha quantificam percentualmente a qu ao valor mínimo do erro quadrático médio. Nota-se bem a influê do passo de adaptação na convergência do algoritmo.
A Tabela mostra que os modos mais lentos estão associados ao valor próprio mais baixo quando u=0,025 ou H=0,1 (vejam-se as suas razões
geométricas ou as constantes de tempo) e ao valor próprio mais elevado quando |=0,265. Quando o passo de adaptação tem o valor óptimo ambos os modos decrescem com a mesma velocidade.
Este último modo tem uma razão geométrica, 0,3, mais baixa Das primeiro, e por isso diminuirá mais rapidamente com O tempo. ver isso representando £,yc(n) graficamente na Fig. 3.16, juntamente itui ntes. Pode observar-se que Ex (n) v ai com as duas parcelas constitui
diminuindo em direcção a zero com uma velocidade que depende
nitidamente do modo mais lento, correspondente ao valor promo menor, Aq. Se essa velocidade de convergência só dependesse do ou ; à modo natural o erro quadrático médio em excesso evanescia logo figura. a com segunda iteração, de acordo
89
88
18 17+ 16+ e(n) 15f 14h 13+
N
/:
Tmse,1
Tmse,0
lterações
10
Es
12 a
10
15
20
n
Fig. i g 3.16. 6. A curva de aprendizagem e as suas exponenciais decrescentes, quando u=0,1 Caso 4)
5
na situação divergente (Hu = 0,29). Fig. 3.18. Curva de aprendizagem
CL]
u = 0,29
Estamos numa situação de divergência, pois este passo de adaptação é mais
elevado
que
o
valor
náximo
pe
nitido
A
se
3.6. Resumo o do os filtros de Wiener e o algoritm Neste capítulo foram apresentados gradiente.
0.5+ v7
Fi
EE
Ok
Ga D) )
ag .
EA
a
É
;
| ê
ig. 3.17. Divergência do algoritmo do gradiente com passo de adaptação u = 0,29
o erro coeficientes fixos que minimizam Os filtros de Wiener são filtros de ie de rfíc supe por gna desi se o multidimensional quadrático médio, cuja representaçã erro do imo mín r valo ao te baixo, corresponden “performance”. O seu ponto mais mos, ópti res valo m ume ass do os coeficientes quadrático médio, é atingido quan Wiener-Hopf. de ção obtidos de acordo com a equa uma rio algoritmo do gradiente como Em seguida foi apresentado O próp o fund o ir ating se bém tam coeficientes variáveis, maneira iterativa de, com filtros de de rais natu os mod dos A abordagem quer da superfície de “performance”. permitiu constantes de tempo associadas das quer o convergência do algoritm tativos adap os filtr dos ntes ergência dos coeficie concluir que a velocidade de conv iz R. matr da rios próp res da disparidade de valo depende do passo de adaptação e tação esen repr a é que , agem e à curva de aprendiz O mesmo se concluiu relativament o. temp co médio ao longo do gráfica da evolução do erro quadráti
F
90
Súmula de expressões
91
4. O ALGORITMO LMS E VARIANTES
Filtro de Wiener Copr=R' -1 Pp
Co =C-Cop
O algoritmo LMS
v=QTe, =Q/(c-cop)
Ruído de gradiente e ruído de coeficientes
e = Ele? (n)]= Eld? (n)]-2e”p+ e”Re
O desajuste Comparação com o algoritmo do gradiente
Emin = E[a? (m]- P'cop:
Outras variantes Resumo
E =Emin +(€- Cop) R(c- Copy) = = Emin + cíRe, = =
= Emin + V T Av Algoritmo do gradiente
Na prática usam-se estimativas do gradiente, V(n), em vez do verdadeiro
e(n+1) = e(n) + 2uE[e(n)a(n)] 0O D=1,89
O passo de adaptação nosalgoritmos LMS e do sinal deve respeitar a 1 condição O0
b+Ia(n)]
e
c(n+ D=c(n)+ 2ue(n)signla(n)]
(4.45)
c(n+ D=c(n) + 2usignle(n)]signla(n)]
(4469)
|
e(n + 1) = c(n) + 2ué(n) a(n)
lem]y
é(n) = nie Losignle(n)] e
beL=1
e(n)>d>0
e(n)+d
e(n) E e para obtermos T
-*
conduzem a um erro quadrático médio mínimo menor [Johnson95];
(6.33) a taxa do amostrador era menor, —, provocandoaliasing. T
"e
são independentes da fase de amostragem [Ungerboeck76] [Haykin91] [Cowan85].
O intervalo de tempo entre iterações consecutivas é agora de E. Assim M
Em contrapartida, o número de elementos de atraso e o número de * coeficientes necessários para cobrir um mesmointervalo de tempo aumentam por um
2
como os coeficientes são actualizados de T em T segundos, a saída do igualizador nos instantes kT vale
KT UT) = pda cATAT-) 2
'
factor M e M/K,respectivamente, em relação ao igualizador síncrono. No entanto,
“ tem-se chegado à conclusão que os igualizadores T/2 com o mesmo número de “coeficientes comportam-se tão bem ou melhor que os igualizadores espaçados de T. E Estes comportam-se sempre pior que os fraccionários quando a distorção de atraso * nas frequências próximas de 1/2T é elevada, independentemente da boa escolha da
k=-0,12..
é
* fase do amostrador [Qureshi85].
Em termos de iterações n a equação anterior é equivalente à seguinte , com n=kM,k>0, correspondente aos instantes kT:
6.5.3.1. Resposta impulsional global
N-1
VM) = VM) = Sc;(kM)aCkM - jk) j=0
k=0,1,2,...
Consideremos o sistema da Fig. 6.13, onde o sinal s(n), depois de atravessar
— um
No caso mais vulgar dos igualizadores tem-se T/2 (K=1 e M=2) pelo quea saída y(n) é obtida em iterações alternadas usando a equação
N=1 vmW= Sejman-s) /=
8 =[80 É
n ímpar (1, 3, 5, ...),
canal
de
comunicações
gm-1] Ag
T
resposta
impulsional
amostrada
, é igualizado através de um filtro adaptativo transversal
— com N coeficientes, c = [co *
com
T
om
cx-1) . Tratando-se da cascata de dois filtros,
qualéa resposta impulsional global do conjunto?
Lo
229
stato então que a fonte de sinal produz amostras à cadência de 1/7 as/s e q que os elemen tos gE e cj: estão estã separados de T segundos. Estamos portanto, a considerar que o igualizador é síncrono. Aresposta impulsional, i i h, que procuramos obtém-se calculando a convoluçãão d os dois i vectores g e c, pelo que éÊ composta por M+N-1 elementos Torn a-se conveniente recorrer à matriz da resposta imp ulsional do canal, ou matr iz de convolução, definida como [
respostas impulsionais dosfiltros. Esta situação ocorre quando se usam igualizadores fraccionários: é que passamosa ter amostras de sinal separadas de T segundos e os coeficientes do igualizador estão separados entre si de uma fracção desse intervalo de tempo (normalmente é T/2, como já se disse). E além disso, “para complicar mais”, ainda temos um amostrador síncrono (1/T) à saída do igualizador. Como
| * * *
fazer?
Suponhamosentão que: :
80
0
...
0
0
81
80
as
0
0
resposta impulsional
c=[co
8M- 1]
81
1) quer a resposta impulsional g =[80 c1
cn-1]
T
do
T
do canal quer a .
à
-
igualizador estão
sobreamostradas em intervalos temporais de T/2;
8N-2
BEN-3
80
0
8N-1
B&N-2
81
80
8N-1
82
81
EN
e
'
.
0
* 2) dispomos de amostras do sinal de entrada s(n) colhidas de T em T segundos; 3) à saída do igualizador fraccionário temos um amostrador à cadência 1/T.
(6.37) 8M-2
B8M-3
SM-N
$8M-N-1
8M-1
BM-2
8M-N+1
8M-N
0
8M-1
8M-N+2
&M-N41
0
0
e
cs
8M-2
0
0
...
0
8M-1
A matriz A tem dimensões
convolução A, que tem M+N-1 linhase N colunas, pois podemos remover-lhe
“ Jinhas alternadas; em vez dela podemos usar uma matriz de convolução reduzida, D,
com P= [E linhas e N colunas, |
(M+N-DxN e, dada a forma da sua
construção, é uma matriz de... Toeplitz.
A resposta impulsi sional h calcula-se então de ã e acordo com a expressão matricial
h=[ho os
hyen-2[ = Ac
Nasituação descrita é comoseo sinal de entradativesse sido afinal amostrado à mesma cadência de h e c e alternadamente as suas amostras fossem nulas, como se mostra na Fig. 6.26. Estas amostras extra originam algumas operações nulas ao * calcular as convoluções envolvidas no trânsito do sinal desde a entrada do canal até à saída do igualizador fraccionário. Por consequência, é escusado usar a matriz de
(6.38)
es caso diferente surge quando sinal de entrada é composto por amostras paçadas no tempo de um valor diferente do espaçamento entre elementos das
5
g
0
=
00
82
8
0
84
83
O
0
AS
(6.39)
em que [x] representa o tecto de x, isto é, o menorinteiro superior ou igual a x.
A convolução das respostas impulsionais calcula-se multiplicando a matriz D c, ou então reorganizando-a de tal modo que a expressão final equivalente vector pelo
231
230
Subentende-se na expressão anterior que
seja
T
co 80
h=
0
0
82
&
O
8
&
8
|
0
0
0
eeIICa
ig
0
0
183
8
0
: -—
1 1
l
(6.40)
lc
É
Ea =[co
cz
cz
com M; = E |
gui],
83
81
Eimpar -[0
M
cena) ,
com Np = 2|
ou iguala x . E de notar sendo [*] o chão de x, quer dizer, o maior inteiro inferior
o elemento O introduzido em par CEM Simpar -
Ruído n(kT/2)
=
sEs(kT)
Espaçamento:
Ee
Cana
ES
+ 7
g
T/2
T/2
no A convolução no domínio dos tempos corresponde a uma multiplicação que escrever podemos 6.41, Eq. domínio das frequências. Assim, e servindo-nos da a função de transferência global, H(z), é igual a
f FSE basis, c
T/2
yT/2
T/2
YT
H(z) = Gpar (Z)Cpar (2)+ Gimpar (Z)Cimpar (2) =
bT;
a
[go + 89Z 2 + +8M, 12 Fig. 6.26. Cascata de dois filtros (canal e igualizador fraccionário) com respostas impulsionais amostradas a T/2 segundose sinais de entrada e saída amostrados a T segundos.
O vector h representa a resposta impulsional global entre a entrada do canal ea saída do amostrador. Os seus elementos estão “espaçados de T” segundos. Naexpressão anterior as partições indicadas na matriz e no vector separam os elementos de ordem par dos elementos de ordem ímpar, o que leva a considerar o cálculo de h como a “concatenação” de duas convoluções: uma envolvendo apenas os elementos de ordem par e outra envolvendo apenas os elementos de ordem ímpar [Johnson95], h= 8par*Cpar + Simpar*Címpar -
(6.41)
-M,+1
n
eo + coz
a
-M,+1 = (82) + 83Z 2 ++gm, 2 Mi+ Jaz
-1
-2
+ +Cn1Z
-Np +
+
-N;+1
+c32 -3 tenaz!
ência em que Gpar(2), Gimpar(2)» €par(2) e Cimpar(Z) são as funções de transfer correspondentes a gpa» SBimparº
i e e Cpar € ímpar respectivamente,
z
1
corresponde a um atraso de T/2 (e não T!. de T/2” A Eq. 6.41 diz-nos que a cascata dos dois filtros “espaçados sinais “espaçados (Fig. 6.26) é equivalente a duas cascatas em paralelo, com filtros e de T”, como na Fig. 6.27. A Eg. 6.40 é equivalente a
N,-1
N;-1
im
im
hj = Senga-i + > CoimiBz(-i-DA+l»
pedais
(6.42)
232
233
onde c»; representa os
Np coeficientes fraccionários de ordem pare c i+] representa os N; coeficientes fraccionários de ordem ímpar de c [Schniter96] Do
mesmo modo $2(/-;) € 82(l-i-1)+1 são os elementos dos subcanais de ordem par
eimpar, ga € Eimpar » respectivamente.
g =[0,1
-01
|
fas
Ipar
—————» sEs(kT)
+
de T/2 segundos. Para o igualizar é usado um igualizador fraccionário T/2 com 3 coeficientes. Pretende-se que a resposta impulsional amostrada global do conjunto seja
+
2
Cpar
1
0
of. com
2
se de
au AR: 1 A+
E
| Símpar |
D=
Nímpar
Fig. 6.27. Esquema equivalente ao esquemada Fig. 6.26. Se as amostras de saída forem recolhidas nos instantes T/2, 3T/2, ST/2,etc (em vez de 0, T, 2T, etc., como até aqui), a Eq. 6.40 deve ser substituída por
0
! 8&o
0
0
cz
pa8
0
| 82
8
O
É
85
8
! 84
&
80
C1
|
cs
2. Exemplo de cálculo da resposta impul sional global com sobreamostragem
Vamos considerar duas situações:
P1: Suponhamos que um canal é modelizado pela resposta impulsional
81
80
84
&3
82
O
0
ga
de reorganizarmos a matriz D criando as partições adequadas:
82
ea
82
As condições exigidas ao vector h são satisfeitas pela Eq. 6.40, depois
gw
Co
E
h= [o
=|é linhase N =3 colunas:
E 5
=| ímpar
83
—0, rf. com elementos separados
R1: A matriz de convolução reduzida D tem
Npar
e
0
0,3
amostras separadas de T segundos. Quais deverão ser os valores dos coeficientes do igualizador?
s(KT)
g
0,9
010 80181
co
&
!
wie
x|co|=
o
1
cj
gm'o
0 1
|2lo 0
+
01
010
0,9
0,11 -0,1
-01 0
e
09:03)
X|e2 |+| |=
|
C1
011
0
0 1
lol 0
Note-se que nesta multiplicação os coeficientes não estão colocados na ordem habitual. Invertendo a matriz concluiríamos que os coeficientes que satisfazem o pretendido são
co = 0,9398 Cj = -1,0
co = 0,4337
234
235
Todos os valores da resposta impulsional global foram “forçados a
zero” excepto aquele que tem um valor unitário.
4
P2: O sistema de que agora nos vamos ocupar está represen -
tado
a=[2
na
Fig.
-1
6.28.
3
As
respostas
impulsionais
dos
s 2
2 1 2, são amostradas nosinstantes 0, 7/2, T, 3T/2, ... e o sinal de entrada, no ponto 1 da s(G7)=2 e s(4T)=1
saída do amostrador?
|
3+
filtros,
af e b=[3
figura, é constituído pelas amostras s(0)=1,
e
19
s«(T)=3, 5(Q7)=4,
0
(Fig. 6.29). Qual é o sinal Yr obtido na
é
0
ZE
27
3T
4T
(1)
e)
mm!
Srta)
Filtro a
ICEEeee reias
Fig. 6.29. Sinal de entrada do exemplo.
WT
Filtro b ER
yT/2
—
yT
Fig. 6.28. Cascata de dois canais + amostrador do exemplo
À saída do amostrador síncrono (ponto 3) teremos então
yr=[6
27
64
79
52
3
T cf,
3
representada na Fig. 6.31 juntamente com o sinal Y7/2.
4
e
E
3t
Su/28 8]
R2: Seja ssr=[1
0
3
0
4
0
2
0
Po vector
14
obtido introduzindo amostras nulas entre amostras consecutivas do
vector de entrada
sr=[1
3
4
92
'g
à 1 7 (Fig. 6.30). Então
as amostras y7/2 no ponto 2, à saída do filtro b, calculadas através
4 e
T
e
ese
e
Sit;
S
4T
Fig. 6.30. Sinal de entrada do exemplo, com zeros acrescentados.
da convolução dos vectores Sr/2, a e b, valem
100
T
Yrr2 = [9
(5)
|
=8S7/2 *axb =
50 -
essoó
19 13 3 2 8f[0127 16 64 41 79 48 92 19 39
3/2
o
Q
5] so,
TO
2r
Ol:
o
q
|
|
sr
o--
sr
sr
/ 2 YT/2
era
Fig. 6.31. Sinais de saída do exemplo. HIMMMEDOIMNARE REAPOAL
mo mrarm k
236
237
Podemos chegar a este mesmo resultado com a matriz de convolu ção reduzida ID ou, equivalentemente, através da concat enação de convoluções. Neste último caso os vectores de que precisamos são os
seguintes:
2
1) o sinal de entrada, s(n), é um sinal PSK binário (BPSK) de potência
4
3
unitária, o? = 1, gerado à cadência de 1/T bits/s;
2
Dpar o h
P.: Pretende-se calcular a função de custo CMAassociada ao igualizador ruído. Os dados do problema são os seguintes:
Limpar =|—1
0
3. Exemplo de função de custo CMA
fraccionário T/2 do sistema da Fig. 6.32 em duas situações: com e sem
0
Apar =|3
E
2) a resposta impulsional amostrada do canal, em instantes separados
Dinpar = |
de T/2 segundos, é g=[0,2
A saída y(kT) vem então dada por
0,5
1,0
-0,1P;
3) o filtro adaptativo tem dois coeficientes, cy e cj, separados no tempo de T/2 segundos;
JET =[y(0)
1 3 al E 2! 1
(7)
fo = s7+[a par*Dpar + Agmpar *Bimpar| =
4) na situação com ruído a variância
1 3
61 [0 6 |U)3l*holl=|Pha|=[6 ]-2 9 27 64 19 52 3 3 Ff lol legl) |2 É
q
o? deste é tal que a relação
sinal-ruído é de 7dB.
deE
Ruído
Comose previa, o resultado foi o mesmo.
on?
Se as amostras de saída do amostrador forem obtidas nos instant es T/2, 37/2, 5T/2, etc., não deveremos usar a Eq. 6.40 mas sim a Eq. 6.43. Assim fazendo, obtemos:
s(m)
as
Canal
ii
E
g=10,2 0,5 1,0 -0,1]7 e 1 2
(37)
H 2)
a;
0
1 ag
=s7*)las
a;
a
0
as
i
0
0
PAR
Igualizador
FSE
vm
/ cleo cf
bo bo
ag|x 5 as
+
=
Fig. 6.32. Sistema de igualização fraccionária T/2 para determinação da função de custo CMA.
f
b3
R.: A constante de dispersão R; é unitária tratando-se de BPSK, de acordo com a Tabela 6.1. Precisamos de calcular a resposta impulsional global A . Comecemos pela resposta impulsional do canal e pelo filtro adaptativo, que têm M=4 valores e N=2 coeficientes, respectivamente. Destes coeficientes
238
239
um é de ordem par (Np=1) e o outro é de ordem ímpar (N,=1). A matriz reduzida D tem dimensões
e a resposta impulsional HH resultante seria
[ester[8=perene
H=|
e é igual a
80
D=|g2 0
0
0,2
gi|=|L0 83
0
h=|[L0 0
0
-0,1
0,2cp
0,5 | |- co +0,5c; C1
0,2
1,0
0,5
8
O
0,2
0
81
80
03
0,2
g|=|10
0,5
83
8g|
|-061
10º
O
83
0
-0,1
0,5cp + 0,2c1 =|
Ci
-0,1
1,0
0
01
co+0,5c; -O, Ico +cj
-0,1c;
Não havendo ruído devemos usar a Eg. 6.29 para calcular a função de custo CMA. Substituindo valores obtemos 2
J=1-25h 125 Sun? 2 = i=0
i=0j=0
i=0
= 1,2416c) + 2,24cjcj + 1,6224câc7 + 0,56cocj —
neste exemplo se reduziria a hj = Co821 + Ci821-1.
Um aparte: suponhamos que afinal a amostragem era feita à cadência de 1/T segundos e que o igualizador era síncrono. A matriz de convolução seria a seguinte,
|x
Co
Situação sem ruído
-0, lc;
Concluímos que a resposta impulsional global tem P=3 elementos, distanciados de T segundos.
0,2cp
Se compararmos h com H verificamos que os elementos daquele são os elementos de ordem par deste.
Chegaríamos ao mesmo resultado se tivéssemos usado a Eg. 6.42, que
A=|g2
0,5
0,5
cg
-0,1
0
0
O vector h calcula-se através da Eg. 6.40: 0,2
02
-2,08c) — 2cpcy — 0,5207 +0,0776c7 +1 Na Fig. 6.33 são apresentadas curvas de nível de J. Nota-se que existem quatro mínimos globais. Todos têm valor nulo e estão situados em
e=+[1,9231
c=+[-0,3846
0,1923/
0,9615/
240
241 Se o igualizador “cair” num daqueles mínimos locais o seu desempenho será menos eficiente. É por isso que a questão da
inicialização dos coeficientes é tão importante em igualização cega.
Fig. 6.33. Curvasde nível da função de custo CMA do exemplo > com igualizador fraccionário e sem ruído. Confirma-se que, ao contrário do que acontece com o erro quadráti co
médio, não existe um mínimo único.
Situação com ruído
Estando o ruído 7dB abaixo do nível dosinal e tendo este uma variância unitária, a variância daquele vale
;
,
E
So
Fig. 6.34. Curvas de-nível da função de custo CMA do exemplo, com igualizador fraccionário e ruído.
02 =1007 -0,2.
[]
A equação que agora devemos usar é a Eg. 6.28:
E
ud 02 as 2n2 J=1-25 Sn + h “0,43, 2 +35 Shhj25 i=0
i=0
i=0j=0
2 1 11 5 23 h2 > c2+0,1 23 3 cic?
i=0
j=0 '
i=0j=0
i=0
,
6.5.4. 4. Os igualizadores com realimentação da decisão (DFE) E Ê
.
.
O igualizador DFE consiste num ramo “feedforward” (FE)é num ramo de “feedback” (FB), como se mostra na Fig. 6.18. O ramo FF é idêntico a um dos igualizadores anteriores (síncrono ou FSE) e o outro j i j Í tro ramo é um filtro transversal síncrono, com coeficientes espaçados de T segundos.
0,1365/", e dois mínimos globais, de valor 0,3859,
0, 6897".
|
De acordo com a Fig. 6.35, os símbolos previamente detectados no decisor (e que constituem um sinal quantizado) são usados como entrada do me estao
próximos de c = +[-0,1914
.
desempenho na presença de interferência intersimbólica severa [Falconer76].
Na Fig. 6.34 são apresentadas curvas de nível de J, Agora existem dois mínimos locais, de valor 0,5722, situados em c= +[0, 9326
.
Se o canal introduzir uma elevada distorção de amplitude é recomendáiza ve usar-se um igualizador DFE [Belfiore79]. Este tipo de igualizador tem um bom
LL
243 ruído e da sensibilidade à fase do amostrador 1/T. Como existe um outro filtro que trata das caudas da resposta impulsional do conjunto canal+filtro FF, sem amplificar o ruído, este último filtro pode apresentar na sua saída amostras não-nulas a seguir ao pico principal dos impulsos de dados. O filtro FF tem, pois, a “vida facilitada”. Pelas razões anteriores, os igualizadores DFE compensam eventuais valores
Entrada SK
a
(a)
É (nd)
KT/M
“a(n-2)
Co(n)
KTM|-
cos
nulos do espectro de entrada devidos a uma fase incorrecta do amostrador realçando * menos o ruído que os igualizadores lineares síncronos, mas à custa de um número mais elevado de coeficientes FB. Podemos assim afirmar que o igualizador DFE é * menosinsensível à fase do amostrador que o igualizador síncrono.
a(n-N+1)
O problema de sensibilidade à fase desaparece se o filtro FF for fraccionário,
* pois vimos queé insensível à fase do amostrador.
Cnci(m)
Como o ramo FB trabalha com amostras sem ruído (admitindo que as decisões do decisor são correctas), o ruído do canal não é amplificado por este ramo. Claro que se as decisões forem incorrectas haverá propagação de erros.
—>
Saída X(n)
esaf7
Poderíamos pensar em usar apenas o ramo de “feedback”. Normalmente não se faz isso pois se o canal apenas distorcer o sinal em amplitude a sua resposta impulsional é simétrica em relação a um pico, originando pré-cursores que o ramo FB não consegue eliminar. Essa tarefa é realizada pelo filtro FF. Num igualizador DFE com N coeficientes FF espaçados de T segundos e M coeficientes FB a actualização simultânea dos coeficientes é feita, no algoritmo LMS, de acordo com
Fig. 6.35. O igualizador DFE .
= A saída do filro FB é a soma dos pós-cursores » isto é, é à soma o enentemente ponderada dos últimos símbolos detect ado s no decisor. Os pesos ssa soma, que são os coeficie ntes do filtro FB, terão assim de se ir aproximando adaptativamente dos valores da cauda da resposta impuls i ona l do sistema que precedero decisor (o conjun to canal-+filtro FE).
c(n+1) = e(n) + 2ue(n)a“(n)
(6.44)
b(n + 1) = b(n) + 2ue(%“(n— 1)
(6.45)
em que o vector complexo X(n) é definido como
em=[8n)
E]
Xn-D)
Lo
&n-m+eD/.
4. Exemplo de pré- e pós-cursores
Fez-se passar uma sequência de impulsos de cosseno elevado com factor de “roll-off” 0,3 por um canal modelizado como um filtro FIR com Juma resposta impulsional amostrada
h=[0,1
0,406
0,71
0,406
-0,1]/.A Fig. 6.36 mostra um
desses impulsos, juntamente com a correspondente resposta do
filtro. Podemos observar o seguinte : 1) No instante O o impulso envi ado tem um valor não-nulo ao passo que nosinstantes +T, +27T, etc. o seu valor é nulo. Respeita, port anto,
0 primeiro critério de Nyquist nos tempos (não há interferênci a intersim bólica).
2) Cada impulso recebido exib e pré-cursores e pós-cursores não-nulos isto é,
existe ISI. Assim, se a sequênci a de saída for amostrada nos instantes assinala
dos (tendo em conta o atra so de 2T introduzido pelo filtro), cada impulso é resp onsável pelos pré-cursores A e pelos
pós-cursores B.
Suponhamos, por exemplo, que se pretendia transmitir a sequênci a binária 11010 através do cana l, atribuindo o impulso de cosseno elevado da figura ao bit 1 eo seu simétrico ao bit O. O efeito dist orsor do canal fará com que nos inst antes de amostragem 2T, 3T,.... 6T a sequência de saída contenha ISI, que pode provocar erros de dete cção, como se mostra na Tabela segu inte, onde se comparam as duas situações: com ISI e sem ISI.
1
4
0.8 +
Impulso enviado A Impulso recebido
0.6 (A Pré-cursores
04»
É
Pós-cursores 4
92L
Instante de amostragem
OL
-0.2 |
Sequência de saída amostrada Instante
2T
3T
4T
ST
6T
Com ISI
1,016
0,81
-0,098
-0,202
-0,204
Sem ISI
0,71
0,71
-0,71
0,71
-0,71
No instante 5T as amostras têm sinal contrário, logo a detecção símbolo a símbolo desta sequência produziria um erro no 4º bit,
fazendo com que a sequência binária detectada fosse 11000.
6.6. O algoritmo ZF Sabemos que a função de um igualizador é eliminar a interferência intersimbólica na medida do possível. Essa interferência manifesta-se através da existência de pré-cursores e pós-cursores nos impulsos recebidos.
As técnicas de igualização de canais de comunicação apresentadas até ao momento assentam na minimização de umafunção de custo quadrática. Podemos, no entanto, abordar a questão da igualização a partir de uma perspectiva diferente, que passa pela eliminação dos pré- e pós-cursores. A ideia, lançada pelo “pai” da igualização adaptativa, Robert Lucky, em meados dos anos sessenta, consiste numa escolha criteriosa dos coeficientes do igualizador de modo que estes, minimizando uma distorção de pico, “forcem a zero” um número finito de cursores. É por esse motivo quese dá a esta técnica “primitiva” de igualização, hoje em desuso, o nome de algoritmo “zero forcing”, ou simplesmente algoritmo ZF. Vejamos como proceder. Em primeiro lugar vamos definir a chamada distorção de pico normalizada. Para isso, admitamos que a resposta impulsional amostrada do sistema que antecede o igualizador é dada pelos valores /hp), sendo
ho = max|h] - À distorção de pico normalizada é definida como a função
MR
Eee
OC
ASS t/T
pps
Spa
Rs
RS
F
RT
Fig. 6.36. Um impulso os seus pré- e pós-cursores.
1 Dpico = Stu. O k=0
(6.46)
Trata-se, como se vê, da soma dos valores absolutos dos elementos da resposta
impulsional amostrada (excepto Ao), soma que representa o valor máximo da
246
interferência intersimbólica que afecta o sinal. Quanto menorfor Dpico menor é o
valor máximo da interferência intersimbóli ca, isto é, maior é à abertura do diagrama
de olho. Se porventura Dpico = O, isso significa que a interferência intersimbólica é nula pois nesse caso não há nem pré-nem pós-c ursores.
Se o diagrama de olho estiver associado a um sinal com L níveis a sua abertura está relacionada com a distorção depic o através de [Gitlin92]
Abertura = 1 -(L — DDpico
(6.47) Fig. 6.37. Igualizador para o algoritmo ZF.
No caso binário (L=2) a abertura do olho é simplesmente
Abertura = 1 — Diem
(L=2)
x
Umaabertura unitária significa que o olho está completamente aberto. Uma situação intermédia (olho aberto, mas não completamente) ocorre quandoa abertura
é positiva e inferior a um (e nesse caso D p ico 1), além de que nãose estão a incluir osefeitos
do ruído no critério de desempenho. Apesar de apenas minimiz ar a interferência intersimbólica, a simplicidade do algoritmo fez com que os igualiz adores com ele equipados fossem os primeiros a ser incluídos em modems. Hoje em dia já não são usados, tendo há muito sido substituídos por igualizadores com o algoritmo LMS,
Antes da igualização ZF 1,2 r RR
que com uma sequência de treino funcionam mesmo quando o olho está
1,0
IS
0,8+
completamente fechado.
0,6 +
E
5. Exemplo com o algoritmo ZF
Neste exemplo vamosaplicar o algoritmo ZF numasituação em que o impulso recebido à entrada de um igualizador com 5 coeficientes tem
a forma apresentadana Fig. 6.38. Quais são os valores dos coeficientes de modo quea interferência intersimbólica de pico seja minimizada? De acordo com figura, a matriz À vale q 4
Ala
q
4
44 4
dm
q |
ads 44
as dy
as as
aq
uy
tsl=)
a
[e]
ag
q
aq
as]
1 -0,15
0,12 1
01
015
0
-0,05
|-005
O
0,08 0,12
1
-015 0,1
0 -0,08
0 0
0,12
-0,08
-0,15
1
1
NCce porreIrONE
0,4 0,2
E
0,0
o -0,2-
0,12
a
EN
a
OO
NE
-0,08
Es
0,1
-0,1
1
1
Tempo
3
5
7
Fig. 6.38. Impulso recebido no igualizador ZF.
Com estes valores o impulso original foi transformado no impulso da Fig. 6.39. Comose vê, o igualizador forçou a zero M=2 valores de cada lado do pico do impulso. Note-se ainda o atraso de duas unidades introduzido pelo filtro. A distorção de pico, que originalmente era de
Dpico (origi iginal) nal) == 0,08+0,12+0,15+0,1+0 ,05=0,5,
0,12
passou a ser de
Sendo assim, os coeficientes ezr=[c2
c1
co
q
Dpico(igualizada) = 0,007 +0,018+0+0+0+0+0,02 +0,016 = 0,061.
of
passas
do igualizador são os que resultam da equação do algoritmo ZF
250
251
A abertura do olho passou assim de 50% para cerca de 94%. Muito mais aberto...
Depois da igualização ZF
tão
1,0
0,8+
O capítulo terminou com a apresentação do algoritmo ZF; agora pouco usado, foi incluído por razões históricas e para que o capítulo ficasse mais completo. O algoritmo ZF tem como objectivo abrir o diagrama de olho da comunicação (reduzindo assim a interferência intersimbólica). O que se faz E tenta minimizar a distorção de pico associada a esta interferência, ao contrário dos algoritmos adaptativos convencionais, nos quais se tenta minimizar uma distorção quadrática.
0,6+ 0,4+ 0,2+ 0,018 si
o
ERON
EQIAE
ES
Foram também apresentadas mais algumas variantes do algoritmo do gradiente, mas agora aplicadas à igualização cega: o algoritmo de Sato e o algoritmo CMA.A função de custo deste último foi calculada analiticamente e através de um exemplo confirmou-se a existência de mínimos locais em certas circunstâncias adversas. A existência de uma superfície de erro multimodal justifica, assim, todo o cuidado a ter na correcta inicialização dos coeficientes do igualizador adaptativo.
1
1
=3
Ri!
1
1 Tempo
0 Z
NS os L
3
5
1
-0,016
7
J
Fig. 6.39. Impulso igualizado pelo algoritmo ZF.
6.7. Resumo
Neste capítulo foi apresentada a igualização adaptativa de canais de comunicações, uma das aplicações mais vulgares do processamento adaptativo em telecomunicações. Foram referidas a igualização cega e a igualização com sequência de treino (ambas propostas por Robert Lucky nos anos 60); mostrou-se que, consoante o sistema use ou não modulação, assim se podem usar igualizadores com sinais complexos (passa-banda) ou sinais reais (em banda-base) e foram apresentados os três tipos de igualizadores transversais em uso hoje em dia: os igualizadores lineares síncronos, os igualizadores com realimentação da decisão (DFE) e os igualizadores fraccionários (FSE). Pelo meio fez-se uma revisão de questões relacionadas com o teorema da amostragem, importantes para a justificação da utilização e compreensão do funcionamento dos igualizadores FSE.
253
7. APLICAÇÕES EM TELECOMUNICAÇÕES: O CANCELAMENTO DE ECO
Introdução Caracterização dos sinais e ecos Cancelamento de eco com o algoritmo LMS Cancelamento de eco com o algoritmo do sinal Cancelamento de eco não linear Cancelamento de eco com estimativa do sinal remoto Resumo
7.1. Introdução Z O cancelamento de eco é outra aplicação importante do processamento adaptativo em telecomunicações. O filtro adaptativo que realiza a operação de
cancelamento chama-se, obviamente, cancelador de eco. Um dos sistemas que usa canceladores como maneira de melhorar o desempenho é a RDIS; o mesmose passa,
por exemplo, com a transmissão de dados na linha telefónica com modems obedecendo às normas da União Internacional de Telecomunicações (ITU), como a normaV.34. Existe uma grande diversidade de sistemas de comunicações. Nalguns, como a radiodifusão de televisão, a informação flui num só sentido, da estação para os receptores. Noutros, como em certas comunicações ponto-a-ponto por satélite, a comunicação é bidireccional, com um emissor e um receptor em cada extremo do sistema a usarem bandas de frequência diferentes em cada sentido da transmissão. Num outro sistema — o serviço telefónico de rede fixa — a comunicação faz-se nos dois sentidos simultaneamente, através dum mesmo suporte físico e na mesma banda
de frequências — é a chamadatransmissão “full-duplex”. A comunicação é realizada através de um complexo encaminhamento das chamadas, por comutação de circuitos;
E
podendo coexistir diferentes mecanismos de transmissão ao longo de todo o
254
percurso, havendo ou não portadoras passa-banda no sistema, e sendo usados diferentes equipamentos, desde o emissor até ao receptor, ocorrem por isso interferências várias, como ruídos, ecos, interferência intersimbólica e diafonias
provenientes de linhastelefónicas vizinhas. A interferência intersimbólica provocada pelo canal é eliminada ou reduzida com igualizadores adaptativos, como já vimos. A diafonia (designada em inglês por “crosstalk”) é um factor altamente perturbador das comunicações. Existem dois tipos de diafonia, designados em inglês por “near-end crosstalk” (NEXT) e “far-end crosstalk” (FEXT). O mais importante naslinhas digitais de assinante é o NEXT, devido a sinais provenientes de outros emissores próximos. É uma interferência que aumenta com a frequência à razão de f””. Este facto levou à adopção de um código de linha quaternário, 2B1Q, para a transmissão digital no Acesso Básico da RDIS (160kbits/s), por ocupar metade da largura de banda de um sinal não-codificado. De facto, num código 2B1Q a cada par de bits é atribuído um de quatro níveis, reduzindo para metade o número de símbolos transmitidos em cada segundo.
A linha telefónica entre as instalações do assinante e a central telefónica, constituída por um par entrançado de cobre com eventuais mudanças de diâmetro ao longo do seu percurso, pode ser usada para a transmissão “full-duplex” a 160kbits/s; é igualmente o canal de comunicação previsto para a transmissão a velocidades ainda mais elevadas, como em HDSL(“High Speed Digital Subscriber Line”) — 2Mbits/s na Europa — e em ADSL (“Asymmetric Digital Subscriber Line”) — transmissão assimétrica a mais de 6Mbits/s no sentido mais rápido. Diremos, nos três casos (RDIS, HDSL e ADSL), que temos uma “linha digital de assinante”.
As comunicações telefónicas “full-duplex” são um campo privilegiado de aplicação do processamento adaptativo. No capítulo anterior encontrámos uma dessas aplicações (a igualização de canais) e neste capítulo vamos tratar da eliminação adaptativa de ecos. Estes constituem um importante obstáculo à comunicação de dados; em menor grau, embora, são também um factor perturbador nas comunicações de voz.
A anulação, ou pelo menos a diminuição, dos ecos é tarefa dos canceladores de eco. Como é que surgem estes ecos? Observemosa Fig. 7.1, onde se apresenta um esquema simples de um sistema telefónico comutado, de longa distância,
normalmente usado para comunicações de voz e, ultimamente, também em
comunicações de dados via “modem”. Para efeitos da exposição vamos considerar que o emissor-receptor da esquerda é o emissor-receptor local e que à direita se encontra o emissor-receptor remoto.
255
-
PE) :V
To
O LinhadeN À
A KHHa) dá Hr) assinante
Eco próximo | devido a H1 j x
Sistema local “e fios)
pio da?
Eco | iss
y
Eco próximo
devido a H 2
inha dede Linha
7 HaN assinante
4
g Ha
N Z [EA
a
E,
Longa distância (4 fios)
Loreena Sistema remoto (2 fios)
Fig. 7.1. Um circuito telefónico de longa distância.
Em algunstroços do sistema da figura a comunicação faz-se a quatro fios ao passo quenoutros se faz apenas a dois. A conversão 4/2 fios é feita por um acoplador direccional híbrido, ou simplesmente “híbrido”. Tomemos como exemplo o sistema local e o híbrido H, (sêndo tudo idêntico para o equipamento remoto): o sinal proveniente do emissor deve fluir para a linha telefónica para ser entregue no receptor remoto, depois de atravessar todo o sistema. Idealmente nenhuma energia proveniente do emissor local deveria atingir o receptor local. Mas issonão acontece. E porquê? É que há uma enorme diversidade de linhas telefónicas. As suas características de transmissão variam consoante o comprimento e o diâmetro dos pares entrançados (0,5mm, 0,6mm, etc.) e dependem do modo de instalação, da existência de outros pares vizinhos, de eventuais derivações em circuito aberto (muito comuns na rede americana) e ainda de condições ambientais como a temperatura. Esta multiplicidade de casos impede que os conversores híbridos estejam adaptados a todas as situações, fazendo com que haja um escoamento do sinal do ramo superior do híbrido para o ramo inferior. O resultado é, comojá foi referido, o aparecimento de ondas reflectidas nos locais assinalados da figura, ou onde houver desadaptação de impedâncias. Como fazer então para anular os ecos? A solução é colocar um filtro adaptativo (o cancelador) em paralelo com o conversor híbrido, funcionando de modo que na suasaída se tenha umaréplica o mais fiel possível da perturbação que se deseja anular, isto é, estamos numasituação típica de identificação de sistemas. O
cancelamento é conseguido se ao eco subtraírmosa tal réplica fiel, como se mostra na Fig. 7.2 para uma linha local de assinante entre as instalações deste e a central telefónica.
=|
O tn =]
256
Emissor |
Emissor
Cancelador de
Eco
&
+
y
NUA
A
Eco
=| Receptor japa
Linha de
assinante
e!
y
Ê
Híbrido y 7 N
Ls
Cancelador de eco
Sinal
Cancelador de
igualizado
Eco
Eco
+
E
Receptor >
Fig. 7.2. O cancelamento de eco adaptativo nalinha de assinante.
Como se vê na figura o cancelamento de eco coloca o filtro adaptativo “em paralelo” com o dispositivo que provoca o eco (o híbrido), ao passo que na igualização filtro está colocado “em série” com o bloco que introduz distorção no sinal, isto é, o canal de comunicações.
Ls
Cancelador de eco
e
e/
ú
Consoante a proveniência, podemos falar de ecos distantes e ecos próximos (veja-se a Fig. 7.1). Os ecos distantes chegam bastante mais tarde que os ecos próximos, comoé natural. De acordo com [Gitlin92], o tempo deatrasositua-se entre
+ Sinal igualizado
5 e 600 ms, consoante o circuito (se incluir satélites, por exemplo, o atraso será dos
maiores). Quanto ao eco próximo,naturalmente que é mais intenso que o eco distante (cerca de 15dB acima). Em qualquer das versões da linha digital de assinante também ocorrem ecos, sendo o mais significativo o eco próximo, proveniente do híbrido local e mostrado na Fig. 7.2. Na análise que se segue só este eco será considerado. Os canceladores de eco podem actuar independentemente dos igualizadores ou em conjunto [Lin90]. O primeiro casoé ilustrado na Fig. 7.3a com um igualizador DFE. Este tipo de igualizador é também usado na Fig. 7.3b para ilustrar o
processamento conjunto.
Em resumo, os ecos ocorrem sempre que houver desadaptação de impedâncias ao longo do circuito telefónico, pois essa desadaptação gera ondas reflectidas que replicam o sinal transmitido, assim indesejavelmente “devolvido à procedência”.
b)
Fig. 7.3. a) Igualização e cancelamento de eco separados; b) Igualização e cancelamento de eco conjuntos.
7.2. Caracterização dos sinais e ecos Em ADSL, onde são usados métodos de transmissão multiportadora (DMT,
ou “Discrete Multitone”) com milhares de portadoras ortogonais, é muito difícil analisar e combater o cancelamento de eco [Ho96]. Assim, e com o objectivo de tornar a exposição que se segue mais clara, vamos tomar como modelo linhadigital de assinante na sua versão mais simples, RDIS. O nosso ponto de partida é a Fig. 7.4, onde se apresenta um diagrama esquemático correspondente ao sistema de cancelamento de eco da Fig. 7.2. O cancelador (C. E.) é modelizado por um filtro adaptativo transversal com uma
258
259
resposta impulsional c(n) e o canal, ou percurso, de eco é representado pelo bloco h, também ele um filtro transversal mas de coeficientes fixos.
en(n) = 3 ha(n-i)= i=0
No ramo inferior do híbrido local da Fig. 7.2 a forma de onda tem três
N-
componentes: uma, s(n), é o sinal distante, proveniente do emissor remoto; outra,
o
= Sman-i)+ Sman-d)= i=0 i=N
n(n), é o ruído gaussiano no canal; finalmente, a terceira componente é o eco próximo eh(n). Só a primeira componente é desejável pelo receptor, as outras são interferências que prejudicam a recepção do sinal distante.
(7.1)
=h7a(n) + 3 ha(n-i) i=N
1
Em paralelo com o híbrido deverá ser colocado o cancelador, que
a(n)
u(m) =s (n) +n (n) C.E.
c(n)
h
Ruído
dn) =en(n) + u(n)
vamos
considerar
e(n) =[co(n)
E
A es e(n)
d(n)
u(n)
s(n)
Linha de assinante
Fig. 7.4. A linha digital de assinante e o eco próximo.
Admitamos na Fig. 7.4 que, sendo h;,0