Processamento Adaptativo de Sinais 972-31-0896-8

338 75 82MB

Portuguese Pages 155 Year 2000

Polecaj historie

Processamento Digital de Sinais Utilizando Matlab e Wavelets 9788521621416

Processamento Digital de Sinais – Utilizando MATLAB® e Wavelets é uma excelente ferramenta de estudo sobre este importan

634 64 35MB Read more

Processamento Artesanal de Carne Suína

166 92 14MB Read more

Sinais de um Cristão Autêntico

Um Cristão Genuíno - William Guthrie (1620-1665) Um genuíno cristão valoriza o Senhor Jesus Cristo acima de tudo o mais

197 85 55KB Read more

Processamento Artesanal De Carne Suína

167 67 15MB Read more

Sinais de um Cristão Autêntico

Um Cristão Genuíno - William Guthrie (1620-1665) Um genuíno cristão valoriza o Senhor Jesus Cristo acima de tudo o mais

209 30 222KB Read more

Sinais dos tempos

"O presente trabalho - afirma o Autor - é fruto de uma pesquisa que exigiu tempo e aplicação. Tem um caráter pronun

793 130 10MB Read more

Palavras e sinais : modelos críticos 2 8532614310

681 49 4MB Read more

Análise Linear de Sinais: Teoria, Ensaios Práticos e Exercícios [1 ed.] 8521214154, 9788521214151

Este livro trata de um conjunto de assuntos clássicos que permeia todos os programas de graduação em engenharia e ciênci

197 90 244MB Read more

Portugal Islâmico. Os últimos sinais do Mediterrâneo

600 83 19MB Read more

Análise Linear de Sinais: Teoria, Ensaios Práticos e Exercícios [1 ed.] 8521214154, 9788521214151

Este livro trata de um conjunto de assuntos clássicos que permeia todos os programas de graduação em engenharia e ciênci

163 106 3MB Read more

Processamento Adaptativo de Sinais
972-31-0896-8

Author / Uploaded
Silvio abrantes

Citation preview

PROCESSAMENTO ADAPTATIVO DESINAIS

621.3822 A143p

N.Cham. 621.3822 A143p Autor: Abrantes, Sílvio A. Título: Processamento adaptativode sina

miNonmm 13844513

Ac. 72916

PROCESSAMENTO ADAPTATIVO DE SINAIS

UNIVERSIDADE FEDERAL DO

CEARA

SÍLVIO A. ABRANTES

PROCESSAMENTO ADAPTATIVO DE SINAIS

SERVIÇO DE EDUCAÇÃO E BOLSAS FUNDAÇÃO CALOUSTE GULBENKIAN UNIVERSIDADE FEDERAL DDOCEEA RÁ Biblioteca de Ciências a Ta

Prefácio

Senti duas motivações para escrever este livro. A primeira, mais imediata, derivou do facto de há alguns anosleccionar as matérias aqui apresentadas no curso de Engenharia Electrotécnica e de Computadores da Faculdade de Engenharia da Universidade do Porto e sentir alguma premência em redigir um texto integrado, com princípio, meio e fim, que aproveitasse as diversas notas e apontamentos que fui desenvolvendo. A outra motivação, mais latente e difusa mas de alcance porventura mais profundo, foi surgindo paradoxalmente antes da primeira: que eu tenha conhecimento, não existe no mercado nenhuma publicação em língua portuguesa que aborde o processamento adaptativo. Este facto foi um incentivo adicional estimulante para que pusesse mãos à obra. Assim, este livro destina-se prioritariamente a alunos universitários dos países de língua portuguesa. Será também de utilidade para engenheiros que em formação pós-graduada queiram actualizar os seus conhecimentostécnicos na área. O processamento adaptativo de sinais é um tema de crescente importância hoje em dia, dada a multiplicidade de situações em que pode ser aplicado e tendo em conta os consideráveis avanços tecnológicos que se têm verificado nos últimos anos nos processadores digitais de sinal. Podemosdizer, sem receio de falhar, que qualquer sistema de telecomunicaçõs medianamente avançado beneficia do processamento adaptativo em maior ou menor grau, nomeadamente sob a forma de filtros igualizadores de canal. Um assunto tão vasto como este, com aplicações tão diversas, pode ser abordado de variadas maneiras. Dada a minha formação, é o ponto de vista das “telecomunicações” que sobressai, embora tenha tido a preocupação de não descurar demasiado outras áreas. Reservados todos os direitos de acordo com lei

E Edição da FUNDAÇÃO CALOUSTE GULBENKIAN Av. de Berna | Lisboa 2000 ISBN - 972:31-0896-8 DEP. LEGAL- 160358/01

O livro está dividido em sete capítulos. No primeiro faz-se uma breve introdução ao processamento adaptativo com a ajuda de numerosos exemplos de aplicação. O capítulo seguinte, por sua vez, serve de antecâmara aos que lhe sucedem. Nele são feitas algumas revisões de natureza matemática, necessárias para a exposição subsequente. São também referidas brevemente as estruturas e as famílias de algoritmos adaptativos que mais tarde serão expostas com mais profundidade.

UNIVERSIDADE FEDERAL DO CEARÁ Biblioteca da Ciânnriae a Torna

Os capítulos 3, 4 e 5 constituem, por assim dizer o núcleo do livro. No

capítulo 3 é estudado o algoritmo teórico mais importante de todos, o algoritmo do gradiente, tão importante que o seu conceito deu origem aos mais usados algoritmos práticos, cujo máximo expoente de popularidade é o algoritmo LMS. Este e outros “filhos” são o tema do capítulo 4.

No capítulo 5 é feita a abordagemda outra família importante de algoritmos adaptativos, afamília dos “mínimos quadrados”, com ênfase nas técnicas recursivas e suas versões rápidas, como o chamado algoritmo “fast Kalman'”.

Os dois últimos capítulos, 6 e 7, apresentam cada um uma aplicação do processamento adaptativo em telecomunicações:a igualização e o cancelamento de eco. O capítulo 6 aborda pormenorizadamente a primeira aplicação nos seus vários modos de funcionamento, com ou sem auxílio de sinais de treino, e através de várias estruturas de implementação (igualizadores lineares, FSE e DFE). No capítulo 7 é o cancelamento de eco que é estudado nas suas especificidades, não só quando o objectivo é eliminarecoslineares mas também quando existem não-linearidades no sistema.

ou problemas, a incluir no fim de cada capítulo de uma futura edição. Para todos estes efeitos poderei ser contactado na Faculdade de Engenharia da Universidade do Porto ou por correio electrónico nos endereços sam Qinescn.pt ou sam Ofe.up.pt. Em resumo, espera-se que esta publicação contribua, à sua medida, para uma maior divulgação das técnicas de processamento adaptativo, tão correntes por tão necessárias na actualidade.

Porto, Setembro de 1997 Sílvio Abrantes

No fim do livro encontra-se uma extensa lista de referências bibliográficas citadas no texto. É uma boa fonte de informação para quem desejar aprofundar os

assuntos expostos.

A teoria apresentada nos diversos capítulos é complementada com exemplos para confirmação de resultados ou para consolidação e revisão dos temas analisados. Uma chamada de atençãofinal: este texto não é nem exaustivo nem definitivo. A população-alvo que pretendo atingir não necessita de uma obra enciclopédica e alguns temas, inegavelmente interessantes, saem fora do âmbito desejado e tiveram de ser excluídos. É por esse motivo que neste livro não são apresentados algoritmos com estruturas “lattice” ou outras que não as transversais não-recursivas (os

conhecidos filtros FIR). Limito-me, de facto, a utilizar estas últimas, excepto num pequeno caso específico do cancelamento de eco. A mesma razão levou-me a excluir da exposição as questões da precisão finita em implementações digitais, bem como o processamento no domínio das frequências, de utilização muito mais reduzida quando comparada com o processamento no domínio dos tempos, o único considerado aqui.

Não sendo definitivo, este livro será revisto e melhorado (espera-se...) quando se achar oportuno. As sugestões de aperfeiçoamento ou os comentários que a leitura suscitar são bem-vindos, tal como o são sugestões ou ideias para exercícios

UNIVERSIDADE FEDERAL DO CEARA

1. INTRODUÇÃOE APLICAÇÕES Introdução ao processamento adaptativo Classes de processamento adaptativo Exemplos de aplicações

1.1. Introdução ao processamento adaptativo Este livro trata de filtros. Filtros adaptativos. Encontramosfiltros nas mais variadas situações. Todos conhecem osfiltros de

café, feitos de papel, os filtros de ar e de óleo usados nos automóveis, os filtros solares

para uso nas praias ou materiais para isolamento acústico. O objectivo é sempre o mesmo, do ponto de vista conceptual: queremos que o filtro impeça a propagação de algo indesejável, seja isso impurezas, raios ultra-violetas ou ruído sonoro.

Os filtros eléctricos partilham com os exemplos anteriores alguns atributos comuns: os sinais eléctricos que aplicamos na entradados filtros vão ser alterados em algumas das suas características. Podemos, por exemplo, usar um filtro para retirar de um sinal eléctrico alguns dos seus harmónicos. Ou imagine-se termos um sinal útil de tal modo imerso em ruído que não o “vemos” (é tudo “nevoeiro”, parece. . ). Um filtro poderá servir para diminuir o nível de ruído e assim se poder observar ou usar o sinal, agora mais limpo.

O comportamento de um filtro deverá ser avaliado, para sabermos se a filtragem está a ser eficaz ou não. Muitas vezes servimo-nos de certas características estatísticas dos sinais e ruídos em presença (como a média ou a variância) para fazermos essa avaliação. Assim, o objectivo da filtragem poderá ser, por exemplo, a minimização de um erro, definido como diferença entre uma resposta desejada e a saída do filtro, ou a minimização da média dos quadrados dessa diferença — O chamadoerro quadrático médio.

Tendo entradas estacionárias, ao filtro com o qual se consegue minimizar O erro quadrático médio dá-se o nome defiltro de Wiener. Diz-se então que este filtro é óptimo no sentido quadrático médio. A representação gráfica do erro quadrático HAVRDCINANE CENEDA! DNOCEARÁ

13

12

médio em função dos parâmetros do filtro dá-se o nome desuperfície de “performance” do erro e o ponto mais baixo dessa superfície corresponde à solução de Wiener. Se o sinal ou ruído tiver características não-estacionárias já não poderemos usar filtros de Wiener. Nesse caso precisamos de usar filtros cujas características ou parâmetros variem no tempo, acompanhando automaticamente as variações da entrada. É este o objectivo do processamento adaptativo: condicionar sinais de modo a atingir gradualmente determinados objectivos, como os atrás indicados. Os filtros usados em processamento adaptativo são quase sempre filtros digitais. Os seus coeficientes são variáveis no tempo e o modo como variam depende do algoritmo adaptativo escolhido. Um filtro adaptativo é, pois, um filtro capaz de auto-aprendizagem: à medida que o tempo decorre o filtro vai ajustando as suas características de modo que o seu comportamento seja o desejável. Osfiltros digitais trabalham com sinais amostrados no tempo. Por esse motivo não iremos considerar sinais em tempo contínuo mas sempre sinais em tempo discreto. Isto não é de forma nenhuma uma limitação porque sabemos que podemos representar um sinal em tempo contínuo com a suficiente fidelidade simplesmente através de amostras suas colhidas a um ritmo de acordo com o que recomenda o teorema da amostragem, isto é, com uma frequência de amostragem que seja superior ao dobro da maior frequência do sinal. O ajuste das características do filtro, isto é, o modo como o condicionamento dos sinais é feito, poderá ser realizado tendo em conta o sinal de entrada e outros

dados “de entrada”. Estaremos então na presença de um esquema em anel aberto (open-loop) [Widrow85] como o indicado na Fig. 1.1, onde a informação obtida a partir de medidas das características da entrada é aplicada a uma fórmula ou algoritmo, sendo o resultado usado para ajustar o sistema adaptativo. Podemos,no entanto, usar também o sinal de saída do filtro para o monitorizar

podem ser algo como informações acerca do “ambiente” do sistema adaptativo, ou uma versão desejada do sinal de saída. Toda esta informação vai permitir optimizar o desempenho do sistema.

Sinal

de €—

Entrada

a

Processadorde /

à

Outros dados

Fig.1.1. Adaptação em anel aberto.

Tendo mais vantagens, os esquemas em anel fechado serão os únicos que vamos considerar daqui para diante. Sinal

de

ú

0-4 processador

Entrada

/

Esquema em anel aberto

;

Esquema em anel fechado

No esquema em anel fechado (Fig. 1.2) temos em conta não só as características da entrada mas também as características da saída e outros dados, que

Sinal

> de

Saída

Algoritmo de

Adaptação

Cálculo D

|

Saída

Algoritmo de a Adaptação

e lhe ajustar as características. Desta maneira dispomos de mais informação do que a que tínhamos em anel aberto. A este novo esquema chamamos esquema em anel fechado (closed-loop): Processamento adaptativo

Sinal

de nho esempenho

o Outros dos

Fig. 1.2. Adaptação em anel fechado.

Tal como os filtros convencionais de parâmetros fixos, também os filtros adaptativos podem ser classificados como lineares e não-lineares. Dizemos que um filtro (convencional) é linear se a sua saída for uma função linear das observações

14

aplicadas à entrada. Se assim não for o filtro é não-linear. À primeira vista qualquer filtro adaptativo seria não-linear, visto que os seus parâmetros dependem dos dados de entrada e variam de iteração para iteração (não obedecendo ao princípio da sobreposição). Mesmo assim podemos fazer a distinção entre um filtro adaptativo linear e um filtro adaptativo não-linear. Diremos então que “um filtro adaptativo é linear se a estimativa da resposta desejada é calculada adaptativamente, na saída,

como uma combinação linear do conjunto disponível de observações aplicadas à entrada do filtro” [Haykin96]. Não sendo assim, o filtro adaptativo é não-linear. Em qualquer caso estes filtros, ao contrário dos convencionais, são variantes no tempo,

obviamente.

1.2. Classes de processamento adaptativo Apesar da diversidade de aplicações podemos considerar um esquema adaptativo genérico como da Fig. 1.3. O elemento fundamental é o processador, um filtro digital com um númerofinito de pesos, ou coeficientes, variáveis de uma forma

adaptativa. Esses pesos são ajustados repetidamente, em intervalos regulares, de acordo com um algoritmo (adaptativo) de maneira a optimizar um determinado critério de qualidade relacionado com um erro de estimaçãoe. Este erro é a diferença entre uma resposta desejada, d, e a saída do processador, y. Em resumo, além do filtro adaptativo, devemos ter sempre um sinal de entrada, uma resposta desejada e um erro.

Teremos, então, em esquema: Filtros

foi

à

à

Filtros de parâmetrosfixos

d (resposta desejada)

A

x (entrada)

Filtros adaptativos

O Processador

/

Filtros lineares

Filtros não-lineares

Filtros lineares

Filtros não-lineares

Teremos ocasião de encontrar filtros adaptativos dos dois tipos nas restantes páginas deste livro, sendo os lineares sem dúvida os mais vulgares. As áreas de aplicação do processamento adaptativo de sinais são muito diversas. Eis uma pequenalista com as áreas mais evidentes: º

telecomunicações (HF, feixes de microondas, espalhamento de espectro (“spread

y (saída)

e (erro)

Algoritmo

Adaptativo

Fig. 1.3. Esquema adaptativo genérico.

O critério de qualidade é normalmente designado por função de custo. Consoante a aplicação, a função de custo usada pode ser o valor absoluto do erro, o seu quadrado, a média dos seus quadrados (erro quadrático médio) ou uma outra função do erro. A Fig. 1.4 apresenta três exemplos de funções de custo.

e

lel

f(e)

spectrum”), telefonia, etc.);

*

geofísica;

*

processamento de dados sísmicos;

º

análise de dados biomédicos (electrocardiografia, por exemplo);

º*

processamento de sinais de áudio, vídeo, radar e sonar;

º

controlo de máquinas industriais.

se

Fig. 1.4. Exemplos de funções de custo.

HNIVERSINANE CEDEDL nes nrana

16

17

A evolução da função de custo ao longo do tempo é uma indicação das qualidades de aprendizagem do algoritmo adapta tivo. A sua representação gráfica chama-se, por isso, curva de aprendizagem. A Fig. 1.5 apresenta um exemplo.

Classes e aplicações do processamento adaptativo

eb Erro quadrático médio

|

po

i ã Identificação de sistemas

Predição adaptativa

:

20-

e codificação de voz

15

e estimação espectral e detecção e branqueamento

à

e Igualização de canais de comunicação e Controlo adaptativo

e processamento de voz

inai

e desconvolução « projecto de filtros digitais (síntese defiltros IIR)

pç e ADPCM

de ruído ento EE ' o pesa a 'º Ecancelam * eleelectrocar

ómi e ciências sociais e económicas iológi e sistemas biológicos i e controlo adaptativo o

projecto

E

;

jo

lterações

E

o

e geofísica

e

titros

aa celamento ei

Igualização

igitais (síntese

e

cancelamento

iitros

no e modelização de canais de comunicação com “multipath”

dos

lobos

laterais

dos

"e extracção de sinusóides de pequena amplitude em ruído de banda larga

Fig. 1.5. A curva de aprendizagem.

À função de custo mais usada é sem dúvid a oerro quadrático médio. Podemos apontar duas razões para isso: 1) é fácil obter algoritmos adaptativos a partir do erro quadrático médio, como veremos; 2) norm almente o verdadeiro objectivo do processamento adaptativo é satisfeito quan do o erro quadrático é pequeno!.

.

5

Predição adaptativa;

*

Identificação de sistemas (ou modelização adaptativa directa); Igualização (ou modelização adaptativa inver sa); Cancelamentode interferências.

º *

o que

e pa

a em cada um

a) Predição

Instalação

b) Identificação de sistemas

O esquema seguinte apresenta algumas das aplicações do processamento adaptativo distribuídas pelas quatro grand es classes precedentes. 'Por exemplo, na igualização de canais de comunicação o que efectivamente se pretende é reduzir a interferência intersimbólica. Isso conseg ue-se se se reduzir o erro quadrático médio.

]

dos casos.

As diversas aplicações, embora distintas, poderão enquadrar-se em quatro grandes classes de filtragem adaptativa consoante a configuração do sistema adaptativo e o objectivo a atingir: *

.

2O

artigo

de C. Richard Johnson, Jr, “Yetstill more on the interaction of adaptive filtering, entao

eol” IEEE Signal Processing Magazine, Março de 1995, faz uma Esmia ça E E actualizada, do processamento desinal e do controlo e estimação, com algu aplicações em telecomunicações.

UNIVERSIDADEFEDERAL DO CEARÁ

19

18

Nesta classe de aplicações a resposta desejada é a saída da “Instalação” a modelizar.

Atraso

são

Instalação

Z

|

A

Processador Japtativo

+

a

-

-— (2)

alaca

al c) Igualização

sm

primária

PR

entrada

A

x

Processador

d) Cancelamento

Adaptativo

de referência

Fig. 1.6. As quatro classes de processamento adaptativo: a) Predição adaptativa; b) Identificação de sistemas; c) Igualização; d) Cancelamento de interferências.

1.2.1. Predição adaptativa De acordo com a Fig. 1.6a, com base num sinal x, que é uma versão atrasada do sinal corrente s, o processador tenta obter uma saída y que se aproxime de d (que é igual a s), minimizando assim e. Por outras palavras, o processador tenta “prever” o sinal de entrada corrente, s. Note-se que o sinal corrente é também a resposta desejada. A predição adaptativa é usada, por exemplo, na codificação de voz, na estimação espectral, na detecção e branqueamento de sinais e em PCM diferencial adaptativo (ADPCM) [Widrow85] [Cowan85]. 1.2.2. Identificação de sistemas (modelização)

A Fig. 1.6b apresenta uma configuração utilizada para identificar, ou modelizar, sistemas desconhecidos, como a caixa preta? designada na figura por “Instalação”. Neste caso o processador tenta “emular” a função de transferência da Instalação. De facto, sendo a entrada s aplicada simultaneamente à caixa preta e ao processador, se a saída deste, y, for aproximadamente igual à saída da Instalação, d,

então o processador estará a comportar-se aproximadamente como a Instalação. 3

Oubranca.

A identificação de sistemas é usada para modelizar “instalações” em que se conhece a entrada e a saída. Certos estudos de vibrações em sistemas mecânicos recorrem a esta técnica e também se encontram aplicações nas ciências sociais e económicas, em sistemas biológicos, em sistemas de controlo adaptativo, no projecto de filtros digitais (síntese de filtros FIR), em geofísica (modelização do solo), na modelização de canais de comunicação com “multipath”, etc. [Widrow85].

1.2.3. Igualização adaptativa

Na igualização procede-se a uma modelização inversa da anterior, como se mostra na Fig. 1.6c. O processador está agora em série com a “Instalação”. Se esta for, por exemplo, um canal de “comunicações (que introduz atraso), então o processador tenta recuperar uma versão atrasada do sinal s, o qual foi alterado quer pelas características variáveis do canal quer por ruído aditivo. A resposta desejada é umaversão atrasada do sinal de entrada da “Instalação”. Após convergência a função de transferência do processador é o inverso da função de transferência do canal. Além dá igualização de canais de comunicações, a modelização adaptativa inversa é aplicada, por exemplo, no controlo adaptativo, no processamento de voz, na desconvolução (por exemplo, em sismologia) e no projecto de filtros digitais (na síntese de filtros IIR) [Widrow85].

1.2.4. Cancelamento de interferências

A Fig. 1.6d apresenta uma configuração usada para cancelar interferências, entradas: na entrada primária o sinal s está corroído por ruído n e na duas com referência n' é uma versão distorcida mas correlacionada com n. de entrada O processador tenta aproximar y de n de modo que, após convergência, a saída do sistema, e, é aproximadamente iguala e=s+n-— n=s, isto é, sinal sem ruído.

A entrada primária (sinal + ruído) é a resposta desejada dofiltro adaptativo.

Na Fig. 1.7 é apresentada uma configuração usada numa aplicação de acústica e que é idêntica à da Fig. 1.6d.

20

Cancelador adaptativo de ruído

Sinal

Db

|

s+n |I

+

| |

=

É

Estimativa do ruído

| | Fonte de Ruído

DE

Fo

Adaptativo

/

Entrada de |

ao

e

Fonte de energia sísmica

sitema

| | | | | | | | | |

[

Referência |

a

Later meia fase puta fe a rei E]

Fonte de

E RAR Ro ]

Fig. 1.7. Cancelamento de ruído.

Como o próprio nome deixa antever, o cancelamento adaptativo de interferências é usado para cancelar ruído e eco em sinais de voz e de dados, em electrocardiografia*, no cancelamento dos lobos laterais dos diagrama s de radiação de antenas e na extracção de sinusóides de pequena amplitude em ruído de banda larga (“adaptive line enhancement”) [Widrow75] [Widrow85].

1.3. Exemplos de aplicações Nesta Secção são apresentados alguns exemplos concretos de aplicação do processamento adaptativo”.

1.3.1. Modelização da resposta impulsional do subsolo A Geologia também beneficia do uso de técnicas adaptativas. A Fig. 1.8 mostra comose pode determinar a resposta impulsional do subsolo recorrendoa estas técnicas, mediante a utilização de sensores (geofones) e de equipamento que produza ondas sísmicas (um compressor, dinamite, etc.). Este gera ondas que, devido às características

particulares do solo (camadas estratificadas, jazidas minerais, petróleo, água, etc.), são recebidas em instantes diferentes nos geofones. Este procedimento, conjugad o com o filtro adaptativo da figura, permite medir a resposta impulsional entre a fonte de energia e o geofone e assim formar uma “imagem” do subsolo que é útil na prospecç ão mineira de recursosnaturais (“estaremos em cima de um lençol de petróleo?”). * Comono caso dos batimentos cardíacos fetais perturbados pelo batimento cardíaco materno. * Algunsdos exemplos foram extraídos dolivro “Adaptive Signal Processing”, de B. Widrow e S. Stearns, Prentice-Hall, 1985 [Widrow85]. Os exemplos de cancelamento podem ser encontrados em [Widrow75] e o exemplo de comunicações troposféricas em [reichler87].

Superfície da Terra Camada 1 Camada 2 Camada 3 Camada 4

Fig. 1.8. Procedimento para determinar a resposta impulsional do solo.

Na Fig. 1.9 é apresentada uma resposta impulsional de subsolo. O efeito das diferentes reflexões é visível nos picos da resposta.

Á Resposta impulsional

Entrada

Filtro Adaptativo)

Saída

A IP = Tempo

Fig. 1.9. Resposta impulsional do subsolo usando a técnica adaptativa da Fig. 1.8.

1.3.2. Igualização adaptativa de canais de comunicação A Fig. 1.10 ilustra o fenómeno de multipath que ocorre em muitas situações; neste caso trata-se de um sistema de comunicações troposférico apresentado em [Treichler87]. Como se mostra na figura, existem diversos trajectos que o sinal percorre desde o emissor até ao receptor, devidos ao atravessamento de zonas da

atmosfera com diferentes índices de refracção.

23

22

ps Turbulência

Ondas APStadas pela turbulência troposférica

como este está em série com o igualizador a função de tranferência global passa a ter uma amplitude constante, comose pretendia. O filtro transversal está pormenorizado na Fig. 1.12, onde T representa o intervalo de amostragem da comunicação.

o

POGEIN E

,

EE RR | Emissor Emissor

|

Es

Troposférico

|

|

piso E

4

E

E

7

|

|

Receptor

nedo

asa

200 - 600km

coeficientes

Fig. 1.10. Um sistema de comunicações troposférico

Este canal de comunicação tem, portanto, características variáveis no tempo | e o seu efeito prejudicial é combatido com um igualizador adaptativo, representado na Fig. 1.11 pelo filtro “inverso”. O papel deste filtro é o de daqui a chamada interferência intersimbólica, que comoo próprio nome indica, consiste na influência que os sucessivos símbolos de informação de uma transmissão digital têm uns nos outros, influência que é perniciosa na medida em queo receptor, nessa situação, tem mais dificuldade em reconhecer ou identificar os símbolos e terão sido Fa pelo emissor. Para que não haja interferência intersimbólica à entrada do desmodulador teoricamente o conjunto canal+igualizador deve ter uma funçã transferência de módulo constante. ER

Transmitido E

Sinal

Recebido.

igualizado

Canal de

Igualizador

ou Filtro Inverso

Desmodulador TESS

| Avaliação | — — — — — 3] de | qualidade [ea

Fig. 1.12. O igualizador como filtro transversal FIR.

Para além dos canais atmosféricos, os filtros adaptativos são também usados para igualizar cabos coaxiais, pares entrançados delinhas telefónicas ou outras linhas de transmissão que necessitem de igualização. Sendo adaptativo, o filtro ajusta automaticamente as suas características a diferentes comprimentos de cabos. 1.3.3. Cancelamento de interferências em electromedicina

Siinal

propagação troposférico

|

ps mag |

T+

Selecção de

Sinal -

|

|

Ivalizador q

|

|

Desmodulad E

Fig. 1.11. Emprego de um filtro “inverso” para igualizar o canal troposférico.

e Neste exemplo o igualizador é simplesmente um filtro transversal FIR com coe icientes que variam no tempo de tal maneira quea sua função de transferência se vai progressivamente aproximando do inverso da função de transferência do canal: 2

O processamento adaptativo encontra aplicações muito úteis em electromedicina. Por exemplo, veja-se como se pode proceder para eliminar a influência da frequência da redeeléctrica (50 Hz) no funcionamento de equipamento de instrumentação médica, como o usado em exames electrocardiográficos. Em electrocardiografia faz-se a representação de descargas eléctricas cardíacas captadas por eléctrodos convenientemente colocados no peito dos pacientes. Ora acontece queos valores dos impulsos eléctricos envolvidos são muito baixos e nem sempre o percurso do coração até ao sensor apresenta boa condutividade, havendo necessidade de melhorar a resistência de contacto da pele com o eléctrodo através do uso, por exemplo, de gel para adaptação de índices de refracção. Em circunstâncias tão desfavoráveis qualquer interferência exterior, mesmo ínfima, é um grande obstáculo à correcta representação eléctrica dos sinais

24 cardíacos e à sua interpretação pelos médicos. Uma destas interfer ências provém das tomadas de corrente na parede, pois os fios dos aparelhos, actuand o como antenas, captam o sinaltde S0Hz da rede eléctrica. Para então reduzir o efeito deste ruído é conveniente usar um esquema adaptativo (veja-se a Fig. 1.7) no qual a entrada de referência, que é só interferência, provém de uma tomada na parede e a entrada primária, que contém sinal útil mas também ruído, provém do peito do paciente, como na Fig. 1.13. Ao filtro adaptativo basta ter dois coeficie ntes que forneçam os dois graus de liberdade necessários ao cancelamento de uma sinusóide pura: um coeficiente para a sua amplitude e outro para a sua fase.

o

*

Adaptativo

A

Sinal de

Cancelador] de eco

erro

Receptor dd Modem

ZDe s

Fig. 1.14. Cancelamento de eco na linha telefónica.

Datomada de corrente (50 Hz)

Dá Processador

Emissor do Modem

[7

E = s

e

ECG

Rs

paciente

Fig. 1.13. Cancelamento da frequência de rede em electrocardiografi a.

Desta maneira o sinal de erro, que é o sinal de entrada do aparelho de electrocardiografia, fica gradualmente mais “limpo” do sinal de 50Hz indesejável. Do mesmo modo, se se desejar ouvir o batimento cardíaco de um feto no

ventre da mãe, pode colocar-se um eléctrodo sobre o abdóme n da mãe (constituindo o sinal primário) e outro sobre o seu tórax (sinal de referência), sendo assim possível destrinçar melhor o batimento cardíaco do feto do da mãe, que é naturalmente muito mais intenso. 1.3.4. Cancelamento de eco na linha telefónica

Natransmissão de voz ou dados nalinha telefónica o sinal remoto que chega ao receptor local vem misturado com ecos (ondas reflectidas) devido a factores como a desadaptação de impedâncias em conversores ou transfo rmadores ditos híbridos. Os ecos deverão ser eliminados, ou cancelados, para que o sinal proveniente do emissor remoto:chegue aoreceptor local em boas condições. Para isso usam-se filtros adaptativos designados por canceladores de eco [Weins tein77] [Sondhi80], colocados em paralelo com o percurso de eco dos híbridos com o fim de o modelizar, como se mostra na Fig. 1.14. Por outras palavras, a função de transferência do cancelador de eco deve convergir para a função de transfe rência do percurso de eco para queo sinal de erro seja evanescente.

1.3.5. Supressão de ruído em cabinas de avião As cabinas dos aviões são algo ruidosas, em parte devido ao ruído das turbinas. Ora é possível tornar o ambiente do avião mais silencioso se se usar mi esquema idêntico ao da Fig. 1.7. Um microfone colocado no Extenion capta o ruído dos motores do avião, ruído que constitui a entrada de referência do circuito. A

entrada primária é obtida no interior do avião através de pes outro microfone, que capta o ambiente sonoro da cabina, ambiente que inclui pita de fundo de origem exterior correlacionado com o do outro microfone. E esse ruído de fundo que se quer “abafar”. Com software adequado e um conjunto de altifalantes a produzir sons que replicam o ruído exterior em oposição de fase é possível aumentar o conforto auditivo da viagem [Texas Instruments96]. Esquema idêntico ss pode considerar na comunicação do avião para a torre de controlo: aí a entrada primária é a voz do piloto mais o ruído ambiente do “cockpit”. Nos capítulos seguintes vamos apresentar as técnicas e os algoritmos adaptativos usados nas diversas classes e aplicações mencionadas.

26

1.4 Resumo

ES 2. ESTRUTURAS, ALGORITMOS E DEFINIÇÕ

Neste capítulo fez-se a apresentação do processamento adaptativo como método utilizável em diversas ciências, depois de terem sido feitas algumas considerações de ordem genérica sobrefiltros, incluindo o filtro de Wiener. Consoante a aplicação, viu-se comoas diversas situações se podem inscrever em quatro grandes áreas do processamento adaptativo: predição, identificação de sistemas, igualização e cancelamento de interferências. O capítulo terminou com a apresentação de vários exemplos de aplicações onde o processamento adaptativo tem sido usado com sucesso.

Estruturas de filtros adaptativos Famílias de algoritmos adaptativos Algo sobre matrizes Definições para uso futuro Resumo

21. Estruturas defiltros adaptativos rados no tempo a uma Os sinais que vamos encontrar são sinais amost ser discreto, em vez de contínuo, e cadência regular, bem definida. O tempo passa à ua passamos a ter um conjunto de em substituição de uma forma de onda contín subsequentemente. amostras (ou números, afinal) que vão ser processadas digital. A diferençaestá O processador adaptativo assume a forma de um filtro Os coeficientes têm que s, em em que, ao contrário dosfiltros digitais convencionai , à medida que tempo variáveis no valores fixos, aqui os valores dos coeficientes são decorre o processo de adaptação. tomar a forma recursiva ou Sendo um filtro digital, um filtro adaptativo pode os filtros nela baseados têm uma não-recursiva. Esta é a mais vulgarmente usada e denominadosfiltros FIR, de serem (daí resposta impulsional cuja duração é finita no instante discreto n está y(n), Finite Impulse Response). A saída destes filtros, diferenças às ão relacionada com a sua entrada, x(n), através da equaç N-1

ym)= Sen-k),

(2.1)

k=0

filtro FIR. onde cy representa os N coeficientes, ou pesos, do

ta impulsional do filtro, mas Dadaa forma da Eq. 2.1 cy acaba por ser a respos

poderemos concluí-lo de outra maneira:

29

28

Por definição a função de transferência H(z) de um filtro é igual à razão entre a transformada em z da saída, Y(z), e a transformada em z da entrada, X(z); é também a transformada em z da resposta impulsional amostrada, hp:

rd Wo4

H(2) Xe”re .

(2.2)

Comoa função de transferência correspondente à Eg. 2.1 é N-1

H(z) = * ser

b) Filtro “lattice“ Fig. 2.1. Estruturas não-recursivas

(2.3)

k=0

concluímos que os valores doscoeficientes cy de um filtro FIR representam a própria resposta impulsional dofiltro.

E

de duração infinita — Infinite A estrutura recursiva possui uma resposta impulsional 2.2 na sua forma canónica Impulse Response (IIR) — e é apresentada na Fig. [Oppenheim83].

É possível realizar um filtro de resposta impulsional finita através de diferentes estruturas; as mais usadas são as estruturas transversal e “lattice”,

apresentadas na Fig. 2.1. A estrutura transversal é a realização directa da Eg. 2.1. A estrutura “lattice” é uma realização equivalente, composta de vários andares idênticos. Os seus coeficientes km chamam-se coeficientes de reflexão ou coeficientes PARCOR

(“partial correlation”).

Fig. 2.2. Estrutura recursiva (filtro TR).

a) Filtro transversal.

é idêntica à estrutura Esta estrutura é composta de duas secções: uma is de entrada e saída Ossina o. não-recursiva e a outra é uma malha de realimentaçã estão relacionados através de

30 N-1

M

k=0

k=1

y(n) = > apx(n— k)- 3 beoXkn-k)

(2.4)

EE e X(2) 1+B(z)' N-1 k=0

É

No método dos mínimos quadrados (ou LS, de “least squares”), a apresentar no Capítulo 5, a estimativa da função de custo (o erro quadrático) é obtida a partir dos dados disponíveis num dado instante, tratados de forma recursiva e normalmente

M

e B(z)= Sof, dando origem ao esquema equivak=1

lente da Fig. 2.3. Substituindo os valores de A(z) e B(z) obtemos então a função de transferência expressa em função dos M pólos by e dos N zerosay:

H(7)

= 20 + az + digtecenirdã]ND (2) = 5 5 STE l+bjz+byz“+...+byz

Entrada

e método do gradiente. Estes não são os únicos métodos possíveis. Uma alternativa recente usa algoritmos genéticos nafiltragem adaptativa com filtros IIR [Ng96].

a que corresponde uma função detransferência

em que A(z) = 3 az

e método dos mínimos quadrados

(2.5)

Saída

enquadrados numa janela rectangular com memória. A este método chama-se, por isso, método dos mínimos quadrados recursivos, ou RLS (“recursive least squares”); uma variante do método usa uma janela exponencial negativa em vez duma janela rectangular, para esquecer o passado mais rapidamente, o que é conveniente quando o sinal de entrada não é estacionário. No método do gradiente! a actualização de parâmetros faz-se recorrendo ao gradiente do erro quadrático médio. O método será apresentado no Capítulo 3. Na prática usam-se algoritmos simplificados que iremos ver no Capítulo 4. Os métodos de mínimos quadrados apresentam grande complexidade computacional mas são rápidos a convergir; pelo contrário, os algoritmos baseados no método do gradiente são computacionalmente pouco complexos e extremamente robustos, permitindo implementações simples, mas a convergência dos coeficientes do filtro adaptativo é mais lenta que nos outros métodos referidos. Antes de apresentarmos estes métodos precisamos de recordar alguns conceitos da Álgebra Linear e estabelecer algumas definições prévias.

Fig. 2.3. Filtro IIR equivalente aofiltro da Fig. 2.2.

Se o filtro não tiver malha de realimentação (B(z) = 0) a estrutura deixa de ser recursiva e a resposta impulsional passa a ter uma duração finita. Daqui para a frente iremosusar exclusivamente filtros transversais FIR porque são os mais vulgarmente usados, dada a sua simplicidade relativa.

2.2. Famílias de algoritmos adaptativos A minimização da função de custo recorre normalmente a um de dois métodos:

2.3. Algo sobre matrizes Nos próximos capítulos estaremos em contacto permanente com operações sobre vectores e matrizes. É a hora de fazermos uma breve revisão de algumas definições e propriedades [Luís85].

2.3.1. Matriz inversa

Uma matriz A tem inversa, AÍ, se esta for tal que AA -T,

'Naliteratura anglófona este método é também designado por method of steepest descent, que poderemos traduzir por método da descida mais íngreme.

33

32

E condição necessária e suficiente de existência de inversa que o determinante de A seja diferente de zero. Uma matriz invertível denomina-se matriz regular. Se não for invertível diz-se singular.

à

1-3)

3-5j

4

ida

1+3;

2

-S-j

2+j

8-4;

3+5)

—5+j

2

13

10+5j

4

2-j

13

2

-Tj

2-2j

8+4j

10-5j

Tj

2

2.3.2. Transconjugação A matriz transconjugada de A, designada por AHéa que se obtém daquela por transposição e conjugação dos seus elementos. Por exemplo, a transconjugada de

2 A=|1-2;

3

3+3j

1

2

1-3;

Diz-se que uma matriz é uma matriz de Toeplitz se os elementos da diagonal principal forem iguais e se os elementos das outras “diagonais” paralelas também forem iguais. Se quiséssemos recorrer a uma analogia cromática em que cada elemento fosse representado por uma cor, uma matriz de Toeplitz seria uma matriz às riscas (oblíquas). A matriz seguinte é uma matriz de Toeplitz:

2+j

6j] for um vector, o seu vector

2

bÉ =

elementosreais é, obrigatoriamente, uma matriz simétrica.

2.3.4. Matriz de Toeplitz

é a matriz

Do mesmo modo, seb=[2 transconjugado é

é um exemplo de uma matriz hermiteana complexa. Uma matriz hermiteana de

2.3.5. Valores próprios e vectores próprios

1+3;

A cada matriz quadrada A, de dimensões NxN, podemos associar um conjunto de N valores escalares Ajo chamados valores próprios. A cada valor próprio A; está associado um vector Q;, chamado vector próprio.

2-j -6j

Os valores próprios da matriz A determinam-se resolvendo a equação 2.3.3. Matriz hermiteana

homogénea

Uma matriz A é hermiteana se for igual à sua matriz transconjugada,

“AH

.

o.

A=A“. Os elementos da diagonal principal de A são necessariamente reais.

A matriz

(2.6)

[A-21]Q;-0

Nesta equação À é umavariável escalar, I é a matriz identidade NxN, Q ; é um vector coluna Nx1 e 0 é um vector nulo Nx1. A equação tem soluções não triviais

para À e Q; se e só se o determinante det[A — AT] = JA — Al) for nulo: JA -AI|= 0

cs bl LEA

(2.7)

UNIVERSIDADE FEDERAL DO CEARÁ

34

35

Esta é a equação característica de A, afinal um sistema de N equações a N incógnitas cujas soluções, À,, À,,..., À, , são os valores próprios de A. Correspondendo a cada hj existe pelo menos uma solução vectorial da Eg. 2.7 determinada a partir da

associada aos chamados modos naturais de alguns algoritmos. Q é uma matriz ortonormal, o que quer dizer que o produto pela sua transconjugada é a matriz identidade,

Eq. 2.6 ou, o que é o mesmo, a partir de

AQ; =2;Q;.

(2.8)

Esta equação diz-nos que o produto da matriz A por um dos seus vectores próprios Q); é um vector proporcional a Q;, mantendo portanto a mesma orientação. Por outras palavras, em vez de multiplicarmos o vector Q;por uma matriz basta multiplicá-lo por um escalar.

(2.11)

Q”Q-I, e portanto a sua inversa é igual à sua transconjugada,

(2.12)

q! -qr.

A suacoluna de ordem j (Q;) é o vector próprio de A associado ao valor próprio dj Cada Q; tem comprimento unitário e é ortogonal a cada um dos outros vectores

Desenvolvendo a Eq. 2.8 para j=0,1,..., N-1 obtemos

próprios, devido à ortonormalidade de Q: t

QUQ,=ôj AO

OQ. Qua]-[0

Qu

Na equaçãoanterior Ô;; representa o delta de Kronecker,

que podemos compactar em AQ=QA.

(2.9)

1

i=j

óy=lo

izj

Se na Eg. 2.9 multiplicarmos à direita por Q1 obteremos finalmente a chamada forma normal de A

Em (2.9) A é a matriz diagonal dos valores próprios de A,

o

Ao

0

0

o

4

0

o

0

Ay

ij=01,..,N-1

A=QAQ”!- Q4Q”,

(2.13)

equivalente a

(2.10)

Q'AQ-QUAQ-A,

(2.14)

obtida multiplicando (2.9) à esquerda.

é Q-[9

Das

On] é a matriz dos vectores próprios de A, também

denominada matriz modal de A porque, como veremos na altura própria, está

Ao quociente entre o maior e o menor valor próprio chama-se disparidade de valores próprios, D:

36

D = Amax

(2.15)

Amin

A multiplicação de uma matriz quadrada NxN por um vector Nxl origina um novo vector Nx1. No caso geral este novo vector tem uma direcção e um comprimento diferentes do original. Há ocasiões em que, todavia, o novo vector tem a mesma direcção ou o mesmo comprimento. Já encontrámos antes a primeira dessas situações, em que o produto dava origem a um vector com a mesma orientação: se uma matriz quadrada for multiplicada por um dos seus vectores próprios o vector resultante é colinear com ele e o seu comprimento é proporcional ao valor próprio correspondente (veja-se a Eq. 2.8 a este propósito). E quando é que o vector resultante tem o mesmo comprimento, masdirecção diferente? É quando o multiplicamos por uma matriz ortonormal, como Q. De facto, se considerarmos um vector Nx1 arbitrário, V, e o multiplicarmos por Q obtendo V' = QV, a norma

1) Determine as matrizes de valores próprios e de vectores próprios de B.

2) Use o vector V= [1

R.: 1) Determinação de valores e vectores próprios. Os valores próprios de B são obtidos a partir da equação de 2º grau

dei[B 1] bos

c

s

-s

€

| = |

cos 0

senô

-sen6

cos6

| ,

A=

(2.16)

í

o vector ao qual foi aplicada esta matriz diz-se que sofreu uma rotação de Jacobi, ou rotação de Givens? [Haykin96]. O ângulo de rotação é 0, medido no sentido dos ponteiros do relógio. Como o comprimento não foi alterado diz-se queas rotações de Givens preservam o comprimento. E

1. Exemplo de cálculo de valores e vectores próprios

R

.

P.: Considere a matriz quadrada real B =

0,5

0,25

0,25

0,5

.

? Naliteratura de Processamento Adaptativo usa-se mais o segundo termo (rotação de Givens).

0,25

0,5- à

3 =1/-1+0,1875=0

cuja solução é

IviIÊ = vv -=(qv)! qv=vZQrov=vYIv=|v

O = |

0,5-A =|

e

quadrática deste é igual à norma quadrática de V:

No caso particular de uma matriz quadrada real e ortonormal de dimensões 2x2, dada por

2 para ilustrar uma rotação de Givens.

0,25

=

0,75

A=

0,25

0

0

0,75

Os valores próprios obtidos são positivos e a disparidade vale

Os vectorés próprios podem ser calculados através de BQj = À; Qj ou de [B - NIQj= 0. Fazendo as contas determinamos

Q=

doo

Ho

IJ

1

0,25

0,25

doo

ne

0,25

go1

o

doo

== |

doi

q

|

1 — constante

>]

No -0,25

0,25

0,25

-0,25|

Io

[gn

=0

o qu

=

c2

co — constante

c2

T . Vamos normalizar a matriz Q (de modo que QQ" =T):

38

00” =|

q

GQ

2 2; la = ci [+04 +Cc o Eh

lo

Daqui se tira que cj =

c

2

2

=ci i +c|

“ef +

ci +c3

1 = VZ pelo que,finalmente,

O comprimento é ||QVI| = 5 , igual ao comprimento de V, portanto,

prevíramos. Uma representação gráfica mostraria que efectivamente houve uma rotação de 45º no sentido dos ponteiros do

como

relógio.

O

2.3.6. Traço de uma matriz quadrada

Repare-se que os vectores próprios de B são ortogonais (produt o

Os elementos principais de uma matriz quadrada são os elementos da ua diagonal principal. O traço de uma matriz quadrada A, designado por tr[A], é simplesmente a soma dos elementos principais da matriz. Assim, sendo

interno nulo):

YO, = %Wo hot Ih =1-1=0 Repare-se ainda que o produto da matriz B por um dos seus vectore s próprios origina um novo vector com a mesma direcção e cujo comprimento vem multiplicado pelo valor próprio correspondente . Tomemos como exemplo Q,. Se o multiplicarmos por B (à direita) é de

aq

2

A=|:a21

a22

an1

ana

0,25

“2

2) Rotação de Givens

A matriz modal Q apresenta a mesmaforma da matriz de Givens, O, da

Eg. 2.16, com

arecos(g99 ) = arecos(1/V2 ) = 45º. Logo, qualquer vectorreal que for multiplicado por esta matriz será rodado de 45º e mantém o seu comprimento. É fácil de o confirmar com o vector real

V-[1

4ia é

q2N

...

|

.

aNN

N

asnel o 0sha]

1/2)

MN

o seu traço é

prever queo resultado seja 1/0; = 0,750:

BO, - | 0,5

nã 5

2:

vz lia)

( 2.17)

tr[A] = 3 aii i=1

Por exemplo, o traço da matriz

2 A=-|6 2

1/4 4 6 2 4

é tr[A]=2-4+4=2. O traço de uma matriz é também igual à soma dos seus valores próprios, N-l

mAl= SA;

(2.18)

j=0

UNIVERSIDADE FEDERALD CEARA Pihlintara da Ciênciac a Tarn

MIA

40

41

Os valores próprios da matriz do exem plo são Ag =4,075+ j2,736, AM =4,075- ;2,736 e À2 =-6,15, conf irmando a Eq. 2.18.

* O traço é negativo, t]A]0.

2.3.7. Característica de uma matriz

H

Chama-se característica? de uma matri z A, designada por r(A), ao núme ro máximo delinhas ou colunas que

são linearmente independentes.

O número de linhas linearmente independ entes é igual ao número

semidefinida positiva, ou definida / não-negativa, i j se e sóÓ se v"Av=>0, qualqu er que seja v,e vZAv=0 com algum v=0.

de colunas linearmente independentes; é indif erente, portanto, definir a caracterís tica da matriz à custa das linhas ou das colunas.

e A característica de A vale r(A)0.

Uma matriz quadrada A, de dimensõe s categorias:

NxN, classifica-se em cinco

* definida positiva, se e sóse v/Ay > O, qualquer que seja v=0,emque v éum vector Nx1.

º À característica de A vale rA)=N.

* Todos os valores próprios de A são positivos.

r(A) valores próprios são positivos e os restantes N-r(A) são nulos.

* O determinante é nulo, det[A|=0. H

e semidefinida negativa, ; see sóÓ se v“Av0.

* O determinante é nulo, det[AJ=0.

* definida negativa, se e só se vZAy < O, qualquer que seja v = 0. º A característica de A vale r(A)=N .

* Todos os valores próprios são negat ivos. * Em inglês a característica de uma matriz é designada por rank.

H º indefinida, se e só se vHAv>0 para algum v,e v/Av(n) e os processos x(n) e 9,(n) são não-correlacionados, então R é igual à soma da matriz de autocorrelação

Mas d(n) é também a entrada do canal de comunicações:

x(n)=d(n)-byx(n-1) ou x(n)+ byx(n— D)=d(n), com bj = 0,65.

de x(n) com a matriz de autocorrelação de 9,(n): R=R, +R,. 2

Ora R,=E = tm)

x(n)x(n 1)

Hode(o 1) . Prova-se! que x2(n-1)

Observando a figura anterior vemos que a saída do canal, x(n), pode ser obtida aplicando o ruído 9 (n) a um filtro de 2º ordem com função de transferência

H(e) = Hi(2)Ho(2) = (1

1

40,577] TÁ -0, 6501) - 1-0,1571-0,32572

apresentada na figura seguinte. A respectiva equação as diferenç as é

x(n)+asx(n-1)+agx(n-2) = 9 (n)

com

aa = -0,15

aq = -0,325 N

Logo, ! Ver “Adaptive Filter Theory”, S. Haykin, Prentice-Hall, 1991, 2.º Ed., Sec. 2.9.

59

1,4 0,22

0,22 1,4 |

e =1,588-2[1,257

Como &,(n) é ruído branco com média nula e variância of = 01,

com amostras não-correlacionadas, então R, = [o R=R,+R; =

1,5

0,22

0,22

1,5

0,|: Portanto,

-0,69]

Cc

j

c

|+[co

a]

15

0,220

0,22

15

2 - 1,588 -2,514 cy +1,38 cy +0,44c9c) + 1,5 (cô2 +c7)

A Fig. 3.4 mostra as curvas de nível da superfície de “performance”. 4) Filtro de Wiener

Osvalores próprios desta matriz são Ag = 1,28 e A =1,72, pelo que

Os coeficientes óptimos do filtro, no sentido da minimização do erro

quadrático médio, são a solução da equação de Wiener-Hopf, Rc,p; =P. Substituindo valores:

a disparidade vale D=1,34. Quanto ao vector p podemosescrever:

1,5

o

E[d(nJu(n)] = Efa(n) v2(n) + x(n)]h = E[d(n) vo (n)]+ Eld(n)x(n)]0

= Elfx(n) +byx(n-1)De(n ) = E? (n))+ by E[x(n)x(n - 1)] 1,40

0,22

isto é, E[d(n)u(n)|=1,4+0,22by = 1,257.

0,22

s| Ciopt

=

|-0,69

0,9254

Coopt

1,257

COopt

=>

Crop

=

|-0,5957

Seria fácil de' confirmar que, sem ruído aditivo no canal, Copt =[1

-0,657, de modo que o produto da função de

transferência H>(z) pela função de transferência do filtro de Wiener

seria unitário, como era de esperar.

A

Da mesma maneira Eld(n)u(n - 1)] =0,22+1,4bj = -0,69, logo 1,257 —0,69 | 3) Superfície de "performance"

E = [a?(n) |- 2pTc+clRc

cá Substituindo valores:

|lc

10

Fig. 3.4. Curvas de nível da superfície de “performance”

-

F

60

5) Erro quadrático médio mínimo

Emin = E[d(n)]-p7op = 1,588 [1,257 -0,69]

0,9254 —0,5957

61

=

TA

E — Emin = 3 2;[(€- copo) Q;|

= 0,0138

2

/=

(3.8)

À diferença entre o vector de coeficientes c e o valor óptimo Copt Vamos

| i 3.4 confirma estes resultados. A Fig.

chamar vector de erro dos coeficientes, ce:

L]

|

3.2. A superfície de “performance”

|

.

Vamos aprofundar a análise da superfície de “performance”. Iremos chegar à conclusão que esta muito depende das características do sinal de entrada. De facto, veremos que a matriz de autocorrelação de entrada, R, é o principal factor condicionante da forma da superfície. E habitual definir novos vectores e introduzir uma mudança de eixos. Os nossos pontos de partida são as equações 3.2 e 3.6, aqui repetidas:

c=€-Cop Convém definir um segundo novo vector

T |

T

(3.10)

v=0 €.=Q (€-Cop)

Chegamos então a

= emin + 6.7 (QAQT e, = z E T To. Emin +(Q' e,)' AQ" e, =

e = Eld?(n)]-2e"p+ cTRe >

(3.9)

mn I

[1

311 (3.11)

T

= Emin tV Av

E

Emin = Hd (m]-p Copt Ao contrário das equações 3.7 e 3.8, esta expressão não tem termos cruzados,

o = de emin à primeira : Se subtrairmos a equação e nos desembaraçarmos do

como se vê na equação seguinte: E

vector p usando a equação de Wiener-Hopf, Rcp; =P» obtemos

NA o

.

ly.

E=EmintV AVv=Emin+ 3 A; Iv;l

(3.12)

j=0

coeficientes a superfície de de um filtro com. apenas dois Nocaso particular — ; “performance” é representada pela expressão quadrática

E — Emin = cTRe - (Ze — Copr)” Re opt T =c FR R(c- Copt) E —(c- Copt) RCop

Ê

=(c-Copi) Re-(c- Copt)' RCopr =

T

=(C-Cop) R(C-Cop;) NI Como R=QAQ” = 3 A;Q105 , então j=0

E= Ein th vida VÊ2

(3.13)

(3.7)

Para um valorfixo de e a Eq. 3.13 representa umaelipse centrada na origem,

com semieixos de comprimentos (e -emin)/Ão e (e - Emin)/A

situados

ao longo doseixos dos v, e dos vj, respectivamente. Se considerarmos diferentes valores de £ obteremos um conjunto de elipses concêntricas. Se A = Aq, as curvas são circunferências.

63

62

Concluimos que as curvas de nível da superfície de “performance” serão tanto mais excêntricas quanto maior for a disparidade de valores próprios da matriz R, como se mostra na Fig. 3.6 com três exemplos de curvas de nível. A Eq. 3.10 corresponde a uma rotação do sistema de eixos de cp. O que fizemos de facto foi: em primeiro lugar (Eq. '3.9) procedemos a uma translação de eixos, passando de um sistema de coordenadas cujos eixos são os elementos de c para um sistema de coordenadas cujos eixos são os elementos de cg; em segundo lugar (Eq. 3.10) rodámosos eixos cp e obtivemosos eixos v. Sendo N=2, por exemplo,

os dois eixos vo9V; são representados respectivamente pelos vectores unitários No =[1

o” e N;=[0

mM, cada um deles correspondendo a um valor

próprio da matriz R. As suas coordenadas no “velho” sistema de eixos c,oc,j São Fig. 3.5. Os três sistemas de eixos, €, Cp € V.

Ioo

Co = QNo = Qo = dn q

E

isto é, os eixos das elipses, dispostos segundo Ny e Ny, são iguais aos vectores próprios de R. A Fig. 3.5 procura ilustrar a situação apresentando em conjunto ostrês sistemas de eixos. O ângulo O vale, portanto, arc cosqoo. O caso N=2 é apenas um caso particular: as considerações sobre os eixos aplicam-se a qualquer dimensão N. Um caso em que todos os valores próprios são iguais ocorre quando a sequência do sinal de entrada a(n) é estatisticamente independente (sinal branco). Nesse caso a matriz de autocorrelação de entrada R é diagonal, com todos os

e curvas de 3. Exemplo: Erro quadrático médio, disparidade nível

cie de Na Fig. 3.6 são apresentadas curvas de nível da superfí valores aos s ondente corresp vov1: € “performance” nos planos cocq da tabela seguinte. Dados

Matriz R

elementos da diagonal iguais à variância do sinal: R = oil (e A; = o2 » para j=0, 1, ..., N-1). As curvas de nível serão circunferências concêntricas.

Caso a)

Caso b)

Caso c)

2

0,1

2

1

2

1,5

os

2

1

2

Lô

2

7

7

7

8

8

8

Eld2(n)]

54

42

42

Disparidade D

1,1

3

7

Vector p

OCEA) FEDERALD UNIVERSItecDAa DE icenciogie de Ciências = Biblio

64

Nota-se bem que quanto maior é a disparidade mais as linhas

Il

isométricas da superfície de “performance” são excêntricas. No primeiro exemplo a disparidade está próxima do valor mínimo, 1, e as curvas de nível são “quase” circunferências, o que já não acontece nos outros dois exemplos, em que as disparidades são mais elevadas.

0.5

=

o

a

O

1 a

1

o

Emin = E[d(m)|-pTcop =0,17

o

;

No caso a) podemos obter as seguintes expressões e valores:

J

c) Disparidade D = 7. Fig. 3. 6. Disparidade e curvas de nível.

SEO

2

4 E

Razão entre eixos das elipses, no plano vov7: -0.5

0

0.5

1

E-Emin do

3.6a) Disparidade D = 1.1.

|

E — Emin

A 1,05 Ag

Ai

No caso b) temos: Emin * 4

w

2 g=4+ vê +3V7

o

C41

= 1,73 Razão entre eixos, no plano vov4 : 3

o a

Re qro

4 10

e no caso c), finalmente:

Emin = 8,86 E =8,86+0,5v9 +3,5VI Razão entre eixos, no plano vov7 : N7 = 2,65

3.6b) Disparidade D = 3.

SQAMEANVIM Ot

2

E =EmintÃo vê +A) vZ =0,17+1,9v9+2,1v]

-0.5

66

67

A expressão do erro quadrático médio em função dos coeficientes c

expresso de outra forma. De facto, como e(n) = d(n) — c7 (n) a(n) e podendo nós

contém termos cruzados. Usemos a Eg. 3.8 para o comprovar no caso

b), para o qual

Con;

=

2

A=

trocar os operadores E e à dada a sualinearidade, obteremos

es)

0

3

)j de(n) o: 9e?(n) = Fl2 de(n) 9ELe? (n)] E [e(m)a(n 0 ge(n) V(n) = El = dead o) |

1 3.15)

2I1/1

Assim, a Eq. 3.14 pode ser reescrita como

De facto, depois dos desenvolvimentos chegaríamos a

e(n + 1) = e(n) + 2uE[e(n)a(n)]

(GRADIENTE)

E = Emin +Ão [e - Cop)” Qo Ef +A [e = ep” Qi| =

= 4+(206 +0,2c9cy + 207 +8,6c0 — 22,4c1 + 27,2)

(3.16)

O erro quadrático médio e(n) = Ele? (n)] varia com o tempo — no fim de contas o objectivo é minimizá-lo. Isto significa que o erro de estimação e(n) não é

A simplicidade da equação em função de v,

E=4+ vê +3v2, é

estacionário.

notável quando comparada com a que acabámos de obter. [1]

3.3.1. A descorrelação entre o erro e o vector de entrada

No fundo da superfície de “performance” o gradiente é nulo e e(n) = Cop; -

3.3. O algoritmo do gradiente

Então podemos concluir que, quando e(n) = e opt * O erro e(n) e os sinais de entrada

Como atingir Copt sem efectuar as operações da Eq. 3.5, que implicam

calcular o vector p e a matriz R e seu inverso? Uma maneira é fazer como já se esboçou anteriormente: os coeficientes do filtro deverão ser ajustados iterativamente de forma a descer-se pela superfície de “performance” abaixo, subtraindo ao valor anterior de c um termo proporcional ao gradiente. A equação de actualização respectiva resume o algoritmo do gradiente:

não são correlacionados, porque, da Eq. 3.15,

V(n) = -2Ele(n)a(n)] = 0

(se e(n) = Copr)

(3.17)

Esta conclusão, que também se aplica aos filtros de Wiener, é uma

manifestação do chamado Princípio da Ortogonalidade [Haykin96] [Honig84].

e(n+D)=e(n)-uV(n)

(3.14)

3.4. Modos naturais e convergência A constante q é uma constante de proporcionalidade positiva, chamada passo de adaptação, de que depende o desempenho do algoritmo, como veremos. O gradiente da Eq. 3.4, que agora se passa a designar por V(n), pode ser ? O vector c passará a ser designado por e(n) para evidenciar que os seus elementos variam no tempo.

3.4.1. Modosnaturais

A análise do desempenhoe da convergência do algoritmo recorre ao vector de erro dos coeficientes e ao vector v(n). Comecemos por subtrair Copt à ambos os membros da Eq. 3.14, tendo em conta a Eg. 3.4:

ET

68

69

e(n + 1) -— Copt = (1- 2uR)c(n) +2up-— e opt

-(1-28Rfe(m) -cop|

(3.18)

A solução da Eg. 3.18 é

e(n)- Cop; = (1-24R)"fe(0)-c,,,|

(3.19)

Para qualquer matriz A verifica-se (QAQ!)* = QA*Q”!. Como QQT-=T e

R=QAQ-I=QAQT , então

(1-2uR)” =(QQ” -2uQAQ” " -[Q(I-24A)QTT =QA-2UA)" QT

A equação matricial 3.23 representa um sistema de N equações

voln) vi(n)

[(1-2uAo) 0

vn(1)

0

j=01,..,N-1

(3.25)

O elemento vj(m) é o j-ésimo modo natural do algoritmo do gradiente. Para que o algoritmo convirja os modosnaturais deverão diminuir à medida que n cresce,

Teremosentão

quer dizer,

(3.20)

lim vj (n) = 0. Então deverá ser sempre, para cada um dos N modos

n>0%0

naturais de convergência,

-2uAjl Hopt -

(n) = e(n)- 8,86 = 2,25x 0,92" 42,89 x 0,37”

u> Uopr

| A primeira exponencial, 2,25 x 0,92", corresponde ao modo natura M: de natural do valor próprio Ag, O menor, e a segunda ao modo

4=0,025

u=0,1

H=0,25

H=0,265

A0=0,5 — 2,25x0,9"

ro

0,975

0,90

0,75

Hr

0,74

0,825

0,30

-0,75

a -3,5 — 2,89x0,32

To

-0,86

39,50

9,49

3,48

Tj

3,25

520

0,83

348

Tmse,0

6,38

19,75

4,15

1,74

Tmse,1

1,62

2,60

0,42

1,74

vo(20)

3,19

13113

0,2866

0,0090

vi(20)

0,0061

-0,0235

0

0,0038

co(20)

0,0463

2,0534

1,3455

1,1519

c1(20)

1,1799

2,1990

2,9402

3,1392

s(20)

3,1713

9,7188

8,8982

8,8572

-

8,8647

9,73%

0,46%

0,001%

0,08%

Emin

2n

Tomando o caso de |J=0,1 como exemplo o erro quadrático médio em excesso vale

Eexc

1

Uopt

3.48:

2

Tabela 3.1 Valores obtidos nos exemplos

Tere

e(n)= Emin + VO(O)Ão (1 24A0)7” + vi (0)M (1 247) 2

A Tabela seguinte agrupa os resultados mais relevantes associados aos

PE Rs

Os valores da última linha quantificam percentualmente a qu ao valor mínimo do erro quadrático médio. Nota-se bem a influê do passo de adaptação na convergência do algoritmo.

A Tabela mostra que os modos mais lentos estão associados ao valor próprio mais baixo quando u=0,025 ou H=0,1 (vejam-se as suas razões

geométricas ou as constantes de tempo) e ao valor próprio mais elevado quando |=0,265. Quando o passo de adaptação tem o valor óptimo ambos os modos decrescem com a mesma velocidade.

Este último modo tem uma razão geométrica, 0,3, mais baixa Das primeiro, e por isso diminuirá mais rapidamente com O tempo. ver isso representando £,yc(n) graficamente na Fig. 3.16, juntamente itui ntes. Pode observar-se que Ex (n) v ai com as duas parcelas constitui

diminuindo em direcção a zero com uma velocidade que depende

nitidamente do modo mais lento, correspondente ao valor promo menor, Aq. Se essa velocidade de convergência só dependesse do ou ; à modo natural o erro quadrático médio em excesso evanescia logo figura. a com segunda iteração, de acordo

89

88

18 17+ 16+ e(n) 15f 14h 13+

N

/:

Tmse,1

Tmse,0

lterações

10

Es

12 a

10

15

20

n

Fig. i g 3.16. 6. A curva de aprendizagem e as suas exponenciais decrescentes, quando u=0,1 Caso 4)

5

na situação divergente (Hu = 0,29). Fig. 3.18. Curva de aprendizagem

CL]

u = 0,29

Estamos numa situação de divergência, pois este passo de adaptação é mais

elevado

que

o

valor

náximo

pe

nitido

A

se

3.6. Resumo o do os filtros de Wiener e o algoritm Neste capítulo foram apresentados gradiente.

0.5+ v7

Fi

EE

Ok

Ga D) )

ag .

EA

a

É

;

| ê

ig. 3.17. Divergência do algoritmo do gradiente com passo de adaptação u = 0,29

o erro coeficientes fixos que minimizam Os filtros de Wiener são filtros de ie de rfíc supe por gna desi se o multidimensional quadrático médio, cuja representaçã erro do imo mín r valo ao te baixo, corresponden “performance”. O seu ponto mais mos, ópti res valo m ume ass do os coeficientes quadrático médio, é atingido quan Wiener-Hopf. de ção obtidos de acordo com a equa uma rio algoritmo do gradiente como Em seguida foi apresentado O próp o fund o ir ating se bém tam coeficientes variáveis, maneira iterativa de, com filtros de de rais natu os mod dos A abordagem quer da superfície de “performance”. permitiu constantes de tempo associadas das quer o convergência do algoritm tativos adap os filtr dos ntes ergência dos coeficie concluir que a velocidade de conv iz R. matr da rios próp res da disparidade de valo depende do passo de adaptação e tação esen repr a é que , agem e à curva de aprendiz O mesmo se concluiu relativament o. temp co médio ao longo do gráfica da evolução do erro quadráti

F

90

Súmula de expressões

91

4. O ALGORITMO LMS E VARIANTES

Filtro de Wiener Copr=R' -1 Pp

Co =C-Cop

O algoritmo LMS

v=QTe, =Q/(c-cop)

Ruído de gradiente e ruído de coeficientes

e = Ele? (n)]= Eld? (n)]-2e”p+ e”Re

O desajuste Comparação com o algoritmo do gradiente

Emin = E[a? (m]- P'cop:

Outras variantes Resumo

E =Emin +(€- Cop) R(c- Copy) = = Emin + cíRe, = =

= Emin + V T Av Algoritmo do gradiente

Na prática usam-se estimativas do gradiente, V(n), em vez do verdadeiro

e(n+1) = e(n) + 2uE[e(n)a(n)] 0O D=1,89

O passo de adaptação nosalgoritmos LMS e do sinal deve respeitar a 1 condição O0

b+Ia(n)]

e

c(n+ D=c(n)+ 2ue(n)signla(n)]

(4.45)

c(n+ D=c(n) + 2usignle(n)]signla(n)]

(4469)

|

e(n + 1) = c(n) + 2ué(n) a(n)

lem]y

é(n) = nie Losignle(n)] e

beL=1

e(n)>d>0

e(n)+d

e(n) E e para obtermos T

-*

conduzem a um erro quadrático médio mínimo menor [Johnson95];

(6.33) a taxa do amostrador era menor, —, provocandoaliasing. T

"e

são independentes da fase de amostragem [Ungerboeck76] [Haykin91] [Cowan85].

O intervalo de tempo entre iterações consecutivas é agora de E. Assim M

Em contrapartida, o número de elementos de atraso e o número de * coeficientes necessários para cobrir um mesmointervalo de tempo aumentam por um

2

como os coeficientes são actualizados de T em T segundos, a saída do igualizador nos instantes kT vale

KT UT) = pda cATAT-) 2

'

factor M e M/K,respectivamente, em relação ao igualizador síncrono. No entanto,

“ tem-se chegado à conclusão que os igualizadores T/2 com o mesmo número de “coeficientes comportam-se tão bem ou melhor que os igualizadores espaçados de T. E Estes comportam-se sempre pior que os fraccionários quando a distorção de atraso * nas frequências próximas de 1/2T é elevada, independentemente da boa escolha da

k=-0,12..

é

* fase do amostrador [Qureshi85].

Em termos de iterações n a equação anterior é equivalente à seguinte , com n=kM,k>0, correspondente aos instantes kT:

6.5.3.1. Resposta impulsional global

N-1

VM) = VM) = Sc;(kM)aCkM - jk) j=0

k=0,1,2,...

Consideremos o sistema da Fig. 6.13, onde o sinal s(n), depois de atravessar

— um

No caso mais vulgar dos igualizadores tem-se T/2 (K=1 e M=2) pelo quea saída y(n) é obtida em iterações alternadas usando a equação

N=1 vmW= Sejman-s) /=

8 =[80 É

n ímpar (1, 3, 5, ...),

canal

de

comunicações

gm-1] Ag

T

resposta

impulsional

amostrada

, é igualizado através de um filtro adaptativo transversal

— com N coeficientes, c = [co *

com

T

om

cx-1) . Tratando-se da cascata de dois filtros,

qualéa resposta impulsional global do conjunto?

Lo

229

stato então que a fonte de sinal produz amostras à cadência de 1/7 as/s e q que os elemen tos gE e cj: estão estã separados de T segundos. Estamos portanto, a considerar que o igualizador é síncrono. Aresposta impulsional, i i h, que procuramos obtém-se calculando a convoluçãão d os dois i vectores g e c, pelo que éÊ composta por M+N-1 elementos Torn a-se conveniente recorrer à matriz da resposta imp ulsional do canal, ou matr iz de convolução, definida como [

respostas impulsionais dosfiltros. Esta situação ocorre quando se usam igualizadores fraccionários: é que passamosa ter amostras de sinal separadas de T segundos e os coeficientes do igualizador estão separados entre si de uma fracção desse intervalo de tempo (normalmente é T/2, como já se disse). E além disso, “para complicar mais”, ainda temos um amostrador síncrono (1/T) à saída do igualizador. Como

| * * *

fazer?

Suponhamosentão que: :

80

0

...

0

0

81

80

as

0

0

resposta impulsional

c=[co

8M- 1]

81

1) quer a resposta impulsional g =[80 c1

cn-1]

T

do

T

do canal quer a .

à

-

igualizador estão

sobreamostradas em intervalos temporais de T/2;

8N-2

BEN-3

80

0

8N-1

B&N-2

81

80

8N-1

82

81

EN

e

'

.

0

* 2) dispomos de amostras do sinal de entrada s(n) colhidas de T em T segundos; 3) à saída do igualizador fraccionário temos um amostrador à cadência 1/T.

(6.37) 8M-2

B8M-3

SM-N

$8M-N-1

8M-1

BM-2

8M-N+1

8M-N

0

8M-1

8M-N+2

&M-N41

0

0

e

cs

8M-2

0

0

...

0

8M-1

A matriz A tem dimensões

convolução A, que tem M+N-1 linhase N colunas, pois podemos remover-lhe

“ Jinhas alternadas; em vez dela podemos usar uma matriz de convolução reduzida, D,

com P= [E linhas e N colunas, |

(M+N-DxN e, dada a forma da sua

construção, é uma matriz de... Toeplitz.

A resposta impulsi sional h calcula-se então de ã e acordo com a expressão matricial

h=[ho os

hyen-2[ = Ac

Nasituação descrita é comoseo sinal de entradativesse sido afinal amostrado à mesma cadência de h e c e alternadamente as suas amostras fossem nulas, como se mostra na Fig. 6.26. Estas amostras extra originam algumas operações nulas ao * calcular as convoluções envolvidas no trânsito do sinal desde a entrada do canal até à saída do igualizador fraccionário. Por consequência, é escusado usar a matriz de

(6.38)

es caso diferente surge quando sinal de entrada é composto por amostras paçadas no tempo de um valor diferente do espaçamento entre elementos das

5

g

0

=

00

82

8

0

84

83

O

0

AS

(6.39)

em que [x] representa o tecto de x, isto é, o menorinteiro superior ou igual a x.

A convolução das respostas impulsionais calcula-se multiplicando a matriz D c, ou então reorganizando-a de tal modo que a expressão final equivalente vector pelo

231

230

Subentende-se na expressão anterior que

seja

T

co 80

h=

0

0

82

&

O

8

&

8

|

0

0

0

eeIICa

ig

0

0

183

8

0

: -—

1 1

l

(6.40)

lc

É

Ea =[co

cz

cz

com M; = E |

gui],

83

81

Eimpar -[0

M

cena) ,

com Np = 2|

ou iguala x . E de notar sendo [*] o chão de x, quer dizer, o maior inteiro inferior

o elemento O introduzido em par CEM Simpar -

Ruído n(kT/2)

=

sEs(kT)

Espaçamento:

Ee

Cana

ES

+ 7

g

T/2

T/2

no A convolução no domínio dos tempos corresponde a uma multiplicação que escrever podemos 6.41, Eq. domínio das frequências. Assim, e servindo-nos da a função de transferência global, H(z), é igual a

f FSE basis, c

T/2

yT/2

T/2

YT

H(z) = Gpar (Z)Cpar (2)+ Gimpar (Z)Cimpar (2) =

bT;

a

[go + 89Z 2 + +8M, 12 Fig. 6.26. Cascata de dois filtros (canal e igualizador fraccionário) com respostas impulsionais amostradas a T/2 segundose sinais de entrada e saída amostrados a T segundos.

O vector h representa a resposta impulsional global entre a entrada do canal ea saída do amostrador. Os seus elementos estão “espaçados de T” segundos. Naexpressão anterior as partições indicadas na matriz e no vector separam os elementos de ordem par dos elementos de ordem ímpar, o que leva a considerar o cálculo de h como a “concatenação” de duas convoluções: uma envolvendo apenas os elementos de ordem par e outra envolvendo apenas os elementos de ordem ímpar [Johnson95], h= 8par*Cpar + Simpar*Címpar -

(6.41)

-M,+1

n

eo + coz

a

-M,+1 = (82) + 83Z 2 ++gm, 2 Mi+ Jaz

-1

-2

+ +Cn1Z

-Np +

+

-N;+1

+c32 -3 tenaz!

ência em que Gpar(2), Gimpar(2)» €par(2) e Cimpar(Z) são as funções de transfer correspondentes a gpa» SBimparº

i e e Cpar € ímpar respectivamente,

z

1

corresponde a um atraso de T/2 (e não T!. de T/2” A Eq. 6.41 diz-nos que a cascata dos dois filtros “espaçados sinais “espaçados (Fig. 6.26) é equivalente a duas cascatas em paralelo, com filtros e de T”, como na Fig. 6.27. A Eg. 6.40 é equivalente a

N,-1

N;-1

im

im

hj = Senga-i + > CoimiBz(-i-DA+l»

pedais

(6.42)

232

233

onde c»; representa os

Np coeficientes fraccionários de ordem pare c i+] representa os N; coeficientes fraccionários de ordem ímpar de c [Schniter96] Do

mesmo modo $2(/-;) € 82(l-i-1)+1 são os elementos dos subcanais de ordem par

eimpar, ga € Eimpar » respectivamente.

g =[0,1

-01

|

fas

Ipar

—————» sEs(kT)

+

de T/2 segundos. Para o igualizar é usado um igualizador fraccionário T/2 com 3 coeficientes. Pretende-se que a resposta impulsional amostrada global do conjunto seja

+

2

Cpar

1

0

of. com

2

se de

au AR: 1 A+

E

| Símpar |

D=

Nímpar

Fig. 6.27. Esquema equivalente ao esquemada Fig. 6.26. Se as amostras de saída forem recolhidas nos instantes T/2, 3T/2, ST/2,etc (em vez de 0, T, 2T, etc., como até aqui), a Eq. 6.40 deve ser substituída por

0

! 8&o

0

0

cz

pa8

0

| 82

8

O

É

85

8

! 84

&

80

C1

|

cs

2. Exemplo de cálculo da resposta impul sional global com sobreamostragem

Vamos considerar duas situações:

P1: Suponhamos que um canal é modelizado pela resposta impulsional

81

80

84

&3

82

O

0

ga

de reorganizarmos a matriz D criando as partições adequadas:

82

ea

82

As condições exigidas ao vector h são satisfeitas pela Eq. 6.40, depois

gw

Co

E

h= [o

=|é linhase N =3 colunas:

E 5

=| ímpar

83

—0, rf. com elementos separados

R1: A matriz de convolução reduzida D tem

Npar

e

0

0,3

amostras separadas de T segundos. Quais deverão ser os valores dos coeficientes do igualizador?

s(KT)

g

0,9

010 80181

co

&

!

wie

x|co|=

o

1

cj

gm'o

0 1

|2lo 0

+

01

010

0,9

0,11 -0,1

-01 0

e

09:03)

X|e2 |+| |=

|

C1

011

0

0 1

lol 0

Note-se que nesta multiplicação os coeficientes não estão colocados na ordem habitual. Invertendo a matriz concluiríamos que os coeficientes que satisfazem o pretendido são

co = 0,9398 Cj = -1,0

co = 0,4337

234

235

Todos os valores da resposta impulsional global foram “forçados a

zero” excepto aquele que tem um valor unitário.

4

P2: O sistema de que agora nos vamos ocupar está represen -

tado

a=[2

na

Fig.

-1

6.28.

3

As

respostas

impulsionais

dos

s 2

2 1 2, são amostradas nosinstantes 0, 7/2, T, 3T/2, ... e o sinal de entrada, no ponto 1 da s(G7)=2 e s(4T)=1

saída do amostrador?

|

3+

filtros,

af e b=[3

figura, é constituído pelas amostras s(0)=1,

e

19

s«(T)=3, 5(Q7)=4,

0

(Fig. 6.29). Qual é o sinal Yr obtido na

é

0

ZE

27

3T

4T

(1)

e)

mm!

Srta)

Filtro a

ICEEeee reias

Fig. 6.29. Sinal de entrada do exemplo.

WT

Filtro b ER

yT/2

—

yT

Fig. 6.28. Cascata de dois canais + amostrador do exemplo

À saída do amostrador síncrono (ponto 3) teremos então

yr=[6

27

64

79

52

3

T cf,

3

representada na Fig. 6.31 juntamente com o sinal Y7/2.

4

e

E

3t

Su/28 8]

R2: Seja ssr=[1

0

3

0

4

0

2

0

Po vector

14

obtido introduzindo amostras nulas entre amostras consecutivas do

vector de entrada

sr=[1

3

4

92

'g

à 1 7 (Fig. 6.30). Então

as amostras y7/2 no ponto 2, à saída do filtro b, calculadas através

4 e

T

e

ese

e

Sit;

S

4T

Fig. 6.30. Sinal de entrada do exemplo, com zeros acrescentados.

da convolução dos vectores Sr/2, a e b, valem

100

T

Yrr2 = [9

(5)

|

=8S7/2 *axb =

50 -

essoó

19 13 3 2 8f[0127 16 64 41 79 48 92 19 39

3/2

o

Q

5] so,

TO

2r

Ol:

o

q

|

|

sr

o--

sr

sr

/ 2 YT/2

era

Fig. 6.31. Sinais de saída do exemplo. HIMMMEDOIMNARE REAPOAL

mo mrarm k

236

237

Podemos chegar a este mesmo resultado com a matriz de convolu ção reduzida ID ou, equivalentemente, através da concat enação de convoluções. Neste último caso os vectores de que precisamos são os

seguintes:

2

1) o sinal de entrada, s(n), é um sinal PSK binário (BPSK) de potência

4

3

unitária, o? = 1, gerado à cadência de 1/T bits/s;

2

Dpar o h

P.: Pretende-se calcular a função de custo CMAassociada ao igualizador ruído. Os dados do problema são os seguintes:

Limpar =|—1

0

3. Exemplo de função de custo CMA

fraccionário T/2 do sistema da Fig. 6.32 em duas situações: com e sem

0

Apar =|3

E

2) a resposta impulsional amostrada do canal, em instantes separados

Dinpar = |

de T/2 segundos, é g=[0,2

A saída y(kT) vem então dada por

0,5

1,0

-0,1P;

3) o filtro adaptativo tem dois coeficientes, cy e cj, separados no tempo de T/2 segundos;

JET =[y(0)

1 3 al E 2! 1

(7)

fo = s7+[a par*Dpar + Agmpar *Bimpar| =

4) na situação com ruído a variância

1 3

61 [0 6 |U)3l*holl=|Pha|=[6 ]-2 9 27 64 19 52 3 3 Ff lol legl) |2 É

q

o? deste é tal que a relação

sinal-ruído é de 7dB.

deE

Ruído

Comose previa, o resultado foi o mesmo.

on?

Se as amostras de saída do amostrador forem obtidas nos instant es T/2, 37/2, 5T/2, etc., não deveremos usar a Eq. 6.40 mas sim a Eq. 6.43. Assim fazendo, obtemos:

s(m)

as

Canal

ii

E

g=10,2 0,5 1,0 -0,1]7 e 1 2

(37)

H 2)

a;

0

1 ag

=s7*)las

a;

a

0

as

i

0

0

PAR

Igualizador

FSE

vm

/ cleo cf

bo bo

ag|x 5 as

+

=

Fig. 6.32. Sistema de igualização fraccionária T/2 para determinação da função de custo CMA.

f

b3

R.: A constante de dispersão R; é unitária tratando-se de BPSK, de acordo com a Tabela 6.1. Precisamos de calcular a resposta impulsional global A . Comecemos pela resposta impulsional do canal e pelo filtro adaptativo, que têm M=4 valores e N=2 coeficientes, respectivamente. Destes coeficientes

238

239

um é de ordem par (Np=1) e o outro é de ordem ímpar (N,=1). A matriz reduzida D tem dimensões

e a resposta impulsional HH resultante seria

[ester[8=perene

H=|

e é igual a

80

D=|g2 0

0

0,2

gi|=|L0 83

0

h=|[L0 0

0

-0,1

0,2cp

0,5 | |- co +0,5c; C1

0,2

1,0

0,5

8

O

0,2

0

81

80

03

0,2

g|=|10

0,5

83

8g|

|-061

10º

O

83

0

-0,1

0,5cp + 0,2c1 =|

Ci

-0,1

1,0

0

01

co+0,5c; -O, Ico +cj

-0,1c;

Não havendo ruído devemos usar a Eg. 6.29 para calcular a função de custo CMA. Substituindo valores obtemos 2

J=1-25h 125 Sun? 2 = i=0

i=0j=0

i=0

= 1,2416c) + 2,24cjcj + 1,6224câc7 + 0,56cocj —

neste exemplo se reduziria a hj = Co821 + Ci821-1.

Um aparte: suponhamos que afinal a amostragem era feita à cadência de 1/T segundos e que o igualizador era síncrono. A matriz de convolução seria a seguinte,

|x

Co

Situação sem ruído

-0, lc;

Concluímos que a resposta impulsional global tem P=3 elementos, distanciados de T segundos.

0,2cp

Se compararmos h com H verificamos que os elementos daquele são os elementos de ordem par deste.

Chegaríamos ao mesmo resultado se tivéssemos usado a Eg. 6.42, que

A=|g2

0,5

0,5

cg

-0,1

0

0

O vector h calcula-se através da Eg. 6.40: 0,2

02

-2,08c) — 2cpcy — 0,5207 +0,0776c7 +1 Na Fig. 6.33 são apresentadas curvas de nível de J. Nota-se que existem quatro mínimos globais. Todos têm valor nulo e estão situados em

e=+[1,9231

c=+[-0,3846

0,1923/

0,9615/

240

241 Se o igualizador “cair” num daqueles mínimos locais o seu desempenho será menos eficiente. É por isso que a questão da

inicialização dos coeficientes é tão importante em igualização cega.

Fig. 6.33. Curvasde nível da função de custo CMA do exemplo > com igualizador fraccionário e sem ruído. Confirma-se que, ao contrário do que acontece com o erro quadráti co

médio, não existe um mínimo único.

Situação com ruído

Estando o ruído 7dB abaixo do nível dosinal e tendo este uma variância unitária, a variância daquele vale

;

,

E

So

Fig. 6.34. Curvas de-nível da função de custo CMA do exemplo, com igualizador fraccionário e ruído.

02 =1007 -0,2.

[]

A equação que agora devemos usar é a Eg. 6.28:

E

ud 02 as 2n2 J=1-25 Sn + h “0,43, 2 +35 Shhj25 i=0

i=0

i=0j=0

2 1 11 5 23 h2 > c2+0,1 23 3 cic?

i=0

j=0 '

i=0j=0

i=0

,

6.5.4. 4. Os igualizadores com realimentação da decisão (DFE) E Ê

.

.

O igualizador DFE consiste num ramo “feedforward” (FE)é num ramo de “feedback” (FB), como se mostra na Fig. 6.18. O ramo FF é idêntico a um dos igualizadores anteriores (síncrono ou FSE) e o outro j i j Í tro ramo é um filtro transversal síncrono, com coeficientes espaçados de T segundos.

0,1365/", e dois mínimos globais, de valor 0,3859,

0, 6897".

|

De acordo com a Fig. 6.35, os símbolos previamente detectados no decisor (e que constituem um sinal quantizado) são usados como entrada do me estao

próximos de c = +[-0,1914

.

desempenho na presença de interferência intersimbólica severa [Falconer76].

Na Fig. 6.34 são apresentadas curvas de nível de J, Agora existem dois mínimos locais, de valor 0,5722, situados em c= +[0, 9326

.

Se o canal introduzir uma elevada distorção de amplitude é recomendáiza ve usar-se um igualizador DFE [Belfiore79]. Este tipo de igualizador tem um bom

LL

243 ruído e da sensibilidade à fase do amostrador 1/T. Como existe um outro filtro que trata das caudas da resposta impulsional do conjunto canal+filtro FF, sem amplificar o ruído, este último filtro pode apresentar na sua saída amostras não-nulas a seguir ao pico principal dos impulsos de dados. O filtro FF tem, pois, a “vida facilitada”. Pelas razões anteriores, os igualizadores DFE compensam eventuais valores

Entrada SK

a

(a)

É (nd)

KT/M

“a(n-2)

Co(n)

KTM|-

cos

nulos do espectro de entrada devidos a uma fase incorrecta do amostrador realçando * menos o ruído que os igualizadores lineares síncronos, mas à custa de um número mais elevado de coeficientes FB. Podemos assim afirmar que o igualizador DFE é * menosinsensível à fase do amostrador que o igualizador síncrono.

a(n-N+1)

O problema de sensibilidade à fase desaparece se o filtro FF for fraccionário,

* pois vimos queé insensível à fase do amostrador.

Cnci(m)

Como o ramo FB trabalha com amostras sem ruído (admitindo que as decisões do decisor são correctas), o ruído do canal não é amplificado por este ramo. Claro que se as decisões forem incorrectas haverá propagação de erros.

—>

Saída X(n)

esaf7

Poderíamos pensar em usar apenas o ramo de “feedback”. Normalmente não se faz isso pois se o canal apenas distorcer o sinal em amplitude a sua resposta impulsional é simétrica em relação a um pico, originando pré-cursores que o ramo FB não consegue eliminar. Essa tarefa é realizada pelo filtro FF. Num igualizador DFE com N coeficientes FF espaçados de T segundos e M coeficientes FB a actualização simultânea dos coeficientes é feita, no algoritmo LMS, de acordo com

Fig. 6.35. O igualizador DFE .

= A saída do filro FB é a soma dos pós-cursores » isto é, é à soma o enentemente ponderada dos últimos símbolos detect ado s no decisor. Os pesos ssa soma, que são os coeficie ntes do filtro FB, terão assim de se ir aproximando adaptativamente dos valores da cauda da resposta impuls i ona l do sistema que precedero decisor (o conjun to canal-+filtro FE).

c(n+1) = e(n) + 2ue(n)a“(n)

(6.44)

b(n + 1) = b(n) + 2ue(%“(n— 1)

(6.45)

em que o vector complexo X(n) é definido como

em=[8n)

E]

Xn-D)

Lo

&n-m+eD/.

4. Exemplo de pré- e pós-cursores

Fez-se passar uma sequência de impulsos de cosseno elevado com factor de “roll-off” 0,3 por um canal modelizado como um filtro FIR com Juma resposta impulsional amostrada

h=[0,1

0,406

0,71

0,406

-0,1]/.A Fig. 6.36 mostra um

desses impulsos, juntamente com a correspondente resposta do

filtro. Podemos observar o seguinte : 1) No instante O o impulso envi ado tem um valor não-nulo ao passo que nosinstantes +T, +27T, etc. o seu valor é nulo. Respeita, port anto,

0 primeiro critério de Nyquist nos tempos (não há interferênci a intersim bólica).

2) Cada impulso recebido exib e pré-cursores e pós-cursores não-nulos isto é,

existe ISI. Assim, se a sequênci a de saída for amostrada nos instantes assinala

dos (tendo em conta o atra so de 2T introduzido pelo filtro), cada impulso é resp onsável pelos pré-cursores A e pelos

pós-cursores B.

Suponhamos, por exemplo, que se pretendia transmitir a sequênci a binária 11010 através do cana l, atribuindo o impulso de cosseno elevado da figura ao bit 1 eo seu simétrico ao bit O. O efeito dist orsor do canal fará com que nos inst antes de amostragem 2T, 3T,.... 6T a sequência de saída contenha ISI, que pode provocar erros de dete cção, como se mostra na Tabela segu inte, onde se comparam as duas situações: com ISI e sem ISI.

1

4

0.8 +

Impulso enviado A Impulso recebido

0.6 (A Pré-cursores

04»

É

Pós-cursores 4

92L

Instante de amostragem

OL

-0.2 |

Sequência de saída amostrada Instante

2T

3T

4T

ST

6T

Com ISI

1,016

0,81

-0,098

-0,202

-0,204

Sem ISI

0,71

0,71

-0,71

0,71

-0,71

No instante 5T as amostras têm sinal contrário, logo a detecção símbolo a símbolo desta sequência produziria um erro no 4º bit,

fazendo com que a sequência binária detectada fosse 11000.

6.6. O algoritmo ZF Sabemos que a função de um igualizador é eliminar a interferência intersimbólica na medida do possível. Essa interferência manifesta-se através da existência de pré-cursores e pós-cursores nos impulsos recebidos.

As técnicas de igualização de canais de comunicação apresentadas até ao momento assentam na minimização de umafunção de custo quadrática. Podemos, no entanto, abordar a questão da igualização a partir de uma perspectiva diferente, que passa pela eliminação dos pré- e pós-cursores. A ideia, lançada pelo “pai” da igualização adaptativa, Robert Lucky, em meados dos anos sessenta, consiste numa escolha criteriosa dos coeficientes do igualizador de modo que estes, minimizando uma distorção de pico, “forcem a zero” um número finito de cursores. É por esse motivo quese dá a esta técnica “primitiva” de igualização, hoje em desuso, o nome de algoritmo “zero forcing”, ou simplesmente algoritmo ZF. Vejamos como proceder. Em primeiro lugar vamos definir a chamada distorção de pico normalizada. Para isso, admitamos que a resposta impulsional amostrada do sistema que antecede o igualizador é dada pelos valores /hp), sendo

ho = max|h] - À distorção de pico normalizada é definida como a função

MR

Eee

OC

ASS t/T

pps

Spa

Rs

RS

F

RT

Fig. 6.36. Um impulso os seus pré- e pós-cursores.

1 Dpico = Stu. O k=0

(6.46)

Trata-se, como se vê, da soma dos valores absolutos dos elementos da resposta

impulsional amostrada (excepto Ao), soma que representa o valor máximo da

246

interferência intersimbólica que afecta o sinal. Quanto menorfor Dpico menor é o

valor máximo da interferência intersimbóli ca, isto é, maior é à abertura do diagrama

de olho. Se porventura Dpico = O, isso significa que a interferência intersimbólica é nula pois nesse caso não há nem pré-nem pós-c ursores.

Se o diagrama de olho estiver associado a um sinal com L níveis a sua abertura está relacionada com a distorção depic o através de [Gitlin92]

Abertura = 1 -(L — DDpico

(6.47) Fig. 6.37. Igualizador para o algoritmo ZF.

No caso binário (L=2) a abertura do olho é simplesmente

Abertura = 1 — Diem

(L=2)

x

Umaabertura unitária significa que o olho está completamente aberto. Uma situação intermédia (olho aberto, mas não completamente) ocorre quandoa abertura

é positiva e inferior a um (e nesse caso D p ico 1), além de que nãose estão a incluir osefeitos

do ruído no critério de desempenho. Apesar de apenas minimiz ar a interferência intersimbólica, a simplicidade do algoritmo fez com que os igualiz adores com ele equipados fossem os primeiros a ser incluídos em modems. Hoje em dia já não são usados, tendo há muito sido substituídos por igualizadores com o algoritmo LMS,

Antes da igualização ZF 1,2 r RR

que com uma sequência de treino funcionam mesmo quando o olho está

1,0

IS

0,8+

completamente fechado.

0,6 +

E

5. Exemplo com o algoritmo ZF

Neste exemplo vamosaplicar o algoritmo ZF numasituação em que o impulso recebido à entrada de um igualizador com 5 coeficientes tem

a forma apresentadana Fig. 6.38. Quais são os valores dos coeficientes de modo quea interferência intersimbólica de pico seja minimizada? De acordo com figura, a matriz À vale q 4

Ala

q

4

44 4

dm

q |

ads 44

as dy

as as

aq

uy

tsl=)

a

[e]

ag

q

aq

as]

1 -0,15

0,12 1

01

015

0

-0,05

|-005

O

0,08 0,12

1

-015 0,1

0 -0,08

0 0

0,12

-0,08

-0,15

1

1

NCce porreIrONE

0,4 0,2

E

0,0

o -0,2-

0,12

a

EN

a

OO

NE

-0,08

Es

0,1

-0,1

1

1

Tempo

3

5

7

Fig. 6.38. Impulso recebido no igualizador ZF.

Com estes valores o impulso original foi transformado no impulso da Fig. 6.39. Comose vê, o igualizador forçou a zero M=2 valores de cada lado do pico do impulso. Note-se ainda o atraso de duas unidades introduzido pelo filtro. A distorção de pico, que originalmente era de

Dpico (origi iginal) nal) == 0,08+0,12+0,15+0,1+0 ,05=0,5,

0,12

passou a ser de

Sendo assim, os coeficientes ezr=[c2

c1

co

q

Dpico(igualizada) = 0,007 +0,018+0+0+0+0+0,02 +0,016 = 0,061.

of

passas

do igualizador são os que resultam da equação do algoritmo ZF

250

251

A abertura do olho passou assim de 50% para cerca de 94%. Muito mais aberto...

Depois da igualização ZF

tão

1,0

0,8+

O capítulo terminou com a apresentação do algoritmo ZF; agora pouco usado, foi incluído por razões históricas e para que o capítulo ficasse mais completo. O algoritmo ZF tem como objectivo abrir o diagrama de olho da comunicação (reduzindo assim a interferência intersimbólica). O que se faz E tenta minimizar a distorção de pico associada a esta interferência, ao contrário dos algoritmos adaptativos convencionais, nos quais se tenta minimizar uma distorção quadrática.

0,6+ 0,4+ 0,2+ 0,018 si

o

ERON

EQIAE

ES

Foram também apresentadas mais algumas variantes do algoritmo do gradiente, mas agora aplicadas à igualização cega: o algoritmo de Sato e o algoritmo CMA.A função de custo deste último foi calculada analiticamente e através de um exemplo confirmou-se a existência de mínimos locais em certas circunstâncias adversas. A existência de uma superfície de erro multimodal justifica, assim, todo o cuidado a ter na correcta inicialização dos coeficientes do igualizador adaptativo.

1

1

=3

Ri!

1

1 Tempo

0 Z

NS os L

3

5

1

-0,016

7

J

Fig. 6.39. Impulso igualizado pelo algoritmo ZF.

6.7. Resumo

Neste capítulo foi apresentada a igualização adaptativa de canais de comunicações, uma das aplicações mais vulgares do processamento adaptativo em telecomunicações. Foram referidas a igualização cega e a igualização com sequência de treino (ambas propostas por Robert Lucky nos anos 60); mostrou-se que, consoante o sistema use ou não modulação, assim se podem usar igualizadores com sinais complexos (passa-banda) ou sinais reais (em banda-base) e foram apresentados os três tipos de igualizadores transversais em uso hoje em dia: os igualizadores lineares síncronos, os igualizadores com realimentação da decisão (DFE) e os igualizadores fraccionários (FSE). Pelo meio fez-se uma revisão de questões relacionadas com o teorema da amostragem, importantes para a justificação da utilização e compreensão do funcionamento dos igualizadores FSE.

253

7. APLICAÇÕES EM TELECOMUNICAÇÕES: O CANCELAMENTO DE ECO

Introdução Caracterização dos sinais e ecos Cancelamento de eco com o algoritmo LMS Cancelamento de eco com o algoritmo do sinal Cancelamento de eco não linear Cancelamento de eco com estimativa do sinal remoto Resumo

7.1. Introdução Z O cancelamento de eco é outra aplicação importante do processamento adaptativo em telecomunicações. O filtro adaptativo que realiza a operação de

cancelamento chama-se, obviamente, cancelador de eco. Um dos sistemas que usa canceladores como maneira de melhorar o desempenho é a RDIS; o mesmose passa,

por exemplo, com a transmissão de dados na linha telefónica com modems obedecendo às normas da União Internacional de Telecomunicações (ITU), como a normaV.34. Existe uma grande diversidade de sistemas de comunicações. Nalguns, como a radiodifusão de televisão, a informação flui num só sentido, da estação para os receptores. Noutros, como em certas comunicações ponto-a-ponto por satélite, a comunicação é bidireccional, com um emissor e um receptor em cada extremo do sistema a usarem bandas de frequência diferentes em cada sentido da transmissão. Num outro sistema — o serviço telefónico de rede fixa — a comunicação faz-se nos dois sentidos simultaneamente, através dum mesmo suporte físico e na mesma banda

de frequências — é a chamadatransmissão “full-duplex”. A comunicação é realizada através de um complexo encaminhamento das chamadas, por comutação de circuitos;

E

podendo coexistir diferentes mecanismos de transmissão ao longo de todo o

254

percurso, havendo ou não portadoras passa-banda no sistema, e sendo usados diferentes equipamentos, desde o emissor até ao receptor, ocorrem por isso interferências várias, como ruídos, ecos, interferência intersimbólica e diafonias

provenientes de linhastelefónicas vizinhas. A interferência intersimbólica provocada pelo canal é eliminada ou reduzida com igualizadores adaptativos, como já vimos. A diafonia (designada em inglês por “crosstalk”) é um factor altamente perturbador das comunicações. Existem dois tipos de diafonia, designados em inglês por “near-end crosstalk” (NEXT) e “far-end crosstalk” (FEXT). O mais importante naslinhas digitais de assinante é o NEXT, devido a sinais provenientes de outros emissores próximos. É uma interferência que aumenta com a frequência à razão de f””. Este facto levou à adopção de um código de linha quaternário, 2B1Q, para a transmissão digital no Acesso Básico da RDIS (160kbits/s), por ocupar metade da largura de banda de um sinal não-codificado. De facto, num código 2B1Q a cada par de bits é atribuído um de quatro níveis, reduzindo para metade o número de símbolos transmitidos em cada segundo.

A linha telefónica entre as instalações do assinante e a central telefónica, constituída por um par entrançado de cobre com eventuais mudanças de diâmetro ao longo do seu percurso, pode ser usada para a transmissão “full-duplex” a 160kbits/s; é igualmente o canal de comunicação previsto para a transmissão a velocidades ainda mais elevadas, como em HDSL(“High Speed Digital Subscriber Line”) — 2Mbits/s na Europa — e em ADSL (“Asymmetric Digital Subscriber Line”) — transmissão assimétrica a mais de 6Mbits/s no sentido mais rápido. Diremos, nos três casos (RDIS, HDSL e ADSL), que temos uma “linha digital de assinante”.

As comunicações telefónicas “full-duplex” são um campo privilegiado de aplicação do processamento adaptativo. No capítulo anterior encontrámos uma dessas aplicações (a igualização de canais) e neste capítulo vamos tratar da eliminação adaptativa de ecos. Estes constituem um importante obstáculo à comunicação de dados; em menor grau, embora, são também um factor perturbador nas comunicações de voz.

A anulação, ou pelo menos a diminuição, dos ecos é tarefa dos canceladores de eco. Como é que surgem estes ecos? Observemosa Fig. 7.1, onde se apresenta um esquema simples de um sistema telefónico comutado, de longa distância,

normalmente usado para comunicações de voz e, ultimamente, também em

comunicações de dados via “modem”. Para efeitos da exposição vamos considerar que o emissor-receptor da esquerda é o emissor-receptor local e que à direita se encontra o emissor-receptor remoto.

255

-

PE) :V

To

O LinhadeN À

A KHHa) dá Hr) assinante

Eco próximo | devido a H1 j x

Sistema local “e fios)

pio da?

Eco | iss

y

Eco próximo

devido a H 2

inha dede Linha

7 HaN assinante

4

g Ha

N Z [EA

a

E,

Longa distância (4 fios)

Loreena Sistema remoto (2 fios)

Fig. 7.1. Um circuito telefónico de longa distância.

Em algunstroços do sistema da figura a comunicação faz-se a quatro fios ao passo quenoutros se faz apenas a dois. A conversão 4/2 fios é feita por um acoplador direccional híbrido, ou simplesmente “híbrido”. Tomemos como exemplo o sistema local e o híbrido H, (sêndo tudo idêntico para o equipamento remoto): o sinal proveniente do emissor deve fluir para a linha telefónica para ser entregue no receptor remoto, depois de atravessar todo o sistema. Idealmente nenhuma energia proveniente do emissor local deveria atingir o receptor local. Mas issonão acontece. E porquê? É que há uma enorme diversidade de linhas telefónicas. As suas características de transmissão variam consoante o comprimento e o diâmetro dos pares entrançados (0,5mm, 0,6mm, etc.) e dependem do modo de instalação, da existência de outros pares vizinhos, de eventuais derivações em circuito aberto (muito comuns na rede americana) e ainda de condições ambientais como a temperatura. Esta multiplicidade de casos impede que os conversores híbridos estejam adaptados a todas as situações, fazendo com que haja um escoamento do sinal do ramo superior do híbrido para o ramo inferior. O resultado é, comojá foi referido, o aparecimento de ondas reflectidas nos locais assinalados da figura, ou onde houver desadaptação de impedâncias. Como fazer então para anular os ecos? A solução é colocar um filtro adaptativo (o cancelador) em paralelo com o conversor híbrido, funcionando de modo que na suasaída se tenha umaréplica o mais fiel possível da perturbação que se deseja anular, isto é, estamos numasituação típica de identificação de sistemas. O

cancelamento é conseguido se ao eco subtraírmosa tal réplica fiel, como se mostra na Fig. 7.2 para uma linha local de assinante entre as instalações deste e a central telefónica.

=|

O tn =]

256

Emissor |

Emissor

Cancelador de

Eco

&

+

y

NUA

A

Eco

=| Receptor japa

Linha de

assinante

e!

y

Ê

Híbrido y 7 N

Ls

Cancelador de eco

Sinal

Cancelador de

igualizado

Eco

Eco

+

E

Receptor >

Fig. 7.2. O cancelamento de eco adaptativo nalinha de assinante.

Como se vê na figura o cancelamento de eco coloca o filtro adaptativo “em paralelo” com o dispositivo que provoca o eco (o híbrido), ao passo que na igualização filtro está colocado “em série” com o bloco que introduz distorção no sinal, isto é, o canal de comunicações.

Ls

Cancelador de eco

e

e/

ú

Consoante a proveniência, podemos falar de ecos distantes e ecos próximos (veja-se a Fig. 7.1). Os ecos distantes chegam bastante mais tarde que os ecos próximos, comoé natural. De acordo com [Gitlin92], o tempo deatrasositua-se entre

+ Sinal igualizado

5 e 600 ms, consoante o circuito (se incluir satélites, por exemplo, o atraso será dos

maiores). Quanto ao eco próximo,naturalmente que é mais intenso que o eco distante (cerca de 15dB acima). Em qualquer das versões da linha digital de assinante também ocorrem ecos, sendo o mais significativo o eco próximo, proveniente do híbrido local e mostrado na Fig. 7.2. Na análise que se segue só este eco será considerado. Os canceladores de eco podem actuar independentemente dos igualizadores ou em conjunto [Lin90]. O primeiro casoé ilustrado na Fig. 7.3a com um igualizador DFE. Este tipo de igualizador é também usado na Fig. 7.3b para ilustrar o

processamento conjunto.

Em resumo, os ecos ocorrem sempre que houver desadaptação de impedâncias ao longo do circuito telefónico, pois essa desadaptação gera ondas reflectidas que replicam o sinal transmitido, assim indesejavelmente “devolvido à procedência”.

b)

Fig. 7.3. a) Igualização e cancelamento de eco separados; b) Igualização e cancelamento de eco conjuntos.

7.2. Caracterização dos sinais e ecos Em ADSL, onde são usados métodos de transmissão multiportadora (DMT,

ou “Discrete Multitone”) com milhares de portadoras ortogonais, é muito difícil analisar e combater o cancelamento de eco [Ho96]. Assim, e com o objectivo de tornar a exposição que se segue mais clara, vamos tomar como modelo linhadigital de assinante na sua versão mais simples, RDIS. O nosso ponto de partida é a Fig. 7.4, onde se apresenta um diagrama esquemático correspondente ao sistema de cancelamento de eco da Fig. 7.2. O cancelador (C. E.) é modelizado por um filtro adaptativo transversal com uma

258

259

resposta impulsional c(n) e o canal, ou percurso, de eco é representado pelo bloco h, também ele um filtro transversal mas de coeficientes fixos.

en(n) = 3 ha(n-i)= i=0

No ramo inferior do híbrido local da Fig. 7.2 a forma de onda tem três

N-

componentes: uma, s(n), é o sinal distante, proveniente do emissor remoto; outra,

o

= Sman-i)+ Sman-d)= i=0 i=N

n(n), é o ruído gaussiano no canal; finalmente, a terceira componente é o eco próximo eh(n). Só a primeira componente é desejável pelo receptor, as outras são interferências que prejudicam a recepção do sinal distante.

(7.1)

=h7a(n) + 3 ha(n-i) i=N

1

Em paralelo com o híbrido deverá ser colocado o cancelador, que

a(n)

u(m) =s (n) +n (n) C.E.

c(n)

h

Ruído

dn) =en(n) + u(n)

vamos

considerar

e(n) =[co(n)

E

A es e(n)

d(n)

u(n)

s(n)

Linha de assinante

Fig. 7.4. A linha digital de assinante e o eco próximo.

Admitamos na Fig. 7.4 que, sendo h;,0