Médias móveis Médias móveis Com conjuntos de dados convencionais, o valor médio é geralmente o primeiro, e uma das estatísticas de resumo mais úteis para calcular. Quando os dados estão na forma de uma série temporal, a série significa uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos curtos, quer antes do período atual, quer centrados no período atual, são geralmente mais úteis. Uma vez que esses valores médios variam, ou se movem, à medida que o período atual se move do tempo t 2, t 3. etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel ponderada exponencialmente é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela proximidade com a hora atual. Como não há um, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisados como uma série e usados em modelagem e previsão. Uma série de modelos pode ser construída usando médias móveis, e estas são conhecidas como modelos MA. Se esses modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Uma vez que uma série temporal pode ser considerada como um conjunto de valores, t 1,2,3,4, n a média desses valores pode ser calculada. Se assumirmos que n é bastante grande, e selecionamos um inteiro k, que é muito menor que n. Podemos calcular um conjunto de médias de bloco, ou médias móveis simples (da ordem k): cada medida representa a média dos valores de dados ao longo de um intervalo de observações k. Observe que o primeiro MA possível da ordem k gt0 é aquele para t k. Mais geralmente podemos soltar o subíndice extra nas expressões acima e escrever: Isto indica que a média estimada no tempo t é a média simples do valor observado no tempo t e as etapas de tempo precedentes de k-1. Se forem aplicados pesos que diminuam a contribuição das observações que estão mais longe no tempo, a média móvel é dita suavizada exponencialmente. As médias móveis são freqüentemente usadas como forma de previsão, pelo que o valor estimado para uma série no instante t 1, S t1. É tomado como MA durante o período até e inclusive o tempo t. por exemplo. A estimativa de hoje é baseada em uma média de valores registrados anteriores até e inclusive ontem (para dados diários). As médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados de poluição do ar mostrado na introdução deste tópico foi aumentado por uma linha de média móvel de 7 dias (MA), mostrada aqui em vermelho. Como pode ser visto, a linha MA suaviza os picos e as depressões nos dados e pode ser muito útil na identificação de tendências. A fórmula padrão de cálculo direto significa que os primeiros pontos de dados k -1 não possuem valor MA, mas, posteriormente, os cálculos se estendem ao ponto final de dados da série. PM10 valores médios diários, fonte de Greenwich: London Air Quality Network, londonair. org. uk Um dos motivos para o cálculo de médias móveis simples da maneira descrita é que permite que os valores sejam computados para todos os intervalos de tempo do tempo até o presente, e Como uma nova medida é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem algumas questões com essa abordagem. É razoável argumentar que o valor médio nos últimos 3 períodos, por exemplo, deve estar localizado no tempo t -1, e não no tempo t. E para um MA em um número par de períodos, talvez ele deve estar localizado no meio do ponto entre dois intervalos de tempo. Uma solução para esta questão é usar cálculos de MA centrados, em que o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, essa abordagem não é geralmente usada porque requer que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centrado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, eliminando alguns componentes de alta freqüência de uma série de tempo e destacando (mas não removendo) tendências de maneira similar à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar uma computação média móvel a uma série que já foi suavizada, ou seja, suavizando ou filtrando uma série já suavizada. Por exemplo, com uma média móvel da ordem 2, podemos considerá-la como sendo calculada usando pesos, de modo que o MA em x 2 0,5 x 1 0,5 x 2. Do mesmo modo, o MA em x 3 0,5 x 2 0,5 x 3. Se nós Aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3, isto é, a filtragem de 2 estágios O processo (ou convolução) produziu uma média móvel simétrica ponderada de forma variável, com pesos. Várias convoluções podem produzir médias móveis bastante ponderadas, algumas das quais foram encontradas de particular uso em campos especializados, como nos cálculos do seguro de vida. As médias móveis podem ser usadas para remover efeitos periódicos se computado com o comprimento da periodicidade como conhecido. Por exemplo, com os dados mensais, as variações sazonais podem ser muitas vezes removidas (se este for o objetivo) aplicando uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro e o último que são ponderados por 12. Isso ocorre porque haverá Tenha 13 meses no modelo simétrico (tempo atual, t. - 6 meses). O total é dividido por 12. Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Médias móveis ponderadas exponencialmente (EWMA) Com a fórmula média móvel simples: todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, alfa t. Cada um dos pesos k seria igual a 1 k. Então a soma dos pesos seria de 1, e a fórmula seria: já vimos que as múltiplas aplicações desse processo resultam na variação dos pesos. Com médias móveis exponencialmente ponderadas, a contribuição para o valor médio de observações mais removidas no tempo é deliberada reduzida, enfatizando eventos mais recentes (locais). Essencialmente, um parâmetro de suavização, 0lt alfa lt1, é introduzido e a fórmula revisada para: Uma versão simétrica desta fórmula seria da forma: se os pesos no modelo simétrico forem selecionados como os termos dos termos da expansão binomial, (1212) 2q. Eles somarão para 1, e como q se tornar grande, irá se aproximar da distribuição Normal. Esta é uma forma de ponderação do kernel, com o Binomial atuando como a função kernel. A convolução de dois estágios descrita na subseção anterior é precisamente esse arranjo, com q 1, produzindo os pesos. Em suavização exponencial, é necessário usar um conjunto de pesos que somem para 1 e que reduzem de tamanho geométricamente. Os pesos utilizados são tipicamente da forma: Para mostrar que esses pesos somam para 1, considere a expansão de 1 como uma série. Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial (1- x) p. Onde x (1-) e p -1, o que dá: Isto fornece uma forma de média móvel ponderada da forma: esta soma pode ser escrita como uma relação de recorrência: o que simplifica bastante a computação e evita o problema de que o regime de ponderação Deve ser estritamente infinito para os pesos somarem para 1 (para valores pequenos de alfa. Isso geralmente não é o caso). A notação utilizada por diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escreve: enquanto a literatura da teoria do controle geralmente usa Z em vez de S para os valores exponencialmente ponderados ou suavizados (veja, por exemplo, Lucas e Saccucci, 1990, LUC1 , E o site NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com o alfa 1, a estimativa média é simplesmente seu valor medido (ou o valor do item de dados anterior). Com 0,5, a estimativa é a média móvel simples das medições atuais e anteriores. Em modelos de previsão o valor, S t. É freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isso mostra que o valor de previsão no tempo t 1 é uma combinação da média móvel ponderada exponencialmente anterior Mais um componente que representa o erro de previsão ponderado, epsilon. No tempo t. Assumindo que uma série de tempo é fornecida e uma previsão é necessária, é necessário um valor para alfa. Isso pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados, obtendo com valores variáveis de alfa para cada t 2,3. Definindo a primeira estimativa para ser o primeiro valor de dados observado, x 1. Nas aplicações de controle, o valor de alfa é importante, isto é, é usado na determinação dos limites de controle superior e inferior e afeta o comprimento de execução médio (ARL) esperado Antes que esses limites de controle sejam quebrados (sob o pressuposto de que a série temporal representa um conjunto de variáveis independentes aleatoriamente, distribuídas de forma idêntica com variância comum). Nessas circunstâncias, a variância da estatística de controle: é (Lucas e Saccucci, 1990): os limites de controle geralmente são estabelecidos como múltiplos fixos dessa variância assintótica, p. - 3 vezes o desvio padrão. Se alfa 0.25, por exemplo, e os dados que estão sendo monitorados assumem ter uma distribuição Normal, N (0,1), quando no controle, os limites de controle serão - 1.134 e o processo atingirá um ou outro limite em 500 etapas na média. Lucas e Saccucci (1990 LUC1) derivam os ARLs para uma ampla gama de valores alfa e sob vários pressupostos usando os procedimentos da Cadeia de Markov. Eles tabulam os resultados, incluindo o fornecimento de ARL quando a média do processo de controle foi deslocada por algum múltiplo do desvio padrão. Por exemplo, com uma mudança de 0,5 com alfa 0.25, o ARL tem menos de 50 etapas de tempo. As abordagens descritas acima são conhecidas como suavização exponencial única. Uma vez que os procedimentos são aplicados uma vez às séries temporais e, em seguida, os processos de análise ou controle são realizados no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, o alisamento exponencial de dois ou três estágios pode ser aplicado como meio de remoção (modelagem explícita) desses efeitos (veja ainda mais a seção sobre Previsão abaixo e o exemplo do NIST). CHA1 Chatfield C (1975) The Analysis of Times Series: Teoria e Prática. Chapman and Hall, London HUN1 Hunter J S (1986) A média móvel ponderada exponencialmente. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de Controle Médio Médio Ponderado Exponencialmente: Propriedades e Melhorias. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de tabela de controle com base em médias móveis geométricas. Technometrics, 1, 239-250 Resposta de frequência do Filtro Médico de Corrente A resposta de freqüência de um sistema de LTI é o DTFT da resposta de impulso. A resposta de impulso de uma média móvel de L é como o filtro de média móvel é FIR, a resposta de freqüência Reduz-se à soma finita Podemos usar a identidade muito útil para escrever a resposta de freqüência como onde nós deixamos ae menos jomega. N 0 e M L menos 1. Podemos estar interessados na magnitude desta função, a fim de determinar quais frequências obtêm o filtro desatualizado e atenuados. Abaixo está um gráfico da magnitude desta função para L 4 (vermelho), 8 (verde) e 16 (azul). O eixo horizontal varia de zero a pi radianes por amostra. Observe que em todos os três casos, a resposta de freqüência possui uma característica de passagem baixa. Um componente constante (zero freqüência) na entrada passa pelo filtro desatualizado. Certas frequências mais altas, como pi 2, são completamente eliminadas pelo filtro. No entanto, se a intenção era projetar um filtro de passagem baixa, então não fizemos muito bem. Algumas das freqüências mais altas são atenuadas apenas por um fator de cerca de 110 (para a média móvel de 16 pontos) ou 13 (para a média móvel de quatro pontos). Nós podemos fazer muito melhor do que isso. O argumento acima foi criado pelo seguinte código Matlab: omega 0: pi400: pi H4 (14) (1-exp (-maome4)). (1-exp (-iomega)) H8 (18) (1-exp (- Iomega8)). (1-exp (-iomega)) H16 (116) (1-exp (-iomega16)). (1-exp (-iomega)) trama (omega, abs (H4) abs (H8) abs ( H16)) eixo (0, pi, 0, 1) Copyright copy 2000- - Universidade da Califórnia, Berkeley O cientista e engenheiros Guia de processamento de sinal digital Por Steven W. Smith, Ph. D. Capítulo 15: Filtros médios móveis Parentes do filtro de média móvel Em um mundo perfeito, os designers de filtros só precisam lidar com informações codificadas no domínio do tempo ou no domínio da freqüência, mas nunca uma mistura dos dois no mesmo sinal. Infelizmente, existem algumas aplicações em que ambos os domínios são simultaneamente importantes. Por exemplo, sinais de televisão se enquadram nesta categoria desagradável. As informações de vídeo são codificadas no domínio do tempo, ou seja, a forma da forma de onda corresponde aos padrões de brilho na imagem. No entanto, durante a transmissão, o sinal de vídeo é tratado de acordo com sua composição de freqüência, como sua largura de banda total, como as ondas de suporte para cor de amplificador de som são adicionadas, restauração de amplificação de eliminação do componente de CC, etc. Como outro exemplo, interferência eletromagnética É melhor entendido no domínio de freqüência, mesmo que a informação de sinais seja codificada no domínio do tempo. Por exemplo, o monitor de temperatura em uma experiência científica pode estar contaminado com 60 hertz das linhas de energia, 30 kHz de uma fonte de alimentação de comutação ou 1320 kHz de uma estação de rádio AM local. Parentes do filtro de média móvel têm melhor desempenho de domínio de freqüência e podem ser úteis nestas aplicações de domínio misto. Os filtros médios móveis de passagem múltipla envolvem passar o sinal de entrada através de um filtro médio móvel duas ou mais vezes. A Figura 15-3a mostra o kernel geral do filtro resultante de uma, duas e quatro passagens. Duas passagens equivalem a usar um kernel de filtro triangular (um kernel de filtro retangular convolvido com ele próprio). Após quatro ou mais passagens, o kernel de filtro equivalente parece um Gaussiano (lembre-se do Teorema do Limite Central). Conforme mostrado em (b), as passagens múltiplas produzem uma resposta de passo em forma de S, em comparação com a linha reta da única passagem. As respostas de freqüência em (c) e (d) são dadas pela Eq. 15-2 multiplicado por si mesmo por cada passagem. Ou seja, cada vez que a convolução do domínio resulta em uma multiplicação dos espectros de freqüência. A Figura 15-4 mostra a resposta de freqüência de dois outros familiares do filtro de média móvel. Quando um Gaussiano puro é usado como um kernel de filtro, a resposta de freqüência também é gaussiana, conforme discutido no Capítulo 11. O gaussiano é importante porque é a resposta de impulso de muitos sistemas naturais e manmados. Por exemplo, um breve pulso de luz entrando em uma longa linha de transmissão de fibra óptica sairá como um pulso gaussiano, devido aos diferentes caminhos captados pelos fótons dentro da fibra. O kernel de filtro gaussiano também é usado extensivamente no processamento de imagens porque possui propriedades únicas que permitem rápidas ondulações bidimensionais (ver Capítulo 24). A segunda resposta de freqüência na Fig. 15-4 corresponde ao uso de uma janela Blackman como kernel de filtro. (A janela do termo não tem significado aqui é simplesmente parte do nome aceito desta curva). A forma exata da janela Blackman é dada no Capítulo 16 (Eq. 16-2, Fig. 16-2) no entanto, parece muito com um gaussiano. Como estes parentes do filtro de média móvel melhor do que o filtro de média móvel em si. Três maneiras: primeiro e mais importante, esses filtros têm melhor atenuação de parada do que o filtro de média móvel. Em segundo lugar, os grãos de filtro se afilam a uma amplitude menor perto das extremidades. Lembre-se de que cada ponto no sinal de saída é uma soma ponderada de um grupo de amostras da entrada. Se o kernel do filtro diminui, as amostras no sinal de entrada que estão mais distantes recebem menos peso do que as próximas. Em terceiro lugar, as respostas passo a passo são curvas suaves, em vez da linha direta abrupta da média móvel. Estes últimos dois geralmente são de benefício limitado, embora você possa encontrar aplicativos onde eles são vantagens genuínas. O filtro de média móvel e seus parentes são quase iguais em reduzir o ruído aleatório enquanto mantém uma resposta passo a passo. A ambigüidade reside na forma como o tempo de subida da resposta passo é medido. Se o tempo de subida for medido de 0 a 100 da etapa, o filtro médio móvel é o melhor que você pode fazer, como mostrado anteriormente. Em comparação, medir o tempo de subida de 10 a 90 torna a janela Blackman melhor do que o filtro de média móvel. O argumento é que isso é apenas dificuldades teóricas consideram esses filtros iguais neste parâmetro. A maior diferença nesses filtros é a velocidade de execução. Usando um algoritmo recursivo (descrito em seguida), o filtro de média móvel funcionará como um raio em seu computador. Na verdade, é o filtro digital mais rápido disponível. Várias passagens da média móvel serão correspondentemente mais lentas, mas ainda muito rápidas. Em comparação, os filtros gaussianos e negros são incrivelmente lentos, porque devem usar convolução. Acho um fator de dez vezes o número de pontos no kernel do filtro (com base na multiplicação sendo cerca de 10 vezes mais lento do que a adição). Por exemplo, espere que um gaussiano de 100 pontos seja 1000 vezes mais lento do que uma média móvel usando recursão.
No comments:
Post a Comment