Diferenças entre edições de "Teste Kolmogorov-Smirnov"

Da Thinkfn
 
Linha 2: Linha 2:
  
 
A [[função distribuição acumulada]] ''F''<sub>''n''</sub> para ''n'' observações ''y<sub>i</sub>'' é definida por
 
A [[função distribuição acumulada]] ''F''<sub>''n''</sub> para ''n'' observações ''y<sub>i</sub>'' é definida por
 +
  
 
:<tex>F_n(x)={1 \over n}\sum_{i=1}^n \left\{\begin{matrix}1 & \mathrm{if}\ y_i\leq x, \\ 0 & \mathrm{otherwise}.\end{matrix}\right.</tex>
 
:<tex>F_n(x)={1 \over n}\sum_{i=1}^n \left\{\begin{matrix}1 & \mathrm{if}\ y_i\leq x, \\ 0 & \mathrm{otherwise}.\end{matrix}\right.</tex>
 +
  
 
As duas estatíticas de teste Kolmogorov-Smirnov de apenas um lado são dadas por  
 
As duas estatíticas de teste Kolmogorov-Smirnov de apenas um lado são dadas por  
 +
  
 
:<tex>D_n^{+}=\max(F_n(x)-F(x))\,</tex>
 
:<tex>D_n^{+}=\max(F_n(x)-F(x))\,</tex>
 +
  
 
:<tex>D_n^{-}=\max(F(x)-F_n(x))\,</tex>
 
:<tex>D_n^{-}=\max(F(x)-F_n(x))\,</tex>
  
onde ''F''(''x'') é a distribuição em hipótese ou outra distribuição empírica. As distribuições de probabilidade destas duas estatísticas, dado que a [[hipótese nula]] de igualdade das distribuições é verdadeira, não depende daquilo que a distribuição em hipótese é, desde que ela seja contínua. [[Donald Knuth]] faz uma descrição detalhada de como analisar a significância deste par de estatísticas. Muitas pessoas usam max(''D''<sub>''n''</sub><sup>+</sup>, ''D''<sub>''n''</sub><sup>&minus; </sup>) alternativamente, mas a distribuição desta estatística é de uso mais difícil.
+
 
 +
onde ''F''(''x'') é a distribuição em hipótese ou outra distribuição empírica. As distribuições de probabilidade destas duas estatísticas, dado que a [[hipótese nula]] de igualdade das distribuições é verdadeira, não depende daquilo que a distribuição em hipótese é, desde que ela seja contínua. Donald Knuth faz uma descrição detalhada de como analisar a significância deste par de estatísticas. Muitas pessoas usam max(''D''<sub>''n''</sub><sup>+</sup>, ''D''<sub>''n''</sub><sup>&minus; </sup>) alternativamente, mas a distribuição desta estatística é de uso mais difícil.
  
 
Notar que quando a variável independente subjacente é cíclica, como em dias da semana, então o [[teste de Kuiper]] é mais apropriado.
 
Notar que quando a variável independente subjacente é cíclica, como em dias da semana, então o [[teste de Kuiper]] é mais apropriado.
Linha 19: Linha 24:
  
  
{{Wikipedia|Teste_Kolmogorov-Smirnov}}
+
{{Wikipedia|Teste Kolmogorov-Smirnov}}
  
 
[[Categoria:Estatística]][[Categoria:Testes estatísticos]]
 
[[Categoria:Estatística]][[Categoria:Testes estatísticos]]

Edição atual desde as 08h00min de 25 de novembro de 2008

Em estatística, o teste Kolmogorov-Smirnov é usado para determinar se duas distribuições de probabilidade subjacentes diferem uma da outra ou se uma das distribuições de probabilidade subjacentes difere da distribuição em hipótese, em qualquer dos casos com base em amostras finitas.

A função distribuição acumulada Fn para n observações yi é definida por


F_n(x)={1 \over n}\sum_{i=1}^n \left\{\begin{matrix}1 & \mathrm{if}\ y_i\leq x, \\ 0 & \mathrm{otherwise}.\end{matrix}\right.


As duas estatíticas de teste Kolmogorov-Smirnov de apenas um lado são dadas por


D_n^{+}=\max(F_n(x)-F(x))\,


D_n^{-}=\max(F(x)-F_n(x))\,


onde F(x) é a distribuição em hipótese ou outra distribuição empírica. As distribuições de probabilidade destas duas estatísticas, dado que a hipótese nula de igualdade das distribuições é verdadeira, não depende daquilo que a distribuição em hipótese é, desde que ela seja contínua. Donald Knuth faz uma descrição detalhada de como analisar a significância deste par de estatísticas. Muitas pessoas usam max(Dn+, Dn) alternativamente, mas a distribuição desta estatística é de uso mais difícil.

Notar que quando a variável independente subjacente é cíclica, como em dias da semana, então o teste de Kuiper é mais apropriado.

Note-se ainda que o teste Kolmogorov-Smirnov é mais sensível em pontos próximos da mediana da distribuição do que nas caudas. O teste Anderson-Darling é um teste que providencia igual sensitividade nas caudas.


Smallwikipedialogo.png

Esta página usa conteúdo da Wikipedia. O artigo original estava em Teste Kolmogorov-Smirnov. Tal como o Think Finance neste artigo, o texto da Wikipedia está disponível segundo a GNU Free Documentation License.