통계

1-3 P-값(p-value)는 무엇인가?(왜 유의할까?) 한방에 이해하기

Strong_H 2021. 11. 18. 22:47

p-값(p-value)이 0.05보다 작으니 유의하다.?

 

도대체 p-값(p-value)은 무엇이고, 0.05는 뭐며, 유의하다는건 무슨 뜻일까

 

어쩌면 통계가 어려웠던건, 이런 단순한 질문에 아무도 대답을 해주지 않았기 때문일수도 있다.

 

 

p-값(p-value) 이란 ?

 

p는 p로 시작하는 어떤 영어단어의 제일 앞 글자를 따온것일텐데..

percent? possibility? preference?

 

p-값(p-value) : probability value

p-값(p-value) : 확률값

여기서 말하는 확률값은 무엇에 대한 확률값인가?

 

1-1에서 통계적 사고방식은

"어떤 사건이 우연히 발생할 확률이 얼마일까"라고 묻는 것 이라고 했는데,

 

여기서 말하는 어떤 사건이 우연히 발생할 확률이 p-값(p-value)이다.

 

정통 통계학적으로는 이 설명이 틀린 설명일 수 있으나, 거의 유사한 설명이 된다.

 

p-값(p-value)이 0.1이라면, 이 사건이 우연히 발생할 확률이 10%이다. 라는식으로 이해하면 편하다.

 

 

근데 왜 p-값(p-value)은 항상 0.05보다 작아야 할까 ? 혹은 작기를 바랄까? 왜 기준이 0.05인가?

(0.05를 %로 바꾸면 5%를 말한다.)

 

 

p-값(p-value)이 0.05보다 작다는 것은 어떤 사건이 우연히 발생할 확률이 5%보다 작다는 의미이다.

 

우연히 발생할 확률이 5%보다 작다는 것은 이 사건이 우연히 일어났을 가능성이 거의 없다고 보는것.

즉 이 사건은 우연히 발생한 것이 아니라 분명히 뭔가 이유(인과관계)가 있다고 추정하는 것

 

기준이되는 5%는 쉽게 말해 이정도면 우연은 아닐거야..라는 수준의 정도

 

 

결론 

 

p-값(p-value)이 0.05보다 작다는 것은 어떤 사건이 우연히 발생할 가능성이 없다는 뜻이므로 뭔가 이유가 있다는 뜻이 되고, 이를 우리는 "유의하다". 즉 뭔가 의미(이유)가 있다(인과관계가 있다)정도로 해석한다.

 

만약 p-값(p-value)이 0.05보다 크면, 이 사건은 우연히 발생한 것이다 라고 생각하고,

이 사건에는 어떠한 의미 즉, 인과관계가 없다고 판단한다.

 

아주 옛날에 수학자들이 자기들끼리 모여서 0.05로 정했다고 하는데....이게뭐람...

 

 

출처

https://www.youtube.com/watch?v=5Xke4ao1g9E&list=PLalb9l0_6WAq-ZNVWOhRdax1nroxFovUb&index=3