전체 글27 혼동행렬(Confusion matrix)-분류모델의 성능평가 안녕하세요!! 통계하는 피터팬 입니다!! 오늘은 머신러닝의 성능평가에서 중요한 부분을 차지하고 있는 혼동행렬(Confusion matrix)와 그에 따린 여러 지표들에 대해 설명하도록 하겠습니다!!! 글과 그림 및 내용은 제가 공부했던 지식과 위키피디아를 이용했습니다! 그래서 우선 저작권 명시부터 하고 가겠습니다!! 아래에 표시되는 그림과 일부 내용들은 출처: 위키피디아(CC BY-SA 3.0) 입니다! 그럼 시작해 보겠습니다! 일단 혼동행렬이 뭔가 궁금해 하실것 같아서 정리가 된 그림을 가져왔습니다! 역시 앞서 밝힌대로 출처는 위키피디아입니다! https://en.m.wikipedia.org/wiki/Template:Diagnostic_testing_diagram Template:Diagnostic t.. 2022. 9. 5. 활용도가 높은 분할표 분석의 기초적인 검정 안녕하세요!! 통계하는 피터팬 입니다. 이번 글에서는 표의 형태로 된 데이터를 분석할 때 활용이 가능한 분할표 분석의 기본적인 검정 2개에 대해 소개하도록 하겠습니다. 바로 동질성 검정과 독립성 검정인데, 각각이 무엇을 검정하는 것인지 차근차근 설명 해보겠습니다. 참고로 검정에 대한 내용은 이전에 포스팅 되있으니 참고하여 읽고 오시기 바랍니다! 시작하겠습니다! 참고로 이후에 첨부되는 그림들은 모두 제가 직접 그린 그림으로 불법으로 퍼가는 것을 금지합니다. 대신 직접그린 그림이다보디 매우 형편없이 못나서 아무도 안 퍼가실거라 생각합니다... 1.동질성 검정 검정을 설명하기 앞서 용어대한 설명을 간다한게 하도록 하겠습니다. Pop는 모집단을, Cate는 범주를 의미하고 O는 관측치를 의미합니다. 즉 행 하나.. 2022. 9. 4. 대표적인 몇가지 상황과 그에 따른 가설검정 방법 설명 안녕하세요! 통계하는 피터팬입니다. 오늘은 기초부터 설명하는 통계적 가설검정 3편으로 몇 가지 상황별 대표적인 가설검정 방법에 대해 설명하도록 하겠습니다. 설명에 들어가기 앞서, 세상에는 아주 많은 가설에 대한 검정이 존재합니다. 그래서 제가 모든 것들을 설명할 수 없습니다. 대신에 몇 가지 대표적인 방법론을 설명하고 어떤 식으로 적용하는지 보여줌으로써 연구자 혹은 가설검정을 진행하실 때 어떤식으로 사용하면 될지 감을 잡을 수 있는 방향으로 설명하는 것이 목표입니다. 그래서 제가 설명하지 않은 가설에 대한 검정 방법은 구글을 이용하면 됩니다. 구글에 굉장히 많은 검정법들이 설명되어 있고, 사용하시는 언어, 도구의 코드까지 설명이 잘 되어있습니다. 그럼 이제 시작하겠습니다! 1. 한 개 혹은 두 개의 평균.. 2022. 9. 4. p-value에 대한 개념과 가설검정의 절차 안녕하세요! 통계하는 피터팬 입니다. 오늘은 저번 글에서 포스팅 한 통계적 가설검정을 이어서 설명하도록 하겠습니다. 앞의 글을 읽지않으신 분은 제 블로그에서 이전 포스팅들을 천천히 음미하며 읽고 와주시면 좋을것 같습니다. 그럼 이제 시작하겠습니다! 1.p-value p-value는 귀무가설이 올하는 가정하에 표본으로 구해진 데이터와 같거나 더 극단적인 결과를 얻을 확률을 의미합니다(위키백과 참고). 즉 p-value가 작다면 귀무가설의 가정에 대한 반증이 강하게 나타났다는 것을 의미합니다. 다시 말해 귀무가설이 옳다고 가정하고 확률을 구했음에도 그 값이 충분히 크지 못했다는 것을 의미하기 때문에 귀무가설에 대한 반대되는 증거로 생각하는 것입니다. 반대로 p-value값이 크다는 것은 표본의 결과가 충분히.. 2022. 9. 4. 이전 1 2 3 4 5 6 7 다음