'데이터마이닝' 태그의 글 목록

728x90

데이터마이닝 2

개요 단순규칙모형: 예측변수가 필요 없는 모형, 주로 고급 모형들과 비교하기 위한 baseline 단순 베이즈 분류모형 => 이 기법들은 데이터 구조에 대한 가정을 거의 하지 않는다는 공통점! (data-driven) (makes no assumption about the data) 단순규칙 모든 예측변수를 분류한 상채에서 어느 한 record를 m개의 집단 중에 제일 많은 하나(prevalent class)로 분류하는 단순한 규칙 단순 베이즈 분류모형 단순규칙보다 정교한 방법 : 단순규칙 + 예측변수 정보 다른 분류모형과 달리 naive bayes classifier는 예측변수가 범주형인 경우에만 적용됨 따라서 수치형 예측변수는 범주형 예측변수로 변환하여야 함 단순 베이즈 기법은 데이터 집합이 매우 클..

Computer Science/Data Science 2021.03.08

K-means Clustering 간.단.명.료

알고리즘 : 1) cluster의 개수 k를 지정 k개의 초기 평균값 지정 2) 선태한 k개의 cluster 중심과 개별 데이터 사이의 거리 계산 개별 데이터는 가장 가깝게 있는 cluster의 중심을 그 데이터가 소속되는 cluster로 할당 3) 클러스터에 속하게 된 데이터들의 평균값을 새로운 클러스터의 중심으로 둠 4) 2~3단계를 알고리즘이 수렴할 때까지 반복 (클러스터의 중심이 더이상 변하지 않을 때까지) 출처 : m.blog.naver.com/PostView.nhn?blogId=samsjang&logNo=221016339218&proxyReferer=https:%2F%2Fwww.google.com%2F [30편] k-means 클러스터링 우리는 여태까지 답이 이미 제시되어 있는 데이터를 이용하..

Computer Science/Data Science 2021.03.06

728x90

🌷나의 선인장🌵

데이터마이닝 2

티스토리툴바