Matthews 상관 계수는 이진 및 멀티 클래스 분류의 품질 측정으로 기계 학습에 사용됩니다. 그것은 참과 거짓 긍정과 부정을 고려하고 일반적으로 클래스의 크기가 매우 다른 경우에도 사용할 수있는 균형 잡힌 척도로 간주됩니다. MCC는 본질적으로 -1과 +1 사이의 상관 계수 값입니다. +1의 계수는 완전 예측, 0은 평균 랜덤 예측, -1은 역 예측을 나타냅니다. 통계량은 파이 계수라고도합니다. [출처 : Wikipedia]

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.matthews_corrcoef.html

from sklearn.metrics import matthews_corrcoef

Label = data["LABEL"].values
Gender = data["GENDER"].values
Age = data["AGE"].values
Job = data["JOB"].values

y_true = Label
y_pred = Job
matthews_corrcoef(y_true, y_pred)

MCC의 공식

 

피어슨 상관계수, 스피어만 상관계는 모수전, 비모수적에 대한 구분으로 연속형 자료에서 가능

 

둘다 이산적 형태이면 Phi coefficient

이산과 연속이 섞여있으면 point-biserial correlation coefficient

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.pointbiserialr.html

 

scipy.stats.pointbiserialr — SciPy v0.14.0 Reference Guide

Parameters:x : array_like of bools y : array_like

docs.scipy.org

from scipy import stats

y_true = Label
y_pred = Age

stats.pointbiserialr(y_true, y_pred)

 

 

+ Recent posts