Matthews 상관 계수는 이진 및 멀티 클래스 분류의 품질 측정으로 기계 학습에 사용됩니다. 그것은 참과 거짓 긍정과 부정을 고려하고 일반적으로 클래스의 크기가 매우 다른 경우에도 사용할 수있는 균형 잡힌 척도로 간주됩니다. MCC는 본질적으로 -1과 +1 사이의 상관 계수 값입니다. +1의 계수는 완전 예측, 0은 평균 랜덤 예측, -1은 역 예측을 나타냅니다. 통계량은 파이 계수라고도합니다. [출처 : Wikipedia]
https://scikit-learn.org/stable/modules/generated/sklearn.metrics.matthews_corrcoef.html
from sklearn.metrics import matthews_corrcoef
Label = data["LABEL"].values
Gender = data["GENDER"].values
Age = data["AGE"].values
Job = data["JOB"].values
y_true = Label
y_pred = Job
matthews_corrcoef(y_true, y_pred)
피어슨 상관계수, 스피어만 상관계는 모수전, 비모수적에 대한 구분으로 연속형 자료에서 가능
둘다 이산적 형태이면 Phi coefficient
이산과 연속이 섞여있으면 point-biserial correlation coefficient
https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.pointbiserialr.html
from scipy import stats
y_true = Label
y_pred = Age
stats.pointbiserialr(y_true, y_pred)
'IT 공방 > Python' 카테고리의 다른 글
train.exponential_decay (0) | 2020.01.03 |
---|---|
colab(코랩)에서 ipynb 파일을 html로 저장하기 (0) | 2019.12.10 |
Python list(리스트) 형태 엑셀(excel) 로 저장하기 (0) | 2019.09.23 |
python으로 json 파일 읽기(파싱) (0) | 2019.09.19 |
AE(autoencoder) tensorflow code (by 골빈해커) (0) | 2019.07.30 |