1. 대괄호 인덱싱
대괄호 안에 필요한 컬럼명을 나열해 해당 열의 데이터만 추출
df = df[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Survived']]
2. map() 메서드
pd.DataFrame['요소'].map({'기존값': 새로운 값})
df['Sex'] = df['Sex'].map({'male':0, 'female':1}) #sex를 0 또는 1의 정수값으로 변환
3. dropna()와 drop() 메서드
dropna() : 결측치(NaN)가 존재하는 행을 제거(디폴트)
- axis 옵션
- axis = 0(또는 row) : 행 기준 삭제 (default)
- axis = 1(또는 column) : 열 기준 삭제
drop() : 선택한 값이 삭제된 새로운 객체를 리턴(기존 객체는 변화 X)
- axis 옵션 적용됨
df = df.dropna()
X = df.drop('Survived', axis=1) //Survived 열이 삭제된 객체 리턴
4. DecisionTreeClassifier() ; 결정 트리 분류기
파라미터 참고 자료 : https://inuplace.tistory.com/548
from sklearn import tree
model = tree.DecisionTreeClassifier()
5. confusion matrix; 혼동행렬(분류 모델 성능 평가 지표)
pd.DataFrame() : 데이터를 테이블 형식으로 만듦
- DataFrame() 파라미터
- index : 행에 해당하는 인수 전달
- columns : 열에 해당하는 인수 전달
from sklearn.metrics import confusion_matrix
pd.DataFrame(
confusion_matrix(y_test, y_predict),
columns=['Predicted Not Survival', 'Predicted Survival'],
index=['True Not Survival', 'True Sruvival']
)
output
'Etc > Deep Learning' 카테고리의 다른 글
3장 머신러닝 - 비지도 학습(1) : K-평균 군집화, 밀도 기반 군집 분석 (0) | 2021.07.25 |
---|---|
머신러닝 핵심 알고리즘(3) - 지도학습(로지스틱 회귀와 선형 회귀) (0) | 2021.07.21 |
3장 머신러닝 핵심 알고리즘(2) - 지도학습(결정 트리) (0) | 2021.07.20 |
3장(1) 실습 - Pandas 기초 | Tensorflow 기초 | KNN, SVM 구현 예제 설명 (0) | 2021.07.19 |
3장 머신러닝 핵심 알고리즘(1) - 지도학습(K-최근접 이웃, 서포트 벡터 머신) (0) | 2021.07.19 |