머신러닝_03_머신러닝 과정 실습
[환경설정]Google Collaboratory
- 구글 드라이브-새로 만들기-더보기-연결할 앱 더보기
- Collaboratory 검색
- 새로 만들기-더보기-Google Collaboratory
- 런타임-런타임 유형 변경-T4 GPU(대용량 데이터 처리
- 세션 종료: 런타임-세션관리-삭제 버튼
-파일 작성 완료 후 반드시 세션 종료해야 다른 파일 사용가능
[머신러닝 과정]
[AND 조건문제 실습]
- 문제와 정답 DataFrame 형태로 만들기
import pandas as pd
and_df=pd.DataFrame({'A': [0,0,1,1,1,0,1,0], #문제
'B': [0,1,0,1,0,0,1,1],
'A and B': [0,0,0,1,0,0,1,0] #정답
})
and_df
2. 훈련용과 테스트용으로 문제 분할
train=and_df.iloc[0:6] #훈련용 문제/답(0~5번째)
test=and_df.iloc[6: ] #테스트용 문제/답(6~7번째)
3. 문제와 정답 데이터 분할
#문제와 정답 분할
#train 분할
X_train=train.iloc[:, 0:2] #문제(0, 1 컬럼)
y_train=train.iloc[:, 2] #답(2 컬럼)
#y_train=train.iloc[:, -1] #2번째 방법
#test 분할
X_test=test.iloc[:, 0:2] #문제(0, 1 컬럼)
y_test=test.iloc[:, 2] #답(2 컬럼)
4. 모델 생성
#머신러닝 모델 실행하기
from sklearn.neighbors import KNeighborsClassifier
#모델 생성
knn_model=KNeighborsClassifier(n_neighbors=1)
5. 모델 학습
#모델 학습
knn_model.fit(X_train, y_train)
6. 모델 예측
#모델 예측
pre=knn_model.predict(X_test)
7. 모델 평가
from sklearn.metrics import accuracy_score #평가 라이브러리
accuracy_score(pre, y_test) #예측결과 실제 결과
[XOR 조건문제 실습]
- A,B 값이 모두 True이거나 False인 경우 False
- A,B 값이 서로 다를 경우 True
- 데이터 만들기
#XOR 연산데이터 만들기
xor_df=pd.DataFrame({'A': [0,1,0,1,0,1,0,1,0,1],
'B': [1,0,0,1,0,1,1,0,1,0],
'A xor B': [1, 1, 0,0,0,0,1,1,1,1 ]
})
xor_df
2. 훈련용/평가용 데이터 분할
#훈련용/평가용 데이터 분할
train2=xor_df.iloc[0:7] #훈련용 데이터
test2=xor_df[7: ] #평가용 데이터
3. 문제/정답 데이터 분할
#문제와 정답 분할
#훈련용 문제/정답
X_train2=train2.iloc[:, 0:2] #문제
y_train2=train2.iloc[ :, 2] #정답
#평가용 문제/정답
X_test2=test2.iloc[:, 0:2] #문제
y_test2=test2.iloc[:, -1] #정답
4. 모델 생성
#모델 생성
knn_model2=KNeighborsClassifier(n_neighbors=1)
5. 모델 학습
#모델 학습
knn_model2.fit(X_train2, y_train2)
6. 모델 예측
#모델 예측
pre2=knn_model2.predict(X_test2)
7. 모델 평가
#모델 평가
accuracy_score(pre2, y_test2)
'머신러닝' 카테고리의 다른 글
[ML]6. Decision Tree 모델 (0) | 2023.08.17 |
---|---|
[ML]5. KNN 모델(Iris 데이터) (0) | 2023.08.16 |
[ML]4. 데이터 핸들링(Titanic 실습) (0) | 2023.08.14 |
[ML]2. 머신러닝 개요 (0) | 2023.08.07 |
[ML]1. 기초통계 (0) | 2023.08.04 |