머신러닝 13

[ML]3. 머신러닝 과정 실습

머신러닝_03_머신러닝 과정 실습 [환경설정]Google Collaboratory 구글 드라이브-새로 만들기-더보기-연결할 앱 더보기 Collaboratory 검색 새로 만들기-더보기-Google Collaboratory 런타임-런타임 유형 변경-T4 GPU(대용량 데이터 처리 세션 종료: 런타임-세션관리-삭제 버튼 -파일 작성 완료 후 반드시 세션 종료해야 다른 파일 사용가능 [머신러닝 과정] [AND 조건문제 실습] 문제와 정답 DataFrame 형태로 만들기 import pandas as pd and_df=pd.DataFrame({'A': [0,0,1,1,1,0,1,0], #문제 'B': [0,1,0,1,0,0,1,1], 'A and B': [0,0,0,1,0,0,1,0] #정답 }) and_df ..

머신러닝 2023.08.10

[ML]2. 머신러닝 개요

머신러닝: 데이터를 기반으로 컴퓨터에게 학습시켜 예측하게 만드는 기법 -인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 알고리즘 기술을 개발하는 분야 - 통계학, 데이터마이닝, 컴퓨터 과학이 어우러진 분야 2. 머신러닝의 역사: 암호해독가 앨런 튜링이 1950년에 ‘기계도 생각할 수 있을까?’ 논문발표 튜링테스트: 컴퓨터가 지능이 있는지 판별하는 시험 규칙 기반 전문가 시스템: if와 else로 하드코딩된 명령을 사용하는 시스템 -많은 상황에 대한 규칙들을 모두 만들어낼 수 없음 -제작한 로직이 특정작업에만 국한, 작업이 조금만 변경되면 전체 시스템을 변경해야 함 -규칙을 설계하려면 해당 분야에 대해서 잘 알고 있어야 함 3. 머신러닝: 데이터를 이용하여 스스로 특성과 패턴을 찾아 학습하고 예측 4. 머..

머신러닝 2023.08.07

[ML]1. 기초통계

기초통계_01 통계: 데이터를 요약해 만든 정보를 바탕으로 데이터 속에 있는 차이를 확인하는 것 -데이터 요약은 큰 틀에서 보고 데이터의 특징을 숫자로 표현하여 그 속에서 차이를 확인하는 것이 중요 2. 빅데이터: 디지털 환경에서 생성되는 수치, 문자, 이미지, 영상데이터를 포함하는 대규모 데이터 -규모(Volume)/속도(Velocity)/다양성(Variety)/정확성(Veracity)/가치(Value) 3. 자료의 종류 *data: datum의 복수형 양적 자료: 수치로 표현할 수 있는 자료 -이산형자료(정수형) 예) 자녀 수 등 -연속형 자료(실수형) 예)키, 무게 등 질적자료: 수치로 표현할 수 없는 자료 예)이름, 직업, 거주지 등 4. 모집단과 표본집단 모집단: 연구목적을 달성하기 위해 통계적..

머신러닝 2023.08.04