SlideShare una empresa de Scribd logo
1 de 65
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
슬로우캠퍼스 딥러닝 스쿨
– 딥러닝/머신러닝 이론 파트
한대희 @ 슬로우캠퍼스
딥러닝 교육/컨설팅
daehee@slowcampus.com
http://medium.com/@slowcampus
http://slowcampus.com
Just Start up your Deep Learning for your Future !
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
슬로우캠퍼스
SLOW는 SW(소프트웨어) 입니다
2
슬로우는 학습과 성장을 의미합니다
홈페이지 http://slowcampus.com
블로그 http://medium.com/@slowcampus
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
딥러닝 스쿨: 딥러닝 Tensorflow & Keras 1일 완성
• 딥러닝 워크샵 클릭
• 한대희 강사 클릭
• 딥러닝 참가 클릭
3
딥러닝
배우고
달리자
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
인공지능은 기술이 아니여, 아직 달성되지 않은Goal 이여 !!
4
데이터 학습/분석 기술
머신러닝 수학통계적
인공지능
데이터를
배우는
기술
데이터를
지탱하는
기술
데이터마이닝
클라우드 기술 (인프라)
컴퓨팅
DB,
스토리지
Goal:
데이터로
가치 만들기
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
데이터의 시대
• 제1차 정보통신혁명 à 데이터의 흐름과 보관 완성 시대 (1980년~2010년)
• 제2차 정보통신혁명 à 데이터분석/학습을 통한 가치창출과 인공지능의 시대 (2010년~2040년)
유형의 재화(HW)는 공유되고, 서비스되는 형태로 변화하면서,
무형의 SW중심의 사회/경제으로 진화 중.
그 진화 과정에서 핵심 재화는 데이터임.
인공지능구현 기술, 데이터마이닝 기술은 데이터로부터 재화를 만들어내는 핵심 기술임.
여러 방법론 중에 딥러닝이 거의 모든 분야에서 최고의 성능을 보이고 있음.
5
Data
Information
Knowledge
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
딥러닝/머신러닝 관련 스킬 피라미드
• 새로운 딥러닝
아키텍쳐 및 모델 창안
ML
Researcher
• 자신에 도메인에 딥러닝을
적용하여 최고 성능을 구현
ML Engineer
• 데이터분석/딥러닝
인프라 구현/관리
Data Engineer
6
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
판단이란?
판단 判斷 Judgement, Decision
7
1 .사물을 인식하여 논리나 기준 등에 따라 판정을 내림.
2 .어떤 대상에 대하여 무슨 일인가를 판정하는 인간의 사유 작용.
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
판단의 기준은?
일반적으로 우리는 무엇에 근거하여 판단/결정을 내리는가?
• 규칙 (Rule) 기반
• 사례(Example) 기반 – 통계 및 데이터 기반
8
à 이제는 Data Driven Decision 시대로 가고 있는 중
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
판단의 타입
판단(문제에 대한 답)의 종류
9
질문(문제) 답의 종류 판단 작업 이름
이것은 암세포인가 ?
이 사람은 보험가입 중에 차 사고를 낼
것인가?
Logistic
Yes/No, True/False
Logistic regression
강아지? 고양이? 소? 새? 불연속값
(Discrete)
Classification
주식 종합지수 예측,
태풍의 진로,
로봇제어를 위한 힘 산출
연속값
(Continuous)
Regression,
Prediction,
…
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
문제 유형 - regression
10
주어진 점(point, 데이터)들로부터
Input X와 output Y 사이의 관계식(함수)을 찾는 것
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
문제유형 – Classification (분류)
Input X에 대해 label(output Y, discrete values) 를 붙이는 것
CAT (1)
DOG (2)
입력 X 출력 Y
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
머신러닝 - Classification
Input X에 대해 label(output Y) 를 붙이는 것
0
1
2
...
9
입력 X 출력 Y
모델의 의미 (실생활에서)
13
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Fit & Modeling
기성복은
우리의 몸을
5~6 가지의 수치로
표현(모델링)하는 것임
14
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Fit & Modeling
마네킹은
우리 몸을
1개의 대표 수치로
표현하는 것임
15
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Fit
몸을 옷에 맞출 것인가?
옷을 몸에 맞출 것인가?
16
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
• 내 몸에 맞는 옷을 찾아가는 과정
• 내 데이터에 맞는 모델을 찾아가는 과정
17
Fitting
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
이 점들을 모델링 해보자
18
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Exponential fit: y = aebx
• 데이터(점)에 가장 fit
하는 a, b 값을 구하기
• 파라미터가 2개인 모
델임. (a, b)
19
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Power fit: y = axb
20
• 데이터(점)에 가장 fit
하는 a, b 값을 구하기
• 파라미터가 2개인 모
델임. (a, b)
머신 러닝 및 모델링의 원리
(수학통계의 모델링도 이와 유사함)
21
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
– H.B. BARLOW
“Intelligence is the art of
good guesswork”
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
– 한 대 희 J
“지능이란
다른 것들에서 공통점을 찾고,
비슷한 것들에서 차이점을 찾는 것”
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링 – fitting 의 과정
가설
실험
관측
24
데이터 분석이 곧 데이터 모델링이며,
데이터 모델링 과정은 과학 실험 과정과 유사하다.
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링
• Input – output 간의 함수/관계/매핑/패턴을 가장 잘
표현하는 모델을 찾아가기
25
* 실세계의 데이터는 수학세상의 함수의 정의를
만족하지 못하는 경우가 많다. X를 구성하는 feature를
우리가 다 알지 못하기 때문이다.
함수정의: 모든 x에 대해 단 하나의 y가 존재해야 한다.
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링으로 찾고자 하는 것 (용어)
26
문제 답
입력값(X) 출력값(Y)
Features Class, Label
Pattern Function
Vectors Relation
학습/테스트 데이터
(training/test)
Probability Function
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링
•Input – output 블랙박스
27
? ?
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링 – 학습 및 결관
• Input – output 관계를 저장
28
0.0 0.0 0.0 ….
0.0 0.0 0.0 ….
0.0 0.0 0.0 ….
0.9 0.8 0.1 …
0.2 0.3 0.5 …
0.2 0.3 0.5 …
…
학습 결과
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
연립방정식 (2원1차)
• 미지수(변수)가 2개이면 식이 2개 필요하다
• 딥러닝은 엄청난 숫자의 파라미터(변수)가 있는 것임
29
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
연립방정식 (3원1차)
30
• X (x, y, z): 데이터
• A, B는 모델 파라미터
• A의 이름은 Weight
• B의 이름은 Bias
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
31
연립방정식 (N원1차)
• X (x1, x2, …, xn): 데이터
• A, B는 모델 파라미터
• A의 이름은 Weight
• B의 이름은 Bias
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링 – 학습 과정 원리
• 진짜 output과 예측한 output의 오차(Erorr, Loss, Cost)를
• 점진적으로 줄여나가는 것 (minimize)
• Iteration == Loop == Epoch
32
0.9 0.8 0.1 …
0.2 0.3 0.5 …
0.2 0.3 0.5 …
…
X
Y’Y
모델
파라미터
E = Y – Y’
파라미터(W, b) 조정
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
모델링 과정
• 오차(Loss, Cost)를 최소화하기 위해 모델 내부 파라미터
(weights)를 점진적으로 수정해 나가는 최적화 문제임.
33
X: 실제 입력 데이타 Y: 실제 데이터(학습용)
Y”: 모델의 출력 데이터
오차(MSE, cost, loss)모델
파라미터
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Training, Validation, Test
• Training – 교과서
• Validation – 정기 모의고사: 언
제 학습을 종료할지 판단
• Testing – 최종 모의고사, 학습
완료된 모델의 최종 성능
34
보유한 전체 데이타
학습용
(Training)
테스트용
(Testing)
분할
검증용
(Validation)
80%, 10%, 10%
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
학습(training)과 테스트
35
training(X, Y) pair: Data for Training
Y’ - 모델의 출력값
학습된모델
파라미터들
(weights,
biases)
파일
(파라미터
저장)
Save
X’: Data for Test test
학습된모델
파라미터들
(weights,
biases)
Load
Threshold
&
Decision
머신 러닝 종류
36
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
지능은 학습의 누적
37
• 머신러닝에서는 데이터의 누적, 데이터 학습의 누적이 지능
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
머신 러닝의 종류
38
Supervised Unsupervised
Reinforcement
Learning
정답지가 있음
(X, Y)쌍 존재
정답지가 없음
Guess & Measure
모델과 환경이 서
로 영향을 줄때 사
용: 게임, 주식
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Supervised 학습 사례) Lunit
39
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
사례) 뷰노
40
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Unsupervised사례) Dable뉴스 추천, 상품 추천
41
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Unsupervised 사례) Watcha 영화 추천, 뮤직 추천
42
지도학습 vs 비지도학습
43
http://www.kdnuggets.com/2016/05/implement-machine-learning-algorithms-scratch.html
• 지도학습 –
• 비지도학습 – 데이터 마이닝 분야에 많음
명칭, 용어 정리하고 가실께요
44
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
인공지능기술 자체가 인공지능은 아님
인공지능은 목표임. 머신러닝은 수단임
인공지능기술이란 인공지능을 목표로하는
방법/기술부류를 의미함
머신러닝 기법 중 현재 딥러닝이 답
45
인공지능
머신러닝
딥러닝
수단(Method)
목표(Goal)
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
머신러닝 == 데이터 러닝
머신러닝이란? 머신(컴퓨터)이 데이터간의 규칙/패턴/함수/관
계/매핑을 찾아내는 것.
à Learning from Data
46
Inductive Learning (learning by examples)
automatic discovery of regularities in data through the use
of computer algorithms and generalizing those into new but
similar data
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
데이터마이닝
• 사람 및 전문가도 금방 분석해내기 어려운 가치 정보를 방대한
데이터로부터 찾아내는 작업
• 아마존 – 책, 영화 추천 (Collaboration filtering)
• 월마트 – 장바구니 추천 (Associative Rules)
• …
47
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
인공지능
• 사람이라면 누구나 잘 하는 것 (다른 동물/사물/기계 대비하여)
• 보고, 글자를 읽고
• 듣고, 말을 이해하고
• 말하고
• 걷고
• 운전하고
48
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
인공지능을 실현하려면 딥러닝 이상의 돌파구가 필요
데이터 분석/활용
• 인공지능 (보기,읽기,듣기,말하기,배우기)
• 자율주행 자동차 (달리기)
• 로봇 (움직이기, 제어하기)
• 드론 (날기)
• IoT – 데이터 원천의 확대
• 생명공학+데이타분석
• 뇌과학
생명,뇌연구
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
패턴 인식 (Pattern Recognition)
• 1990년대 용어
• 데이터에서 어떠한 규칙적인 패턴을 찾아내기 위한 기술
• ‘데이터 분석’ 이라는 말과 유사한 레벨
• ‘데이터 분석이 수학/통계학의 용어라면
• ‘패턴 인식’은 전산학(컴퓨터 사이언스)의 용어라고 할 수 있다
50
데이터와 서비스
51
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
왜 카카오/네이버는 AI스피커를 공짜로 뿌리나요?
서비스
클라우드데이터
52
서비스 – 데이터의
선순환 고리를 만들어야
살아남는다 !
구글/페북/애플/아마존에
밟혀 죽는다 ㅠㅠ
살려야 한다 !!
반드시
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
딥러닝 기술 배우면 뭐하나? 데이터가 없는데 !
53
클라우드
컴퓨팅 스토리지
1.서비스
2.데이타3.분석
데이터
수집,저장,가공처리
Data
Scientist
Data
Engineer
데이터 분석,
지능
수학통계적 방법론
vs
머신 러닝 방법론
54
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
55
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Statistics vs Machine Learning
56https://www.datasciencecentral.com/profiles/blogs/machine-learning-vs-traditional-statistics-different-philosophi-1
https://svds.com/machine-learning-vs-statistics/
“Machine learning is for Computer
Science majors who couldn’t pass a
Statistics course.”
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Statistics vs Machine Learning
57https://www.datasciencecentral.com/profiles/blogs/machine-learning-vs-traditional-statistics-different-philosophi-1
https://svds.com/machine-learning-vs-statistics/
“Machine learning is essentially
a form of applied statistics”
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Statistics vs Machine Learning
58https://www.datasciencecentral.com/profiles/blogs/machine-learning-vs-traditional-statistics-different-philosophi-1
https://svds.com/machine-learning-vs-statistics/
“Machine learning is Statistics minus any
checking of models and assumptions.”
머신러닝 vs 통계/수학
수학
• Deterministic
• 입력, 출력 관계 명확
• 데이터의 확률분포, 함수의 차
수 등에 대한 가정 포함
머신 러닝
• Stochastic (probabilistic + time)
• 입력변화에 따른 출력 변화에 대한
예측이 어려움
• 데이터에 대한 가정 별로 없음
59
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
Machine Learning (ML) Traditional statistics (TS)
Goal: “learning” from data of all sorts Goal: Analyzing and summarizing data
No rigid pre-assumptions about the problem a
nd data distributions in general
Tight assumptions about the problem and data distri
butions
More liberal in the techniques and approaches Conservative in techniques and approaches
Generalization is pursued empirically through t
raining, validation and test datasets
Generalization is pursued using statistical tests on the
training dataset
Not shy of using heuristics in approaches in se
arch of a “good solution”
Using tight initial assumptions about data and the pr
oblem, typically in search of an optimal solution unde
r those assumptions
Redundancy in features (variables) is okay, and
often helpful. Preferable to use algorithms desi
gned to handle large number of features
Often requires independent features. Preferable to us
e less number of input features
Does not promote data reduction prior to learn
ing. Promotes a culture of abundance: “the mo
re data, the better”
Promotes data reduction as much as possible before
modeling (sampling, less inputs, …)
Has faced with solving more complex problems
in learning, reasoning, perception, knowledge
presentation, …
Mainly focused on traditional data analysis
60
머신 러닝 vs 알고리즘
61
머신러닝 vs 알고리즘
머신러닝
• 데이터를 분석하는 프로그램을 직
접 개발하거나 활용
• 알고리즘은 학습된 모델의 파라미
터 값에 담겨지게 됨. 해석 어려움.
알고리즘
• 컴퓨터에게 step-by-step 으로
해야 할 세부 절차/작업/규칙을
직접 명식적으로 알려줌
• 알고리즘을 프로그램에 담음
62
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
알고리즘 예시 - sorting
63
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
알고리즘 예시 - sorting
64
배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스,
알고리즘 예시 - sorting
65

Más contenido relacionado

La actualidad más candente

파이썬 데이터 분석 3종세트
파이썬 데이터 분석 3종세트파이썬 데이터 분석 3종세트
파이썬 데이터 분석 3종세트itproman35
 
Deep learning framework 제작
Deep learning framework 제작Deep learning framework 제작
Deep learning framework 제작Tae Young Lee
 
Ml for 정형데이터
Ml for 정형데이터Ml for 정형데이터
Ml for 정형데이터JEEHYUN PAIK
 
파이썬으로 나만의 강화학습 환경 만들기
파이썬으로 나만의 강화학습 환경 만들기파이썬으로 나만의 강화학습 환경 만들기
파이썬으로 나만의 강화학습 환경 만들기정주 김
 
딥러닝 - 역사와 이론적 기초
딥러닝 - 역사와 이론적 기초딥러닝 - 역사와 이론적 기초
딥러닝 - 역사와 이론적 기초Hyungsoo Ryoo
 
실패한 오픈소스 공헌으로 배워가기
실패한 오픈소스 공헌으로 배워가기실패한 오픈소스 공헌으로 배워가기
실패한 오픈소스 공헌으로 배워가기Sung-Hee Kang
 
딥러닝 기본 원리의 이해
딥러닝 기본 원리의 이해딥러닝 기본 원리의 이해
딥러닝 기본 원리의 이해Hee Won Park
 
기계학습을 이용한 숫자인식기 제작
기계학습을 이용한 숫자인식기 제작기계학습을 이용한 숫자인식기 제작
기계학습을 이용한 숫자인식기 제작Do Hoerin
 
Google AlphaGo, 어떻게 동작할까요?
Google AlphaGo, 어떻게 동작할까요?Google AlphaGo, 어떻게 동작할까요?
Google AlphaGo, 어떻게 동작할까요?Lee Ji Eun
 
머신러닝 간단 뽀개기
머신러닝 간단 뽀개기머신러닝 간단 뽀개기
머신러닝 간단 뽀개기Heejae Jeong
 
개발자를 위한 공감세미나 tensor-flow
개발자를 위한 공감세미나 tensor-flow개발자를 위한 공감세미나 tensor-flow
개발자를 위한 공감세미나 tensor-flow양 한빛
 
Ai 그까이거
Ai 그까이거Ai 그까이거
Ai 그까이거도형 임
 
Tensorflow for Deep Learning(SK Planet)
Tensorflow for Deep Learning(SK Planet)Tensorflow for Deep Learning(SK Planet)
Tensorflow for Deep Learning(SK Planet)Tae Young Lee
 
알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기Kwangsik Lee
 
코드와 실습으로 이해하는 인공지능
코드와 실습으로 이해하는 인공지능코드와 실습으로 이해하는 인공지능
코드와 실습으로 이해하는 인공지능도형 임
 
[Tf2017] day2 jwkang_pub
[Tf2017] day2 jwkang_pub[Tf2017] day2 jwkang_pub
[Tf2017] day2 jwkang_pubJaewook. Kang
 
Anomaly detection practive_using_deep_learning
Anomaly detection practive_using_deep_learningAnomaly detection practive_using_deep_learning
Anomaly detection practive_using_deep_learning도형 임
 
Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차Taekyung Han
 
Learning by association
Learning by associationLearning by association
Learning by association홍배 김
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)Haesun Park
 

La actualidad más candente (20)

파이썬 데이터 분석 3종세트
파이썬 데이터 분석 3종세트파이썬 데이터 분석 3종세트
파이썬 데이터 분석 3종세트
 
Deep learning framework 제작
Deep learning framework 제작Deep learning framework 제작
Deep learning framework 제작
 
Ml for 정형데이터
Ml for 정형데이터Ml for 정형데이터
Ml for 정형데이터
 
파이썬으로 나만의 강화학습 환경 만들기
파이썬으로 나만의 강화학습 환경 만들기파이썬으로 나만의 강화학습 환경 만들기
파이썬으로 나만의 강화학습 환경 만들기
 
딥러닝 - 역사와 이론적 기초
딥러닝 - 역사와 이론적 기초딥러닝 - 역사와 이론적 기초
딥러닝 - 역사와 이론적 기초
 
실패한 오픈소스 공헌으로 배워가기
실패한 오픈소스 공헌으로 배워가기실패한 오픈소스 공헌으로 배워가기
실패한 오픈소스 공헌으로 배워가기
 
딥러닝 기본 원리의 이해
딥러닝 기본 원리의 이해딥러닝 기본 원리의 이해
딥러닝 기본 원리의 이해
 
기계학습을 이용한 숫자인식기 제작
기계학습을 이용한 숫자인식기 제작기계학습을 이용한 숫자인식기 제작
기계학습을 이용한 숫자인식기 제작
 
Google AlphaGo, 어떻게 동작할까요?
Google AlphaGo, 어떻게 동작할까요?Google AlphaGo, 어떻게 동작할까요?
Google AlphaGo, 어떻게 동작할까요?
 
머신러닝 간단 뽀개기
머신러닝 간단 뽀개기머신러닝 간단 뽀개기
머신러닝 간단 뽀개기
 
개발자를 위한 공감세미나 tensor-flow
개발자를 위한 공감세미나 tensor-flow개발자를 위한 공감세미나 tensor-flow
개발자를 위한 공감세미나 tensor-flow
 
Ai 그까이거
Ai 그까이거Ai 그까이거
Ai 그까이거
 
Tensorflow for Deep Learning(SK Planet)
Tensorflow for Deep Learning(SK Planet)Tensorflow for Deep Learning(SK Planet)
Tensorflow for Deep Learning(SK Planet)
 
알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기알아두면 쓸데있는 신비한 딥러닝 이야기
알아두면 쓸데있는 신비한 딥러닝 이야기
 
코드와 실습으로 이해하는 인공지능
코드와 실습으로 이해하는 인공지능코드와 실습으로 이해하는 인공지능
코드와 실습으로 이해하는 인공지능
 
[Tf2017] day2 jwkang_pub
[Tf2017] day2 jwkang_pub[Tf2017] day2 jwkang_pub
[Tf2017] day2 jwkang_pub
 
Anomaly detection practive_using_deep_learning
Anomaly detection practive_using_deep_learningAnomaly detection practive_using_deep_learning
Anomaly detection practive_using_deep_learning
 
Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차Python을 활용한 챗봇 서비스 개발 2일차
Python을 활용한 챗봇 서비스 개발 2일차
 
Learning by association
Learning by associationLearning by association
Learning by association
 
1.introduction(epoch#2)
1.introduction(epoch#2)1.introduction(epoch#2)
1.introduction(epoch#2)
 

Similar a 마이캠퍼스 딥러닝스쿨(한돌) 파트#1-이론

[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝Haesun Park
 
T ka kr_4th
T ka kr_4thT ka kr_4th
T ka kr_4thSubin An
 
전자회로설계(설문분석)2013-1
전자회로설계(설문분석)2013-1전자회로설계(설문분석)2013-1
전자회로설계(설문분석)2013-1Yong Heui Cho
 
Workshop 210417 dhlee
Workshop 210417 dhleeWorkshop 210417 dhlee
Workshop 210417 dhleeDongheon Lee
 
Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)Don Chang
 
효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁Jaimie Kwon (권재명)
 
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인r-kor
 
안.전.제.일. 강화학습!
안.전.제.일. 강화학습!안.전.제.일. 강화학습!
안.전.제.일. 강화학습!Dongmin Lee
 
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출 NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출 정주 김
 
2018 06-11-active-question-answering
2018 06-11-active-question-answering2018 06-11-active-question-answering
2018 06-11-active-question-answeringWoong won Lee
 
객체지향 개념 (쫌 아는체 하기)
객체지향 개념 (쫌 아는체 하기)객체지향 개념 (쫌 아는체 하기)
객체지향 개념 (쫌 아는체 하기)Seung-June Lee
 
Deep Learning for AI (1)
Deep Learning for AI (1)Deep Learning for AI (1)
Deep Learning for AI (1)Dongheon Lee
 
Coding interview
Coding interviewCoding interview
Coding interviewSoohan Ahn
 
학생 개발자, 인턴십으로 성장하기
학생 개발자, 인턴십으로 성장하기학생 개발자, 인턴십으로 성장하기
학생 개발자, 인턴십으로 성장하기재원 최
 
왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능SeokWon Kim
 
Into The Unknown - A Gentle Introduction to AI.pptx
Into The Unknown - A Gentle Introduction to AI.pptxInto The Unknown - A Gentle Introduction to AI.pptx
Into The Unknown - A Gentle Introduction to AI.pptxMyungHoKim10
 
Security_issues of AI
Security_issues of AISecurity_issues of AI
Security_issues of AI대선 최
 

Similar a 마이캠퍼스 딥러닝스쿨(한돌) 파트#1-이론 (20)

[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝
[홍대 머신러닝 스터디 - 핸즈온 머신러닝] 1장. 한눈에 보는 머신러닝
 
T ka kr_4th
T ka kr_4thT ka kr_4th
T ka kr_4th
 
전자회로설계(설문분석)2013-1
전자회로설계(설문분석)2013-1전자회로설계(설문분석)2013-1
전자회로설계(설문분석)2013-1
 
메이크챗봇 자연어기초
메이크챗봇 자연어기초메이크챗봇 자연어기초
메이크챗봇 자연어기초
 
Ml
MlMl
Ml
 
Workshop 210417 dhlee
Workshop 210417 dhleeWorkshop 210417 dhlee
Workshop 210417 dhlee
 
Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)
 
효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁효율적 데이터 과학을 위한 7가지 팁
효율적 데이터 과학을 위한 7가지 팁
 
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
RUCK 2017 권재명 효율적 데이터 과학과 데이터 조직을 위한 7가지 요인
 
안.전.제.일. 강화학습!
안.전.제.일. 강화학습!안.전.제.일. 강화학습!
안.전.제.일. 강화학습!
 
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출 NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
NDC 2016 김정주 - 기계학습을 활용한 게임어뷰징 검출
 
2018 06-11-active-question-answering
2018 06-11-active-question-answering2018 06-11-active-question-answering
2018 06-11-active-question-answering
 
객체지향 개념 (쫌 아는체 하기)
객체지향 개념 (쫌 아는체 하기)객체지향 개념 (쫌 아는체 하기)
객체지향 개념 (쫌 아는체 하기)
 
MachineLearning
MachineLearningMachineLearning
MachineLearning
 
Deep Learning for AI (1)
Deep Learning for AI (1)Deep Learning for AI (1)
Deep Learning for AI (1)
 
Coding interview
Coding interviewCoding interview
Coding interview
 
학생 개발자, 인턴십으로 성장하기
학생 개발자, 인턴십으로 성장하기학생 개발자, 인턴십으로 성장하기
학생 개발자, 인턴십으로 성장하기
 
왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능왓슨컴퓨터의 인공지능
왓슨컴퓨터의 인공지능
 
Into The Unknown - A Gentle Introduction to AI.pptx
Into The Unknown - A Gentle Introduction to AI.pptxInto The Unknown - A Gentle Introduction to AI.pptx
Into The Unknown - A Gentle Introduction to AI.pptx
 
Security_issues of AI
Security_issues of AISecurity_issues of AI
Security_issues of AI
 

마이캠퍼스 딥러닝스쿨(한돌) 파트#1-이론

  • 1. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 슬로우캠퍼스 딥러닝 스쿨 – 딥러닝/머신러닝 이론 파트 한대희 @ 슬로우캠퍼스 딥러닝 교육/컨설팅 daehee@slowcampus.com http://medium.com/@slowcampus http://slowcampus.com Just Start up your Deep Learning for your Future !
  • 2. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 슬로우캠퍼스 SLOW는 SW(소프트웨어) 입니다 2 슬로우는 학습과 성장을 의미합니다 홈페이지 http://slowcampus.com 블로그 http://medium.com/@slowcampus
  • 3. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 딥러닝 스쿨: 딥러닝 Tensorflow & Keras 1일 완성 • 딥러닝 워크샵 클릭 • 한대희 강사 클릭 • 딥러닝 참가 클릭 3 딥러닝 배우고 달리자
  • 4. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 인공지능은 기술이 아니여, 아직 달성되지 않은Goal 이여 !! 4 데이터 학습/분석 기술 머신러닝 수학통계적 인공지능 데이터를 배우는 기술 데이터를 지탱하는 기술 데이터마이닝 클라우드 기술 (인프라) 컴퓨팅 DB, 스토리지 Goal: 데이터로 가치 만들기
  • 5. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 데이터의 시대 • 제1차 정보통신혁명 à 데이터의 흐름과 보관 완성 시대 (1980년~2010년) • 제2차 정보통신혁명 à 데이터분석/학습을 통한 가치창출과 인공지능의 시대 (2010년~2040년) 유형의 재화(HW)는 공유되고, 서비스되는 형태로 변화하면서, 무형의 SW중심의 사회/경제으로 진화 중. 그 진화 과정에서 핵심 재화는 데이터임. 인공지능구현 기술, 데이터마이닝 기술은 데이터로부터 재화를 만들어내는 핵심 기술임. 여러 방법론 중에 딥러닝이 거의 모든 분야에서 최고의 성능을 보이고 있음. 5 Data Information Knowledge
  • 6. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 딥러닝/머신러닝 관련 스킬 피라미드 • 새로운 딥러닝 아키텍쳐 및 모델 창안 ML Researcher • 자신에 도메인에 딥러닝을 적용하여 최고 성능을 구현 ML Engineer • 데이터분석/딥러닝 인프라 구현/관리 Data Engineer 6
  • 7. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 판단이란? 판단 判斷 Judgement, Decision 7 1 .사물을 인식하여 논리나 기준 등에 따라 판정을 내림. 2 .어떤 대상에 대하여 무슨 일인가를 판정하는 인간의 사유 작용.
  • 8. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 판단의 기준은? 일반적으로 우리는 무엇에 근거하여 판단/결정을 내리는가? • 규칙 (Rule) 기반 • 사례(Example) 기반 – 통계 및 데이터 기반 8 à 이제는 Data Driven Decision 시대로 가고 있는 중
  • 9. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 판단의 타입 판단(문제에 대한 답)의 종류 9 질문(문제) 답의 종류 판단 작업 이름 이것은 암세포인가 ? 이 사람은 보험가입 중에 차 사고를 낼 것인가? Logistic Yes/No, True/False Logistic regression 강아지? 고양이? 소? 새? 불연속값 (Discrete) Classification 주식 종합지수 예측, 태풍의 진로, 로봇제어를 위한 힘 산출 연속값 (Continuous) Regression, Prediction, …
  • 10. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 문제 유형 - regression 10 주어진 점(point, 데이터)들로부터 Input X와 output Y 사이의 관계식(함수)을 찾는 것
  • 11. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 문제유형 – Classification (분류) Input X에 대해 label(output Y, discrete values) 를 붙이는 것 CAT (1) DOG (2) 입력 X 출력 Y
  • 12. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 머신러닝 - Classification Input X에 대해 label(output Y) 를 붙이는 것 0 1 2 ... 9 입력 X 출력 Y
  • 14. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Fit & Modeling 기성복은 우리의 몸을 5~6 가지의 수치로 표현(모델링)하는 것임 14
  • 15. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Fit & Modeling 마네킹은 우리 몸을 1개의 대표 수치로 표현하는 것임 15
  • 16. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Fit 몸을 옷에 맞출 것인가? 옷을 몸에 맞출 것인가? 16
  • 17. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, • 내 몸에 맞는 옷을 찾아가는 과정 • 내 데이터에 맞는 모델을 찾아가는 과정 17 Fitting
  • 18. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 이 점들을 모델링 해보자 18
  • 19. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Exponential fit: y = aebx • 데이터(점)에 가장 fit 하는 a, b 값을 구하기 • 파라미터가 2개인 모 델임. (a, b) 19
  • 20. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Power fit: y = axb 20 • 데이터(점)에 가장 fit 하는 a, b 값을 구하기 • 파라미터가 2개인 모 델임. (a, b)
  • 21. 머신 러닝 및 모델링의 원리 (수학통계의 모델링도 이와 유사함) 21
  • 22. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, – H.B. BARLOW “Intelligence is the art of good guesswork”
  • 23. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, – 한 대 희 J “지능이란 다른 것들에서 공통점을 찾고, 비슷한 것들에서 차이점을 찾는 것”
  • 24. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링 – fitting 의 과정 가설 실험 관측 24 데이터 분석이 곧 데이터 모델링이며, 데이터 모델링 과정은 과학 실험 과정과 유사하다.
  • 25. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링 • Input – output 간의 함수/관계/매핑/패턴을 가장 잘 표현하는 모델을 찾아가기 25 * 실세계의 데이터는 수학세상의 함수의 정의를 만족하지 못하는 경우가 많다. X를 구성하는 feature를 우리가 다 알지 못하기 때문이다. 함수정의: 모든 x에 대해 단 하나의 y가 존재해야 한다.
  • 26. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링으로 찾고자 하는 것 (용어) 26 문제 답 입력값(X) 출력값(Y) Features Class, Label Pattern Function Vectors Relation 학습/테스트 데이터 (training/test) Probability Function
  • 27. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링 •Input – output 블랙박스 27 ? ?
  • 28. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링 – 학습 및 결관 • Input – output 관계를 저장 28 0.0 0.0 0.0 …. 0.0 0.0 0.0 …. 0.0 0.0 0.0 …. 0.9 0.8 0.1 … 0.2 0.3 0.5 … 0.2 0.3 0.5 … … 학습 결과
  • 29. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 연립방정식 (2원1차) • 미지수(변수)가 2개이면 식이 2개 필요하다 • 딥러닝은 엄청난 숫자의 파라미터(변수)가 있는 것임 29
  • 30. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 연립방정식 (3원1차) 30 • X (x, y, z): 데이터 • A, B는 모델 파라미터 • A의 이름은 Weight • B의 이름은 Bias
  • 31. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 31 연립방정식 (N원1차) • X (x1, x2, …, xn): 데이터 • A, B는 모델 파라미터 • A의 이름은 Weight • B의 이름은 Bias
  • 32. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링 – 학습 과정 원리 • 진짜 output과 예측한 output의 오차(Erorr, Loss, Cost)를 • 점진적으로 줄여나가는 것 (minimize) • Iteration == Loop == Epoch 32 0.9 0.8 0.1 … 0.2 0.3 0.5 … 0.2 0.3 0.5 … … X Y’Y 모델 파라미터 E = Y – Y’ 파라미터(W, b) 조정
  • 33. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 모델링 과정 • 오차(Loss, Cost)를 최소화하기 위해 모델 내부 파라미터 (weights)를 점진적으로 수정해 나가는 최적화 문제임. 33 X: 실제 입력 데이타 Y: 실제 데이터(학습용) Y”: 모델의 출력 데이터 오차(MSE, cost, loss)모델 파라미터
  • 34. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Training, Validation, Test • Training – 교과서 • Validation – 정기 모의고사: 언 제 학습을 종료할지 판단 • Testing – 최종 모의고사, 학습 완료된 모델의 최종 성능 34 보유한 전체 데이타 학습용 (Training) 테스트용 (Testing) 분할 검증용 (Validation) 80%, 10%, 10%
  • 35. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 학습(training)과 테스트 35 training(X, Y) pair: Data for Training Y’ - 모델의 출력값 학습된모델 파라미터들 (weights, biases) 파일 (파라미터 저장) Save X’: Data for Test test 학습된모델 파라미터들 (weights, biases) Load Threshold & Decision
  • 37. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 지능은 학습의 누적 37 • 머신러닝에서는 데이터의 누적, 데이터 학습의 누적이 지능
  • 38. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 머신 러닝의 종류 38 Supervised Unsupervised Reinforcement Learning 정답지가 있음 (X, Y)쌍 존재 정답지가 없음 Guess & Measure 모델과 환경이 서 로 영향을 줄때 사 용: 게임, 주식
  • 39. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Supervised 학습 사례) Lunit 39
  • 40. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 사례) 뷰노 40
  • 41. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Unsupervised사례) Dable뉴스 추천, 상품 추천 41
  • 42. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Unsupervised 사례) Watcha 영화 추천, 뮤직 추천 42
  • 43. 지도학습 vs 비지도학습 43 http://www.kdnuggets.com/2016/05/implement-machine-learning-algorithms-scratch.html • 지도학습 – • 비지도학습 – 데이터 마이닝 분야에 많음
  • 44. 명칭, 용어 정리하고 가실께요 44
  • 45. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 인공지능기술 자체가 인공지능은 아님 인공지능은 목표임. 머신러닝은 수단임 인공지능기술이란 인공지능을 목표로하는 방법/기술부류를 의미함 머신러닝 기법 중 현재 딥러닝이 답 45 인공지능 머신러닝 딥러닝 수단(Method) 목표(Goal)
  • 46. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 머신러닝 == 데이터 러닝 머신러닝이란? 머신(컴퓨터)이 데이터간의 규칙/패턴/함수/관 계/매핑을 찾아내는 것. à Learning from Data 46 Inductive Learning (learning by examples) automatic discovery of regularities in data through the use of computer algorithms and generalizing those into new but similar data
  • 47. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 데이터마이닝 • 사람 및 전문가도 금방 분석해내기 어려운 가치 정보를 방대한 데이터로부터 찾아내는 작업 • 아마존 – 책, 영화 추천 (Collaboration filtering) • 월마트 – 장바구니 추천 (Associative Rules) • … 47
  • 48. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 인공지능 • 사람이라면 누구나 잘 하는 것 (다른 동물/사물/기계 대비하여) • 보고, 글자를 읽고 • 듣고, 말을 이해하고 • 말하고 • 걷고 • 운전하고 48
  • 49. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 인공지능을 실현하려면 딥러닝 이상의 돌파구가 필요 데이터 분석/활용 • 인공지능 (보기,읽기,듣기,말하기,배우기) • 자율주행 자동차 (달리기) • 로봇 (움직이기, 제어하기) • 드론 (날기) • IoT – 데이터 원천의 확대 • 생명공학+데이타분석 • 뇌과학 생명,뇌연구
  • 50. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 패턴 인식 (Pattern Recognition) • 1990년대 용어 • 데이터에서 어떠한 규칙적인 패턴을 찾아내기 위한 기술 • ‘데이터 분석’ 이라는 말과 유사한 레벨 • ‘데이터 분석이 수학/통계학의 용어라면 • ‘패턴 인식’은 전산학(컴퓨터 사이언스)의 용어라고 할 수 있다 50
  • 52. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 왜 카카오/네이버는 AI스피커를 공짜로 뿌리나요? 서비스 클라우드데이터 52 서비스 – 데이터의 선순환 고리를 만들어야 살아남는다 ! 구글/페북/애플/아마존에 밟혀 죽는다 ㅠㅠ 살려야 한다 !! 반드시
  • 53. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 딥러닝 기술 배우면 뭐하나? 데이터가 없는데 ! 53 클라우드 컴퓨팅 스토리지 1.서비스 2.데이타3.분석 데이터 수집,저장,가공처리 Data Scientist Data Engineer 데이터 분석, 지능
  • 55. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 55
  • 56. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Statistics vs Machine Learning 56https://www.datasciencecentral.com/profiles/blogs/machine-learning-vs-traditional-statistics-different-philosophi-1 https://svds.com/machine-learning-vs-statistics/ “Machine learning is for Computer Science majors who couldn’t pass a Statistics course.”
  • 57. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Statistics vs Machine Learning 57https://www.datasciencecentral.com/profiles/blogs/machine-learning-vs-traditional-statistics-different-philosophi-1 https://svds.com/machine-learning-vs-statistics/ “Machine learning is essentially a form of applied statistics”
  • 58. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Statistics vs Machine Learning 58https://www.datasciencecentral.com/profiles/blogs/machine-learning-vs-traditional-statistics-different-philosophi-1 https://svds.com/machine-learning-vs-statistics/ “Machine learning is Statistics minus any checking of models and assumptions.”
  • 59. 머신러닝 vs 통계/수학 수학 • Deterministic • 입력, 출력 관계 명확 • 데이터의 확률분포, 함수의 차 수 등에 대한 가정 포함 머신 러닝 • Stochastic (probabilistic + time) • 입력변화에 따른 출력 변화에 대한 예측이 어려움 • 데이터에 대한 가정 별로 없음 59
  • 60. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, Machine Learning (ML) Traditional statistics (TS) Goal: “learning” from data of all sorts Goal: Analyzing and summarizing data No rigid pre-assumptions about the problem a nd data distributions in general Tight assumptions about the problem and data distri butions More liberal in the techniques and approaches Conservative in techniques and approaches Generalization is pursued empirically through t raining, validation and test datasets Generalization is pursued using statistical tests on the training dataset Not shy of using heuristics in approaches in se arch of a “good solution” Using tight initial assumptions about data and the pr oblem, typically in search of an optimal solution unde r those assumptions Redundancy in features (variables) is okay, and often helpful. Preferable to use algorithms desi gned to handle large number of features Often requires independent features. Preferable to us e less number of input features Does not promote data reduction prior to learn ing. Promotes a culture of abundance: “the mo re data, the better” Promotes data reduction as much as possible before modeling (sampling, less inputs, …) Has faced with solving more complex problems in learning, reasoning, perception, knowledge presentation, … Mainly focused on traditional data analysis 60
  • 61. 머신 러닝 vs 알고리즘 61
  • 62. 머신러닝 vs 알고리즘 머신러닝 • 데이터를 분석하는 프로그램을 직 접 개발하거나 활용 • 알고리즘은 학습된 모델의 파라미 터 값에 담겨지게 됨. 해석 어려움. 알고리즘 • 컴퓨터에게 step-by-step 으로 해야 할 세부 절차/작업/규칙을 직접 명식적으로 알려줌 • 알고리즘을 프로그램에 담음 62
  • 63. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 알고리즘 예시 - sorting 63
  • 64. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 알고리즘 예시 - sorting 64
  • 65. 배포금지 J 외부자료외 저작권 보호 딥러닝스쿨 @ 슬로우캠퍼스, 알고리즘 예시 - sorting 65