Deep Learning3 Attention Is All You Need 리뷰 (공학 설계 프로젝트 기획 논문 3) 논문 : https://arxiv.org/abs/1706.03762 Attention Is All You Need The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a new arxiv.org RNN, 특히 LSTM은 sequence model과 machine translation에서 주요하게 사용되고 있다. RN.. 2019. 7. 27. Lec 02: Simple Linear Regression Regression : 전체 평균으로 되돌아간다. (어떤값이 들어와도 전체 평균으로 되돌아가려는 속성이 있다.) Linear Regression(선형 회귀): 데이타를 가장 잘 대변하는 직선의 방정식 가장 알맞은 Linear를 구하는것이 목표. H(x)-y의 값의 합이 작으면 작을수록 잘 표현되어있다.(cost가 작은것) 그런데 양수와 음수의 경우가 있기 때문에 제곱해서 사용한다. 목적은 최소한의 비용이다. Cost는 에러(h-y)의 제곱의 평균값으로 정의. https://www.edwith.org/boostcourse-dl-tensorflow/joinLectures/22150 불러오는 중입니다... 참조 2019. 7. 10. Lec 01: 기본적인 Machine Learning 의 용어와 개념 설명 모두를 위한 딥러닝 시즌2를 공부하면서 내용을 정리하고자 한다 모두를 위한 딥러닝 시즌2 - TensorFlow 강좌소개 : edwith - Deep Learning Zero To All www.edwith.org Machine Learning • Limitations of explicit programming - Spam filter: many rules - Automatic driving: too many rules 머신 러닝이란 프로그램을 만들때 하나하나 explicit 하게 만들기 힘들기 때문에 사용하게 되었다. 스팸메일 필터나 자동주행 자동차같은 것들은 너무 많은 규칙이 필요하기 때문에 explicit하게 만들기 어렵다. 학습을 시키는 방법은 크게 2가지가 있다. Supervised learni.. 2019. 7. 10. 이전 1 다음