전체 글

전체 글

    [DL] Overfitting and Underfitting

    [DL] Overfitting and Underfitting

    1. Interpreting the learning curve 강의에서는 훈련데이터의 정보를 Signal과 Noise로 분류한다. Signal은 데이터의 일반화된 부분이고, 새로운 데이터를 예측하는데 도움을 주는 부분이다. 반대로 Nosie는 훈련데이터의 실제의 값을 담당하며 모델의 예측에 크게 도움이 되지 않는 부분이다. 결국에 우리가 손실함수에 대한 Parameter와 weight를 최적화 시키더라도 궁극적으로는 새로운 데이터 즉, 평가 데이터에 대해 예측 정확도를 높여야 한다. 그래서 평가데이터에 대한 정확성을 훈련데이터의 정확성과 같이 플로팅하게 되는데 이것이 'Learning Curves'이다. 훈련 데이터의 손실함수 값은 Signal을 학습하던, Noise를 학습하던 지속적으로 감소한다. 하지..

    [DL] Stochastic Gradient Descent

    [DL] Stochastic Gradient Descent

    1. Introduction 모델을 정의하는 것과는 별개로, 모델은 training data를 이용하여 학습되어야 한다. Neural Network는 예측값과 실제값의 차이가 가장 작은 가중치(weight)를 찾아야 한다. 손실함수(Loss Function) : 예측값과 실제값의 차이를 나타내는 함수 Optimizer : 손실함수의 값을 최소화시키는 모델의 가중치를 찾는 방법 2. The Loss Function 손실함수(Loss Function)는 예측값과 실젯값의 분리도를 측정한다. 분류문제냐 회귀문제냐에 따라 손실함수가 달라지게 되는데, 회귀 문제에서는 연속형 값을 손실함수에 적용한다. 회귀문제에서 흔히 사용하는 손실함수는 Mean Absoulte Error(MAE)로, 예측값과 관측값의 차이에 대..

    Data Engineer Roadmap

    Data Engineer Roadmap

    Data Engineer Roadmap Seattle Data Guy가 제공하는 대략적인 Data Engineering Road map이다. Coding Basic, Data Warehouse, WorkFlow, NoSQL, Cloud, Streaming and Distributed System, UI/UX에 걸친 Roadmap을 제시하며 영상 하단에 있는 PDF파일에는 Youtube source와 강의 url이 제공되어 있으니 확인해보면 되겠다. Author Source of the video : Data Engineer Road Map Video channel on youtube : Seattle Data Guy Seattle Data Guy Welcome to my channel. I make vi..

    Data Ecosystem, Languages

    보호되어 있는 글입니다.