일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- value function
- 강화학습
- interesting party
- action value function
- Reinforcement Learning
- 소스코드 올리기
- seednet
- RL
- 탑코더
- TensorFlow
- state value function
- linearclassification
- 머신러닝
- cnn
- multiagent
- 멀티에이전트
- 텐서플로로 시작하는 딥러닝
- classification
- reinforcement
- 2019정처기
- ML
- 인공지능
- atari RL
- DeepLearning
- 티스토리 코드올리기
- 큐넷시험일정
- 딥러닝
- 알고리즘
- 텐서플로우
- 2019기사일정
- Today
- Total
돌아서면 까먹어서
Neural Network의 토대가 되는 분류방법Parametric Approach f(x, W)는 output으로 각 class에 대한 score를 출력한다. (bias는 일단 생략)linear classification에서는 W에 학습 정보를 넣기때문에 Test할 때 W만 있으면 된다. 중요한 것은 f()를 잘 설계하는 것!linear classification = W * x +b 이다. bias : class에 우선권(영향력)을 주는 용도 - 한 class 내 단 하나의 템플릿만 학습한다.- parity problem과 같은 linear한 decision Boundary로 구분할 수 없는 문제는 해결이 어렵다.ex) XOR과 같은 문제 이 포스팅은 http://cs231n.stanford.edu 바..
확률론에서, 마르코프 연쇄(Марков連鎖, 영어: Markov chain)는 이산 시간 확률 과정이다.마르코프 연쇄는 시간에 따른 계의 상태의 변화를 나타낸다. 매 시간마다 계는 상태를 바꾸거나 같은 상태를 유지한다. 상태의 변화를 전이라 한다. 마르코프 성질은 과거와 현재 상태가 주어졌을 때의 미래 상태의 조건부 확률 분포가 과거 상태와는 독립적으로 현재 상태에 의해서만 결정된다는 것을 뜻한다 출처 : https://ko.wikipedia.org/wiki/%EB%A7%88%EB%A5%B4%EC%BD%94%ED%94%84_%EC%97%B0%EC%87%84※ Stochastic Process는 확률분포를 가진 랜덤 변수가 일정 시간 간격으로 값을 발생시키는 문제를 모델링 한 것Markov Chain은 이..
Classification problem : Input Data를 미리 정해진 클래스 중 하나인 label로 분류하는 문제 1. Viewpoint Variation : 카메라에 의해 시점이 달라지는 경우2. Scale Variation : 크기 변화3. Deformation : 변형, 여러 자세로 찍힌 사물4. Occlusion : 다른 부분에 의해 가려진 경우, 일부만 보이는 경우5. Background Clutter : 배경과 비슷해 구분이 안되는 경우6. Intra-class Variation : 객체의 종류가 많은 경우 Data Driven Approach : 먼저 com에게 각 class에 대해 많은 예제를 주고서 Test Data를 보고 시각적으로 학습할 수 있는 training 알고리즘을 개..
RL(Reinforcement Learning) : 강화학습기본 구조Environment : agent 외 모든것 Action : agent가 Environment 내에서 할 수 있는 행동 Discrete, Continuous action으로 구분할 수 있다. Reward : 주기적으로 얻을 수 있는 스칼라 값 positive or negative agent의 action이 얼마나 좋은지 나쁜지를 판단할 수 있는 기준으로 사용가능. Observation : environment로부터 편의를 위해서 얻을 수 있는 정보 * 잘못된 부분들은 댓글 부탁드립니다