본문 바로가기

AI

(5)

[단단한 강화학습] 1장 - 강화학습이란 강화학습이란? 주어진 상황에서 어떠한 행동을 취할지 학습하는 것. 행동의 결과는 최대한의 이득을 가져와야 하며, 그 이득의 함수는 수치적 표현이 가능해야 한다. 학습자는 어떤 행동을 취할지에 대한 어떠한 지침 없이 시행착오를 통해서 찾아내야 한다. 강화학습은 정답이 미리 존재하는 지도 학습이나 정답 없이 데이터에서 패턴을 읽어내야 하는 비지도학습과는 구별되는 제 3의 학습 방법이다. 강화학습의 구성 요소 정책: 특정 시점에서 학습자가 취하는 행동.보상 신호: 강화학습이 성취해야 할 목표를 정의함. 무엇이 좋은가를 즉각적으로 안내함.가치 함수: 장기적인 관점에서 평가한 지표.환경 모델: 현재 상태와 취해지는 행동으로부터 다음 상태와 보상을 예측.모델과 계획을 사용해서 강화학습 문제를 해결 $\righta..

개발자를 위한 머신러닝 & 딥러닝 - NLP 1. 자연어 처리란사람의 언어를 이해하기 위한 인공지능 기술2. 언어를 숫자로 인코딩하기listen을 예로 들어보면, l, i, s, t, e, n의 아스키 코드 값은 76, 73, 83, 84, 69, 78이므로 이렇게 인코딩이 가능. → 좀 더 나아가서 문자가 아닌 단어를 기준으로 인코딩해보자! I love my dog에서 [1, 2, 3, 4]로 인코딩하면 I love my cat은 [1, 2, 3, 5]로 인코딩 가능. [1, 2, 3, 4]와 [1, 2, 3, 5]가 비슷하므로 두 문장은 비슷하다고 할 수 있다. 위의 과정이 Tokenization! 3. TensorFlow로 토큰화하기sentences = ['Today is a sunny day', 'Today is a rainy day'..

개발자를 위한 머신러닝 & 딥러닝 - 고급 컴퓨터 비전 1. 합성곱가중치의 필터로서 픽셀에 가중치를 곱해서 새로운 픽셀 값을 만든다. → 이미지를 특성으로 압축할 수 있다. 2. 풀링이미지 내의 내용을 보존하면서 픽셀을 줄이는 과정. 예를 들어 4 * 4 픽셀 집단이 있을 시 2 * 2개의 블록의 최댓값으로 합쳐서 2 * 2 픽셀 집단으로 만드는 방법이 있으며, 이것을 최대 풀링이라 한다. 비슷하게 가장 작은 값을 선택하는 최소 풀링 또는 평균값을 선택하는 평균 풀링이 존재.3. 이미지 증식 텐서플로우가 데이터를 업로드할 때 이미지에 여러 변환을 적용해 새로운 데이터를 추가로 만드는 기법 훈련 데이터에 포함되지 않은 자료를 분석하기 위해 사용

개발자를 위한 머신러닝 & 딥러닝 - 컴퓨터 비전 1. 컴퓨터 비전이란?컴퓨터의 눈이 되는 것. 즉 컴퓨터가 시각 데이터를 처리할 수 있게 도와준다! 2. 컴퓨터 비전을 위한 신경망traning_images /= 255.0test_images /= 255.0 #Normalizationmodel = keras.Sequential([ keras.layers.Flatten(input_shape = (28, 28)), keras.layers.Dense(128, activation = tf.nn.relu), keras.layers.Dense(10, activation = tf.nn.softmax)]) Dense: 뉴런의 층. 여기서는 임의로 128개의 뉴런을 지정했다. 여기서 입력과 출력 사이에 위치해서 밖에서는 보이지 않으므로 '은닉 층'이라 ..

개발자를 위한 머신러닝 & 딥러닝 - 모델 구축 1. 머신러닝이란?전통적인 프로그래밍은 규칙과 데이터를 입력으로 받아서 정답을 출력한다.하지만 머신러닝은 정답과 데이터를 입력으로 받아서 규칙을 출력한다.2. 텐서플로우란 머신러닝 모델을 만들고 사용하기 위한 오픈 소스 플랫폼여러 알고리즘과 패턴을 이미 학습시켜 놨기에 문제에만 집중 가능3. 훈련, 추론훈련: 머신러닝 모델을 만드는 과정추론: 훈련된 모델이 새로운 입력을 분석 후 인식 & 분류하는 과정

이전 1 다음

티스토리툴바