본문 바로가기

컴퓨터 공학/머신러닝

(5)
[ML-agents] 란 무엇 인가? https://github.com/Unity-Technologies/ml-agents Unity-Technologies/ml-agents Unity Machine Learning Agents Toolkit. Contribute to Unity-Technologies/ml-agents development by creating an account on GitHub. github.com Ml-agents의 공식 홈페이지다. ML-agnets는 유니티에서 지능형 에이젼트를 학습하고 개발할 수 있는 환경을 제공하는 시뮬레이션 플러그인이다. 현재 오픈소스로 개발되고 있고 현재는 베타 버젼이다. ML-agents는 총 크게 4가지 방식으로 에이젼트를 학습시킬 수 있는 환경을 제공한다. Reinforcement Le..
[ML-agents]의 공식 문서에는 무엇이 있나? https://github.com/Unity-Technologies/ml-agents/blob/master/docs/Readme.md Unity-Technologies/ml-agents Unity Machine Learning Agents Toolkit. Contribute to Unity-Technologies/ml-agents development by creating an account on GitHub. github.com ML-agents 개발자가 Git-hub에 차근차근(숨막히게) 작성해 놓았다. 위에서 부터 Tensorflow, Docker 설치 방법, 3D-ball 예제 실행하는 방법, 새로운 환경을 만드는 법(Agents, Academy, Brain), 모니터링(Tensorboar), 트..
[ML-agents]관찰, 행위, 보상이란? ML-agents에 관한 모든 포스팅 내용은 https://github.com/Unity-Technologies/ml-agents 에 있는 내용을 바탕으로 만들어졌습니다. 문서에서 이 툴킷을 설명하기 위해, 게임을 진행할 때 등장하는 NPC를 학습시키는 것을 예로 들고있다. NPC는 "Non Playable Character"의 약어로서 게임에서 상인이나 도움을 주는 사람들로 주로 등장한다. 더욱 올바른 설명을 하기 위해서 더욱 자세한 가정을 하는데 가정은 다음과 같다. 게임의 테마는 전쟁이고, 오로지 두 팀만이 존재한다. 각각의 팀은 다섯명의 플레이어와 한명의 메딕 NPC가 존재한다. 이 메딕은 상처를 발견하고 치료를 해준다. (마치 스타크래프트1에서 메딕같다.) 메딕의 행동은 꽤 복잡하게 정의되어야 ..
[ML-agents] 학습환경이란? ML-agents에 관한 모든 포스팅 내용은 https://github.com/Unity-Technologies/ml-agents 에 있는 내용을 바탕으로 만들어졌습니다. 배경지식 ML-agents 툴킷은 아래 세가지의 High-level 컴포넌트들로 생각할 수 있다. Learning Environment - Unity scene을 포함한 모든 게임 캐릭터들 Python API - Macine Learning과 관련된 학습과 알고리즘으로 구성된 코드. 혼동하지 말아야 할 점은 Python API는 유니티의 일부가 아니라는 점이다. 파이썬은 외부프로그램이지만 작동하지만 위의 그림처럼 External Communicator를 사용하면 유니티와 함께 작동시킬 수 있다 External Communicator -..
[모두를 위한 머신러닝/딥러닝 요약] 1강-7강 모두를 위한 머신러닝/딥러닝 요약 1강-7강 모두를 위한 머신러닝 딥러닝 공식 홈페이지이다. https://hunkim.github.io/ml/ 공식 홈페이지에 들어가보면 동영상 강좌의 링크, 강의 슬라이드, Lab 슬라이드가 모두 준비되어있다. 딥러닝에 대해서 아무것도 모르던 시절, 이 강좌를 보면서 입문하게 되었다. 강좌는 교수님께서 해당 Lecture의 개념을 필기와 함께 설명해주시고, 개념 강좌가 끝나면 Lab시간에 Tensorflow 코드를 살펴보고 실행해 보는 과정으로 진행된다. 이론에서 끝마치는 것이 아니고, 실제 코드를 통해 결과값을 볼 수 있으니까 기억속에 훨씬 더 오래 남는 것 같다. 이렇게 좋은 강의를 제공해 주신 김성훈 교수님과 관련자 분들께 너무 감사한 마음이다. Lec0: Ori..