ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 3. 강화 학습으로 사과를 지워보자
    Project/Fruit Box 2023. 3. 27. 00:35

    강화학습과 함께라면 높은 점수가 가능하지 않을까?

     

    이미지를 저장하기엔 용량이 부족할 것으로 예상되어 txt로 배열을 처리해서 저장하고자 하였다

    pyautogui를 이용하여, 판을 읽어서 txt에 저장 새로 고침 후 저장을 반복하였다

     

    그 게임판에서 나오는 최대 점수를 알아내기는 어렵고

    또한 방법이 항상 하나만 있기는 어렵다고 생각하여

    지운 사과 개수 최대화로 무지성 강화학습을 돌려보았다

     

    이때 DQN알고리즘을 가져와서 사용하였다

    현재의 게임판을 state Q로 하고, 점수를 높이기를 목표로 학습을 돌렸다

    이건 검색하면 그냥 나오기에 코드는 패스하겠다

    결론만 알아보자


    생각보다 점수 상승이 크지 않다

    정확히 말하면, 평균 점수는 높은 것 같다는 생각이 들었다

    학습된 판들을 바탕으로 돌린 결과, 무지성 삭제보단 10점 정도? 높은 느낌이 나왔다

     

    그런데 실제로 돌리기 위하여

    게임 사이트에서 새로고침후 시작을 반복하였을 경우에는 뭔가 아쉬웠다

    점수가 높긴 한데...

    이걸 위해 머신 러닝을?

    가끔씩 차이가 없거나

    오히려 그냥 무지성 삭제가 큰 경우도 있었다

    아마도 데이터가 부족한게 원인이 아닐까란 생각이 들었다

     

    그러던 중 무지성 삭제에서 159점인가? 나오는 판도 존재했다

    결국 알고리즘보단 판에 의한 운이 크다는 생각이 들었다

    또한 사람이 하는 경우에도 130 점이 넘는, 140점까지 나오는 경우도 있었다

    아마도 task 자체가 무작위에 의존적이다보니 발생한 결과가 아닐까? 란 생각이 든다

    'Project > Fruit Box' 카테고리의 다른 글

    2. 전략적으로 사과를 지워보자  (0) 2023.03.27
    1. 그리디하게 사과를 지워보자  (0) 2022.12.06
    0. 재밌는 사과 게임  (0) 2022.11.30

    댓글

Designed by Tistory.