모각코 4회차다! 한번 달려보자!
목표
타슈 프로젝트 : 클러스터링 |
활동
이번 주차부터 본격적으로 타슈 프로젝트 논문 작성을 시작했다. 데이터 과학 때 텀 프로젝트로 해당 프로젝트를 진행했는데, 수준이 높아서 충분히 논문을 쓸 만하다고 문현수 박사님께서 멘토링해주셨다. 그래서 그 때 한 프로젝트를 조금 더 디벨롭해서 이번 클러스터링을 진행했는데 크게 세 가지가 바뀌었다.
(1) 데이터셋을 수정했다.
340개의 스테이션에서 262개의 스테이션으로 바꿨다. 타슈 버전 1에서는 262개였는데, 추가 확장된 스테이션 데이터가 추가되었다는 것을 알았다. 그래서 262부터 340의 스테이션은 삭제하고 클러스터링을 진행했다.
(2) 클러스터링 개수를 바꿨다.
클러스터링을 기존에 진행한 개수로는 정확한 분류가 되지 않는 것 같아서 클러스터의 개수를 하나 더 늘렸다. 과연 이 방식이 좋았는지는 모델을 돌려보고 성능을 봐야겠다.
(3) '한밭수목원' 데이터를 따로 처리했다.
대여 패턴과 상관없이 한밭수목원의 데이터는 전체 데이터의 절반정도를 차지한다. 이는 시간별 대여량을 예측하는 데 학습에 영향이 있을 것 같아서 한밭 수목원 스테이션은 따로 클러스터로 묶었다.
확실히 데이터 과학 때 열심히 배워서 그런지 기존에 진행한 프로젝트보다 질이 올라갔다. 다른 기법들을 적용해볼 건 없는지 다시 봐야겠다.
'2023 활동 - 4학년 > 2023 하계 모각코' 카테고리의 다른 글
[모각코 5회 회고록] 타슈 프로젝트 : 클러스터링(2) (0) | 2023.07.31 |
---|---|
[모각코 3회 회고록] SW 중심대학 공동 AI 경진대회 (0) | 2023.07.25 |
[모각코 2회 회고록] 데이터 이해, 획득, 탐색 (0) | 2023.07.12 |
[모각코 1회 회고록] 문제 파악 및 데이터 이해 (0) | 2023.07.04 |
2023 하계 모각코 목표 (0) | 2023.06.30 |