본문 바로가기
2023 활동 - 4학년/2023 하계 모각코

[모각코 2회 회고록] 데이터 이해, 획득, 탐색

by 은행장 노씨 2023. 7. 12.

모각코 2회차의 날이 찾아왔다!

목표

  • 타슈 데이터 분석 포스팅
  • 데이터 이해, 획득, 탐색

활동

블로그 포스팅1

https://velog.io/@nub8p/ProjectTashu-2.-%EB%8D%B0%EC%9D%B4%ED%84%B0-%ED%9A%8D%EB%93%9D-%EC%9D%B4%ED%95%B4-%ED%83%90%EC%83%89

 

[ProjectTashu] 2. 데이터 획득, 이해, 탐색

타슈 대여 데이터는 아주 쉽게 얻을 수 있다.

velog.io

 

SW 중심대학 공동 AI 경진대회

 

현재 데이콘에서 실시하는 경진대회에 참여중이다. train_img와 test_img간 차이가 있기 때문에 Data augmentation을 해야 겠다는 생각이 들어서 코드를 짰다. 파이썬으로 class를 짜는 건 별로 해보지 않았어서 에러가 많이 났는데(torch를 안 써보기도 했다.) 머리를 쥐어뜯고 디버깅해가면서 결국 class Dataset을 완성했다. 현재 데이콘에서 아슬아슬하게 순위권인데, augmentation으로 더 성능이 좋아지면 좋겠다. 팀 스페이스에 내가 한 일을 정리했다. 

 


회고

타슈 데이터를 어디에서 얻었는지, 어떤 데이터들이 있는지 대략적으로 살펴보고 포스팅을 했다. 파이썬에서는 Data Profiling이라는 라이브러리를 따로 제공해줘서 쉽게 분석할 수 있었다. 세상 참 좋아진 것 같다. 타슈 데이터 분석을 해보니까 타슈 연도에 따라 스테이션도 달라지고, 자전거도 달라지고, 사용하는 툴(앱, 포스기?)도 달라져서 그에 따른 데이터의 차이가 있는 듯 했다. 타슈 정책의 변동성을 정리해놔서 그에 따른 어떤 변화가 있는지 알아보는 것도 재밌을 것 같다. 너무 데이터의 양이 방대해서 아직은 막막하지만, 천천히 분석해가면서 미스테리를 하나씩 풀어야겠다.