모각코 2회차의 날이 찾아왔다!
목표
- 타슈 데이터 분석 포스팅
- 데이터 이해, 획득, 탐색
활동
블로그 포스팅1
[ProjectTashu] 2. 데이터 획득, 이해, 탐색
타슈 대여 데이터는 아주 쉽게 얻을 수 있다.
velog.io
SW 중심대학 공동 AI 경진대회
현재 데이콘에서 실시하는 경진대회에 참여중이다. train_img와 test_img간 차이가 있기 때문에 Data augmentation을 해야 겠다는 생각이 들어서 코드를 짰다. 파이썬으로 class를 짜는 건 별로 해보지 않았어서 에러가 많이 났는데(torch를 안 써보기도 했다.) 머리를 쥐어뜯고 디버깅해가면서 결국 class Dataset을 완성했다. 현재 데이콘에서 아슬아슬하게 순위권인데, augmentation으로 더 성능이 좋아지면 좋겠다. 팀 스페이스에 내가 한 일을 정리했다.
회고
타슈 데이터를 어디에서 얻었는지, 어떤 데이터들이 있는지 대략적으로 살펴보고 포스팅을 했다. 파이썬에서는 Data Profiling이라는 라이브러리를 따로 제공해줘서 쉽게 분석할 수 있었다. 세상 참 좋아진 것 같다. 타슈 데이터 분석을 해보니까 타슈 연도에 따라 스테이션도 달라지고, 자전거도 달라지고, 사용하는 툴(앱, 포스기?)도 달라져서 그에 따른 데이터의 차이가 있는 듯 했다. 타슈 정책의 변동성을 정리해놔서 그에 따른 어떤 변화가 있는지 알아보는 것도 재밌을 것 같다. 너무 데이터의 양이 방대해서 아직은 막막하지만, 천천히 분석해가면서 미스테리를 하나씩 풀어야겠다.
'2023 활동 - 4학년 > 2023 하계 모각코' 카테고리의 다른 글
[모각코 5회 회고록] 타슈 프로젝트 : 클러스터링(2) (0) | 2023.07.31 |
---|---|
[모각코 4회 회고록] 타슈 프로젝트 : 클러스터링 (0) | 2023.07.25 |
[모각코 3회 회고록] SW 중심대학 공동 AI 경진대회 (0) | 2023.07.25 |
[모각코 1회 회고록] 문제 파악 및 데이터 이해 (0) | 2023.07.04 |
2023 하계 모각코 목표 (0) | 2023.06.30 |