상세 코드와 내용은 아래의 링크를 참고하자.
github: https://github.com/YeonGun0/Structure/tree/main
streamlit : https://ljedd2-midp-streamlit-intro-kizzcq.streamlitapp.com/
소감 및 회고
첫 미드 프로젝트가 끝났다. 처음에는 우여곡절을 겪는 듯 했으나 생각보다 잘 풀렸던거 같다.
처음에 잡았던 주제는 '코로나 전후로 상권/사업 변화 분석' 에 대한 것이었으나, 주제에 대한 조사가 미흡해서 기각되었다. 데이터의 유무를 확인했어야 했는데, 처음 잡는 주제이다보니 서로 놓친 부분이 있었다.
이후 주제를 한 번 갈아 엎고 나온 것이, 이번 결과물과 관련된 ''초중등 시험 폐지"다. 최근 들어 초등학교 시험의 부활을 논의하고 있기에 나온 주제다. 왜 시험을 부활하려는 걸까? 라는 의문에서 출발하여 왜 시험을 폐지했고, 폐지하니 어떻게 되었지? 에 대한 의문을 잡아 시작했다.
조금이라도 관련 있어 보이는 데이터를 마구잡이로 수집한 뒤, 팀원들과 브레인스토밍을 통해 가설을 세웠다. 총 5가지의 가설을 세워 각자 EDA를 진행했는데, 가설은 크게 '사교육의 변화'와 '학업성취도의 변화' 두 갈래로 진행되었다. EDA의 결과, 5가지 가설이 말하는 결과는 단순했다. "사교육은 늘어나고 학업 성취도는 줄어든다." 이 모순적인 상황이, 도대체 무슨 일 때문에 일어났을까. 우리는 이에 대한 추가적인 가설을 세우고 EDA를 진행했다.
두번째 EDA의 아쉬움은 우리의 분석이 시각화 내지는 상관관계까지 밖에 못미친다는 점이다. 사실 그 둘이 배운 전부이며, 교육학이나 통계 전공자가 없었기에 불가피한 부분이기는 했다. 무슨말이라면, 수시 비율 확대와 사교육비의 증대가 높은 상관관계를 보였으나, 이를 인과관계라 단언할 수 없었단 소리다. 서로가 서로에게 종속되었는지 독립된 변수인지 판단할 수 없었다.
이후의 프로젝트는 두 팀으로 나누어 진행했다. 발표 및 PPT와 streamlit의 구현이다. 본인은 ppt를 만드는 걸 좋아하는 편이라 아래의 피피티를 전담해서 만들었다. 팀원들께 일요일 해뜨기 전까지 드릴게요 라 해놓고 전날 밤을 샜는데, 결국 일출을 보고 드려서 죄송할 따름이었다. 한편으로는 PPT를 토요일까지 오후까지 좀 더 갈아넣었으면 충분히 만들었고 그랬으면 streamlit을 구현을 해볼 수 있었을텐데 하는... 아쉬움과 내 의지에 대한 안타까움을 느꼈었다. 그래도 PPT는 잘 나왔으니 만족한다.
물론, 멘토님들과 최종 피드백 때 자잘한 이슈도 있어고 오탈자나 내용 오류 수정으로 5번 정도 PPT를 고치긴 했으나...별 일은 아니었으니 넘어가자. PPT를 만들며 내용을 정리할 때, Intro - Main - Result의 구조를 작성했다. Main은 하나였다가 Intro를 분할해서 1, 2로 추후 수정했다. Result에서는 가설이나 목적이 달성되었는지에 대한 평가를 진행했다. 이제와서 생각해보면 귀무가설과 대립가설을 이용하면 더 좋았을텐데 싶지만, 당시에는 해당 지식이 부재했으므로 어쩔 수 없었다. 그러나 평가를 한 방식은 가설이 틀리면 No, 상관관계는 있거나 영향은 있는거 같으면 Hmm으로 진행했다. 인과관계를 확인할 수 없은 비전공자의 한계인지라 어쩔 수 없는 부분이랄까.
추가적으로, 미드 프로젝트를 하며 git과 github를 새로 써봤는데 이게 은근 요물이다. 편리성이 엄청 커진 것 같은데, '지옥에서 온 git'이라는 생활코딩님의 강의처럼 알아갈수록 점점 어려워지는 기분이다. 천천히 가까워져야겠다.
총체적으로 정리하면, 우리 모두 고생했다. 팀원들이 진짜 훌륭했다. 멋지게 스트림릿도 구현해줬고, git의 main repository를 맡아 귀찮은 일을 솔선수범해주셨다. 모두들 고마웠고, 나도 나름 만족하게끔 한 것 같다.
ppt 파일 참고
댓글