과연 우리는 어떤 프로젝트를?

오늘 프로젝트를 위한 사전미팅을 가지긴 했으나, 모든 인원이 참석하지 못해 모두의 의견을 나눌 수 없었다. 대략적인 이야기는 나누었으나, 내일 프로젝트 발제를 하고 난 뒤 명확하게 컨셉과 방향을 정할 수 있을 것 같다. 넷플릭스 그대로 clone하는 것도 많이 배울 수 있는 도전이긴 한데, 뭔가 우리만의 프로젝트라는 느낌을 주고 싶다. 우리에게 더 많은 지혜가 생겼으면 좋겠다. 그리고 오늘 FigJam 에서 브레인스토밍을 했는데, 화면도 공유되고 실시간으로 함께하는 사람들의 작업 내용을 볼 수 있어서 원격으로 미팅하기 꽤 좋은 툴이라는 생각이 들었다. 이전에 Discord로 화면을 공유해서 Github Project 사용법을 배울때도 인상적이었는데, 게더타운(GatherTown)만이 전부는 아닌 것 같다.(게더는 너무 컴퓨터의 리소스를 많이 먹는다…) 이런 생산적인 협업툴들이 있어 재택근무가 가능하구나 싶었다.

익숙치 않은 웹 스크래핑

아직 정한 것은 아니지만, 한국 영화, 드라마 정도로만 데이터를 다루자는 얘기가 나와서 그 데이터를 어떻게 정리해서 가지고 있어야 하나 고민 중이다. 영화진흥위원회 에서 제공하는 역대 박스오피스 Top200 데이터(영화, 개봉일 등) + 네이버 영화에서 제공하는 데이터(평점, 러닝타임, 명대사 등) 들을 취합해보려 하는데 쉽지가 않다. 만약 두 플랫폼에서 사용한 각각의 영화코드가 같았다면 엄청 수월했을텐데, 그것은 아니여서 수가 복잡하다. 그냥 드는 생각은 박스오피스 데이터셋에 네이버영화코드를 넣으면 두 데이터를 잘 합쳐볼 수 있지 않을까 싶다. 근데 그 작업을 그냥 수작업으로 할 지, 아니면 웹 스크래핑해서 넣어야 할 지 고민이다. 직접 넣는것도 데이터수가 많지 않아 할 수 있겠지만, 개발자(?)스럽게 웹 스크래핑으로 해당 작업을 한 번 해보려고 한다! 성공한다면 관련하여 새로운 글로 찾아뵙겠다.