서버리스를 쓰게 된 배경 이번에 누구나 리포터 랩을 참여하면서 Lambda라는 기술을 사용하게 되면서 서버리스 환경을 구축하기 위해 고려해야되는 레포 관리 전략과 프레임 워크, 디렉토리 구조 등의 정보등을 조사해봤는데요. 서버리스는 어떤 장점을 가지고 있어서 스타트업부터 대기업까지 다양한 규모의 기업들이 활용하고 있을지 자세히 알아봅시다. 서버리스의 가장 큰 장점 중 하나는 적은 러닝커브에 있습니다. 개발자가 일반적인 웹서버를 구축하기 위해 어떤 지식들이 필요한지 나열한다면 아래의 정보들을 학습하고 어느정도 이해하고 있어야 구축할 수 있을 것입니다.프로그래밍(Java, Node.js, Python 등)프레임워크(Django, SpringBoot, Nest.js 등)인프라 관련(AWS, GCP, Linux..
프로젝트
HTML 파싱 이전에 URL로 요청을 보내고 HTML까지 저장하는 데까지 마무리하고 다음은 저장한 HTML에서 특정 태그를 파싱하여 가져오는 것을 진행했다. 그과정에서 자바에서 제공해주는 joup라는 html parser를 활용하여 글자를 추출해오는데 여기서 가장 큰 걸림돌은 어떻게 해야 글내용만 추출해올 수 있을까? 였다. 모든 글이 각자 다른 플랫폼을 활용하고 있었고 각기 다른 컨텐츠 영역을 가지고 있었기 때문에 셀렉터나 아이디를 활용하여 글영역만 가져오기 쉽지 않았다. 전처리를 하기위한 선택지 플랫폼마다 글영역의 아이디를 저장하고 등록된 플랫폼만 글을 파싱하여 전처리한다. 데이터 품질을 신경쓰지 않고 모든 내용들을 파싱한다. 게시글에 자주 사용되는 태그를을 중심으로 파싱하여 전처리 한다. 머신러닝을..