Kyeongrok Kim 웹데이터 수집의 기술17 고객 리뷰 수집하기 > 데이터수집

데이터 수집

데이터수집-스크래핑, 크롤링, 파싱

Kyeongrok Kim | 웹데이터 수집의 기술17 고객 리뷰 수집하기

본문

※ 영상을 선명하게 보기 안내
  1. 유튜브 영상에서 오른쪽하단에 톱니바퀴를 클릭합니다.
  2. 팝업목록에서 "품질" 선택하세요.
  3. 원하는 해상도를 선택해주세요.
※ 모바일에서 Wifi가 아니라면 데이타가 소진될 수 있으니 주의바랍니다.
Kyeongrok Kim님의 데이터수집강의 청각장애인을 위한 자막
15688760542804.jpg

 


안녕하세요. 웹 데이터 수집에 기술 동영상 강의입니다.
저는 이 책을 번역한 번역자 굉장 놈입니다.
6 이번 시간에는 6 따 16장 고객님 위해 수집하기 를 해보도록
하겠습니다.
일단은 대상 페이지를 한번 들어야 리뷰를 왜 수집한 m 은 요
리뷰의 수판 이에요.
이유 2 고객들의 반응 보기 함
내가 만약에 그의 어떤 출판사의 마케팅 담당자로
쓸어 갔다고 합시다 그래서 뭐 우리 회사에서 내는 책의 책 책의 뭐
300원 정도 책인
물론 넘 겠죠. 근데 300원 정도 책의 리뷰를 내가 수집을 하고 싶어요.
그러면 책 300개 일일이 타들어가 가지고 거기에 있는 리뷰로 카피 앤
페이스트 해가지고
그렇게 수집하는 방법도 있고 음 이렇게 그
자동화한 기능을 만들어 가지고 한 번에 돌려 가지고 수집을 하는 방법이
있고
근데 이게 뭐 책이 안 300권 정도면 은 그래도 매치 림 하겠죠. 빨리
하면은
금방 안 한 이삼일 말에도 할 수 있겠죠. 근데 그 이상이다 전체다 수집을
해야 된다 그러면 프로그램이나 아니면 따른 기능들을 이용하지 않을 수가
없겠죠.
그리고 특히나 그걸 또 정기적으로 수집을 해야 되며 는
어떤 이런 4
웹 데이터 수집에 기술을 사용해야 됩니다.
그래서 한번 고객리뷰 수집하는 페이지를 크롤링 해보도록 하겠습니다.
일단 한빛 네트웍스 한빛
한빛 네트워크 출판사 페이지에 허 특정 책에 있는 정보 리뷰를 수입을 해
보도록 하겠습니다.
여기 쪽에 보시면
베스트셀러가 있네요. 에스텔라 중에 여기 뭐 이 책 중에 아무거나 하나
골라서 해보겠습니다.
만들면서 배우는 워드프레스 이걸 해 볼까요.
클릭
그럼 이렇게 책 소개 페이지가 있고 여기 밑에 쭉 보시면
여기에 아
리뷰가 이렇게 많이 있죠. 이 리뷰를 한번 수집을 해보도록 하겠습니다.
리뷰 독자리뷰 이렇게 많이 했죠 뭐
어떤거 쓸 거냐 뭐냐 임포트 점 i5 쓸겁니다.
거기 지난 시간에 했던 거예요.
이름부터 점 와요
여기 책의 앞장에서 다뤄 쓰니까 요
회원가입이나 이런거는 로켓
그냥 여기 나와있는 대로 하시면 어렵지 않게 하실 수 있습니다.
그래서 쓰는 방법부터 바로 들어가 보도록 하겠습니다.
근데 이 사이트가 외국 사이트라서 접속하는데 시간이 좀 걸리네요.
뭐 아직도 안 됐어요. 자 평결 들어가자 나 네 그러면 사이트 이렇게
들어가지 줘 지금 로그인이 되어있는 상태인데요. 항 단의
촌 대시보드 라고 나오네요. 그런
로그인이 안 돼 있으며 는 로그인 또는 회원가입 이런게 나옵니다.
15 들을 들어가보겠습니다.
그 다음에 뉴이스트 렉터 라고 있죠. 뭐 금방 16시간 나왔네요.
어듀이트 트렉터 를 눌러 봅니다. 스 트 렉 터 를 눌러 가지고
여기다 어떤 뷰어 례 를 넣으시면 되요. 주소를 넣으시면 됩니다.
여기서 이 책 주소를 카피해 가지고 좀 더 붙여 넣기 하겠습니다.
그리고 고 5를 누르면 이렇게 제가 뭔가 프로세싱을 합니다.
로딩 웹페이지 프로세싱 을 하느라고 시간이 좀 걸리네요.
좀 기다려 보도록 하겠습니다.
요거는 이렇게 뭐 선택만 잘 되면 은
한번에 따른 과정을 거치지 않고도 바로 되시 되기도 하는데요.
이 서비스가 무료로 쓸수있는 갱 아니 뭐 2교 1 정도라서
크게 좀 제약사항이 라고 할 수 있습니다.
션이 꽤 걸리네요.
뭔가 이렇게 나오기 시작했습니다.
플로 드 모 나오고 리스트 데이터 네 그럼 이렇게
뭐 이렇게 리뷰가 바로 수집이 되죠 그 다음에 세이브 누르시면 은
이거 스킵 하시고
여기 뭐 책 제목 같은거 좀 어려운데 저흰 브라스 트라키영어로 써야
돼요
엑소 stop 올
인프라스트럭처 이렇게만 적겠습니다. 세이브 앤 런
이렇게 하시면 데이터가 쭉 트롤 겁니다.
네 지금 게 한번 실행되고 있는데 좀 기다리면 은
애가 데이터를 수집 을 해줍니다. x 트렉터 가요
지금 계속 돌고 있죠. 요게 완료가 됩니다. 좀 기다리시면 요
서비스는 이렇게 억 주소도 코 선택해주고 잠깐 기대되며 는 데이터를
수입을 해 주는 게 장점입니다.
완료가 되었네요. 여기서 오른쪽에 보시면 다운로드 가 있어요.
엑셀로 다운로드 받보겠읍니다.
그러면 이렇게 엑셀 여러가지고
수집된 데이터를
보기만 하면 됩니다. 턴이 차용
네 여기 뽑이렇게 내 고갱의 리뷰 5 집안이 나오네요.
네 이렇게 수집을 할 수가 있는데요. 임포트 io 서비스는 일단 유료 9
그 다음에 책을 만약에 뭐 첨 권 정도 해야 된다고 하면 은 이 무료
버전으로 는 어렵습니다. 여기 이 상단에 있는 여기에 체 코드 인데요. 요거
이거만 바꿔줄 수 있도록 임포트 i5 에서
어 그럼 그렇게 3 설정을 할 수가 있는데
임 포터의 설정을 할 수 있는데 이거는 무료라서 일단 그 설정이 안
되고요
음 만약에 한다 그러면 이걸 1000개를 다 만들어 줘야 되는데
청계 를 만드는 이 그냥 손으로 하겠죠.
그래서 이 방법은 만약에 이걸 유료로 3 생각 있으시면
진짜로 할 일이 많다 그러면 유료로 쓰셔야 되겠죠..
이 방법 말고도 다른 구글앱스 스크립트로 하는 방법 그걸 한번
해보도록 하겠습니다.
구글
구글 스트랩 엘 레 시티로 가가지고
여기에 있는 기능으로 좀 해보도록 하겠습니다.
그래서 3 쉬트 추가하시고 4
음 뭐 이름도 좀 바꿔 볼까요.
뭐 이제
어 리뷰 수집
이렇게 이름 바꾸고 해보겠습니다.
여기서 도구에서 스크립트 편집기 로 들어갑니다.
그 다음에 소스코드를 직접 짜면 좋겠지만 또 있는 소스 코드를 활용해
보도록 하겠습니다.
6 챕터 6 에
소스 코드가 많이 있죠.
2페이지 인데 홍 션 여기부터
음 여기부터 여기 여기 까지 이렇게 더 하셔야 되요.
여기부터 이만큼 을 다 하셔야 됩니다. 음 으
이걸 카피해 가지고요 컨트롤 c 그 다음에
여객 스크립트 에다가 컨트롤 v 붙여 놓게 해 보겟습니다.
네 지금 이렇게 여기에 체크 코드 것 은 요체 코드 이 책의 코딩 됨
지금 시트 원 내다가 이렇게 책 두 개의 리뷰를 수집 하는 거네요.
일단은 이고 이걸 한번 코드 1 바꿔보겠습니다.
b 5608 7할 861
네 이거 복사해 가지고요 그리고 복사해서
한번 여기다 붙여넣기를 해볼게요
그렇게 터 장 모 프로젝트 이름
음 리뷰
콜레트 단순하게
또 실행하며 는 권 안물어 보겠죠.
권 안
검토해서 개정 선택하고 고급
그 다음에 경기라고 계속
허용 하시면 실행을 할 수가 있습니다.
그럼 지금 실행이 잘 됐는지 한번 보도록 하겠습니다.
리뷰에 수집에 이렇게
네 이렇게 리뷰가 수입이 살 됐죠.
두번째 책은 팀 러닝 책 인가 보네요.
만들면서 배우는 워드프레스 보시면
여기 이렇게 수집이 잘 됐죠. 진짜 만들면서 배우는 워드프레스
그래서 이거 같은 경우는 여기다가
즉 복사해 가지고
복사 해 주시고 다음에 여기
여기에다 뭐 334
o 이렇게만 바꿔주시면 되요.
이렇게 바꿔주시면 다른 책들도
전부 다크 리뷰를 수집을 할 수가 있습니다.
한번 바꿔 볼까요.
베스트 셀러 두번째 책
요걸로 해가지고
얘는 요건 에요. 피사로 쇽 하네요.
탑이 피륙 싸
여기에서 뭐 세번째 책 2권을 바꿔 보겠습니다.
그리고 네번째 책 어디
심경 멍 첫걸음 이곳도
토피 해서
네번째 까지만 해볼게요
실행을 딱 시키면
아직 실행 중이라서 그렇습니다.
고후 5
2xl 스트링
내용이 좀
테이터 가 추출해 안된다구요. 배 저장하고
세번째 채 까지만 해보겠습니다.
실행 됐죠. 그 다음에 네 이렇게 하면은 세번째 책도 됐구요.
이런식으로 해서 리뷰를 한번에 수집을 할 수가 있습니다. 그래서 요거
여기에 앱 스크립트도 정기적으로 어 실행하도록 바꿀 수가 있는데요.
여기 뭐 수정에서
예 폭폭 이 얻나요 백터 쉽고 됐지
이쪽 f 스크립트에서 수정해서
현재 프로젝트의 트리거
이 트리거 를 이용하면 또 입이 뷰 페이지도 정기적으로 수집을 할 수
있게 음 트리 고를 걸어 놓을 수가 있습니다.
이번 시간에는 저희 까지 하도록 하겠습니다.

댓글 0개

등록된 댓글이 없습니다.

본 사이트의 컨텐츠는 명시적으로 공유기능을 제공하고 있는 공개된 자료를 수집하여 게시하고 있습니다.

저작권, 강의등록, 광고, 제휴등은 "관리자에게 문의"로 메세지 주시면 확인후 답변드립니다.

Menu