Kyeongrok Kim 웹데이터 수집의 기술15 앱스토어 랭킹 정기적으로수집2 > 데이터수집

데이터 수집

데이터수집-스크래핑, 크롤링, 파싱

Kyeongrok Kim | 웹데이터 수집의 기술15 앱스토어 랭킹 정기적으로수집2

본문

※ 영상을 선명하게 보기 안내
  1. 유튜브 영상에서 오른쪽하단에 톱니바퀴를 클릭합니다.
  2. 팝업목록에서 "품질" 선택하세요.
  3. 원하는 해상도를 선택해주세요.
※ 모바일에서 Wifi가 아니라면 데이타가 소진될 수 있으니 주의바랍니다.
Kyeongrok Kim님의 데이터수집강의 청각장애인을 위한 자막
15688760495667.jpg

 


우리 지난 시간에 음
ios 앱스토어 l 앨범 랭킹을 구글 스프레드시트 로 저장 하는걸
해봤습니다.
이제는 이걸 정기적으로 수집을 해서 이렇게 시트 n
날짜 이름 날짜 명으로 요 씨트 이름을 날짜 이름으로
음 83 이 8월 13일자 의 순이고
만약에 뭐 8월 14일이 담 여기다 이렇게 2 0 17 08 1일이며
는 또 이렇게 14일
14일이 만들어지고 그렇게 14일에 데이터 이렇게 이제 이렇게 한번
만들어 보도록 하겠습니다.
이게 물론 뭐 하루에 한 번씩 하면은
이 시트 여러가지고 시트 추가 하고 하면 되지만
만약에 내가 이걸 뭐 3개월 동안 하루도 빠지지 않고 수집을 해야 된다
그렇게 하는건 좀 힘들겠죠. 왜냐하면 주말 같은 경우는 내가 출근을 하는
것도 아니고
어 내가 뭐 다른 일이 있으면 그 하루를 빼먹을 수도 있습니다.
그래서
그리고 매번 이렇게 시트 여러가지고 똑같은 작업을 하려면 이것도 나름
굉장히 피곤한 일이에요. 잠깐이면 되지만요
그래서 이렇게 자동으로 수지 입을 하도록 한번 만들어 보도록 하겠습니다.
그러면 요건은 그 구글 스프레드시트 만으론 안되고요
구글 앱스 스크립트 라고
지난번에 잠깐 했었죠 구글 x 스크립트에서 어떤 스크립트를 이용해서
이걸 할 수가 있습니다.
네 일단은 요걸 하려면
2 스프레드시트 주소를 복사를 해 놔야 됩니다.
요거 한번 복사해서 메모장에 나눠보겠습니다.
카피 해가지고 메모장 a5 rss 주소 지우고 이렇게 지금 스프레드시트
주소를 넣어보겠습니다.
그 다음에 여기에 히트 이름을 베이스 라고 이렇게 해볼게요
페이스 라고 만들고요 그럼 이거 임시로 만들어 놨던 것을 지우겠습니다.
이제
어쨌든 이 베이스 않은 시트가 하나 있어야 됩니다.
왜냐하면 이 이름을 가지고 데이터를 출력을 한 다음에 시트를 만들 거기
때문에 그렇습니다.
이렇게 하고요 그 다음에
어 상단의 도구 에서 스크립트 편지 께
여기 들어가 가지고 스크립트를 작성 해 보겠습니다.
그 화면이 좀 함을 떴죠
여기다가 코드를 작성을 해야 되는데요.
어예 제파 l 여러가지고 한번 해볼게요
우리 챕터 6번 이죠
극본을 여러가지고 메모장으로 열어보겠습니다.
제가 쓰는 프로그램을 여러분들이 안 쓰실 수도 있으니까요.
메모장
메모장의 열면 은 벽이 부분이 있죠.
펑션 말봉 촌 이렇게
거기서 펑션 부터 충과 로 끝나는 데까지
복사를 합니다.
그 다음에 초록집 해보겠습니다.
이렇게 되죠
음 그 다음에 이 부분을 고쳐 줘야 되요.
url 이라고 되어 있는 이 부분
이 부분을 고쳐 줘야 됩니다.
그럼 여기 메모 땅에다가 아까
해놨는데 새로 여는 바람에
내 여기 있네요. 4
그래서 이것 주소 혹을 스프레드시트 소적 복사해 가지고
아까 저쪽 소스 코드의 다가 넣어보겠습니다.
네 여기 따옴표 사이에 다가 알기 더 주시면 됩니다.
어 뭐 새 프로젝트 몰라 할까요.
ii ol 앱스 토
랭킹
뭐 이 정도로 해 놓고 그 다음에 시행을 하면 또 권한 그러겠죠.
권 안 검토 허용해주는 됩니다.
개정 선택해 가지고
고급 다음에 이거 허용
그래서 계속
계속
허용 누르면 허용이 되죠
그 다음에 한번 실행을 해볼까요. 물론
네 이렇게 실행하며 는
이 주소도 바꿔줘야 되겠네요. 이렇게 2 로 나오는데
저 투수를 좀 바꿔 주겠습니다.
여기 주소가 요렇게 이게 주소 거든요 이 카페가 좀
수소를 바꿔줘 보도록 하겠습니다.
음 이거부터 채워줘야 되겠네요.
이렇게 주소를 먹어보겠습니다.
그리고 한번 실행해 볼까요. 그런 으
네 그럼 이렇게 데이터가 풀러 가졌죠.
외적 인 2017년 8월 12일
요렇게 데이터가 쌓였네요.
네 이렇게 어 데이터를 출력 을 할 수가 있습니다.
근데 이날 짝
날짜가 이 서버시간
기준으로 대서 그런 제 2천의
날짜가 8월 12일이 라고 되있네요. 4
일단은 이렇게 해놓은 요렇게 해 놓으면 데이터가 풀러 어지는 것까지
우리가 확인을 할 수가 있죠.
그 다음에 를 정기적으로 실행 않은걸 한번 만들어보겠습니다.
정기적으로 실행을 하려면
여기 상단에 수정 그 다음에 음
트리거 있죠. 트리거 요거 현재 프로젝트의 트리 걸 누릅니다.
그 트리거가 설정되어 있지 않습니다. 여기를 클릭해서 추가 하세요. 라고
나오네요. 클릭해 보겠습니다.
그 시간 이고 그 다음에
시간 115 할까 1일 타이머 그다음엔
에 뭐 자정부터 오전 1시까지 이때 실행하는 걸로 해 보도록 하겠습니다.
그 다음에 저장 누르면 됩니다.
그럼 이제 트리거가 저장이 됐고요 어
이겜 어매 1
그 새벽 1 자정에서 한지 사이에 실행을 해서
여기다가 그 실행된 날짜로 시트를 만들어서 데이터를 계속 쌓놓을
겁니다.
이렇게 하면은 뭐 내 감 정지를 시킬 때까지 계속 데이터를 쌓주기
때문에 나중에 다 모인 데이터를 내가 확인을 할 수가 있습니다.
이번 그 6 따 시사 장의 내용은
이걸로 끝입니다. 수고하셨습니다.

댓글 0개

등록된 댓글이 없습니다.

본 사이트의 컨텐츠는 명시적으로 공유기능을 제공하고 있는 공개된 자료를 수집하여 게시하고 있습니다.

저작권, 강의등록, 광고, 제휴등은 "관리자에게 문의"로 메세지 주시면 확인후 답변드립니다.

Menu