[파이썬] 파이썬으로 오늘의 인기 검색어 만들기: 구글과 네이버 실시간 트렌드 크롤링 자동화
블로그나 웹사이트에 사람들이 지금 가장 관심 있어 하는 주제를 반영하고 싶을 때, 실시간 인기 검색어 데이터를 활용하는 것이 큰 도움이 됩니다. 이번 글에서는 파이썬을 이용해 구글과 네이버에서 오늘의 인기 검색어를 자동으로 가져오는 방법을 소개합니다. 자동화 프로그램을 통해 매일 인기 키워드를 수집하고 활용하는 방법을 구체적으로 설명드릴게요.
오늘의 인기 검색어 크롤러 역할
이 프로그램의 핵심 기능은 하루에 한 번(또는 주기적으로) 구글과 네이버의 인기 검색어 페이지에서 데이터를 수집하는 것입니다. 이렇게 모은 데이터를 통해 콘텐츠 기획, 마케팅 트렌드 분석, 블로그 포스팅 소재 선정 등 다양한 작업에 활용할 수 있습니다.
사용법 요약
이 프로그램은 Python의 requests, beautifulsoup4, json, datetime 등을 활용해 웹 페이지의 인기 검색어 요소를 파싱하고 출력합니다. 원하는 경우 파일로 저장하거나, DB에 넣을 수도 있습니다.
구글 트렌드 인기 검색어 크롤링
역할
구글 트렌드(Google Trends)는 각 나라에서 시간대별로 많이 검색된 키워드를 제공합니다. 우리는 이 중 '오늘의 급상승 검색어' 데이터를 크롤링할 것입니다.
사용법
- 구글 트렌드는 공식적으로 API를 제공하지 않지만, pytrends라는 비공식 라이브러리를 활용하면 데이터를 얻을 수 있습니다.
예제
from pytrends.request import TrendReq
pytrends = TrendReq(hl='ko', tz=540)
trending_searches = pytrends.trending_searches(pn='south_korea')
print(trending_searches.head(10))
결과
0
0 블랙핑크
1 손흥민
2 대선 후보
3 원피스
4 이강인
...
네이버 인기 검색어 크롤링
역할
네이버 실시간 검색어는 현재는 공식적으로 폐지되었지만, 뉴스 트렌드, 쇼핑 트렌드, 연관 검색어 등을 통해 유사한 데이터를 수집할 수 있습니다. 이 예제에서는 뉴스 트렌드 API 페이지를 활용합니다.
사용법
- https://datalab.naver.com/keyword/realtimeList.naver 페이지에서 인기 검색어 HTML을 파싱합니다.
예제
import requests
from bs4 import BeautifulSoup
def get_naver_trending():
url = 'https://datalab.naver.com/keyword/realtimeList.naver?where=main'
headers = {
'User-Agent': 'Mozilla/5.0'
}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
keywords = [span.get_text() for span in soup.select('span.item_title')]
return keywords[:10]
print(get_naver_trending())
결과
['2025 대입', '날씨', '한일전', '토트넘 경기', '부동산 전망', '연봉 실수령액', '지방선거', '금리 인상', '다이어트 방법', '여행지 추천']
결과 통합 및 활용 예제
통합 코드
from datetime import datetime
def print_today_trending():
print("오늘의 인기 검색어 (구글 기준):")
print(get_google_trending())
print("\n오늘의 인기 검색어 (네이버 기준):")
print(get_naver_trending())
print(f"{datetime.now().strftime('%Y-%m-%d')} 기준")
print_today_trending()
결과 활용
- 블로그 상단에 위젯 형태로 매일 인기 키워드를 노출
- 인기 키워드 중에서 블로그 주제와 관련된 항목을 선정해 실시간 포스팅
- 마케팅 뉴스레터 또는 SNS 콘텐츠 자동 발행
이 프로그램은 매일 새벽 자동 실행되도록 스케줄링해두면 더 효과적입니다. cron이나 Windows Task Scheduler를 이용해 자동화해보세요. 또한, 슬랙 또는 텔레그램으로 알림을 보내는 기능도 추가하면 팀 단위 작업에도 유용합니다.
키워드는 단순한 검색어가 아닌 사람들의 관심이 집중된 정보입니다. 이를 잘 활용하면 블로그 운영이 더 전략적이고 효과적으로 바뀔 수 있습니다.