Note
커스텀 URL 주소 크롤링 본문
728x90
커스텀 주소 예시) 이스타 TV
* 예시는 아무런 상관이 없는 제가 좋아하는 채널입니다.
커스텀 하지 않은 URL : https://www.youtube.com/channel/UCn9mJ4htO64-1osMWYu9k5Q
커스텀 URL : https://www.youtube.com/c/이스타TV
channel_id = UCn9mJ4htO64-1osMWYu9k5Q
session = HTMLSession()
result_df = pd.DataFrame()
result = []
result2 = []
video_url = "https://www.youtube.com/channel/{}".format(channel_id)
response = session.get(video_url)
soup = bs(response.html.html, "html.parser")
try:
data = re.search(r"var ytInitialData = ({.*?});", soup.prettify()).group(1)
data_json = json.loads(data)
channelPrimaryInfoRenderer = data_json['contents']['twoColumnBrowseResultsRenderer']['tabs'][0]
browseId = channelPrimaryInfoRenderer['tabRenderer']['endpoint']['browseEndpoint']['browseId']
canonicalBaseUrl = channelPrimaryInfoRenderer['tabRenderer']['endpoint']['browseEndpoint']['canonicalBaseUrl']
result.append(browseId)
result2.append(canonicalBaseUrl)
except:
continue
result_df['channel_id'] = result
result_df['custom_channel_ids'] = result2
channel_id | custom_channel_id |
UCn9mJ4htO64-1osMWYu9k5Q | /c/이스타TV |
'etc > Crawling' 카테고리의 다른 글
인스타그램 크롤링 (2) - id, 프로필 사진 링크 (0) | 2022.07.05 |
---|---|
인스타그램 크롤링 (1) - 자동 로그인 (0) | 2022.07.04 |
유튜브 재생목록 이름 가져오기 (0) | 2022.05.20 |
크롤링 requests.exceptions.SSLError 에러 (0) | 2022.05.13 |
유튜브 id 구분 (0) | 2022.05.09 |
Comments