Skip to content
Go back

Teaching Gemini to Speak YouTube: Adapting LLMs for Video Recommendations to 2B+DAU - Devansh Tandon

Published:  at  08:46 AM
YouTube Thumbnail

영상 링크: Teaching Gemini to Speak YouTube: Adapting LLMs for Video Recommendations to 2B+DAU - Devansh Tandon
채널명: AI Engineer

Gemini에게 유튜브를 가르치다: LLM 기반 추천 시스템을 통해 20억+ DAU에 대응하는 혁신적 접근 핵심 요약


세부 요약 - 주제별 정리

추천 시스템은 검색보다도 더 큰 소비자 영향력을 보일 잠재력이 큼

유저 맥락부터 추천까지, 유튜브가 수집·활용하는 데이터와 문제 정의

Gemini LLM을 유튜브 추천시스템으로 적응시키는 대규모 프레임워크 ‘LRM’ 개발

의미 기반 비디오 토큰화 ‘Semantic ID’를 개발해 LLM 진입의 핵심 문제를 해결함

LLM과 Semantic ID를 결합한 지속 사전학습은 영어와 유튜브 비디오 언어의 ‘바이링궐’ 능력을 만든다

추천 태스크 실제 적용: 생성적(Generative) Retrieval과 오프라인 추천 테이블 전략

LLM 기반 추천은 기존 LLM 훈련보다 훨씬 큰 규모와 신선성 요건 문제에 직면함

‘도메인별 LLM 추천’ 개발을 위한 3단계 레시피 제안

LLM이 점차 추천 품질 개선에서 인터랙티브·생성 추천까지 발전할 전망

LLM과 ‘추천 언어’(SID) 균형 유지 및 학습 전략: 다양한 실험과 고민이 수반됨

Semantic ID 임베딩 초기가 완전히 비지도(unsupervised)로 ‘스스로 의미 공간’을 구축함

비디오 프레임 샘플링은 다양한 접근을 시도하며 사용자 ‘관심 구간’ 중심으로 계속 진화 중

사용자는 현재 ‘콘텐츠 토큰화’의 단계지만, 장기적으로 ‘유저 토큰화’까지 연구되고 있음

LLM 기반 추천은 기존 방식 대비 최근 몇 년간 가장 큰 품질 향상을 보임


수정 요청하기

Previous Post
Transforming search and discovery using LLMs - Tejaswi & Vinesh, Instacart
Next Post
The State of Generative Media - Gorkem Yurtseven, FAL