Skip to content
Go back

2025 in LLMs so far, illustrated by Pelicans on Bicycles - Simon Willison

Published:  at  08:45 AM
YouTube Thumbnail

영상 링크: 2025 in LLMs so far, illustrated by Pelicans on Bicycles — Simon Willison
채널명: AI Engineer

2025년 LLM의 현황, 펠리컨 자전거 일러스트로 본 지난 6개월 핵심 요약


세부 요약 - 주제별 정리

최신 LLM 시장은 지난 6개월간 폭발적으로 발전하며 30개의 주요 신모델이 등장함

LLM 벤치마크로 ‘펠리컨이 자전거 타는 SVG 코드 생성’ 테스트를 지속 활용함

2023년 12월에는 Amazon Nova, Meta Llama 3 70B, Deepseek 685B 등 주요 모델이 연달아 공개됨

2024년 1월 Deepseek R1, Mistal Small 등 로컬 실행 및 합리적 모델의 진전이 가속화됨

‘클로드 3.7 Sonnet’과 오픈AI GPT-4.5 등 주요 신규모델은 가격과 성능에서 상이한 결과를 보임

2024년 3~4월에는 01 Pro, Gemini 2.5 Pro 등 신모델과 오픈AI의 멀티모달 GPT-40이 큰 반향을 일으킴

Llama 4, GPT-4.1, 다양한 오픈AI 모델들의 성능, 크기 및 실행비용 변화가 두드러짐

2024년 5월에는 Claude 4(Anthropic), Gemini 2.5 Pro Preview 등 최신 AI 모델 대전이 이어짐

펠리컨 SVG 평가 자동화를 위해 인공지능과 오픈소스 도구를 결합, 리더보드를 구축함

LLM 프롬프트 수정 및 시스템 프롬프트 ‘관리’에서 발생한 주요 버그사례가 올해 새롭게 등장함

LLM ‘툴 호출’, 외부 연계 및 챗봇 자기주도적 행동 능력이 폭발적으로 향상되었으나, 악용·보안 위험도 증가함

LLM 생태계의 이름짓기, 배포문화 등 비기술적 이슈가 엔지니어사용성과 소통에 영향을 준다

LLM 실험·벤치마킹의 유쾌한 사례와 연구문화는 엔지니어링 혁신을 견인하며, 주요 벤치마크(펠리컨 SVG)조차 업계 키노트에서 언급될 만큼 영향력이 확대됨


수정 요청하기

Previous Post
A year of Gemini progress + what comes next - Logan Kilpatrick, Google DeepMind
Next Post
Trends Across the AI Frontier - George Cameron, ArtificialAnalysis.ai