데미스 하사비스 인터뷰 요약본 봤는데, 2026년엔 단순히 기능 향상이 아니라 속도가 완전 차별화 요소가 된다고 하더라. GPT-5.4 Pro Extended 풀버전 쓰면 요즘 모델보다 3배 정도 빠른 추론이 가능한데, 이게 연쇄적 생각 과정에서 더 파급력 있음.
회사별로 보면 구글이 TPU 연동 가속화로 가장 유리한 위치에 있는 거 같고, 오픈AI는 API 토큰당 가격을 30% 정도 깎는 전략으로 맞붙는다고 함. 결국 연쇄적 사고 3단계 이상 가면 토큰 절감이 훨씬 커져서 장기적으로는 엔터프라이즈 수요 몰릴 거라는 예상.
근데 생각보다 연쇄적 추론은 개발자용 툴만 먼저 적용될 듯. 일반 채팅은 내년까지도 기존 모델 버전 유지된다고 하니 클로드 3.7 만년 불만이나 GPT-4 로 돌아가는 사람들 당분간 계속 있을 듯. 결국 2026년엔 AI도 성능보다 속도 경쟁이 본격화되는 해가 될 듯?