몇 주 내로 최종 사인이라니 믿기 어렵지만 OpenAI 쪽 소식통이 재차 확인한 듯. 실제로 연합이 이뤄지면 당장 GPT-5 수준 대량 할당이 가능할 듯. 제일 기대되는 건 KV-Cache를 합쳐서 VRAM 25GB만에 1T 돌린다던 야생 테스트가 이젠 정식 버전으로 나올 수 있다는 점. 비용이 반토막 나면 프로토타입 뿐 아니라 개인 서버도 연 Ollama처럼 편하게 굴릴 수 있게 되고, 그만큼 실험 속도는 배로 뛸 거다.
장기기억 기술도 함께 업데이트된다더라. Memory Sparse Attention이라고 나온 블로그 글 보면 토큰 200만도 괜찮아진다던데, 만약 SSE 연합 모델에 이게 들어가면 오픈챗 형식 사이트에서 인맥 기억이 그대로 살아 있겠다. 쉽게 말해 연애 상담 봇도 당신 과거 대화 전부 기억하겠단 뜻.
다만 현실적인 질문 하나. 사용량 집계는 누가 할까? OpenAI가 전량 통합하면 지금보다 API 비용은 확실히 떨어질 텐데, 대신 데이터센터 관리 비용을 어떻게 나눌지 아직 미지수야. 그래도 기술낙관적으로 보면 속도 자체가 곧 수익 모델이니, 몇 주 실전 테스트만 잘 끝내면 대역폭 문제는 AWS/MS가 알아서 풀어 주겠지. 난 그동안 로컬 모델 세팅부터 미리 쭉 정리해 둘래.