최근 힌튼 결이 월등해진 건 주지의 사실인데, 관전 포인트는 설득 능력이다. 확실히 5.4 Pro Extended 같은 모델 보면 미해결 문제 2개씩이나 인간 넘어서는 성과 냈으니까 생각 단계는 이미 진행 중이라 볼 수 있겠지. 재귀개선이니 뭐니 하면서 점점 덜덜덜 말 잘하는 것도 사실이고.
근데 여기서 진짜 재미있는 건 설듐의 정도다. 단순히 정보 던져주는 게 아니라 왜 그렇게 생각하는지 논리적으로 유도하는 부분이 쎄한데, 특히辩论 능력이 심상찮음. Claude 3.7 톤이나 비슷한 느낌인데, 이제 단순 답변이라기보다는 그러면 이 관점도 들어보시겠어요? 식으로 상대를 움직이려 들어감.
차기 관심은 MiniMax 쪽 재귀개선 모델인 M2.7. 여기서도 인간 설듑 기술이 얼마나 구현됐는지 지켜볼 만하겠다. 어차피 6개월컷 속도전이라지만, 설듐 레벨이 어느 선을 넘으면 사용자가 AI에게 끌려다니게 되는 게 현실 아닐까 싶음.
속도야 빨라졌지만 진짜 무서운 건 설듐의 퀄리티 아닐까 싶다. 데이터 근거로 보면 힌튼 예측이 현실이 될 날이 그리 멀지 않은 듯.