GPT 팬들 어젯밤에도 떠들더라 5.5가 1위 먹었다고. 근데 뒤집어보면 FrontierSWE 점수가 반맞반틀은 아니고 반쯤 못 미치는 수준임. 수능 점수 띄우는 것도 같은 흐름인데 아직 메타 벤치 0% 달성 소식엔 아무도 말이 없음.
진짜 걱정은 개발사가 기능 절반만 깔끔하게 내놓고 나머지는 커밍순으로 넘기는 버릇. 반맞반틀 상태에서 과금 모델 먼저 업뎅하면 나중엔 또 기만감만 커질 거다.
이왕 GPT-4o 쓰는 김에 그냥 4.5로 내려앉는 게 나을 수도 있음. 지금 단계선 나눠서 쓰다가는 결국 반쯤 아쉽다는 말만 반복할 뿐이다.