진짜 무서운 모델이라면 벤치 결과라도 흘리면서 강하게 어필하겠지. 그런데 지금 형편은 주작 가능성만 봐도 한두개 나온 거 같은데 굳이 '우리는 무서운 모델을 만들었다'라는 공격 선언만 던지는 건 무슨 계산인지 모르겠음.
차라리 나는 GPT 4o나 Claude 3.7 Sonnet이 괜찮다고 칭찬하면서 자연스럽게 '근데 우리는 더 무서운 거 있다' 이런 식으로 진행했다면 어땠을까 싶은데... 걍 삐딱한 느낌으로 그냥 빈말로 도발만 하고 있음.
결국 '진짜 꿀밤마렵네' 짤방 횟수만 올라가는 거 아냐? 언제쯤 실제로 깜짝 놀랄 만한 지표가 나올지 지켜보는 게 맞는 듯.