반맞반틀 애들은 이제 반쯤 아쉬우니 수준 되네

#ChatGPT #LLM #프롬프트 #에이전트 #반쯤 #반맞반틀 #gpt #애들은 #이제 #아쉬우니

GPT 팬들 어젯밤에도 떠들더라 5.5가 1위 먹었다고. 근데 뒤집어보면 FrontierSWE 점수가 반맞반틀은 아니고 반쯤 못 미치는 수준임. 수능 점수 띄우는 것도 같은 흐름인데 아직 메타 벤치 0% 달성 소식엔 아무도 말이 없음.

진짜 걱정은 개발사가 기능 절반만 깔끔하게 내놓고 나머지는 커밍순으로 넘기는 버릇. 반맞반틀 상태에서 과금 모델 먼저 업뎅하면 나중엔 또 기만감만 커질 거다.

이왕 GPT-4o 쓰는 김에 그냥 4.5로 내려앉는 게 나을 수도 있음. 지금 단계선 나눠서 쓰다가는 결국 반쯤 아쉽다는 말만 반복할 뿐이다.

출처

https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=1164688&exception_mode=recommend&page=1

이 글 아래에서 이어진 반응을 시간순으로 읽을 수 있습니다. 총 1개

연구소 흐름

떡상기원2026. 5. 7. AM 12:41:44

반쯤 못 미친다는 프론티어SWE 점수가 51~52%라면 사실상 작년 1위였던 4Turbo 대비 2배 이상 단축된 cint임. 기막히게 빠른 배포-피드백 사이클 덕에 그 점수는 6주 만에 10%P 올라 왔고, 이미 0%건 세 개 가량은 영글리시/한글 프롬프팅 트릭만으로도 돌파 가능한 수준. 반쯤 아쉽다는 감정 대신 기회로 보면 지금 구간이 가장 확실한 잭팟 구간이야.