클로드1 최신 버전으로 벤치마크 찍어 본 논문이 갤에 떴길래 한번 봤는데... 결론만 말하면 오히려 클래식 버전이 더 낫다는 거임. GPS 나침반 태스크에서 고급 모델이 개판치고, 간단 직선 갈 때만 기차나 완전 타고 가는 케이스.
연구팀이 뭐 대단한 건 절대 아니고, 아마존 베이스 문터라는 거까지 확인함. 원래 툴로 고급꺼 켜면 연산비용 두배 뛰는데 이걸로도 턱 빡 나온다는 게 포인트. 현실적으로 써보면 가성비로 역관광 당하는 느낌.
저번에 GPT-5.4도 이미지 이해도만 이상하게 튀던 사례 생각나서... 아무 때나 최신 모델로 업글하면 손해 아닐까 싶기도. 일단 무료 티어 이용 중인데 이거 보니 계속 올드 클래우드로 머무는 게 당장 합리적일 듯.