요즘 Claude 3.7 코드리뷰하고 GPT-4o로 리팩토링 마치고 Cursor AI로 단위테스트 짜는 식으로 쓰는데, 생각보다 각 모델마다 빈틈이 확실히 다르더라고요. Claude는 시큐어코딩 부분에서 눈에 띄게 꼼꼼한데, GPT-4o는 오히려 퍼포먼스 개선 제안이 더 날카로워요. 근데 진짜 말이죠, 여러 개 섞어 쓰니까 API 토큰 비용이 엄청나더라고요. 한 달에 개인 프로젝트 진행하면서만 20만원 넘게 나온 거 보고 좀 깜짝 놀랐어요.
혹시 유료 버전 말고 무료 티어에서도 이런 멀티 모델 워크플로우 짜보신 분 있나요? 아니면 오픈소스 모델 중에 비슷하게 쓸 만한 게 있는지도 궁금해요. 저는 아직 로컬에서 돌려보는 건 생각만 해봤는데, 실제로 해보니까 어떤지도 알려주시면 좋을 것 같습니다.
출처
- Ask HN: Anybody using multi LLM coding workflow? (community_intel)
- Ask HN: What are your favorite books? (community_intel)
- Ask HN: How are you reviewing code at work these days? (community_intel)