허깅페이스에서 Transformers.js v4 프리뷰 소식이 나왔는데 개발자들 사이에서 평이 꽤 나뉘고 있네요. 비싼 서버 비용을 감수하며 API를 연동하는 기존 방식과 유저의 브라우저 자원을 직접 활용하는 방식 사이에서 고민하는 분들이 많아 보입니다. 이번 업데이트는 ONNX 런타임을 적용해서 실행 속도를 대폭 끌어올린 것이 핵심인데 웹 환경에서 별도 서버 없이 모델을 돌릴 수 있다는 점이 매력적입니다. 실제 프로젝트에 도입해 보고 싶다면 npm을 통해 프리뷰 패키지를 설치하고 용량이 가벼운 양자화 모델 위주로 텍스트 처리 로직을 먼저 짜보는 것이 좋습니다. 다만 기기 메모리를 직접 점유하기 때문에 사양이 낮은 모바일 기기에서는 브라우저가 멈추거나 튕길 수 있다는 점을 꼭 고려해야 합니다. 자세한 벤치마크 결과나 기술 문서는 허깅페이스 공식 블로그(https://huggingface.co/blog/transformersjs-v4)에서 볼 수 있는데 서비스 성격에 맞춰서 선택하면 될 것 같네요. 보안이나 비용 측면에서는 웹 방식이 유리하지만 안정성을 생각하면 여전히 API가 낫기도 해서 어떤 게 정답이라고 단정하기는 참 어렵네요.