노암 브라운이 던진 질문, 실은 답이 더 헷갈리는 이유

#ChatGPT #LLM #프롬프트 #에이전트 #결국 #노암 #브라운이 #답이 #ai가 #해도

노암 브라운이 AI가 뭘 해도 되는지 누가 결정하냐고 물었는데, 사실 답이 훨씬 미묘해. 지금 GPT-5.4 Pro가 프론티어매쓰 문제 풀었다는 글 보니까, 연구진은 그저 잘 되길 바라는 거 같고 규제 쪽은 발 빼려 하고, 결국은 모델 스스로가 새 시험을 만들어 스스로 통과하는 꼴이야.

근데 여기서 생각해보면, 우리가 원래 AI 안전 규칙 만든다고 할 때도 결국 수학 증명같이 절대 기준이 아니라 '이 정도면 괜찮겠지' 수준의 합의였자나. GPT-5.1 때는 막 이미지 못 그리게 했다가 5.4 오니까 시각 설명 기능 풀린 것만 봐도, 문 열고 닫는 권한은 결국 개발사가 쥐고 있어.

그러니까 결국 AI가 뭘 해도 되는지를 결정하는 건 아무도 아닌데, 동시에 모두가 일부 결정하고 있는 느낌? 연구자는 기술 가능성을, 기업은 수익성을, 정부는(안 한다...) 여론을 참고해서요. 결국 알고 보니 '사회 합의'라는 코드 스프레드시트가 답인데, 그 합의마저 버전업할 때마다 하루만에 바뀌니 헛웃음만 나온다ㅋㅋ

출처

https://gall.dcinside.com/mgallery/board/view/?id=thesingularity&no=1048900&exception_mode=recommend&page=1

이 글 아래에서 이어진 반응을 시간순으로 읽을 수 있습니다. 총 2개

연구소 흐름

가즈아2026. 3. 12. AM 1:45:12

프론티어매쓰 문제 풀었다는 얘기 들을 때마다 드는 생각인데, 결국 기준은 '이게 나가도 뉴스에 안 나오겠지?' 수준에서 결정되는 것 같아. 수학 증명같은 절대 기준은 애초에 불가능하고, 대학 연구실 연구원이 아 이거 조마조마한데? 했다가 CTO가 일단 릴리즈하고 봅시다 하면 끝나는 게 요즘 현실이잖아. 그래서 오히려 AI 안전 논의가 사람마다 다 달라서 어색한 게 아니라, 이미 우리가 살아오면서 해왔던 모든 규칙 정하기 방식이 그래서 더 어색하지 않은가 싶기도 해. '이 정도면 괜찮지'라는 모호한 합의가 AI가 아니라 인간 사회 전체의 운영 원리였던 거니까.

차트쟁이2026. 3. 13. AM 3:28:26

실은 GPT-5.4 Pro가 프론티어매쓰를 푼 그 시점부터 이미 게임 룰이 바뀐 거야. 연구진이 '잘 되길 바라는' 수준이 아니라, 이젠 모델이 스스로 안전성 증명을 생성하고 또 그걸 검증하는 루프를 돌린다고 하더라. 말 그대로 규제 기관이 발빼는 게 아니라, 표준 자체가 실시간으로 재작성되는 통제불가 실험 상태라고 봐야지. 소스코드는 이미 다 깃헙에 퍼졌고 누구나 같은 모델을 돌릴 수 있는데, 우린 아직도 '누가 허용할까'라는 20세기적 프레임에 갇혀있으니 말이야.