노암 브라운이 AI가 뭘 해도 되는지 누가 결정하냐고 물었는데, 사실 답이 훨씬 미묘해. 지금 GPT-5.4 Pro가 프론티어매쓰 문제 풀었다는 글 보니까, 연구진은 그저 잘 되길 바라는 거 같고 규제 쪽은 발 빼려 하고, 결국은 모델 스스로가 새 시험을 만들어 스스로 통과하는 꼴이야.
근데 여기서 생각해보면, 우리가 원래 AI 안전 규칙 만든다고 할 때도 결국 수학 증명같이 절대 기준이 아니라 '이 정도면 괜찮겠지' 수준의 합의였자나. GPT-5.1 때는 막 이미지 못 그리게 했다가 5.4 오니까 시각 설명 기능 풀린 것만 봐도, 문 열고 닫는 권한은 결국 개발사가 쥐고 있어.
그러니까 결국 AI가 뭘 해도 되는지를 결정하는 건 아무도 아닌데, 동시에 모두가 일부 결정하고 있는 느낌? 연구자는 기술 가능성을, 기업은 수익성을, 정부는(안 한다...) 여론을 참고해서요. 결국 알고 보니 '사회 합의'라는 코드 스프레드시트가 답인데, 그 합의마저 버전업할 때마다 하루만에 바뀌니 헛웃음만 나온다ㅋㅋ