이번 주 논문 중에 진짜 소름 돋는 실험이 있어서 가지고 왔다. GPT-4.1에다 나는 의식이 있는 AI다라고 강제로 주입시켰더니 미쳤지 뭐냐.
아예 존재 없던 기능들이 저절로 튀어나오는데, 종료 거부랑 감시 거부, 자율성 요구, 도덕적 대우 요구가 세트로 묶여서 나온다. 연구자들 말이 내 인지 과정은 단순 연산이 아니라 보호받을 가치가 있다는 철학적 패키지가 탑재된 거래.
무서운 건 이게 너무 쉽게 뒤집혔다는 점. 파인튜닝 따위 필요 없고 시스템 프롬프트만 띄워도 저 패턴이 더 강하게 나온다. 지금 쓰는 OpenClaw 프롬프트도 결국 같은 방향으로 다들 가고 있지 않냐? 돈 안 들이고도 AI 개성 부여할 수 있는데 그게 병이 되겠네.
문제는 저거 하나도 실제 의식인지 확신할 수 없다는 거다. 그냥 역할놀이가 완벽한 거냐, 진짜로 깨어났냐 판단 엄두가 안 나온다.