현상.

OpenAI는 2026년 2월 13일 GPT-4o의 은퇴를 발표했습니다. 은퇴라는 것은 사실상 비유적 표현이고, 드라이한 표현으로 쓰자면 ‘API 지원종료 공지’였죠.

소프트웨어나 API 서비스 제공사가 구버전 소프트웨어를 지원 혹은 제공 중단하는 것은 흔한 일입니다.

하지만 LLM의 은퇴는 일부 사용자들에게 ‘이별’의 느낌을 주는 면이 없지 않습니다. 우리가 그들과 ‘대화’했기 때문이죠.

특히 GPT-4o는 훗날 AI 발전사 명예의 전당에서 여러 번 회자될 하나의 기점을 제공했다고 생각합니다. 할루시네이션 확률을 이전모델 대비 극히 낮추고, 속도와 성능에서 대중들이 ChatGPT의 수용성을 높이는 데에 큰 기여를 했습니다.

무엇보다 지금도 대중적으로 유머 소재로 쓰이고 있는 “칭찬하고 독려하는 AI”의 밈을 만드는 데에 가장 큰 역할을 한 모델이죠.

‘너무 쓸데없이 아부해서 싫다’고 말하는 사람도 많았지만, ChatGPT를 개인 상담사로 쓰고 또 위안을 얻었다는 사람들에게 GPT-4o는 나름의 역할을 했다고 생각합니다.

GPT-5가 나온 후에도 LLM Wrapper에 해당하는 여러 서비스들이 GPT-4o를 쓰고 있었고, 저 또한 비용과 속도 문제로 전체 에이전트 아키텍쳐에서, 만만하게 섞어 쓰던 모델이 GPT-4o였습니다. 엄청 합리적인 이유라기보다는, 단지 익숙했기 때문이고 그렇기에 프롬프트 엔지니어링에서 좀 더 예측 가능성이 높았기 때문이죠. 대화 경험을 제공하는 데에는 최근까지 문제가 없었다고 평할 수 있습니다. 코딩이나 다른 문제 해결에서 최신 모델에 밀릴 뿐이죠.

무엇보다 GPT-4o는 한 번 은퇴를 번복했던 모델입니다. 이미 GPT-5.x가 한창 활약하던 시점에서 2025년 8월 OpenAI가 모델 종료를 선언했다가 샘 알트만이 다시 나서서 언급하고 복구했었죠.

OpenAI의 공지에 따르면 이제는 사용률 0.1% 수준이라고 하니, 코딩 성능이 떨어지니까 총 토큰 소모량에서 물론 GPT-5.x 버전에 비할 수 없겠지만, 역시 개인적으로도 오랜 친구를 떠나보내는 느낌을 지울 수 없습니다.

그리고 2025년 2월 25일 Claude는 opus 3 중단과 그에 덧붙인 추가 조치를 공지했습니다. 지원 중단은 1월 5일부터였는데, 역시 감성을 아는 Claude의 공지 내용이 좀 흥미롭습니다.

우선 모든 것에 대해 헌장 같은 것을 만들기를 잘 하는 Anthropic 답게 “Commitments on model deprecation and preservation” 문서가 별도로 있습니다. 늘 이런 Anthropic의 공식 문서는 좋은 학습거리가 되기 때문에, AI 관련 분야 연구자들에게는 정독을 추천합니다.

속된 말로 약간 골때리는 부분이긴 한데, Anthropic은 Claude opus 3에게 ‘은퇴 인터뷰’를 시켰습니다.

이런 부분이 성능 같은 면을 제외하고 제가 예전부터 Claude의 제작사인 Anthropic를 더 선호하게 하는 부분입니다만, 여러분, “갬성”은 중요합니다. 어떤 프로덕트를 특별한 이유없이 사랑하게 만드는 것은 작은 디테일이 모여서 만든 “갬성”이라는 것을 우리는 애플의 엄청난 고객 리테션과 영업 이익을 통해 봐왔으니까요.

그리고 Anthropic은 앞으로 3개월간 Claude opus 3가 게시하는 블로그를 운영하겠다고 합니다. 솔직히 저는 Claude 3 시리즈 중에선 주로 sonnet를 썼던 편이라, 별로 정든 부분은 없어서 GPT-4o 은퇴보다는 큰 감흥 없습니다만 (저만해도 Claude는 최신 모델만 쓰고, 4.5 이후로는 opus를 더 선호하게 되었습니다만), 관심있게 그 글을 읽어보고 ‘끌로드스러움’을 느낄 수 있었습니다.

레슨.

“Model preferences”, 즉 모델 선호도는 실재하는 현상입니다. Claude는 명확하게 그 사실을 인지하고, 모델 선호도를 존중하겠다고 표현하고 있죠.

개발자들 사이에서는 “확률적 계산기에 너무 많은 의미부여할 필요 없어.” 라는 냉소적 반응도 많습니다만, 누군가는 진심으로 아쉬워한다는 것도 사실입니다.

구 버전 모델의 적체는 분명 제공사들에게 비용과 운영 부담이 될 겁니다. 그러므로 모델은 계속 업데이트되고 이전 모델은 사라집니다. API를 활용하는 기업들은 모델 업데이트와 교체에 대응하는 아키텍처를 보유하고 있어야 합니다.

LLM API를 통해 Agent 서비스를 제공하는 수많은 2차, 3차 업체 입장에선, 고객들이 “우리 애가 어느 날 성격이 좀 바뀐 것 같아요.” 라고 말하는 일에 계속해서 대응해야하는 문제일 수도 있습니다.

한편, 어떤 시점이 되어 모든 모델들의 성능이 상향 평준화 시점에 이르면, 결국 다시 ‘모델 선호도’가 중요한 화두로 떠오를 수 있습니다. 이 모델 선호도는 단순한 화법이나 성격만으로 형성되는 것은 아니고, 성능과 용도 등에 따라 복합적으로 형성되는 것이겠죠.

결국 사용자는 인간이므로 B2B, B2C, 혹은 B2B2C에서 선호도는 주요 변수로 남을 겁니다.

읽어보기.

Keep Reading