AI에게 시험지를 만들게 한 구글 딥마인드, 왜 지금 AGI 채점표를 꺼냈을까요

AI/AI 관련 재밌는 이야기

AI에게 시험지를 만들게 한 구글 딥마인드, 왜 지금 AGI 채점표를 꺼냈을까요

AIThinkLab 2026. 4. 10. 14:09

SMALL

🧪 AI 업계에는 늘 “AGI가 언제 오느냐”는 질문이 따라붙습니다. 그런데 막상 그 질문에 답하려고 하면 의외로 난감합니다. 왜냐하면 다들 AGI를 이야기하지만, 무엇을 기준으로 얼마나 가까워졌는지 측정하는 공통 채점표가 부족했기 때문입니다. 2026년 3월 구글 딥마인드가 내놓은 새 프레임워크는 바로 이 애매한 지점을 정면으로 건드렸습니다.

📚 딥마인드는 “Measuring progress toward AGI: A cognitive framework”라는 글과 함께, 인지과학을 바탕으로 AI의 일반지능 진전을 평가하는 구조를 제안했습니다. 말 그대로 AI에게 성적표를 주기 위한 기준표를 꺼낸 셈입니다. 더 흥미로운 건 이걸 논문 한 편으로 끝내지 않고, Kaggle 해커톤까지 열어 전 세계 연구자와 개발자에게 실제 평가 문제를 함께 만들자고 제안한 점입니다.

🎯 딥마인드가 제시한 10가지 핵심 인지 능력은 꽤 인상적입니다. 지각, 생성, 주의, 학습, 기억, 추론, 메타인지, 실행 기능, 문제 해결, 사회적 인지까지 포함됩니다. 이 목록을 보면 지금 AI 평가가 왜 자꾸 어색했는지가 보입니다. 우리는 대체로 언어 생성 능력이나 벤치마크 점수 몇 개만 보고 “똑똑해졌다”고 말해 왔는데, 실제 일반지능이라면 훨씬 더 다양한 능력을 함께 봐야 하기 때문입니다.

🤖 특히 메타인지와 사회적 인지가 들어간 점이 재미있습니다. 메타인지는 쉽게 말해 “내가 무엇을 알고 무엇을 모르는지”를 스스로 점검하는 능력이고, 사회적 인지는 타인의 의도나 맥락을 읽는 능력에 가깝습니다. 결국 딥마인드는 AGI를 단순히 정답 잘 맞히는 기계가 아니라, 스스로 상태를 점검하고 맥락 속에서 적절히 반응하는 존재로 보겠다는 메시지를 던진 셈입니다.

🏁 여기서 더 흥미로운 건 평가 방식입니다. 딥마인드는 AI 모델만 점수화하자는 것이 아니라, 같은 과제를 인간 표본에게도 수행하게 해서 인간 분포와 비교하자는 접근을 제안합니다. 즉, “이 모델이 인간보다 낫다”는 식의 과장된 표현 대신, 어느 능력에서 인간 평균과 어느 정도 겹치고 어느 부분에서 아직 멀었는지를 더 입체적으로 보자는 것입니다.

💬 개인적으로 이 접근이 재밌는 이유는, AI 업계가 드디어 “성능 자랑”만으로는 부족하다는 사실을 인정하고 있다는 점입니다. 모델이 빨라졌고, 길게 생각하고, 코딩도 잘한다는 것만으로는 사람들에게 충분한 설명이 되지 않습니다. 어떤 종류의 지능이 얼마나 발전했는지, 또 어떤 영역은 아직 빈칸인지 설명할 언어가 필요해졌습니다. 딥마인드의 프레임워크는 그 언어를 만들려는 시도처럼 보입니다.

🏆 Kaggle 해커톤을 붙인 것도 절묘합니다. 학계 안에서만 논문을 돌리는 대신, 실제 평가 도구를 커뮤니티와 함께 만들겠다는 방식이기 때문입니다. 총 20만 달러 상금, 다섯 개 트랙, 그리고 2026년 4월 16일까지 제출이라는 구체적인 실행 계획은 이 아이디어가 단순 담론이 아니라 당장 굴러가는 프로젝트라는 점을 보여줍니다. AI 시대답게, AI를 재는 기준도 오픈 커뮤니티가 함께 만들어 가는 모습입니다.

🔍 또 하나 눈여겨볼 대목은 평가 공백이 큰 능력으로 학습, 메타인지, 주의, 실행 기능, 사회적 인지가 꼽혔다는 점입니다. 다시 말해 오늘날의 유명한 모델들이 텍스트 생성이나 일반 질의응답에서는 많이 발전했지만, 사람이 자연스럽게 해내는 집중 전환이나 자기 점검, 사회적 맥락 판단에서는 아직 충분히 정교한 평가가 없다는 뜻입니다. 이건 곧 앞으로 AI 업계의 경쟁 포인트가 어디로 이동할지 알려주는 힌트이기도 합니다.

🧠 그래서 이 뉴스는 “AGI가 곧 오느냐”보다 더 중요한 질문을 던집니다. 우리는 AGI를 무엇으로 판단할 것인가, 그리고 그 판단 기준은 누가 만들 것인가 하는 문제입니다. 채점표가 없으면 과장도 쉬워지고 공포도 커집니다. 반대로 채점표가 정교해지면 AI를 더 냉정하게 볼 수 있습니다. 과장된 기대도 줄이고, 실제 진전은 더 분명하게 읽을 수 있습니다.

✨ 한마디로 정리하면, 딥마인드는 이번 발표에서 “더 똑똑한 AI를 만들겠다”가 아니라 “더 정확하게 평가하는 방법부터 정리하겠다”는 꽤 성숙한 메시지를 내놨습니다. 화려한 데모보다 기준표가 더 중요해지는 순간, AI 산업은 한 단계 더 현실적인 국면으로 들어갑니다. 시험 잘 보는 AI보다, 어떤 시험을 봐야 하는지 먼저 고민하는 AI 시대가 시작된 셈입니다.

🔗 출처

1. Google DeepMind, Measuring progress toward AGI: A cognitive framework

2. 관련 논문 PDF

3. Kaggle 해커톤 페이지

LIST

'AI > AI 관련 재밌는 이야기' 카테고리의 다른 글

집에서 찍은 집안일 영상이 로봇을 키운다고요? (0)	2026.04.11
개발팀 예산표가 달라집니다, OpenAI Codex 요금제가 바꾼 현실 (0)	2026.04.10
대기업들이 한자리에 모였습니다, AI가 보안팀이 되는 순간 (0)	2026.04.10
AI가 매일 사건을 만든다면, 추리 게임은 어디까지 재밌어질까요 (0)	2026.04.09
캡컷 속 AI 영상 엔진, 15초 상상이 바로 클립이 되는 순간 (0)	2026.04.09

현재글AI에게 시험지를 만들게 한 구글 딥마인드, 왜 지금 AGI 채점표를 꺼냈을까요

AI Think Lab

AI에 관련된 유용한 정보와 재밌는 이야기를 나누는 공간입니다!

축구분석, Anthropic, 재밌는이야기, ai리포트, 재밌는 이야기, Google, 생성형AI, openAI, claude, EPL, 경기리뷰, 축구, AI정보, 구글, AI 주식정보, 반도체, Ai, 해외ai뉴스, 해외 AI 뉴스, gemini,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

AI Think Lab