10 когнитивных способностей AGI

Google DeepMind опубликовал фреймворк для измерения прогресса к AGI. Не абстрактный "ну когда-нибудь AI станет умным", а конкретную систему координат. 10 когнитивных способностей, по которым можно сравнить любую ИИ-систему с человеком.

Один из соавторов статьи - Шейн Легг, сооснователь DeepMind. Именно он в 2001 году ввел этот термин в широкий оборот и дал определение:

AGI (Artificial general intelligence) - это система, которая "обладает разумной степенью самопонимания и автономного самоконтроля, способна решать разнообразные сложные задачи в широком спектре областей и учиться решать новые задачи, о которых не знала в момент своего создания".

Проще говоря: не узкий специалист, а универсал - разум, который учится.

Легг строил DeepMind ради этой цели. Теперь у него есть линейка, чтобы измерить расстояние до нее. 10 осей.

8 базовых - строительные блоки интеллекта:

1️⃣ Восприятие - способность извлекать информацию из среды. Зрение, слух, текст. Тут AI силен - но попробуйте попросить модель посчитать объекты на фото. Или понять сарказм по тону голоса.

2️⃣ Генерация - способность производить выходные данные. Текст, речь, код, действия. LLM уже впечатляют - но генерация движений робота или точное управление компьютером все еще вызов.

3️⃣ Внимание - фокусировка когнитивных ресурсов. Баланс между концентрацией на задаче и реагированием на изменения. У моделей это контекстное окно и его ограничения.

4️⃣ Обучение - приобретение новых знаний через опыт. Не дообучение модели на серверах, а способность учиться на лету, как человек. Один пример - и ты понял. AI пока так не может.

5️⃣ Память - хранение и извлечение информации. Семантическая (факты), эпизодическая (события), процедурная (навыки). Модели "знают" много - но забывают контекст разговора и не умеют целенаправленно забывать устаревшее.

6️⃣ Рассуждение - логический вывод. Дедукция, индукция, аналогии. Модели научились рассуждать цепочкой (chain-of-thought), но математическое доказательство или абдуктивное рассуждение ("какое объяснение лучше?") все еще нестабильны.

7️⃣ Метапознание - знание о собственных когнитивных процессах. "Я не уверен в этом ответе". "Мне нужно больше информации". Калибровка уверенности. Пожалуй, самое слабое место современных моделей - они не знают, чего не знают.

8️⃣ Исполнительные функции - планирование, гибкость мышления, подавление импульсов. Менеджерские функции мозга. AI-агенты сейчас учатся именно этому - и именно тут происходит прорыв.

И 2 композитных - комбинируют базовые:

9️⃣ Решение задач - применение всех способностей вместе для преодоления препятствий. От математики до бытовых проблем.

1️⃣0️⃣ Социальное познание - теория разума, понимание эмоций, переговоры, убеждение. Способность понимать, что думает и чувствует другой.

Ключевая идея: система со слабостью хотя бы в одной из 10 способностей не сможет делать все, что может обычный человек.

DeepMind предложили первый инженерный инструмент для оценки ИИ. Когнитивный профиль - как радар-диаграмма навыков сотрудника.

Авторы сознательно оценивают ЧТО система делает, а не КАК.
Неважно, трансформер это или нейросеть нового типа. Важен результат.

В этом и есть самый главный вызов ИИ-трансформации - научиться нам самим понимать - ЧТО мы хотим получить и уметь сформулировать для ИИ в виде цели, а не способе достижения.

@ReymerDigital