Портал о навигации и мониторинге

Китайская ИИ-система ускоряет вычисления в 100 раз

В мире искусственного интеллекта, долгое время доминируемом ресурсоёмкими моделями на базе архитектуры Transformer, назревает тихая революция. Исследователи из престижного Института автоматизации Китайской академии наук в Пекине представили систему SpikingBrain-1.0 — принципиально новую разработку, которая бросает вызов современным парадигмам. В отличие от своих «прожорливых» предшественников, таких как ChatGPT, эта модель черпает вдохновение в самой эффективной вычислительной системе из известных человечеству — в человеческом мозге. Её создатели обещают не только значительное, в десятки раз, ускорение обработки данных, но и радикальное снижение энергопотребления, что открывает путь к новому поколению экологичного и доступного ИИ.

От трансформеров к нейронам: фундаментальный сдвиг в парадигме

Ключевое отличие SpikingBrain-1.0 кроется в отказе от архитектуры Transformer, ставшей золотым стандартом для больших языковых моделей. Трансформеры обрабатывают информацию одновременно на всём своём объёме, что требует колоссальных вычислительных мощностей и энергии. Китайская разработка основана на принципе импульсных нейронных сетей (Spiking Neural Networks, SNN), которые являются наиболее биологически правдоподобной формой искусственного интеллекта.

Как поясняет медиа-ресурс «Время Электроники», вместо постоянной активной обработки данных, сеть SpikingBrain 1.0 работает по событийно-ориентированному принципу. Её нейроны большую часть времени пребывают в «спящем» состоянии и активируются лишь тогда, когда поступающий входной сигнал достигает определённого порога. Это похоже на работу биологических нейронов в мозге, которые обмениваются краткими электрическими импульсами (спайками) только при необходимости. Такой подход кардинально снижает избыточные вычисления. Энергия тратится не на постоянную пересылку данных через всю сеть, а точечно, только на обработку значимых событий, что и является залогом феноменальной эффективности.

Масштабные испытания и ошеломляющие результаты

Чтобы доказать жизнеспособность своей концепции, исследовательская группа под руководством Сюй Бо провела масштабные эксперименты. Были созданы и всесторонне протестированы две версии модели: компактная, содержащая 7 миллиардов параметров, и крупная — на 76 миллиардов параметров. Примечательно, что обучение обеих моделей было проведено на относительно скромном по современным меркам наборе данных объемом около 150 миллиардов токенов. Это говорит о высокой эффективности алгоритма обучения, которому не требуются экзабайты информации для достижения впечатляющих результатов.

Наиболее ярко преимущества SpikingBrain-1.0 проявились в задачах, связанных с обработкой сверхдлинных последовательностей данных — области, где традиционные трансформеры сталкиваются с наибольшими трудностями из-за экспоненциального роста вычислительной сложности.

  • В первом тесте модель с 7 миллиардами параметров обработала запрос колоссального объёма — длиной в 4 миллиона токенов — и сгенерировала ответ более чем в 100 раз быстрее, чем стандартная система на базе Transformer. Для понимания масштаба: 4 миллиона токенов — это эквивалент нескольких объёмных научных монографий или тысяч страниц юридической документации.
  • Во втором тесте, который измерял скорость извлечения информации из контекста, система продемонстрировала ускорение в 26,5 раз при генерации первого токена из последовательности длиной в один миллион токенов. Этот показатель критически важен для задач, требующих мгновенного ответа на основе большого массива данных.

Практическое применение и стратегическое значение

По словам директора Института автоматизации Сюй Бо, SpikingBrain-1.0 «открывает путь для разработки ИИ нового поколения без использования трансформеров». Эта технология может лечь в основу создания специализированных нейроморфных чипов — процессоров, архитектура которых напрямую копирует структуру нейронных сетей мозга. Такие чипы обещают быть исключительно энергоэффективными, что делает их идеальными для развёртывания в дата-центрах, на мобильных устройствах и в условиях ограниченных энергетических ресурсов.

Важным аспектом успеха проекта стала его стабильная работа в течение нескольких недель на кластере, собранном из сотен чипов MetaX — платформы, разработанной шанхайской компанией MetaX Integrated Circuits Co. Этот факт подчёркивает не только технологическую зрелость системы, но и её стратегическое значение для Китая, демонстрируя возможность создания высокопроизводительных систем ИИ на основе отечественных технологий, снижая зависимость от зарубежных решений.

Потенциальные области применения SpikingBrain-1.0 огромны и охватывают сферы, где обработка больших данных является узким местом:

  • Юриспруденция и государственное управление: мгновенный анализ тысяч страниц судебных дел, законодательных актов и нормативных документов.
  • Медицина и биоинформатика: расшифровка сложных медицинских изображений, анализ геномных данных и ускорение секвенирования ДНК для персонализированной медицины.
  • Фундаментальная наука: моделирование в физике высоких энергий, климатологии и астрофизике, где требуется обработка потоков данных с экспериментальных установок.
  • Когнитивные помощники: создание интеллектуальных интерфейсов, способных в реальном времени обрабатывать и обобщать гигантские объёмы информации для принятия решений.

Взгляд в будущее

Как отмечается в исследовательской работе, успех SpikingBrain-1.0 имеет двойное значение. «Эти результаты не только демонстрируют возможность эффективного обучения больших моделей на платформах, отличных от NVIDIA, но и указывают на новые направления для масштабируемого внедрения и применения моделей, вдохновлённых работой мозга, в будущих вычислительных системах».

Это достижение знаменует собой важный шаг в эволюции искусственного интеллекта — переход от модели, требующей всё больше ресурсов, к модели, которая учится работать умнее и экономнее, подобно природному прототипу. SpikingBrain-1.0 — это не просто ещё одна мощная модель, а возможный фундамент для совершенно нового класса вычислительных систем, которые сделают передовой ИИ более быстрым, доступным и устойчивым.