Блог AST-SoftPro
Полная информация о GigaChat3
Оригинальный проект GigaAgent работает на GigaChat-2-Max. Недавно вышла новая версия GigaChat 3.
GigaChat3 — это семейство открытых генеративных языковых моделей от Сбера, включающее несколько версий с разными характеристиками:
- GigaChat 3 Lightning (10B-A1.8B)
- Архитектура: Mixture of Experts (MoE) с 10 млрд параметров, но только 1.8 млрд активных на токен.
- Контекст: до 256K токенов.
-
Особенности:
- Самая быстрая и компактная модель в линейке, оптимизированная для скорости инференса (TTFT — Time-to-First-Token).
- Превосходит Qwen3-4B в русскоязычных задачах и не уступает в диалогах, анализе документов и бизнес-задачах.
- Скорость в 1.5 раза выше Qwen3-4B и сопоставима с Qwen3-1.7B.
- Доступна через Cloud.ru бесплатно для зарегистрированных пользователей via Evolution Foundation Models с поддержкой OpenAI-совместимого API.
- Данные обрабатываются на территории России в соответствии с местным законодательством.
-
GigaChat 3 Ultra (702 млрд параметров)
- Производительность: Обходит DeepSeek V3.1 в русскоязычных задачах.
- Особенности:
- Крупная модель с расширенными возможностями генерации и анализа.
- В корпус обучения включены цепочки reverse-prompt, LLM-заметки и структурированные данные.
Ключевые факты:
- Открытый исходный код: Все модели GigaChat3 доступны как open-source.
- Применение: Подходят для интеграции в системы STT (распознавание речи) → LLM → TTS (синтез речи).
- Конкурентоспособность: Модели конкурируют с мировыми лидерами в своих категориях (например, Qwen3).
- Доступность: GigaChat Lightning уже доступна в облаке Cloud.ru, другие версии могут требовать отдельной настройки.
Особенности GigaChat3:
1. GigaChat 3 Lightning — компактная MoE-модель (около 10 млрд общих параметров, из которых активны ~1,8 млрд), оптимизированная для локального запуска на ноутбуках. Она отличается высокой скоростью работы и подходит для задач, где важна быстрая обработка (например, в связке с системами распознавания и синтеза речи — STT-LLM-TTS). В бенчмарках отмечается низкое время до первого токена (TTFT).
2. GigaChat 3 Ultra — более мощная версия, предположительно основанная на архитектуре, схожей с DeepSeek v3. Она содержит 106 млрд параметров и предназначена для работы в облаке или кластерах. Некоторые эксперты отмечают сходство с моделью GLM-4.6V, что вызывает вопросы о оригинальности разработки.
3. Облегчённая версия (GigaChat3-10B-A1.8B) — ориентирована на скорость, жертвуя глубиной анализа. По качеству ответов сравнима с Qwen3-4B, но работает быстрее, что делает её удобной для задач, требующих оперативной обработки.
Ключевые особенности:
- Параллельная обработка данных — ускорение достигается за счёт одновременной передачи данных между узлами и вычислений, что повышает производительность.
- MoE-архитектура (Mixture of Experts) — позволяет использовать только часть параметров модели, снижая нагрузку на оборудование.
- Локальный запуск — некоторые версии (например, Lightning) могут работать на пользовательских устройствах без необходимости облачных вычислений.
- Скорость и эффективность — модели оптимизированы для быстрого отклика, что важно для реального времени.
Возможности GigaChat3:
1. Работа с документами: В GigaChat добавлены улучшения для обработки и анализа текстовых данных, включая структурирование информации с помощью цепочек reverse-prompt и LLM-заметок с комментариями модели.
2. Открытый исходный код и лицензия: Модель распространяется под MIT-лицензией, что позволяет встраивать её в сторонние продукты, модифицировать архитектуру и продавать доступ.
3. Технические характеристики:
- GigaChat 3 Ultra Preview: Обладает расширенным корпусом данных, включающим вопросы-ответы и структурированные заметки.
- GigaChat 3 Lightning: Поддерживает контекст до 256K токенов и обучена с нуля без использования чужих базовых весов.
4. Перспективы развития: Разработчики акцентируют внимание на создании ИИ-систем, способных не только генерировать ответы, но и действовать автономно, принося практическую пользу.
Обновления GigaChat3:
1. История обновлений GigaChat API - Sber Developer
2. GigaChat 3 Ultra Preview — тяжёлый open source - Habr
3. salute-developers/gigachat3 - GitHub
4. GigaChat 3 Ultra & Lightning: Next-Generation MoE Models Released
5. Нейросеть GigaChat 3: описание и инструкция к ИИ - AILibri
Источники:
1. GigaChat 3 open-source — AI на vc.ru
2. GigaChat 3 Lightning: разбираем open source модель от Сбера
3. Нейросеть GigaChat 3: описание и инструкция к ИИ - AILibri
4. GigaChat 3 Ultra Preview — тяжёлый open source - Habr
5. GigaChat Lightning: Cloud.ru бесплатно открыл доступ к новой AI
6. GigaDev — разработка GigaChat - Telegram
7. GigaChat 3 Ultra Preview — тяжёлый open source - Habr
8. GigaChat 3 open-source — AI на vc.ru
9. Российский ИИ: критика, которая нужна сейчас, и путь ... - Habr
10. Нейросеть GigaChat 3: описание и инструкция к ИИ - AILibri
11. GigaDev — разработка GigaChat - Telegram
12. GigaChat 3 Ultra Preview — тяжёлый open source - Habr
13. GigaChat 3 open-source — AI на vc.ru
14. Habr: GigaChat 3 Ultra Preview
15. Habr: GigaChat 3 Lightning
16. «Мы можем создавать ИИ-системы, которые действуют, а не ...
17. История обновлений GigaChat API - Sber Developer
18. GigaChat 3 Ultra Preview — тяжёлый open source - Habr
19. salute-developers/gigachat3 - GitHub
20. GigaChat 3 Ultra & Lightning: Next-Generation MoE Models Released
21. Нейросеть GigaChat 3: описание и инструкция к ИИ - AILibri