AI уже помогает создавать следующий AI. Главный вопрос теперь не скорость, а контроль.
Anthropic показывает, как Claude ускоряет разработку frontier-моделей. OpenAI учит ChatGPT замечать привычки пользователя. Государства объединяют вычислительные ресурсы. Все три сюжета говорят об одном: AI превращается из отдельного инструмента в постоянно работающий слой развития.
Recursive self-improvement начинается не с магического AGI, а с обычной производительности инженеров.
Когда AI пишет код, проектирует эксперименты, анализирует результаты и помогает обучать новые модели, возникает усиливающийся цикл: более сильная модель ускоряет создание ещё более сильной модели.
Для бизнеса это не абстрактная футурология. Та же логика уже работает в маркетинге, разработке и операционных процессах: каждый автоматизированный цикл создаёт данные и инструменты, которые позволяют автоматизировать следующий.
Главные события дня
Сегодняшняя повестка связывает три уровня: модели улучшают разработку, продукты лучше понимают человека, а государства строят общий вычислительный фундамент.
Anthropic показывает путь Claude к recursive self-improvement
Anthropic опубликовала материал о том, как AI всё глубже участвует в разработке самого AI. Инженеры компании теперь выпускают в восемь раз больше кода за квартал, чем до 2025 года.
Важна не сама цифра, а направление. Claude помогает писать инфраструктуру, проводить исследования и ускорять эксперименты. Это создаёт петлю: AI улучшает процессы разработки, а улучшенные процессы быстрее создают новый AI.
Одновременно Anthropic призывает обсуждать координированное замедление frontier-разработки. В этом и состоит главный конфликт отрасли: отдельная лаборатория не может просто остановиться, пока конкуренты продолжают ускоряться.
Память ChatGPT начинает запоминать не факты, а поведенческие паттерны
OpenAI развивает память ChatGPT в сторону фонового анализа истории диалогов. Система Dreaming v3 должна не только хранить прямые команды вроде «запомни это», но и замечать устойчивые предпочтения, рабочие привычки и повторяющиеся контексты.
Это меняет интерфейс AI. Вместо одинакового чата для каждого пользователя появляется персональная рабочая среда, которая со временем понимает формат ответов, проекты, приоритеты и ограничения.
Но ценность такой памяти напрямую зависит от прозрачности. Пользователь должен видеть, что сохранено, уметь это исправить и отключать чувствительные темы. Без этого персонализация быстро превращается в потерю контроля над контекстом.
Как обучить небольшую open-source модель писать в нужном стиле
Доступный сценарий fine-tuning выглядит так: собрать качественный корпус, очистить его, разбить на короткие примеры и обучить LoRA-адаптер для небольшой модели вроде Qwen 2.5 7B.
Мини-пайплайн стилевой модели:
1. Собрать легальный корпус текстов нужного стиля.
2. Удалить мусор, индексы и техническую разметку.
3. Разбить текст на цельные примеры до 512 токенов.
4. Подготовить JSONL с инструкциями и ответами.
5. Обучить QLoRA-адаптер на облачной GPU.
6. Сравнить результат с базовой моделью.
7. Запустить адаптер локально через Ollama.
Для бизнеса это способ получить узкую модель для документации, ответов поддержки, карточек товаров или внутренней базы знаний. Но качество корпуса важнее количества: плохие и противоречивые тексты модель тоже выучит.
США и Япония объединяют лаборатории, compute и $1 млрд на AI-исследования
США и Япония запустили совместную исследовательскую программу: каждая сторона планирует вложить по $500 млн за пять лет. Партнёрство охватывает AI, квантовые вычисления, fusion и полупроводники.
Главный дефицит AI-гонки — уже не идеи, а вычисления, энергия, чипы и доступ к сильным лабораториям. Поэтому следующая фаза конкуренции будет идти не только между компаниями, но и между коалициями стран.
Для рынка это сигнал: инфраструктурные решения, оптимизация inference, локальные модели и экономное использование GPU будут цениться не меньше, чем новые чат-интерфейсы.
Как построить собственный цикл улучшения без лаборатории frontier AI
1. Начни с повторяемого процесса
Выбери одну регулярную задачу: обработку заявок, подготовку контента, отчёт или QA. Опиши вход, результат и критерии качества.
2. Сохраняй ошибки и правки
Корректировки человека должны становиться датасетом: какие ответы приняли, что переписали и почему результат оказался слабым.
3. Улучшай систему по метрикам
Меняй промпт, модель, знания или автоматизацию только после измерения времени, стоимости, качества и доли ручных исправлений.
Чем сильнее цикл улучшения, тем важнее независимая проверка
Самоулучшающаяся система может масштабировать не только полезные решения, но и скрытые ошибки. Если AI пишет тесты для собственного кода, оценивает собственные ответы и сам выбирает данные для обучения, один неверный критерий начинает усиливаться на каждом цикле.
Практическое правило: разделяй исполнителя и проверяющего. Используй разные модели или независимые проверки, сохраняй журнал изменений, ограничивай доступы и оставляй human approval для действий с деньгами, публикациями, клиентскими данными и production-системами.
Ещё сигналы из повестки
NVIDIA представила Nemotron 3 Ultra для долгих агентных задач. Оптимизация стоимости выполнения становится отдельным полем конкуренции.
Google DeepMind выпустила Magenta RealTime 2 — open-weights модель для живой генерации музыки на локальных устройствах.
Cloudflare сообщает, что автоматизированный трафик уже превосходит человеческий. Интернет всё быстрее становится средой, в которой агенты работают для других агентов.
Хочешь получать такие разборы без воды?
В бесплатном Telegram-канале AI Buddah я разбираю нейросети, AI-инструменты, автоматизацию, вайбкодинг и практические сценарии для бизнеса.
Перейти в бесплатный каналНужна глубина, промпты и разборы для внедрения?
В AI Base я даю больше практики: закрытые материалы, промпты, видеоуроки, AI-архитектуры, разборы инструментов и задачи, которые можно применять в проектах.
Вступить в AI Base