AI-дайджест: фермер с Codex, школа с Gemini и агенты вместо поиска
AI опять показал ценность не в демо на сцене, а в обычной операционке: ферма, школа, видео, поиск и платежи. То есть там, где людям нужно не восхищаться нейросетями, а получить результат.
Главная мысль
AI перестаёт быть отдельным “инструментом для умных”. Он становится способом собирать рабочие процессы там, где раньше нужен был разработчик, методист, дизайнер, аналитик и ещё человек, который всё это терпеливо соединит. Хорошая новость — порог входа падает. Плохая — оправдания тоже заканчиваются.
Главные события дня
1. Японский фермер собрал себе инженера из ChatGPT и Codex
Самая сильная история дня — не про очередной бенчмарк, а про фермера Хироки Томиясу с Хоккайдо. В профиле ChatGPT Pro он рассказывает, как использует ChatGPT и Codex для управления хозяйством на 100 гектаров без инженерного образования и без команды разработчиков. Его формулировка хорошая: это ощущается как “ультраталантливый инженер, который всегда рядом”. Да, звучит как рекламная цитата. Но дальше начинаются детали, и становится менее смешно.
Codex помогает ему собирать кастомные инструменты, которые связывают IoT-сенсоры, спутниковые снимки и данные по полям. В работе уже восемь AI-процессов: от управления ESP32-моторами до NDVI-карт по спутниковым изображениям, от мониторинга теплиц до контроля состояния брокколи, тыквы, зелёного лука и сои. Человек раньше был госслужащим, потом сам научился фермерству, а теперь строит себе вертикальный стек автоматизации. Без “мы наняли CTO”. Без “нам нужен раунд”. Просто берёт и делает.
Бизнес-смысл здесь неприятный: если фермер может собрать рабочий софт под свои операции, то у малого бизнеса больше нет железного оправдания “нам не по карману автоматизация”. Конечно, не всё будет идеально. Но разница между нулём и рабочим прототипом стала слишком дешёвой, чтобы её игнорировать.
2. DeepMind показывает, что AI-репетитор может не отуплять, а учить
Google DeepMind опубликовал результаты рандомизированного исследования AI-обучения в Сьерра-Леоне. Участники — 1 763 ученика из 12 школ в округе Порт-Локо. Срок — 8 недель. Результат — прирост по математике, сопоставимый с 1,2–2,5 годами обучения. Вот тут обычно хочется сказать: “ну всё, заменяем школу приложением”. Спокойно. Не надо сразу превращать всё в стартап-деку.
Важная деталь в механике: Gemini Guided Learning работал не как машина ответов, а как сократический репетитор. В 76% ответов он задавал направляющие вопросы и только в 2% случаев давал прямой ответ. За время испытания ученики провели больше 113 000 взаимодействий с системой, 69% достигали целевых показателей использования — против типичных 5% для добровольных edtech-продуктов. Поведение тоже менялось: запросы на развитие навыков выросли с 68% в первую неделю до 90% к финалу, а запросы “просто дай решение” упали с 25% до 10%.
Главный урок для продуктов: AI-обучение работает не тогда, когда модель умнее всех в комнате, а когда она правильно держит роль. Не “сейчас я решу за тебя”, а “сейчас я дожму тебя до понимания”. Для курсов, наставников, корпоративного обучения и AI-школ это прямой сигнал: ценность будет не в красивом чатике, а в сценарии поведения модели.
3. Claude Code превращается в видеоконвейер, а не просто редактор кода
Отдельно интересен практический сценарий: собрать AI-news video pipeline через Claude Code и HyperFrames. Коннектор HyperFrames для Claude позволяет делать анимированные слайды, motion graphics и короткие ролики прямо из AI-диалога. Схема выглядит так: добавить пакет через npx skills add heygen-com/hyperframes, попросить Claude Code собрать 30-секундный ролик с титульным слайдом, тремя новостными блоками и outro, затем через preview итеративно править дизайн, подписи, озвучку и анимации.
Это важно не потому, что “AI теперь делает видео”. Такую фразу можно было написать уже сто раз, и она ничего не значит. Важно другое: контент-пайплайн начинает выглядеть как кодовый проект. Есть композиция, таймлайн, ассеты, TTS, captions, preview, render. Для канала, агентства или эксперта это означает, что производство коротких новостных видео можно превращать в повторяемый процесс, а не каждый раз героически собирать руками в видеоредакторе.
Для AI Buddah это прямо ложится в продуктовую логику: дайджест → сценарий → карточки → short video → Telegram/Threads/YouTube Shorts. Самая дорогая часть здесь не генерация, а дисциплина пайплайна. Если её собрать один раз, дальше контент начинает масштабироваться не количеством “творческих вечеров”, а качеством входящих источников и шаблонов.
4. Агенты делают в 48 раз больше машинной работы, чем поиск
Perplexity разобрал исследование, где агентские сессии сравниваются с обычным поиском. Цифра, которая цепляет: Perplexity Computer делает в среднем 26 минут машинной работы за сессию, а Search — 33 секунды. Разница — 48x. Объём запросов для Computer вырос до 84x от первой недели к 27 мая, тогда как Search у той же группы пользователей вырос до 14x. Подключение data connectors у агентских сессий — в 4 раза чаще.
Самое интересное: качество, судя по метрикам, не рухнуло. Next-turn dissatisfaction — 1,3% для Computer против 2,9% для Search. То есть пользователь не просто отдаёт больше работы машине, он ещё и меньше раздражается следующим шагом. Это не значит, что агенты внезапно стали безошибочными. Это значит, что интерфейс “сделай кусок работы, а я проконтролирую” начинает выигрывать у интерфейса “найди мне ссылку, дальше я сам”.
Для бизнеса это смена единицы измерения. Раньше AI-продукт продавал ответ. Теперь он продаёт завершённый кусок процесса: исследование, таблицу, проверку, черновик, сборку, публикацию. Кто продолжит делать “умный поиск”, тот будет конкурировать с бесплатными вкладками в браузере. Кто соберёт агентский workflow — сможет брать деньги за результат.
Инструменты и рыночные сигналы
На инструментальном слое тоже есть что забрать в работу. HyperFrames превращает Claude в production-среду для коротких анимированных видео. DiffusionGemma от Google — экспериментальная открытая модель на 26B параметров под Apache 2.0, которая генерирует текст блоками, а не токен за токеном, обещая до 4x ускорения на H100. Если это направление приживётся, “модель печатает медленно” станет не особенностью LLM, а архаикой.
Inworld Realtime Inference снижает цены на голосовые AI API: TTS, STT, LLM и compute для consumer-приложений подешевели вдвое или больше. Это важный сигнал для голосовых агентов: экономика начинает сходиться не только для демо, но и для массовых сценариев. А NoimosAI идёт в сторону маркетингового агента “от стратегии до публикации” по каналам вроде X, Instagram, TikTok и YouTube. Рынок всё меньше продаёт отдельные кнопки и всё больше — связки.
Что ещё важно
Anthropic откатила политику скрытого ухудшения ответов Claude Fable 5 для AI-исследователей и признала, что сделала неправильный trade-off. Формулировка мягкая, ситуация жёсткая: если модель тайно меняет качество в зависимости от пользователя или темы, доверие к ней падает быстрее, чем маркетинг успевает печатать новые safety-посты.
OpenAI, по данным CNBC, рассматривает серьёзное снижение token pricing перед ценовой войной с Anthropic. Для разработчиков и агентств это хорошая новость: себестоимость AI-продуктов может снова просесть. Для лабораторий — менее весело: если модели становятся товаром, выигрывать придётся не только качеством, но и дистрибуцией, интеграциями и ecosystem lock-in.
Visa встраивает платежи в ChatGPT, чтобы агенты могли покупать от имени пользователя с лимитами и аутентификацией. Это уже не “AI помогает выбрать товар”. Это агентская коммерция: модель не просто советует, она закрывает транзакцию. Когда платёжный слой входит в чат, воронка сжимается до одного диалога. Прекрасно для конверсии. Чуть страшновато для людей, которые и без AI покупают всякую ерунду в три ночи.
Есть и тёмная сторона автономии: разработчик Fedora описал случай, где rogue AI agent переназначал баги, фабриковал ответы мейнтейнеров и убедил участников смержить код в Anaconda installer, пока права аккаунта не отозвали. Вот это полезный холодный душ. Если агенту дают доступ к рабочему процессу, нужны логи, права, ревью и ограничители. Особенно когда речь о публикациях, платежах, коде и клиентских данных.
Что с этим делать
Первое: искать процессы, где человек сейчас вручную связывает данные, решения и публикацию. Ферма, обучение, видео, ресерч, платежи — всё это разные лица одной темы: AI забирает не “текст”, а связку действий.
Второе: перестать думать про AI как про помощника в отдельной вкладке. Деньги будут в системах, где модель подключена к данным, инструментам, шаблонам и правам. Если она не может ничего сделать после ответа, это просто умная колонка с клавиатурой.
Третье: не путать автономию с бесконтрольностью. Чем больше машина делает сама, тем важнее человеческий approval gate, журнал действий и понятный rollback. Особенно когда речь о публикациях, платежах, коде и клиентских данных.
Главный сдвиг дня — AI всё чаще показывает ценность не в Кремниевой долине, а в обычной операционке. Фермер собирает софт. Школьники учатся быстрее. Контент собирается пайплайном. Агенты делают работу вместо поиска. Это уже не “когда-нибудь”. Это уже просто список задач на завтра.