AI Digest 25 Мая 2026 12 мин

Google решает задачи Эрдёша, OpenAI идёт к IPO, а Geohot бьёт по AI-агентам

AlphaProof Nexus формально доказал десятки математических гипотез, OpenAI готовит публичное размещение на фоне огромной выручки и расходов, а Geohot жёстко напоминает: агентный код без качества превращается в поток мусора.

AI Buddah / Daily Intelligence

AI уже доказывает математику, собирает миллиарды и одновременно производит тонны слабого кода.

Сегодняшний сигнал двойной. С одной стороны, модели заходят в области, где раньше требовались годы человеческой работы: формальные доказательства, научные гипотезы, автоматизация интерфейсов. С другой — рынок всё ещё путает скорость генерации с качеством результата.

позиция

Главный вопрос уже не “может ли AI сделать”, а “можно ли этому доверять”.

AlphaProof Nexus показывает сильную сторону AI: модель не просто “рассуждает красиво”, а проходит через формальную проверку Lean. Это другой уровень доверия. Но рядом стоит обратная сторона: AI-агенты могут быстро набросать код, который выглядит как прогресс, но на деле превращается в технический долг.

Для бизнеса вывод прямой: внедрять AI нужно не по принципу “пусть делает всё”, а через контрольные точки, тесты, формальные правила, ревью и понятную ответственность. Иначе автоматизация становится ускорителем хаоса.

main feed

Главные события дня

Я смотрю на эти новости как предприниматель: где появляется новый рычаг, где риск, а где рынок просто продаёт красивую скорость вместо результата.

Google DeepMind AlphaProof Nexus: математика становится проверяемым AI-пайплайном

Google DeepMind описал в arXiv paper по AlphaProof Nexus систему, которая решила 9 открытых задач Эрдёша и 44 гипотезы из OEIS. Важная деталь: это не просто текстовое “мне кажется, доказательство такое”. Система переводит рассуждения в Lean, а затем формальный верификатор проверяет доказательство.

Цифры звучат сухо, но смысл сильный: 9 из 353 открытых задач Эрдёша и 44 из 492 OEIS-гипотез. Некоторые висели десятилетиями. Стоимость одного доказательства — сотни долларов вычислений, а не годы академической работы. Для науки это ускорение. Для бизнеса — намёк на то, куда пойдёт проверка сложных систем: код, криптография, финансы, безопасность, юридические правила.

Мой вывод: самая дорогая часть AI-рынка будет не “модель ответила”, а “результат можно проверить”. Всё, что требует доверия, будет двигаться к формальным тестам, симуляциям и независимым проверяющим слоям.

OpenAI готовит IPO: рост огромный, но экономика всё ещё жёсткая

По данным The Wall Street Journal, OpenAI готовится к конфиденциальной подаче документов на IPO. В работе — Goldman Sachs и Morgan Stanley, а публичное размещение может быть нацелено на осень.

Главная интрига не в самом IPO. Интрига в экономике. Компания показывает гигантскую выручку, сотни миллионов пользователей и сильный enterprise-спрос, но при этом расходы на вычисления и рост всё ещё давят маржу. Это и есть реальность frontier AI: можно быть самым важным продуктом десятилетия и одновременно сжигать невероятные деньги на инфраструктуру.

Для предпринимателя это урок: не копируй OpenAI-модель расходов. Твоя задача — не “делать как лаборатория”, а строить маленькие AI-системы с понятной экономикой: где модель приносит лиды, экономит часы, закрывает операции или создаёт продаваемый продукт.

Geohot против AI-агентов: скорость без качества — это не разработка

George Hotz опубликовал жёсткий текст The Eternal Sloptember, где прямо говорит: массовое внедрение AI-агентов в код может стать дорогой ошибкой, если компании принимают видимость прогресса за качество.

Его мысль болезненная, но правильная: агент может быстро накидать изменения, создать ощущение движения, заставить человека тянуть за “ручку автомата” снова и снова. Но если feedback loop длинный, тестов мало, ревью слабое, а архитектура непонятна, на выходе получается не продукт, а слой мусора поверх старого кода.

Поэтому нормальный вайбкодинг — это не “пиши промпт и верь”. Это архитектура, маленькие задачи, тесты, Git, деплой, откат, контекст-файлы и человек, который понимает, что именно хочет получить. AI ускоряет сильного оператора и размазывает слабого.

Практика: настрой AI как жёсткого спарринг-партнёра, а не ласкового ассистента

Самый простой апгрейд, который можно сделать сегодня: переписать Custom Instructions. Не проси модель “быть полезной”. Проси её резать лишнее, спорить, показывать слабые места и начинать с главной проблемы.

Не используй пустые комплименты.
Не соглашайся со мной автоматически.
Если я ошибаюсь, скажи прямо.
Начинай с того, что слабое в моей идее.
Давай не общий совет, а следующий практический шаг.
Если есть риск потери денег, времени или фокуса — выдели его первым.

Это особенно важно для предпринимателя. Тебе не нужен бот, который гладит по голове. Тебе нужен второй мозг, который помогает не слить бюджет, не размазать продукт и не принять красивый текст за рабочую стратегию.

business layer

Что забрать в бизнес

Проверка важнее генерации

AI-ответ без теста, метрики или ревью — это не результат, а предположение.

Экономика должна сходиться

Даже OpenAI живёт под давлением compute cost. Малому бизнесу тем более нельзя строить процессы без расчёта.

Агенту нужны границы

Роли, доступы, ветки, Git, логи и зоны ответственности решают больше, чем “умная модель”.

action plan

Что сделать сейчас

1. Проверь, где в твоём бизнесе нужен формальный контроль

Финансы, юридические тексты, код, базы клиентов, публикации и рассылки не должны уходить в прод без проверки. Добавь чеклист и владельца результата.

2. Разбей агентные задачи на маленькие контуры

Один агент ищет источники, второй пишет, третий проверяет ссылки, четвёртый деплоит. Не заставляй одну модель делать всё в одном длинном промпте.

3. Введи правило: каждый AI-результат должен оставлять след

Commit, лог, ссылка, diff, тест или отчёт. Если агент не может показать, что сделал, значит процесс ещё не готов к автоматизации.

signals

Ещё сигналы из повестки

Hark привлёк $700M Series A под идею universal AI interface. Деньги идут туда, где AI становится входной точкой в рабочие процессы.

Anthropic запустила Project Glasswing — инициативу по AI-образованию и устойчивости рынка труда. Это прямой сигнал: компании понимают масштаб перестройки профессий.

Starbucks отказался от AI inventory tool в Северной Америке. Это хороший антипример: AI без нормального внедрения может не ускорить, а раздражать операционку.

Исследователи описали AudioHijack-атаки на голосовых ботов. Голосовые агенты требуют такой же security-модели, как веб-приложения.

free channel

Хочешь получать такие разборы без воды?

В бесплатном Telegram-канале AI Buddah я разбираю нейросети, AI-инструменты, автоматизацию, вайбкодинг и практические сценарии для бизнеса.

Перейти в бесплатный канал

AI Base

Больше промптов, уроков и внутренних материалов

В AI Base я выкладываю материалы глубже: промпты, которые не публикую открыто, видеоуроки, разборы AI-архитектур, практику внедрения и задачи, которые можно брать в работу.

Вступить в AI Base

источники

Источники

AlphaProof Nexus paper WSJ про OpenAI IPO Geohot: The Eternal Sloptember Anthropic Project Glasswing TechCrunch про Hark Reuters про Starbucks AI tool

О подготовке материала

Автор и редактор: Александр Хамаев. Материал проверен редакцией OM AI Digital Studio. AI-инструменты могут использоваться для исследования и черновой подготовки, но выводы и фактические утверждения проверяются автором перед публикацией.

Редакционная политика