AI уже доказывает математику, собирает миллиарды и одновременно производит тонны слабого кода.
Сегодняшний сигнал двойной. С одной стороны, модели заходят в области, где раньше требовались годы человеческой работы: формальные доказательства, научные гипотезы, автоматизация интерфейсов. С другой — рынок всё ещё путает скорость генерации с качеством результата.
Главный вопрос уже не “может ли AI сделать”, а “можно ли этому доверять”.
AlphaProof Nexus показывает сильную сторону AI: модель не просто “рассуждает красиво”, а проходит через формальную проверку Lean. Это другой уровень доверия. Но рядом стоит обратная сторона: AI-агенты могут быстро набросать код, который выглядит как прогресс, но на деле превращается в технический долг.
Для бизнеса вывод прямой: внедрять AI нужно не по принципу “пусть делает всё”, а через контрольные точки, тесты, формальные правила, ревью и понятную ответственность. Иначе автоматизация становится ускорителем хаоса.
Главные события дня
Я смотрю на эти новости как предприниматель: где появляется новый рычаг, где риск, а где рынок просто продаёт красивую скорость вместо результата.
Google DeepMind AlphaProof Nexus: математика становится проверяемым AI-пайплайном
Google DeepMind описал в arXiv paper по AlphaProof Nexus систему, которая решила 9 открытых задач Эрдёша и 44 гипотезы из OEIS. Важная деталь: это не просто текстовое “мне кажется, доказательство такое”. Система переводит рассуждения в Lean, а затем формальный верификатор проверяет доказательство.
Цифры звучат сухо, но смысл сильный: 9 из 353 открытых задач Эрдёша и 44 из 492 OEIS-гипотез. Некоторые висели десятилетиями. Стоимость одного доказательства — сотни долларов вычислений, а не годы академической работы. Для науки это ускорение. Для бизнеса — намёк на то, куда пойдёт проверка сложных систем: код, криптография, финансы, безопасность, юридические правила.
Мой вывод: самая дорогая часть AI-рынка будет не “модель ответила”, а “результат можно проверить”. Всё, что требует доверия, будет двигаться к формальным тестам, симуляциям и независимым проверяющим слоям.
OpenAI готовит IPO: рост огромный, но экономика всё ещё жёсткая
По данным The Wall Street Journal, OpenAI готовится к конфиденциальной подаче документов на IPO. В работе — Goldman Sachs и Morgan Stanley, а публичное размещение может быть нацелено на осень.
Главная интрига не в самом IPO. Интрига в экономике. Компания показывает гигантскую выручку, сотни миллионов пользователей и сильный enterprise-спрос, но при этом расходы на вычисления и рост всё ещё давят маржу. Это и есть реальность frontier AI: можно быть самым важным продуктом десятилетия и одновременно сжигать невероятные деньги на инфраструктуру.
Для предпринимателя это урок: не копируй OpenAI-модель расходов. Твоя задача — не “делать как лаборатория”, а строить маленькие AI-системы с понятной экономикой: где модель приносит лиды, экономит часы, закрывает операции или создаёт продаваемый продукт.
Geohot против AI-агентов: скорость без качества — это не разработка
George Hotz опубликовал жёсткий текст The Eternal Sloptember, где прямо говорит: массовое внедрение AI-агентов в код может стать дорогой ошибкой, если компании принимают видимость прогресса за качество.
Его мысль болезненная, но правильная: агент может быстро накидать изменения, создать ощущение движения, заставить человека тянуть за “ручку автомата” снова и снова. Но если feedback loop длинный, тестов мало, ревью слабое, а архитектура непонятна, на выходе получается не продукт, а слой мусора поверх старого кода.
Поэтому нормальный вайбкодинг — это не “пиши промпт и верь”. Это архитектура, маленькие задачи, тесты, Git, деплой, откат, контекст-файлы и человек, который понимает, что именно хочет получить. AI ускоряет сильного оператора и размазывает слабого.
Практика: настрой AI как жёсткого спарринг-партнёра, а не ласкового ассистента
Самый простой апгрейд, который можно сделать сегодня: переписать Custom Instructions. Не проси модель “быть полезной”. Проси её резать лишнее, спорить, показывать слабые места и начинать с главной проблемы.
Не используй пустые комплименты.
Не соглашайся со мной автоматически.
Если я ошибаюсь, скажи прямо.
Начинай с того, что слабое в моей идее.
Давай не общий совет, а следующий практический шаг.
Если есть риск потери денег, времени или фокуса — выдели его первым.
Это особенно важно для предпринимателя. Тебе не нужен бот, который гладит по голове. Тебе нужен второй мозг, который помогает не слить бюджет, не размазать продукт и не принять красивый текст за рабочую стратегию.
Что забрать в бизнес
AI-ответ без теста, метрики или ревью — это не результат, а предположение.
Даже OpenAI живёт под давлением compute cost. Малому бизнесу тем более нельзя строить процессы без расчёта.
Роли, доступы, ветки, Git, логи и зоны ответственности решают больше, чем “умная модель”.
Что сделать сейчас
1. Проверь, где в твоём бизнесе нужен формальный контроль
Финансы, юридические тексты, код, базы клиентов, публикации и рассылки не должны уходить в прод без проверки. Добавь чеклист и владельца результата.
2. Разбей агентные задачи на маленькие контуры
Один агент ищет источники, второй пишет, третий проверяет ссылки, четвёртый деплоит. Не заставляй одну модель делать всё в одном длинном промпте.
3. Введи правило: каждый AI-результат должен оставлять след
Commit, лог, ссылка, diff, тест или отчёт. Если агент не может показать, что сделал, значит процесс ещё не готов к автоматизации.
Ещё сигналы из повестки
Hark привлёк $700M Series A под идею universal AI interface. Деньги идут туда, где AI становится входной точкой в рабочие процессы.
Anthropic запустила Project Glasswing — инициативу по AI-образованию и устойчивости рынка труда. Это прямой сигнал: компании понимают масштаб перестройки профессий.
Starbucks отказался от AI inventory tool в Северной Америке. Это хороший антипример: AI без нормального внедрения может не ускорить, а раздражать операционку.
Исследователи описали AudioHijack-атаки на голосовых ботов. Голосовые агенты требуют такой же security-модели, как веб-приложения.
Хочешь получать такие разборы без воды?
В бесплатном Telegram-канале AI Buddah я разбираю нейросети, AI-инструменты, автоматизацию, вайбкодинг и практические сценарии для бизнеса.
Перейти в бесплатный каналБольше промптов, уроков и внутренних материалов
В AI Base я выкладываю материалы глубже: промпты, которые не публикую открыто, видеоуроки, разборы AI-архитектур, практику внедрения и задачи, которые можно брать в работу.
Вступить в AI Base