Одиннадцать часов. Я смотрел на код, который GPT-5 сгенерировал для клиента из Германии, и понимал: это красиво, но это не работает. Архитектура микросервисов с дырами в аутентификации и race conditions в трёх местах.
$340 на токены и полный рабочий день выброшены.
Март 2026. Клиент Markus из Мюнхена хотел архитектуру для распределённой системы обработки платежей. Задача сложная, я взял её с запасом времени. Открыл GPT-5 - как всегда, по привычке.
Первые промпты шли нормально. GPT давал красивые диаграммы, объяснял паттерны, генерировал код с уверенным тоном. Я итерировал, уточнял, прогонял через несколько сессий.
К часу ночи у меня было 400 строк кода и ощущение, что всё готово.
Утром я запустил статический анализ. JWT-токены без expiration. Отсутствие идемпотентности в payment endpoints. SQL-инъекция в одном из сервисов, которую GPT прикрыл комментарием "в продакшене добавьте валидацию". Это не черновик с недочётами. Это была ловушка, упакованная в профессиональный вид.
Я потерял этого клиента. Не потому что он узнал про уязвимости - я поймал их сам. Но я не уложился в дедлайн, переделывал всё с нуля, и Markus просто нашёл кого-то другого.
Вот что меня злит до сих пор: я выбрал инструмент не потому что он подходил для задачи. Я выбрал его потому что привык. Потому что "GPT - это серьёзно". Потому что дорого значит хорошо.
Это ошибка, которую я вижу у большинства разработчиков вокруг. Человек платит за GPT-5 Pro, использует его на всё подряд - от написания письма клиенту до генерации SQL-схем. Инструмент один, задачи разные, результат непредсказуемый.
Я собрал промпты по этой теме в PDF. Забери бесплатно: https://t.me/airozov_bot
Через три дня после провала с Markus я открыл DeepSeek R2 - просто из злости и любопытства. Дал ему ту же задачу.
40 минут. $4 на API.
Код был другим. Не красивее - строже. DeepSeek сразу заложил идемпотентные ключи в payment-сервис, прописал expiration для токенов, добавил distributed lock для критических секций. Без моих подсказок. Он думал как инженер, а не как генератор контента.
Я понял тогда простую вещь: разные нейросети оптимизированы под разные типы мышления.
Вот как я теперь выбираю инструмент под задачу.
Системная архитектура, сложный код, баги - DeepSeek R2 или Claude 3.7 Sonnet. DeepSeek дешевле и злее в технических задачах. Claude лучше держит контекст на длинных кодовых базах и реже галлюцинирует в edge cases. Я использую DeepSeek когда задача чёткая и изолированная. Claude - когда нужно работать с большим куском чужого кода и не потерять нить.
Общение с клиентами, письма, переговоры - GPT-4o. Да, я критикую GPT за код, но в написании убедительных писем на английском ему нет равных среди того, с чем я работал. За 15 минут он помогает мне сформулировать ответ на сложную претензию клиента так, что тот остаётся доволен.
Исследование и анализ - Perplexity Pro с включёнными источниками. Когда мне нужно быстро понять новый домен или проверить технологию перед тем как предлагать её клиенту - только Perplexity. Он даёт ссылки, я могу проверить. Остальные часто уверенно врут про актуальные данные.
Три инструмента. Три чётких сценария. Никакой универсальности.
Самое неожиданное было не в качестве ответов. Это было в том, как нейросети ошибаются.
GPT-5 ошибается уверенно и красиво. DeepSeek ошибается видимо - он часто пишет "не уверен в этом подходе" или предлагает два варианта с объяснением компромиссов. Claude, когда не знает, говорит что не знает.
Это критично для продакшен-кода. Уверенная ошибка стоит мне часов отладки. Видимая неуверенность стоит мне одного уточняющего вопроса.
Я потерял $340 и клиента не потому что GPT-5 плохой. Я потерял их потому что не умел читать сигналы, которые он давал. Тот красивый код с комментарием "добавьте валидацию в продакшене" - это был сигнал. Я его проигнорировал.
Теперь у меня есть правило: если нейросеть оставляет TODO-комментарии в сгенерированном коде - это не черновик, это она говорит "я не знаю как это сделать правильно". Стоп. Переформулируй задачу или смени инструмент.
Второй инсайт, который меня удивил: стоимость токенов почти никогда не коррелирует с качеством для конкретной задачи. DeepSeek R2 через API в 20-30 раз дешевле GPT-5 на сложных технических задачах. И на большинстве из них он лучше. Это не значит что GPT плохой. Это значит что рынок AI-инструментов сейчас работает странно - люди платят за бренд и за маркетинг, а не за результат в своём конкретном кейсе.
Я видел разработчиков, которые тратят $200 в месяц на подписки и при этом работают медленнее, чем могли бы на $30 при правильном выборе инструментов.
Каждый день разбираю один такой инструмент в Telegram: https://t.me/yevheniirozov
Зайди на claude.ai и напиши вот этот промпт - подставь свою реальную задачу:
*"У меня есть задача: [опиши задачу в одном предложении]. Прежде чем решать - скажи, насколько ты уверен что справишься с этим хорошо, и есть ли типы задач в этом запросе, где ты склонен ошибаться?"*
Это не магия. Это способ получить честную калибровку от инструмента перед тем как тратить на него время.
Если Claude говорит "я не уверен в X" - ты знаешь где проверять особенно внимательно. Если он говорит "справлюсь без проблем" и при этом задача архитектурная и сложная - это тоже сигнал, просто другого рода.
Одиннадцать часов и $340 научили меня одному: нейросеть выбирают не по рейтингу и не по цене. Её выбирают по тому, как она ошибается - и насколько честно она об этом говорит.
• [Вы до сих пор тратите полдня на то, что AI делает за минуту?](https://telegra.ph/Vy-do-sih-por-tratite-poldnya-na-to-chto-AI-delaet-za-minutu-05-23)
• [Как я убрал 3 часа рутины одним запросом к AI](https://telegra.ph/Kak-ya-ubral-3-chasa-rutiny-odnim-zaprosom-k-AI-05-23)
• [Ты всё ещё тратишь день на то, что решает один промпт?](https://telegra.ph/Ty-vsyo-eshchyo-tratish-den-na-to-chto-reshaet-odin-prompt-05-23)
[teletype] 90% людей выбирают нейросети наугад. И теряют время.
Вы точно знаете, какая нейросеть сэкономит вам время в 2026?