ИИ-кейсы

Какая ИИ модель лучше всего сейчас?

Гардероб моделей: как одеть компанию в ИИ — дёшево, быстро и без VPN

Реальные истории, как я скупал модели — и как вам не повторить мои ошибки.

Артикул: ЦЫГАН 05/2026 · Размер: 4XL · Стирка: только бережная (иначе превратится в месиво) · Состав: 100% реальный опыт + 90% самоиронии = 190% · Производитель снимает ответственность за повторение моих ошибок — учитесь на чужих, а не на своих :)

Нет лучшей модели. Есть уместная — ровно как с одеждой.
Андрей Цыган в костюме из синих перьев на сцене бизнес-конференции
На сцене — Киркоров. В кадре — я. Зашло одинаково.

Меня зовут Андрей Цыган, и у меня огромный гардероб моделей. Иногда даже стыдно открывать шкаф — куда я столько накупил, скажу честно.

В этой статье я поделюсь реальными историями: как я скупал модели, что из них в итоге носил, что казалось крутым — а оказалось пустой полкой, и главное — как вам не повторить эти ошибки при выборе модели для своего бизнеса.

А ещё расскажу, почему вопрос «а какая сейчас лучшая?» — на самом деле не имеет ответа. Я слышу его, по-честному, раз 50 в месяц. И единственная аналогия, через которую я могу на него ответить так, чтобы у вас в голове сложилась картинка, — это аналогия с гардеробом. О ней и поговорим.

А если хочешь не читать, а сразу собрать?
4 июня я провожу практический воркшоп по AI-агентам — для собственников и менеджеров, без кода и технических навыков. Один день — и у вас на руках рабочие агенты под ваши живые задачи.
Записаться на atsyhan.by/agents →

00 — Можно ли мужику в синих перьях?

Сначала про другое. Сцена в голове.

Взрослый адекватный мужчина в костюме из синих перьев. Нормально или нет?

Тут сразу с двух сторон. Если этот мужчина — Киркоров, и стоит он на сцене — это не просто нормально, это круто. Ровно то, что нужно его задаче и его аудитории. Эпатаж работает.

А если в таком же костюме я приду на бизнес-конференцию в Минске рассказывать про процессы — ну, смогу, конечно, но выглядеть будет странновато. Та же одежда, тот же я — но не та задача и не то место.

Вот про это вся статья. С моделями — один в один. Не бывает «хорошей» и «плохой» модели. Бывает уместная под задачу или нет.

Открываем шкаф. И снова нечего надеть

Андрей Цыган перед переполненным шкафом утром
7 утра. Шкаф полный. Опять нечего надеть.

Вспомните общагу в студенчестве. Три футболки, две пары штанов, одни кроссовки. Была ли у вас проблема «нечего надеть»? Никогда. Что чистое — то и надел.

А сейчас? Гардероб полный. Вещей навалом. И каждое утро стоишь и не знаешь, что выбрать. Когда выбора нет — проблем нет. Когда выбора много — паралич.

С моделями ровно то же. Два года назад — «ChatGPT и всё». Сегодня — Anthropic с тремя линейками, OpenAI с десятью версиями, Google со своим зоопарком, китайцы выкатывают новое каждую неделю, плюс open-source, плюс реплики в маркетплейсах. Полный гардероб. И — нечего надеть.

Спойлер Если совсем коротко: у вас на старте всегда есть два пути. Либо неделю выбирать идеальную модель, либо неделю работать с первой попавшейся. Выбирайте работать. На старте опыт важнее выбора — потом сами поймёте, что вам реально надо.

Продавец Bentley в шортах и кроксах

Андрей Цыган в бордруме в кроксах, шортах и майке PUNKS
Совет директоров отменяется. Зато удобно.

Прежде чем перебирать модели — поймите, какие у вашего гардероба границы. И кто помогает вам в них одеваться.

Границы вашего гардероба

В жизни всё просто. Какие бы у вас ни были крутые шорты Loro Piana — в государственный банк в них не зайдёшь. Дресс-код такой, что хочешь не хочешь — костюм. И точка.

С моделями — то же. У вашего бизнеса могут быть ограничения, которые отменяют половину разговора: строгая безопасность данных (тогда играем только локально), корпоративный список разрешённого, юридика по региону, банк не пропускает платёж за подписку. Это не приговор, это просто рамки.

Спойлер С одной стороны — легче, вам список уже сократили. С другой — нет свободы. А так бы хотелось прийти на совет директоров в кроксах со «Звёздными войнами» и в майке Punks — но это уже совсем другая история. Не наша.

Стилист — то есть бизнес-архитектор

В одежде нормальный взрослый человек либо сам разбирается в стиле, либо привлекает стилиста. Стилист смотрит на вас, на ваш ритм, на события, в которых вы будете, — и собирает капсулу. Без него каждое утро — стояние перед шкафом по полчаса.

В моделях такая же роль появилась. Я её называю бизнес-архитектор. Это не айтишник. Это переводчик между языком ваших бизнес-задач и языком моделей. Либо вы сами эту насмотренность нарабатываете — и тогда статья как раз для вас, держите под рукой. Либо привлекаете архитектора. Жить без стилиста можно — но мучительно, скажу честно.

Есть ли скидки для владельцев Louis Vuitton в метро

Андрей Цыган в логотипном наряде во дворе хрущёвки
В Гуччи — один раз, на маскараде. Больше не повторится.

Окей, дресс-код понятен. Теперь смотрим, что вообще лежит на прилавке.

Сразу маленькое отступление, потому что для нашего, белорусского бизнесмена тема брендов больная. Если вы видите товарища, у которого большой логотип Гуччи на майке, на шортах, на трусах, на сумке и на кепке — это уже не человек, это ходячий логотип. Смешно и неуместно. Но! Если вы выбираете бренд осознанно, понимая, в чём именно вам качество — вас можно только похвалить. Разница между «купил Loro Piana, потому что мне в нём реально удобно» и «купил Loro Piana, чтобы все увидели» — фундаментальная.

С моделями та же история. Бренд — это нормально. Бренд напоказ — это уже клиника.

Карта рынка — короткая

СегментКто это в мире моделейНа что похоже в одежде
ПремиумAnthropic, OpenAI, Google. Самые сильные. Стабильные, качественные, дорогие за вызов.Brioni, Tom Ford, Loro Piana — топ.
Масс-маркетDeepSeek, Kimi, Qwen, Mistral. Не плохие — просто другие. Часто дешевле в десятки раз. Под многие задачи хватает с головой.Zara, Massimo Dutti — носимо, удобно, недорого, без статуса.
Локальные / open-sourceLlama, Qwen, Mistral в open-source. Ставите на свой сервер, ноутбук или даже на телефон.Шьём сами или собираем руками. Никто не диктует — но и потрудиться придётся.
РепликиПриложения в AppStore Беларуси, которые называются «GPT-5», «ChatGPT Plus» — но внутри что угодно, кроме оригинала.Шов «адидсс» с Ждановичей. Внешне похоже, по факту — не оно.

Линейки внутри бренда

Это важно. У каждого крупного бренда не одна модель, а целое семейство — под разные карманы и случаи. У Anthropic — Opus, Sonnet, Haiku. У OpenAI — линейка GPT с разными уровнями. У Google — Gemini Pro, Flash. В моде это работает один в один: у Inditex есть Zara (масс-маркет), Massimo Dutti (для офиса, дороже), Pull&Bear (молодёжное). Производитель один, линейки разные.

Размер имеет значение?!

Андрей Цыган в костюме Brioni на 3 размера больше перед зеркалом ателье
Brioni — да. Размер — нет. Дорого, но мимо.

Бренды разобрали. Теперь — главное правило, ради которого половина статьи.

В одежде самое первое правило — даже если костюм Brioni, но на два размера больше, вы выглядите как бомж. Хоть и в Brioni. Размер важнее бренда. Уместность важнее цены.

С моделями — точно так же. Самая дорогая модель на маленькой задаче работает хуже, чем дешёвая под эту же задачу.

👔 В одежде Костюм на три размера больше — пусть даже Brioni, выглядишь как бомж. Чем дороже вещь не по фигуре, тем нелепее.
🤖 В моделях Большая модель на маленькую задачу будет дольше думать, перебирать варианты, накручивать то, что и не нужно — и в итоге сделает хуже, чем простая модель «по размеру».
🎩 Лично моё

Сижу, мне нужно простое — конвертнуть HTML-табличку в JPG. У меня по привычке открыт Opus 4.7 с максимальным размышлением, я в нём почти всё делаю. Запустил. Прошло 10 минут — Opus думает, пробует. Прошло 15 — всё ещё крутится. Я в соседнем окне открыл копеечный Gemini 2.5 Flash с той же задачей. Он мне её сделал за 2 минуты. Без размышлений. Просто взял и сделал. Размер пиджака был не тот.

Бытовуха и сложная задача — два разных гардероба

Дома собаку выгулять — кроссовки, спортивки. Удобно, никто не смотрит. На black tie — туфли, бабочка. Так же с моделями: придумать дочери шутку, расшифровать голосовое, набросать тост — не нужен премиум с VPN и подпиской за $200. Локальная модель на ноутбуке или бесплатный чатик. Закинул, получил, забыл. Анализ договора на 60 страниц или агентная система — тут хочешь не хочешь, премиум с регистрацией, оплатой через знакомых, иногда с VPN-танцами.

Travel-капсула — модели, которые всегда в кармане

В одежде есть travel-капсула — маленький набор «на любой случай». В моделях это локальные модели прямо на ноутбуке или телефоне. Работают без интернета и без подписки.

🎩 Лично моё

Полгода назад Google выпустил приложение Edge Gallery на iPhone — туда ставятся локальные модели Gemma. Я был за рубежом — без интернета, без симки, без WiFi. В Таиланде. И мне срочно надо сделать расчёт по счётчикам с нюансами, перед самолётом. Вариантов не было — пошёл в Gemma.

С первого запроса не получилось. Пришлось писать очень точно — много вводных, аккуратно. Но она рассчитала. Я посмотрел, оценил средние — всё сошлось. Потом, когда вернулся к интернету, перепроверил тот же расчёт в Opus — он с первого захода меня примерно понял и пришёл к тому же результату.

Вывод: локальная модель кушать не просит. Всегда с тобой в телефоне. Работает с фото. Но запрос надо писать намного точнее, чем привычной большой модели. Зато спасает, когда вокруг ноль связи.

Дорого — не всегда хорошо. По фигуре — всегда лучше, чем по ценнику.
Воркшоп 4 июня — AI-агенты без кода
Перестать гадать с моделями и начать собирать. Один день, ваши живые задачи, готовые агенты в конце. Для собственников и менеджеров — не для программистов. Без VPN-танцев и без «давайте я вам объясню как нужно жить».
Подробности и запись →

А можно такой же, но с перламутровыми пуговицами?

Андрей Цыган в кардигане с огромными перламутровыми пуговицами, портной за спиной
А можно такой же, но с перламутровыми? Можно. Только швея уже плачет.

Теперь другой выбор. Не «какая модель», а «насколько вы её под себя подгоняете».

Вам всё нравится в готовой модели, но какие-то моменты не устраивают — можно ли прям под себя? Да, можно. Уровней — три.

Уровень 1 — Готовое из магазина
Берёте как есть, надеваете, носите

Самый быстрый и дешёвый путь. Для 80% случаев — идеально. Открыли Claude или GPT, написали задачу, получили результат. Большинство ваших задач — сюда. Не выдумывайте сложное сразу.

Уровень 2 — Подгонка по фигуре
Берёте готовое, чуть-чуть переделываете под себя

У портного укоротили рукав, поджали талию. С моделями это промптинг, скиллы, MCP-подключения, своя структура данных. Модель та же, но обвешана вашим контекстом. Оптимальный компромисс. Большинство серьёзных бизнес-задач — здесь.

Уровень 3 — Кастомный пошив
Шьём с нуля строго под вас

Идеальная посадка. И дорого. И долго. И главное — портной должен быть мастером, иначе угробит дорогую ткань. Это fine-tuning, RAG-системы, агентные цепочки. Без сильной команды — деньги, данные и время в трубу. Зато если «портной» свой и задача узкая, маленькая локальная модель после грамотного дообучения может обогнать топовую облачную — у меня так PaddleOCR на узкой задаче распознавания накладных вытащил +1% к Gemini.

🎩 Лично моё. Как я месяц спалил на fine-tuning

Не секрет, что статьи я не пишу руками — диктую мысли, потом модель с моим стилем оформляет. Мысли мои, оформление — её. Нормально.

Год назад я решил: сделаю-ка я fine-tuning у OpenAI, чтобы модель сразу писала в моём стиле. Собрал датасет, загнал, оказалось — там куча параметров. Месяц с этим возился. Спалил деньги, спалил время. Модель то переобучена, то недообучена, то данные не те. Иногда выдавала прям классные фразы — а потом снова мимо.

В итоге, когда появился стандарт Skills, я сделал один skill для своего стиля, взял обычный Opus и применил его. Уровень 2 — подгонка. Результат — лучше, чем у моего месячного fine-tuning. За день. И почти бесплатно. Сейчас этот skill вы как раз и читаете в виде статьи.

На чём НИКОГДА нельзя экономить

А теперь — про деньги. Бюджет может быть любой, и это нормально. Но есть пара вещей, на которых экономить нельзя никогда. Иначе задешевят весь образ.

Обувь — это оркестратор

На обуви виден класс образа. В дорогом пиджаке и в плохой обуви — никто не поверит в дорогой пиджак. В простой майке и отличной обуви — образ собран.

В моделях такую роль играет оркестратор — главная модель, которая планирует, рассуждает, раздаёт задачи другим моделям и проверяет результат. Главный менеджер вашей цепочки.

На ней не экономят. Никогда. В подзадачах — можно дешёвое. Оркестратор — премиум: GPT-5, Opus 4.7, что-то в этом классе. Один промах оркестратора стоит дороже десяти его правильных вызовов.

На оркестраторе не экономят. Это обувь вашего образа.

Аксессуары — это MCP и интеграции

Часы, ремень, очки — без них образ есть, но «чего-то не хватает». В моделях это MCP-серверы, вызов инструментов, интеграции с CRM, чтение почты, работа с вашими файлами. Не главное, но без них вау-эффекта не будет. И качественно пользоваться моделью не получится.

Запасная рубашка — это fallback

🎩 Лично моё. Три бана от Anthropic — и что мы из этого выстроили

У Anthropic строгая политика по банам, мы их иногда регулярно ловим. По последним трём банам уже знаем много опыта. Вот что у нас выстроено как «запасная рубашка».

Первое — разделили аккаунты. Есть рабочие для операционной работы. Есть — для повседневных экспериментов. И есть один аккаунт, который никогда никуда не лезет, кроме одного места: висит, всегда отглаженный, готовый к работе. Это и есть наша запасная рубашка — как только бан, мы на него переключаемся в течение часа.

Второе — структура переноса работы. Если бан застал в середине работы, у нас есть процедура: продолжить, например, в Codex, без потери контекста.

Третье — на худой конец: одна локальная модель на самом большом MacMini. На случай вообще обрубания всех облаков. Худо-бедно, но работать будем.

Это и есть нормальный fallback. На любом клиенте, который реально работает, такая система должна быть. Без неё однажды утром в понедельник всё встанет, и вы будете объяснять клиенту, что «у провайдера инцидент» — а он будет искать другого исполнителя.

Уход за одеждой — это мониторинг

Пиджак Brioni и пиджак из Черкизов, если бросить оба в стиралку на 90 градусов — превратятся в одинаковое месиво. Цена ткани не спасёт от плохого ухода.

🎩 Лично моё. Как бот молча терял данные

Запустили клиенту систему. Всё хорошо. Бот работает, отвечает, диалоги идут. Месяц прошёл — всё ровно. Потом стали разбираться с аналитикой — а данные диалогов никуда не сохраняются. Просто проскакивают и пропадают. Никто этого не проверил на старте. Модель отрабатывает идеально, отдаёт ответ — а лог в пустоту.

Сумма денег за месяц — впустую. Аналитики нет, оптимизировать нечего, понимания что работает что нет — ноль.

Поэтому железное правило: запустили систему — настройте мониторинг. Не «как-нибудь потом», а в день запуска. Раз в день кто-то должен видеть, что система реально работает как обещали, а не «висит на вешалке».

Купил — и не носишь

А теперь самое неудобное. Положите руку на сердце — все вещи в шкафу вы реально носите? Или половина висит, потому что «вдруг пригодится»?

👰 Жена Ой, у тебя что, опять новое платье?
🎩 Муж Да ты что, оно уже старое, ты просто забыла.
👰 Жена Ага, хорошо. Только бирочку, пожалуйста, отрежь, а то болтается.

Это нормально. Многие вещи покупаются эмоционально в моменте — увидел красивую витрину, нажал «купить». А потом приходит сознание: «а с чем это вообще носить?» Купили майку с принтом, где панда дерётся за шаурму с капибарой и подписью «Mortal Kombat, твари». В магазине показалось гениальным. Дома смотришь — а где её надевать, кроме как в туалет?

С AI-подписками точно так же. Увидели видеоролик — «всё классно, идеально». Нажал, купил. Потом задумался: «а зачем мне такая крутая генерация видео, я что, для Instagram ролики делаю?» И висит подписка как пиджак из Черкизов на вешалке.

🎩 Лично моё. Сколько я слил на «надо потестить»

Grok — $30. Появилась новая функция, два клика, нажал «попробовать», бесплатный период три дня. Я про это, конечно, забыл. $30 списались тихо и красиво.

Higgsfield — $50. Они выкатили классную интеграцию, мне срочно надо было её протестировать. Купил подписку, попробовал. А потом понял: ровно то же самое можно было сделать через прямой API Nano Banana от Google — в разы дешевле. Технически не пропали — но переплатил впустую только ради теста.

OpenAI — $1 000 депозита. Когда вышла o1, чтобы её гонять через API, нужен был самый высокий тир. А для тира — положить на счёт $1 000. Положили. Казалось, модель безумно крутая, окупится. По факту использовали $250. Остальные $750 висят мёртвым грузом — всё подешевело, новые модели вышли, и сидеть на старом дорогом депозите стало просто невыгодно.

Adobe Photoshop AI — $400 в год × 2 года. Подписался в моменте, когда они выкатили AI-фичу — надо было потестить. И два года потом плата шла фоном по карте. Я её просто не отменил. Заметил случайно. Использовал — два раза за два года. Дороговатый тест получился — $800.

Итого по этим четырём — около $1 630, утекших на «потестить». Это не «я дурак». Это нормальная цена за «надо посмотреть новое». Но после каждой такой покупки обязательно поставьте себе напоминание в календаре на 25-й день: «решить — оставляю или отменяю». Без напоминания — теряете деньги по умолчанию. Гарантировано.

💡 Сделайте прямо сейчас

Откройте выписку по карте и пройдитесь по AI-подпискам. По каждой — один вопрос: какую конкретную задачу моего бизнеса она закрывает каждый месяц? Не можете быстро ответить — отменяйте сегодня. Сэкономите больше, чем стоит вся эта статья — даже если бы я брал за неё деньги :)

Прежде чем тащить домой — примерочная

Финал. Самое главное про то, как мерить.

Все рейтинги моделей, которые вы видите в новостях, — это бенчмарки. «Модель X получила 94% на таком-то тесте». Цифры солидные, графики красивые.

Только это не про вас. Это фотосессия модели бренда: идеальная фигура, идеальный свет, идеальные ракурсы. Вы покупаете по фото — а на вас сидит по-другому, потому что вы не подиумная модель.

С AI ровно то же. Бенчмарки на стандартных задачах в идеальных условиях. У вас задачи другие — бизнес другой. Из топа рейтинга модель может оказаться так себе для вас, а из середины — выстрелить.

Бенчмарк — это фотосессия. Вам нужна примерочная.
🎩 Лично моё. Бот для сказок и слепое тестирование

Писали бота, который генерирует детям сказки. Все модели «вроде прикольные» — какую брать?

Сделали так: выписали 30 типовых задач (сказки разной длины, стилей, под разный возраст). Прогнали через 5 моделей — слепое тестирование, то есть нам показывали результаты без указания, какая модель что написала.

И выиграла не та, которую мы изначально предполагали. Совсем не та. Та, которую мы считали слабой, оказалась лучшей на наших сказках. И вышла дешевле в эксплуатации в несколько раз.

Поэтому слепое тестирование на ваших задачах — это золото. Всем можно сказать, что «модель X лучше всех пишет». А оно может быть не так. Особенно если ваш «писать» — это не общее «писать», а вполне конкретный жанр.

И ещё одно — на ту же тему. Когда я гонял 10 моделей на распознавании накладных, обнаружил неожиданное: Gemini 2.5 решила задачу лучше, чем Gemini 3.1. Новая 3.1 начинала переделывать, долго думать, вызов стоил дороже — а результат хуже. Запомните это: новая модель — не всегда лучше под вашу задачу. Только тест на ваших данных скажет правду, а не маркетинг релиза.

Что остаётся от стилиста

После хорошего стилиста у клиента остаётся не просто «вот это носи». Остаётся лукбук с подписями — что с чем сочетать, чтобы потом сам мог.

С AI работает так же. После работы с архитектором у вас должно остаться два артефакта: CLAUDE.md (системный файл «как мы работаем», который модель читает перед задачей) и скиллы — готовые рабочие комплекты под ваши типовые задачи. Скилл — это как карточка из лукбука: «вот так одеваемся для встречи с банком, вот так — для звонка с клиентом». Берёте, запускаете, получаете.

Вместо резюме

Первое. Лучшей модели нет. Вопрос «а сейчас какая лучше» — неправильно поставлен. Замените на «уместная под мою задачу».

Второе. Карта рынка простая. Премиум, масс-маркет, локальные, реплики. Реплики — никогда. Уровень кастома — начинайте с готового. Поднимаетесь только если не хватает.

Третье. На оркестраторе, интеграциях, fallback и мониторинге — не экономьте. Это обувь, аксессуары и запасная рубашка. Подписки, которыми не пользуетесь, — отменяйте сегодня же.

Главное. Не пытайтесь понять «а сейчас какая лучше» через бенчмарки. Соберите 3–5 своих задач — и прогоняйте каждую новую модель слепым тестом через них. Это и есть ваша личная карта реальности, а не чужие графики.

Лучшая модель — та, что уместна под вашу задачу. Всё остальное — мода с подиума.

Капсула. 8 вещей в гардеробе ИИ

Распечатайте и держите рядом с монитором. Перед любым выбором — прогоните через эти 8 пунктов.

1 Дресс-код
Есть ограничения от бизнеса (локально / из списка / без облака)? Если да — выбираете только в этих рамках.
2 Размер задачи
Бытовая — берите дешёвое и быстрое. Сложная с архитектурой — премиум без вариантов.
3 Уровень кастома
Сначала готовое. Не хватает — подгонка (скиллы, промптинг, MCP). И только если совсем никак — пошив (fine-tuning, RAG). Не наоборот.
4 Обувь — оркестратор
На главной модели цепочки не экономим. Премиум, точка. В подзадачах — можно дешевле.
5 Аксессуары — интеграции
MCP, доступ к данным, интеграция с CRM и почтой. Без них модель — голый интеллект.
6 Запасная рубашка — fallback
Любой боевой клиент — с резервной моделью и мониторингом. Чтобы вы узнавали о проблеме первым, а не клиент.
7 Инвентаризация — отмени что не носишь
Раз в месяц — выписка по карте, ревизия подписок. Что не закрывает конкретную задачу бизнеса — отменяй сегодня же.
8 Примерочная — слепое тестирование
3–5 своих задач, на которых вы прогоняете любую новую модель слепо. Бенчмарки с конференций — фотосессия. Ваша примерочная — правда.
Практический воркшоп по AI-агентам. 4 июня.
От Андрея Цыгана. Для собственников и не-технических специалистов. Без кода. На ваших живых задачах. В конце дня — три рабочих агента, готовых запустить в вашем бизнесе. Не теория, не «обзор инструментов» — собственно работа руками.
Записаться на atsyhan.by/agents →