Поведение разных моделей при вайбкодинге
Это стоит обсудить на фоне прошлого того, как Cursor попытался сделать хитрый финт, чтобы собрать кучу денег с подписчиков, но у него не получилось.
По сути, у нас не так-то много качественных вариантов.
Claude Opus 4 — это царь. Но самый дорогой. Есть вариант thinking.
• Он умеет планировать, дебажить и работать над сложными задачами.
• Ему лучше всего давать какую-то комплексную задачу или список задач.
• Стоит сразу указать файлы и папки, с которыми ему предстоит работать + добавить нужное в контекст, хотя в целом он сам неплохо ищет — просто каждый поиск стоит денег.
• Он доведёт список задач до самого конца, попытавшись максимально точно разложить задачу. Идеально — если у него ещё и таск-лист есть.
• При этом он хорошо следует инструкции и редко добавляет отсебятину.
• Контекст — до 200 тыс. токенов.
Claude Sonnet 4 — это рабочая лошадка. Недорого и всё ещё хорошо. Есть вариант thinking.
• Он умеет работать над достаточно сложными задачами, неплохо дебажит, хотя иногда не может найти первопричину.
• К нему применимы все те же советы, что и к Opus. Он также старается довести дело до конца. Просто немного поглупее. Однако это можно считать базовой моделью для любой разработки.
• Также достаточно редко добавляет отсебятину. Любит тестировать результат и очень любит создавать отчёты-гайды.
• Контекст — до 200 тыс. токенов.
GPT-o3 / o3 pro — снайпер. o3 — стал на уровне Sonnet по цене, а o3 pro — как Opus. Обе — только thinking.
• Планирует плохо. Превосходно дебажит: если Claude не справляется и ходит кругами — o3 может помочь. Создаёт новые фичи неплохо, но чересчур лаконично.
Читать далее