Будущее программирование на основе искусственного интеллекта уже близко
Технические компании, включая OpenAI, разрабатывают новое поколение помощников искусственного интеллекта, которые могут не только писать код, но и дебажить, упорядочивать и критиковать его. Первые пользователи подобных помощников рассказывают свои истории. К примеру, как удалось наладить и исправить сложную проблему, связанную с неправильно названным файлом в различных хранилищах кода на сайте GitHub, где размещено программное обеспечение.
Искусственный интеллект (ИИ) погрузился в проблему на GitHub, проходил код и размышлял о том, что может быть не так. Он правильно определил, что основной причиной ошибки была строка, указывающая на неправильное расположение файла, затем перемещался по проекту, нашел файл и внес изменения в код, чтобы все работало должным образом. Это то, что неопытный разработчик может потратить часы, пытаясь отладить.
Многие программисты уже используют искусственный интеллект, чтобы быстрее писать программное обеспечение. GitHub Copilot был первой интегрированной средой разработчика, которая использовала ИИ (AI) , но многие IDE теперь будут автоматически завершать фрагменты кода, когда разработчик начинает вводить текст. Вы также можете задать искусственному интеллекту вопрос о коде или попросить его предложить, как улучшить то, над чем вы работаете.
Минувшим летом Джон Янг и Карлос Хименес, два аспиранта Принстонского университета, начали обсуждать, что нужно для того, чтобы ИИ стал инженером-программистом в реальном мире. Это побуждало их и других сотрудников Принстона к разработке SWE-bench, набору тестов для тестирования инструментов искусственного интеллекта в ряде задач программирования. После выпуска теста в октябре команда разработала собственный инструмент – SWE-агент – для выполнения этих задач.
SWE-agent («SWE» — сокращение от «software engineering», программист) — это одна из ряда значительно более мощных программ кодирования искусственного интеллекта, которые выходят за рамки простого написания строк кода и действуют как так называемые программные агенты, используя инструменты, необходимые для споров, налаживать и упорядочивать программное обеспечение. Стартап Devin стал вирусным с демонстрацией видео одного из таких инструментов в марте.
Офир Пресс, член команды Принстона, говорит, что SWE-bench может помочь OpenAI проверить производительность и надежность программных агентов. «Это только мое мнение, но я думаю, что они очень скоро выпустят программного агента», — говорит Пресс.
OpenAI отказался от комментариев, но другой источник, осведомленный о деятельности компании, пожелавший не называть его имени, сообщил изданию WIRED, что «OpenAI точно работает над агентами кодирования».
Подобно тому, как GitHub Copilot показал, что большие языковые модели могут писать код и повышать производительность программистов, такие инструменты как SWE-agent могут доказать, что агенты ИИ могут работать надежно, начиная с создания и поддержки кода.
Ряд компаний являются агентами тестирования по разработке программного обеспечения. В верхней части таблицы лидеров SWE-bench, измеряющей оценку различных агентов кодирования для различных задач, находится один от Factory AI, стартапа, за которым следует AutoCodeRover, запись с открытым кодом от команды Национального университета Сингапура.
Большие игроки тоже вступают в дело. Инструмент для написания программного обеспечения Amazon Q является еще одним исполнителем в SWE-bench. «Разработка программного обеспечения – это гораздо больше, чем просто набор текста», – говорит Дипак Сингх, вице-президент по разработке программного обеспечения Amazon Web Services.
Он добавляет, что AWS использовала агент для перевода целых стеков программного обеспечения с одного языка программирования на другой. «Это действительно умный программист сидит рядом с вами, пишет и создает программу вместе с вами, — говорит Сингх. – Я думаю, что это достаточно трансформационно».
Команда OpenAI недавно помогла команде Принстона усовершенствовать эталон для измерения надежности и эффективности таких инструментов как SWE-agent, предполагая, что компания также может совершенствовать агентов для написания кода или выполнения других задач на компьютере.
Сингх говорит, что несколько клиентов создают сложные серверные приложения с помощью Q.
Эксперименты из SWE-bench показывают, что кто-либо, кто занимается программированием, вскоре захочет использовать агентов, чтобы улучшить свое мастерство программирования, или рискует остаться позади.
По материалам: Wired
Зарегистрируйтесь, чтобы оставлять комментарии
Вход
Заходите через социальные сети
FacebookTwitter