Разработчики ChatGPT представили новую версию искусственного интеллекта, которая теперь может работать и с картинками. Создатели называют GPT-4 самой эффективной языковой моделью. Ее главное отличие от предшественника — способность анализировать изображения. Например, ИИ может объяснить, что на картинке смешного. Кроме того, утверждается, что модель стала лучше справляться со сложными задачами, хотя в привычном диалоге это может быть незаметно.
Систему обучали на суперкомпьютерах Microsoft, корпорация стала одним из крупнейших инвесторов проекта. В компании заявили, что ее поисковик Bing уже поддерживает новую технологию. “Ъ FM” ее протестировал.
Разработчики заявляют, что обновленную технологию используют банк Morgan Stanley, приложение для изучения языков Duolingo, а также специальный сервис для незрячих Be My Eyes, который преобразует снимки в текстовое описание. Директор по науке и технологиям «Агентства искусственного интеллекта» Роман Душкин считает, что бизнес сможет найти и другие применения языковой модели: «GPT-4 теперь может воспринимать и изображения, и текст, то есть это двухмодальная система.
ChatGPT уже можно использовать в бизнесе. Самый простой способ интеграции — это замена рутинных операций по созданию каких-нибудь писем, справок, отчетов и так далее. ИИ это делает быстрее и зачастую качественнее, чем люди, которые сидят и выдумывают, что бы написать. Поскольку система стала двухмодальной, можно использовать генерацию каких-нибудь специфических изображений типа схем, графиков. То, что представили на презентации от Microsoft и OpenAI, конечно, воображение немного захватывает».
Однако OpenAI предупреждает, что новое программное обеспечение еще не совершенно и что во многих сценариях уступает человеку. По словам компании, у модели все еще есть серьезные проблемы с «галлюцинациями» (выдумыванием фактов), так что она не является надежной с точки зрения представления фактов. GPT-4 по-прежнему склонна настаивать на своей правоте, когда ошибается.
Так что в обозримом будущем технологию едва ли можно считать перспективной, отметил руководитель направления Data Science компании «1С-Битрикс» Александр Сербул: «Серьезные вещи ChatGPT нельзя доверять. Во-первых, система непредсказуема, потому что обучается на мусоре. Никто эту информацию детально не отсматривает. Речь идет об огромном массиве данных, интернете, какие-то книжках. Кроме того, там сотни миллионов параметров. Да, она учится, да, говорит связно. Но как выглядят психически больные люди? Они часто так же гладко разговаривают. Думаю, что бизнес попытается это применить в каком развлекательном аспекте или там, где требуется грязная работа».
Более продвинутый вариант новой языковой модели доступен подписчикам платного сервиса GPT4+. Воспользоваться им можно за $20 в месяц, правда, в России ресурс не работает.
Систему обучали на суперкомпьютерах Microsoft, корпорация стала одним из крупнейших инвесторов проекта. В компании заявили, что ее поисковик Bing уже поддерживает новую технологию. “Ъ FM” ее протестировал.
Разработчики заявляют, что обновленную технологию используют банк Morgan Stanley, приложение для изучения языков Duolingo, а также специальный сервис для незрячих Be My Eyes, который преобразует снимки в текстовое описание. Директор по науке и технологиям «Агентства искусственного интеллекта» Роман Душкин считает, что бизнес сможет найти и другие применения языковой модели: «GPT-4 теперь может воспринимать и изображения, и текст, то есть это двухмодальная система.
ChatGPT уже можно использовать в бизнесе. Самый простой способ интеграции — это замена рутинных операций по созданию каких-нибудь писем, справок, отчетов и так далее. ИИ это делает быстрее и зачастую качественнее, чем люди, которые сидят и выдумывают, что бы написать. Поскольку система стала двухмодальной, можно использовать генерацию каких-нибудь специфических изображений типа схем, графиков. То, что представили на презентации от Microsoft и OpenAI, конечно, воображение немного захватывает».
Однако OpenAI предупреждает, что новое программное обеспечение еще не совершенно и что во многих сценариях уступает человеку. По словам компании, у модели все еще есть серьезные проблемы с «галлюцинациями» (выдумыванием фактов), так что она не является надежной с точки зрения представления фактов. GPT-4 по-прежнему склонна настаивать на своей правоте, когда ошибается.
Так что в обозримом будущем технологию едва ли можно считать перспективной, отметил руководитель направления Data Science компании «1С-Битрикс» Александр Сербул: «Серьезные вещи ChatGPT нельзя доверять. Во-первых, система непредсказуема, потому что обучается на мусоре. Никто эту информацию детально не отсматривает. Речь идет об огромном массиве данных, интернете, какие-то книжках. Кроме того, там сотни миллионов параметров. Да, она учится, да, говорит связно. Но как выглядят психически больные люди? Они часто так же гладко разговаривают. Думаю, что бизнес попытается это применить в каком развлекательном аспекте или там, где требуется грязная работа».
Более продвинутый вариант новой языковой модели доступен подписчикам платного сервиса GPT4+. Воспользоваться им можно за $20 в месяц, правда, в России ресурс не работает.