Оптимизация GPT OpenAI с помощью платформы Gradient
Вклад OpenAI в исследование глубокого обучения и работа по расширению доступа общественности к AI-моделям не подлежит недооценке. От работы компании по открытию моделей, таких как GPT-3.5, до развертывания GPT-4.5 и GPT-4o для общественности, она неизменно предоставляла модели глубокого обучения мирового класса более широкой аудитории, особенно большие языковые модели.
На днях DigitalOcean объявила о партнерстве с OpenAI для внедрения их моделей на нашу собственную платформу Gradient. В частности, мы запустили доступ к двум из самых мощных моделей OpenAI, GPT-4o и GPT-4o mini, с использованием платформы Gradient. Это приносит мощь самых продвинутых и эффективных моделей размышления OpenAI в простоту и доступность облачной инфраструктуры DigitalOcean.
Следуйте этому руководству, чтобы узнать больше о новых моделях рассуждений, доступных от OpenAI на платформе Gradient, обсудить, как их возможности повышаются благодаря платформе Gradient, и увидеть демонстрацию агента, который мы создали, используя материалы общественных руководств, которые мы читаем прямо сейчас!
Модели рассуждений OpenAI: GPT-4o и GPT-4o mini
Рассуждающие LLMs являются последним достижением в технике языкового моделирования. Мы подробно обсуждали рассуждение в нашей статье R1, но, вкратце, мы определяем рассуждение как акт обдумывания чего-либо логичным и разумным способом. Это поведение позволяет моделям расширять свои логические способности за пределы простого вывода к более сложным, почти саморефлексивным стратегиям рассмотрения. На практике модели рассуждения могут активно улучшать свои ответы через контролируемую саморефлексию и мета-анализ в длинных выводах.
GPT-4o и GPT-4o mini являются флагманскими моделью рассуждений от OpenAI и были одними из первых, доступных для использования. Буква «o» в названии означает «Omni», что подразумевает их способность генерировать обоснованные ответы на множество форматов ввода, включая изображения, текст, аудио и видео. В момент релиза эта беспрецедентная универсальность сделала модели мгновенно популярными среди сообщества пользователей LLM. С тех пор их универсальность и возможности только расширялись, были добавлены функции онлайн-исследования через вызов функций и генерирование изображений.
Чтобы сравнить две модели, давайте посмотрим на график ниже, который сравнивает Индекс Генеративной Способности популярных моделей, показатель качества, с скоростью вывода в токенах в секунду:
(Источник)
Как изначально сообщалось в рейтинге Artificial Analysis LLM Arena, GPT-4o и GPT-4o mini доминируют в своих нишах: качестве и эффективности. GPT-4o является одной из самых мощных и информированных моделей, доступных на рынке, в то время как GPT-4o mini является одной из самых эффективных и быстрых. Вместе они предлагают некоторые из самых универсальных моделей, доступных в облаке.
Улучшение возможностей моделей рассуждений OpenAI с помощью платформы Gradient
Платформа Gradient является решением DigitalOcean для всех ваших потребностей в агентных LLM. Она упрощает загрузку ваших собственных данных на платформу и дополнение LLM с помощью технологии Augmented Generation (RAG) из выбора лучших доступных моделей. Оттуда модель может вызывать функции вашего API для выполнения любых задач, которые вам нужны.
С добавлением GPT-4o и GPT-4o mini на платформу эта возможность только усиливается. GPT-4o и GPT-4o mini являются одними из самых продвинутых агентных моделей в своих категориях. С мощностью инфраструктуры DigitalOcean Gradient теперь легко дополнить эти модели вашими собственными данными для любых целей.
Демонстрация возможностей платформы Gradient с моделями рассуждения OpenAI
Начать работу с Gradient легко, а добавление доступа к моделям OpenAI — это просто. Сначала войдите в свою учетную запись DigitalOcean и выберите команду и проект на свой выбор. В боковом меню слева в окне мы можем получить доступ к платформе Gradient, нажав на ссылку в выпадающем меню ‘Управление’. Отсюда вы сможете создать свою первую Базу знаний. Базы знаний — это ресурс, из которого LLM будет извлекать информацию для RAG.
Чтобы создать вашу базу знаний, нам нужно подключить соответствующее пространство DigitalOcean к нашему корпусу. Создайте пространство и загрузите в него ваши данные, если у вас его еще нет. Для демонстрации мы загрузили весь корпус учебников DigitalOcean для анализа.
После этого мы можем подключить наше пространство к нашей новой Базе Знаний во время создания. Затем мы можем выбрать нашу модель встраивания: либо All MiniLM L6 v2 (0,00900 долл./1M токенов), GTE Large EN v1.5 (0,09000 долл./1M токенов) или All MiniLM L6 v2 (0,00900 долл./1M токенов). Выберите модель, наиболее подходящую для вашего случая использования и размера вашего корпуса. Более крупные наборы данных потребуют больших моделей, таких как GTE Large EN v1.5, для встраивания всей информации для RAG. После этого мы можем выбрать наш проект и создать Базу Знаний. Сам процесс создания может занять некоторое время в зависимости от размера вашего входных данных.
Затем нам нужно добавить наш ключ OpenAI на платформу Gradient. Мы можем сделать это, нажав на вкладку «Ключи моделей» в обзоре платформы Gradient. Перейдите на вкладку и введите свой ключ API OpenAI.
Теперь, когда наша база знаний создана и мы добавили наш API ключ, мы можем создать нашего агента с помощью GPT-4o или GPT-4o mini от OpenAI. Для этой демонстрации мы будем использовать GPT-4o mini. Назовите вашего агента подходящим образом в зависимости от его заданий и дайте ему начальный запрос, который будет соответствовать поставленной задаче. Эти инструкции агента будут определять каждый вывод и поведение агента.
Далее мы выбираем наши модели. Выберите опцию «Модели OpenAI» из выпадающего меню. Затем выберите свой API-ключ OpenAI из выпадающего списка ключей. Наконец, выберите свою модель. Мы используем GPT-4o mini для этого демонстрации.
Наконец, мы подключаем нашу базу знаний к агенту. Это позволит моделям OpenAI выполнять RAG на наших данных и информировать все результаты.
Как только эти шаги будут завершены, мы сможем создать нашего агента. Развертывание агента может занять несколько минут. После развертывания мы сможем начать взаимодействовать с ним. Выше представлен пример вывода, который мы получили из нашей демонстрационной версии. Чтобы сделать запрос к модели, мы можем либо использовать связанный Плейграунд Модели для Агента, отправлять запросы с помощью Python-кода, либо использовать cURL. Для получения более подробной информации о том, как запрашивать модель, ознакомьтесь с нашей документацией.
Заключительные мысли
С развитием все более популярных технологий LLM с закрытым исходным кодом, платформа DigitalOcean Gradient становится все более мощной и универсальной. Мы были действительно впечатлены возможностями модели OpenAI в ходе наших тестов и призываем других рассмотреть возможность использования их для своих задач по мере необходимости.








Добавить комментарий