DevGang
Авторизоваться

Революция в технологиях 2024

На конференции Google Cloud Next 2024 в Лас-Вегасе была представлена ​​серия революционных продуктов искусственного интеллекта, демонстрирующих последние достижения в области генеративных технологий искусственного интеллекта. Среди этих инноваций можно выделить такие примечательные обновления, как Gemini 1.5 Pro, Google Vids и Imagen 2, предназначенные для преобразования различных процессов творчества и разработки.

Gemini 1.5 Pro

Google объявила о публичной предварительной версии своей последней модели генеративного искусственного интеллекта Gemini Pro 1.5 на платформе Vertex AI. Эта модель может обрабатывать контексты до 1 миллиона токенов (что эквивалентно примерно 700 000 английским словам или примерно 30 000 строк кода), что в четыре раза превышает емкость модели Anthropic Claude 3 и в восемь раз превышает максимальный контекст OpenAI GPT-4 Turbo. Модели с большими контекстными окнами могут лучше понять общее содержание входных данных и генерировать более подробные контекстные ответы.

Кроме того, Gemini Pro 1.5 поддерживает несколько языков и является мультимодальным, способным понимать текст, изображения, видео и аудиопотоки. Емкость в 1 миллион токенов может обрабатывать около одного часа видео или примерно 11 часов аудио.

Gemini Code Assist

Gemini Code Assist — это корпоративный инструмент для завершения и помощи в кодировании с использованием искусственного интеллекта. Этот инструмент представляет собой усовершенствованную версию Duet AI для разработчиков, в которой используется новейшая модель Gemini 1.5 Pro, которая предоставляет разработчикам комплексный анализ кодовой базы, генерацию кода и поддержку частных репозиториев кода в нескольких решениях для хранения данных. Gemini Code Assist больше конкурирует с Copilot Enterprise от GitHub, чем с базовой версией Copilot. Он предлагает специфические функции Google, такие как поддержка контекстного окна, содержащее до 1 миллиона токенов, и позволяет предприятиям точно настраивать Code Assist на основе внутренних репозиториев кода. Он поддерживает репозитории кода, расположенные на таких сервисах, как локальные серверы, GitLab, GitHub и BitBucket от Atlassian. В настоящее время эта функция находится на стадии предварительного просмотра и поддерживает плагины для популярных редакторов, таких как VS Code и JetBrains.

Google также выпустила CodeGemma, новую модель с открытым исходным кодом, специально предназначенную для генерации кода и помощи, входящую в серию Gemma.

Google Vids

Google Vids станет частью пакета Google Workspace, позволяя пользователям создавать впечатляющие видеоролики путем преобразования маркетинговых текстов и изображений в видеораскадровки, которые поддерживают совместную работу и настройку в реальном времени.

Imagen 2

Imagen 2 — это усовершенствованный инструмент для создания изображений, интегрированный в платформу разработки Google Vertex AI. Несмотря на то, что Google столкнулся с серьезными разногласиями в области создания изображений, Imagen 2, как часть модельного ряда, представляет множество новых функций. К ним относятся создание и редактирование изображений на основе текстовых подсказок, отображение многоязычного текста, логотипов и символов, а также наложение этих элементов на существующие изображения.

Кроме того, в Imagen 2 представлены две новые функции: закрашивание и закрашивание. Подобно Adobe Firefly, эти функции можно использовать для удаления ненужных частей изображения, добавления новых компонентов и расширения границ изображения для создания более широкого обзора. Теперь этот инструмент также имеет возможность генерировать короткие четырехсекундные видеоролики на основе текстовых подсказок, аналогично инструментам создания видеоклипов от таких компаний, как Runway, Pika и Irreverent Labs.

Чтобы смягчить обеспокоенность общественности по поводу создания дипфейкового контента, Google во время презентации заявила, что Imagen 2 использует технику SynthID, разработанную Google DeepMind. Этот метод применяет невидимые водяные знаки на основе шифрования к сгенерированным динамическим изображениям. Google утверждает, что эти водяные знаки устойчивы к редактированию, включая сжатие, фильтрацию и настройку тона. Однако для обнаружения этих водяных знаков требуются инструменты Google, которые пока недоступны третьим лицам.

Vertex AI Agent Builde

Vertex AI Agent Builder — инструмент для создания агентов. На конференции генеральный директор Google Cloud Томас Куриан подчеркнул, что этот продукт без кода позволяет пользователям легко создавать и развертывать чат-агенты. Он направляет и улучшает качество и точность ответов модели, обучая людей.

Vertex AI Agent Builder основан на ранее выпущенных продуктах Google Vertex AI Search and Conversation. Он использует новейшие модели большого языка Gemini и опирается на RAG API и векторный поиск. Эти широко используемые технологии помогают уменьшить возникновение галлюцинаций в ответах модели.

Для профессионалов, стремящихся объединить концепции дизайна непосредственно в готовые к производству форматы, инновационные решения Codia, такие как Design to Code и Screenshot to Figma, могут значительно ускорить и усовершенствовать процесс разработки, внедряя превосходный интеллектуальный дизайн с самого начала. Codia лидирует в преобразовании проектирования и разработки с помощью искусственного интеллекта, делая сложные процессы проще и интуитивно понятнее. Узнайте больше о том, как Codia меняет технологический ландшафт, посетив их веб-сайт.

#Интересное #Новости
Комментарии
Чтобы оставить комментарий, необходимо авторизоваться

Присоединяйся в тусовку

В этом месте могла бы быть ваша реклама

Разместить рекламу