Отправляет email-рассылки с помощью сервиса Sendsay

Beltion Game

  Все выпуски  

Beltion Game Новая ИИ-модель с открытым кодом от Nvidia способна конкурировать с GPT-4


Nvidia выпустила мощную открытую модель искусственного интеллекта, которая может составить конкуренцию таким гигантам, как GPT-4 от OpenAI и решения Google. Новое семейство моделей NVLM 1.0, возглавляемое мультимодальной моделью с 72 миллиардами параметров NVLM-D-72B, демонстрирует выдающиеся результаты как в задачах в области визуальных и языковых навыков, так и в текстовых задачах.

Мы представляем NVLM 1.0 семейство мультимодальных больших языковых моделей передового уровня, которые достигают лучших результатов в задачах на пересечении языка и зрения, конкурируя с ведущими проприетарными моделями (например, GPT-4) и открытыми моделями.

Nvidia

Ключевым моментом стало то, что Nvidia делает веса модели доступными, а также обещает выпустить код для ее обучения. Это решение выделяется на фоне закрытых систем от конкурентов и дает исследователям и разработчикам доступ к передовым технологиям.

NVLM-D-72B отличается высокой адаптивностью и способностью обрабатывать как визуальные, так и текстовые данные. Модель может интерпретировать мемы, анализировать изображения и пошагово решать математические задачи. Особенно примечательно, что ее производительность в текстовых задачах улучшается после мультимодального обучения.

Один из исследователей заметил относительно этого релиза:

Поразительно! Nvidia только что опубликовала модель с 72 миллиардами параметров, которая почти на уровне Llama 3.1 с 405 миллиардами в математических и кодинговых тестах, и еще с поддержкой зрения!

Этот шаг Nvidia может ускорить исследования и разработки в области ИИ, позволяя менее крупным организациям и независимым исследователям вносить значительный вклад в развитие технологий. Проект NVLM также включает инновационные архитектурные решения, такие как гибридный подход к обработке мультимодальных данных, который может задать новые направления исследований в области ИИ.

Открытая публикация такой мощной модели может оказать серьезное влияние на индустрию, вынуждая другие компании пересмотреть свои подходы к разработкам и доступности ИИ. В то же время, данный шаг также вызывает вопросы о рисках, связанных с более широким доступом к таким передовым технологиям кто-то сможет использовать подобные модели со злым умыслом.

Прочесть полную версию и оставить комментарий можно здесь.


В избранное