Gemini - умный чат-бот от Google, конкурент GPT-4
Содержание:
Друзья, интересная новость для тех, кто следит за развитием нейросетей, в частности, языковых их моделей – умных чат-ботов наподобие ChatGPT. Самый что ни на есть настоящий конкурент ChatGPT - Bard AI, не базирующийся на наработках компании OpenAI, а основанный на собственной модели языковой нейросети от Google, переименован в Gemini. С момента запуска Bard AI в 2023 году умный чат-бот был существенно улучшен: получил новые функции, качественно эволюционировал. Но Gemini – это больше, чем эволюционировавший Bard AI. Gemini – это новый этап развития технологий ИИ от компании Google. Что же такое Gemini?
↑ Gemini - умный чат-бот от Google, конкурент GPT-4
↑ Что такое Gemini от Google
Друзья, Bard AI – это умный чат-бот от компании Google, выпущенный позднее ChatGPT, но являвшийся истинным его конкурентом, поскольку его базис - собственные ИИ-наработки Google, альтернативы и конкуренты наработкам OpenAI. О его возможностях детально - в статье «Bard AI - умный чат-бот от Google, главный конкурент ChatGPT». И вот, в процессе своей эволюции Bard трансформировался в Gemini.
Gemini - это более точный, более мощный и более функциональный чат-бот, чем Bard. Gemini может решать более широкий спектр задач. Ребрендинг – один из способов обозначить это. Bard - изначально было пробным рабочим названием проекта, и названием только проекта умного чат-бота от Google. Gemini же - это название не только чат-бота, но всей линейки продуктов на базе ИИ компании Google. В эту линейку входят разные версии самого умного чат-бота с разными возможностями - Gemini Chat, Gemini Nano, Gemini Pro, Gemini Ultra, интерфейс программирования приложений Gemini API, сервисы Gemini для образования, здравоохранения, бизнеса.
Gemini, по мнению Google, в большей степени отражает масштабы ИИ-проектов компании. Почему Gemini? Gemini — это семейство мультимодальных больших языковых моделей от Google, более совершенных преемниц LaMDA и PaLM, на которых базировался Bard AI и в принципе ранние ИИ-наработки Google. Само название Gemini в переводе означает «близнецы». И отражает двойственную природу этого семейства языковых моделей, поскольку сочетает в себе лучшие качества LaMDA и PaLM. Другой аспект названия: модели Gemini могут выполнять разные задачи и работать с разными форматами информации.
Ну и как же без фактора конкурентной борьбы? Gemini – это конкурент мультимодальной языковой модели GPT-4 от компании OpenAI. До появления Gemini GPT-4 являлся самой продвинутой языковой нейросетью. Использование ChatGPT на базе GPT-4 возможно только в рамках платной подписки. Или бесплатно в рамках проекта Copilot от Microsoft.
Основные возможности Gemini – это обработка и генерация различных форматов информации: текст, изображения, видео, аудио. Так, Gemini может:
- Предоставлять информацию, вести беседы на любую тему, рассказывать истории;
- Решать задачи, выполнять расчёты, планировать и т.п.;
- Работать с текстом: генерировать тексты различных стилей и жанров (стихи, рассказы, код, сценарии, письма и т.д.), резюмировать тексты;
- Выполнять перевод на разные языки;
- Распознавать медиаконтент – изображения, видео, аудио, предоставлять информацию и придумывать тексты на базе медиаконтента, редактировать изображения, создавать субтитры для видео и т.п.;
- Создавать изображения как то: логотипы, иллюстрации, иконки, фотографии;
- Программировать.
Gemini понимает и генерирует естественный язык, неотличимый от текста, написанного человеком. Обучается на огромных массивах данных в целях улучшения своих возможностей. Может адаптироваться к новым задачам и контекстам. Может быть расширен за счёт добавления новых функций и возможностей.
Но, друзья, что Gemini, что GPT-4 – это лишь передовые языковые нейросети с продвинутыми возможностями, новая стадия эволюции языковых нейросетей, увы, не несущая избавления от проблемы их галлюцинаций. Галлюцинации – это ошибки языковых нейросетей, когда они генерируют неточную или откровенно бредовую информацию. Компания Google на этот счёт предлагает нам лишь кнопку поиска в Google для проверки ответов нейросети и кнопки отзывов о неправильных ответах.
↑ Как использовать Gemini бесплатно
Бесплатно Gemini доступен для масс:
- В мобильном приложении Google Gemini, это лёгкая модель Gemini Nano для мобильных устройств;
- В веб-версии Gemini, это Gemini Chat, основанный на модели Gemini Pro.
Бесплатные версии Gemini предусматривают только базовые возможности нейросети. В данный момент Gemini недоступен в некоторых странах, в частности, в РФ. Возможно, в будущем ситуация изменится. Пока же, друзья, ВПН в помощь тем из нас, где Gemini недоступен.
Ну и давайте рассмотрим возможности бесплатного Gemini в веб-версии.
↑ Веб-версия Gemini
Бесплатный Gemini доступен в любом браузере как обычный сервис Google. Для авторизации нужен аккаунт Google.
Общаться с чат-ботом можем путём либо ввода текста, либо диктовки в микрофон. Для диктовки форма ввода Gemini предусматривает кнопку в виде микрофона.
Форма ввода чат-бота содержит кнопку добавления изображения, если наш вопрос включает его обработку.
Прилагая к запросу изображение, в бесплатном Gemini можем просить чат-бот распознать текст, перевести его или пояснить. Можем просить распознать объект на изображении и предоставить информацию или сгенерировать на его базе текст.
Ответы Gemini можем менять, применяя к ним настройки как то: короткий или длинный ответ, простой ответ, неформальный или профессиональный стиль ответа. Кнопки этих настроек доступны в конце каждого ответа чат-бота. Также в конце каждого ответа нам предлагаются кнопки лайка или дизлайка ответа, расшаривания его ссылки, отправки в Gmail или Google Документы, копирования ответа, отсылки в поиск Google по нашему вопросу и сообщения компании Google о нарушении чат-ботом законодательства.
Ответы Gemini могут быть озвучены речевым движком. Если наш запрос чат-боту нужно уточнить, дополнить, перефразировать, не нужно его копировать и дописывать или переписывать. Можно нажать кнопку редактирования, изменить текст и получить от Gemini обновлённый ответ. Кнопка «Показать черновики» - это возможность просмотреть разные варианты ответа чат-бота на наш вопрос. Умные чат-боты одно и то же могут сказать массой разных способов, в разных формулировках текста. Возможно, какие-то формулировки будут более понятны, точны, уместны, уникальны и т.п. К черновикам ещё и прилагается кнопка повторной генерации ответа, её можно использовать, если нас не устраивает ни конечный ответ, ни варианты из черновиков, а править сам запрос и уточнять что-то мы не хотим.
Gemini сохраняет историю наших с ним чатов, чтобы мы могли найти информацию, насчёт которой общались ранее, и при необходимости возобновить общение с чат-ботом. Чаты можно переименовывать и закреплять поверх других. В любой момент можем начать новый чат с Gemini. А ненужные чаты при необходимости можем удалить.