✔Google представил нейросеть Gemini 1.5 – за раз она может обработать 11-часовое аудио - «Новости мира Интернет»
Два месяца назад компания Google анонсировала новую языковую модель Gemini, а теперь выпустила ее обновленную версию. Gemini 1.5 уже доступна корпоративным клиентам и разработчикам, а в скором времени ей смогут пользоваться все желающие.
Gemini 1.5 значительно отличается от своей предшественницы – ее Pro-версия на 87% мощнее первоначальной модели и находится примерно на одной ступени с Gemini 1.0 Ultra. Давать столь быстрые ответы позволяет подход Mixture-of-Experts – при отправлении запросов бот запускает только часть модели.
Но самое главное отличие от прошлой версии – огромное контекстное окно. Если раньше это было 32 тысячи токенов, то теперь оно стандартно расширено до 128 тысяч, но его возможно увеличить до 1 миллиона токенов. Новая Gemini 1.5 позволяет обработать за один раз около 11 часов аудио, 30 тысяч строк кода или 700 тысяч слов. А прямо сейчас в Google тестируют контекстное окно на 10 миллионов токенов.
Источник: блог Google (здесь и на обложке)
По мнению представителей Google, большое контекстное окно будет полезно для бизнеса. К примеру, медиакомпания сможет загрузить новый фильм и спросить, как отреагируют на киноленту рецензенты, какую рекламу лучше запустить перед началом показа, какая целевая аудитория у продукта.
На сегодняшний день пользоваться Gemini 1.5 могут только бизнес-клиенты и разработчики Vertex AI и AI Studio. В ближайшем будущем новая нейросеть придет на замену Gemini 1.0, а Gemini 1.5 Pro на 128 тысяч токенов будет выложена на официальном сайте вместо текущей версии Gemini Pro. Чтобы получить контекстное окно размером в 1 миллион токенов, нужно будет доплатить.
Читайте также
Google анонсировал ИИ-модель Gemini