O Google lançou nesta quarta-feira (06/12) o Gemini, seu modelo mais avançado de inteligência artificial (IA). O novo modelo foi testado em uma ampla variedade de tarefas. Ele superou 30 dos 32 pontos das referências acadêmicas amplamente utilizadas na pesquisa e no desenvolvimento de grandes modelos de linguagem.
O novo recurso é capaz de organizar, compreender, operar e combinar diferentes tipos de informação como, por exemplo:
- textos;
- imagens;
- áudios;
- vídeos; e
- linguagens de programação.
Ao divulgar a nova ferramenta, o Google prometeu que o “Gemini vai melhorar significativamente a forma como os desenvolvedores e as empresas constroem soluções com IA”.
A versão do 1.0 recurso, é oferecida de três modos diferentes, para demandas específicas:
- Gemini Ultra — maior e mais hábil para tarefas altamente complexas;
- Gemini Pro — melhor para escalar grande variedade de tarefas;
- Gemini Nano — mais eficiente para tarefas em dispositivos móveis.
O método padrão para criação de modelos multimodais de IA envolvia treinar componentes separados para diferentes modalidades para, em seguida, juntá-los para imitar algumas dessas funcionalidades. Essas modelagens executam bem algumas funções, como descrever imagens, mas correm risco de apresentar problemas com raciocínios mais complexos.
Por meio do novo recurso, o Google busca avançar, criando um modelo multimodal de IA nativo, anteriormente treinado em diferentes modalidades. Teoricamente, isso permite que o Gemini a compreender e raciocinar sobre todos os tipos de informações desde o começo.
ACESSO À FERRAMENTA
Posteriormente ao anúncio do Google, o Bard já foi disponibilizado com Gemini Pro em inglês em mais de 170 países e territórios. O recurso poderá compreender, resumir, raciocinar, fazer brainstorming, escrever e planejar.
Esse é o principal avanço do Bard desde o seu surgimento. O Gemini também já está disponível para o Pixel 8 Pro, primeiro smartphone projetado para rodar o Gemini Nano. Nos próximos meses, o Google promete disponibilizar o Gemini em outros de seus produtos, como a Busca, Ads, Chrome e Duet AI.
FERRAMENTAS MAIS AVANÇADAS
As capacidades mais avançadas da nova ferramenta já estarão disponíveis para clientes corporativos do Google e desenvolvedores a partir da próxima quarta-feira (13/12). Eles acessarão através da API do Gemini no Google AI Studio ou Vertex AI.
O Google AI Studio é uma ferramenta gratuita para desenvolvedores baseada na Web. Ela permite que desenvolvedores e clientes corporativos criem protótipos e lancem aplicativos rapidamente com uma chave de API.
Além disso, logo no começo de 2024, o Google pretende lançar o Bard Advanced. Trata-se de uma nova experiência de IA avançada, por meio da qual será possível acessar os melhores modelos e capacidades, começando pelo Gemini Ultra.
_____
Em seguida, leia também:
Espião da ditadura de Cuba foi importante diplomata dos EUA durante 40 anos