Abril Day: Assine Digital Completo por 1,99

OpenAI anuncia versão gratuita do ChatGPT com interações por imagem e voz 6h6y1f

O objetivo é criar uma interação humano-computador mais natural, segundo a empresa 4n2w5w

Por Marília Monitchele Materia seguir SEGUIR Materia seguir SEGUINDO Atualizado em 13 Maio 2024, 16h20 - Publicado em 13 Maio 2024, 16h13

Nesta segunda-feira, 13, a OpenAI anunciou o GPT-4o (com a letra “o” de “Omni”, que significa “para todos” em latim), seu novo modelo principal de inteligência artificial. Esse modelo traz recursos avançados, incluindo a capacidade de processar imagens e vozes em tempo real. As atualizações estão sendo disponibilizadas gradualmente para os usuários das versões pagas do ChatGPT Plus e Team, com a expectativa de que os usuários das versões gratuitas também tenham o às  novidades nas próximas semanas, conforme afirmou Sam Altman, CEO da OpenAI.

Com o GPT-4o, a ferramenta torna-se capaz de interagir em tempo real, inclusive com recursos de fala e imagem que permitem a escuta de áudios e a “leitura” de fotos e vídeos durante as interações. Em uma demonstração, um executivo solicitou conselhos ao chatBot para se acalmar antes de uma apresentação importante. O assistente de voz recém-implementado analisou a respiração e ofereceu técnicas de controle. Outra demonstração apresentou o ChatGPT lendo uma história gerada por IA em diferentes entonações, desde recitais dramáticos, tons robóticos e até mesmo canto. Em uma terceira demonstração, um usuário apontou a câmera do celular para uma equação e solicitou que a IA a analisasse, auxiliando na resolução em vez de simplesmente fornecer a resposta. Em todos os testes, o GPT-4o demonstrou personalidade e habilidades de conversação mais complexas em comparação com as versões anteriores, além de respostas mais rápidas e a possibilidade de interromper a interação humano-robô. 

A empresa também demonstrou os recursos funcionando simultaneamente em diferentes idiomas, destacando os recursos multimodais em interações visuais, de áudio e de texto, com o assistente de IA capaz de usar a câmera de um telefone para ler notas escritas e tentar detectar a emoção de uma pessoa.

Essas novidades foram apresentadas às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira em Mountain View, Califórnia. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Microsoft e Apple também estão reorganizando suas ofertas em torno de um futuro baseado em IA generativa, e a OpenAI, cujo ChatGPT deu início à corrida, está tentando manter sua liderança.

Publicidade

Matéria exclusiva para s. Faça seu

Este usuário não possui direito de o neste conteúdo. Para mudar de conta, faça seu

ABRIL DAY

Digital Completo 3n1yv

o ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*
Apenas 1,99/mês*

Revista em Casa + Digital Completo 1k27o

Receba 4 revistas de Veja no mês, além de todos os benefícios do plano Digital Completo (cada edição sai por menos de R$ 9)
A partir de 35,90/mês

*o ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
*Pagamento único anual de R$23,88, equivalente a R$ 1,99/mês.

PARABÉNS! Você já pode ler essa matéria grátis.
Fechar

Não vá embora sem ler essa matéria!
Assista um anúncio e leia grátis
CLIQUE AQUI.