ChatGPT: Mais envolvente e Natural
O ChatGPT está passando por uma transformação notável que promete tornar sua experiência ainda mais envolvente, pois a OpenAI está introduzindo avanços significativos em reconhecimento de voz e análise de imagens.
Isso amplia a capacidade do seu chatbot estrela.
Neste artigo, vamos explorar esses emocionantes desenvolvimentos que estão chegando. Continue a leitura e saiba tudo sobre os novos recursos do ChatGPT.
Conversas Vivas com Reconhecimento de Voz e Imagens com o ChatGPT
A OpenAI está realizando uma expansão ousada para aprimorar a interatividade do ChatGPT. Agora, você terá a oportunidade de conversar de forma mais natural com o chatbot, usando tanto voz quanto imagens como meio de comunicação.
Imagine as infinitas possibilidades!
Em suas viagens, você poderá capturar uma foto de um marco impressionante e engajar-se em uma conversa em tempo real com o ChatGPT sobre este local fascinante.
Em casa, basta tirar uma foto da sua geladeira e começar uma discussão sobre receitas e ideias de refeições. A criatividade é o limite.
Disponibilidade para Usuarios Plus e Enterprise
Esses novos recursos estão chegando para aprimorar a experiência de usuários Plus e Enterprise nas próximas semanas.
A capacidade de interação por voz estará disponível exclusivamente nos aplicativos móveis, enquanto a funcionalidade de imagens estará acessível em todas as plataformas.
Conversação por Voz com Cinco Vozes Sintetizadas
O recurso de voz é particularmente empolgante, pois você poderá conversar com o ChatGPT e ouvir suas respostas em uma das cinco vozes sintetizadas disponíveis, trazendo uma dimensão totalmente nova à sua interação com o chatbot.
A ativação da voz é simples.
Basta acessar as Configurações no aplicativo móvel e selecionar a opção "Conversas por Voz". A partir daí, você pode escolher sua voz favorita entre as cinco vozes oferecidas.
A OpenAI implementou esse recurso utilizando um modelo avançado de conversão de texto em fala, treinado em amostras de dubladores. Para o reconhecimento de fala, é utilizado o Whisper, um sistema de fala de código aberto desenvolvido pela OpenAI.
Compartilhando Contexto Visual com Imagens
A capacidade de compartilhar imagens com o ChatGPT é bem emocionante, pois você poderá apresentar uma ou várias imagens para fornecer contexto visual à conversa.
Por exemplo, se você tiver uma foto de uma bicicleta danificada, pode solicitar ao chatbot que diagnostique o problema e sugira soluções.
Em dispositivos móveis, uma ferramenta de desenho está disponível para destacar partes específicas das imagens.
Essa capacidade de imagem é alimentada por uma versão multimodal dos modelos GPT-3.5 e GPT-4, que foram adaptados para processar informações visuais.
A OpenAI enfatiza que esses recursos passaram por rigorosos testes de segurança antes de serem implementados, garantindo uma experiência segura para os usuários.
Abordagem Gradual e Segurança Prioritária
A empresa está ciente dos desafios que essas inovações podem apresentar e está adotando uma abordagem gradual para garantir a segurança dos usuários.
A adição de recursos de voz oferece inúmeras possibilidades criativas, mas também traz preocupações, como a personificação de figuras públicas. Portanto, a funcionalidade de voz está atualmente limitada a conversas no chat, proporcionando um ambiente controlado.
No que diz respeito às imagens, a OpenAI está ciente da necessidade de precaução. O ChatGPT tem limitações para analisar pessoas diretamente em fotos, e a empresa aconselha contra o uso de casos de alto risco sem verificação.
Uma Experiência Mais Natural com IA
Esses novos recursos de voz e imagem representam um salto significativo na jornada da IA conversacional. Eles oferecem aos usuários uma maneira mais natural e envolvente de interação, tornando a experiência de conversação mais rica e intuitiva.
Os usuários Plus e Enterprise terão o privilégio de experimentar essas inovações em breve.
Este é um momento emocionante para todos que têm aproveitado a versatilidade do ChatGPT, pois ele se torna mais do que apenas um chatbot, evoluindo para um companheiro verdadeiramente inteligente em conversas diárias.