Ciência e tecnologia

Gêmeos agora podem responder perguntas sobre imagens no leitor de tela do Android

O Google está tecendo os avanços da IA ​​em suas ofertas de acessibilidade. Ele está lançando atualizações para os recursos do Android e do Chrome, incluindo seu leitor de tela do Talkback e legendas expressivas, informou a empresa na quinta -feira.

Talkback, que foi lançado pela primeira vez em 2009, lê em voz alta o que está na sua tela e permite navegar no seu dispositivo usando gestos personalizadoscomandos de voz ou um teclado virtual em braille. No ano passado, o Google integrou a Gemini no Talkback para oferecer descrições de imagens mais ricas e claras.

Gêmeos em Talkback podem responder a perguntas sobre o que está na sua tela.

Google

Agora, você pode fazer perguntas de Gemini via Talkback para obter mais informações sobre o que está em uma foto. Portanto, se alguém lhe enviar uma imagem e você deseja mais detalhes sobre o que está sendo mostrado, você pode perguntar, e Gemini responderá. Se você está fazendo compras on -line e deseja saber mais sobre o material de um vestido, Gêmeos pode responder às suas perguntas. Também pode responder a perguntas sobre qualquer coisa na tela, como se um item está à venda.

Além disso, o Google está lançando a próxima versão de legendas expressivas, que usa a IA para transmitir detalhes como intensidade de sons de fala e fundo em vídeos e transmissão ao vivo. Quando o recurso foi lançado em dezembro, incluía caracterizações como texto capitalizado para frases faladas com excitação (como “feliz aniversário!”), Bem como descrições de ambiente sons como aplausos ou música.

Um jogador de futebol celebra como leis leis na tela

As legendas expressivas agora podem transmitir discursos alongados.

Google

Agora, as legendas expressivas também transmitirão a duração de uma declaração, adicionando cartas se um locutor esportivo disser “Amaaazing Shot”, por exemplo, ou se alguém em um vídeo disser “nooooo”. Também pode rotular mais sons como alguém assobiando ou limpando a garganta. A atualização está sendo lançada em inglês nos EUA, Reino Unido, Canadá e Austrália em dispositivos que executam o Android 15 ou mais.

Também ficou mais fácil acessar PDFs no Chrome. Anteriormente, os leitores de tela não podiam interagir com os PDFs digitalizados em um navegador Chrome de mesa. Agora, o reconhecimento óptico de caracteres permite que o Chrome reconheça automaticamente esses PDFs, para que você possa usar o leitor de tela e também destacar, copiar e pesquisar texto como faria com qualquer outra página.

O Zoom da página permite aumentar o tamanho do texto sem jogar fora o layout de uma página da web.

Google

E o Zoom agora permite ampliar o texto no Chrome no Android sem distorcer o layout da página da web, semelhante à maneira como funciona no Chrome da área de trabalho. Para usar o recurso, toque no menu de três pontos no canto superior direito do Chrome e escolha seu nível de zoom.

O anúncio do Google ocorre no Dia Global da Consciência de Acessibilidade, para o qual outras empresas de tecnologia como Apple e Tiktok também compartilharam novos recursos. Ele chega quente logo após o Android Show: E/S Edition, durante o qual o Google lançou as atualizações do Android 16 e Gemini. Na próxima semana, a gigante da busca sediará sua conferência de desenvolvedores de E/S, que provavelmente se concentrará fortemente nos recursos de IA.



Fonte

Artigos Relacionados

Botão Voltar ao Topo