Fonte da imagem: Google
| |

Google quer contar às pessoas a história de suas vidas usando IA

Publicidade

O projeto do Google, de codinome Ellmann, permitirá que os usuários obtenham “retrospectiva“em sua história de vida. A ideia é usar grandes modelos de linguagem como o Gemini para processar as consultas de pesquisa de um usuário, identificar padrões em suas fotos, criar um chatbot customizado e “respostas para perguntas anteriormente impossíveis“sobre a vida humana. A equipe também demonstrou Bate-papo Elmann» com uma descrição promissora e assustadora: “Imagine abrir o ChatGPT e ele já sabe tudo sobre a sua vida.”


Publicidade

Fonte da imagem: Google

A equipe do Google propôs o uso de tecnologia de inteligência artificial para criar uma imagem “retrospectiva” da vida dos usuários usando dados de telefones celulares, como fotos e consultas de pesquisa. Não está claro se a empresa planeja trazer esses recursos para o Google Fotos ou para qualquer um de seus outros produtos.

O Projeto Ellmann, em homenagem ao biógrafo e crítico literário Richard David Ellmann, usa LLMs como o Gemini para processar resultados de pesquisa, identificar padrões nas fotos de um usuário, criar um chatbot e “responder a perguntas anteriormente impossíveis”. , diz uma cópia da apresentação do Google. O objetivo do projeto, conforme explicado na apresentação, é criar “Contador da história da sua vida

Publicidade

O gerente de produto do Google Fotos apresentou o projeto Ellmann às equipes Gemini em uma recente cúpula interna. As equipes passaram vários meses determinando que grandes modelos de linguagem eram a tecnologia ideal para tornar realidade essa abordagem da história de vida retrospectiva.

Ellmann pode usar o contexto de uma biografia, fotos anteriores e subsequentes para descrever as fotos específicas de um usuário com mais profundidade do que “apenas pixels com rótulos e metadados“, diz a apresentação. Ele sugere medir uma série de coisas, como anos de universidade, anos morando em um determinado lugar e anos morando como pai.

“Não podemos responder a perguntas difíceis ou contar uma boa história sem alguns insights sobre sua vida no passado.”diz a descrição de uma foto de um menino brincando com um cachorro na lama.

“Nós examinamos suas fotos, estudamos suas tags e localização para determinar o momento significativo, – diz o slide da apresentação. “Quando olhamos para trás e entendemos sua vida em sua totalidade, sua história de vida fica clara.” A apresentação observa que grandes modelos de linguagem podem determinar eventos como o nascimento do filho de um usuário. “Este LLM pode usar o conhecimento das partes superiores da árvore para inferir que este é o nascimento de Jack e que ele é o primeiro e único filho de James e Gemma.”

“Uma das razões pelas quais o LLM é tão eficaz para esta abordagem de backcasting é que ele pode pegar o contexto não estruturado de diferentes ramos da árvore do modelo e usá-lo para melhorar a compreensão de outras áreas da árvore”, – explicado no slide, acompanhado de uma ilustração de diversas vidas momentos» E capítulos» da vida do usuário.

Além disso, a equipe do projeto descreveu a essência de Ellmann com a seguinte frase: “Imagine que você abre o ChatGPT e ele já sabe tudo sobre a sua vida. O que você perguntaria a ele? A seguir, a equipe mostrou um exemplo de chat em que um usuário pergunta: “Eu tenho um animal de estimação?” Ao que o chat responde que sim, o usuário tem um cachorro que usa capa de chuva vermelha, depois sugere o nome do cachorro e os nomes dos dois familiares com quem o animal passa mais tempo.

Ellmann também forneceu um resumo dos hábitos alimentares do usuário. “Você parece gostar de comida italiana. Tem algumas fotos de pratos de massa e também uma foto de pizza.” A postagem dizia ainda que o usuário parecia gostar da nova comida porque uma de suas fotos mostrava um cardápio com um prato não reconhecido. A tecnologia também determinou quais produtos o usuário planejava comprar, seus interesses, planos de trabalho e viagens com base nas capturas de tela do usuário, disse a apresentação. A tecnologia será capaz de reconhecer sites e aplicativos favoritos dos usuários, citando exemplos do Google Docs, Reddit e Instagram✴.

Um porta-voz do Google forneceu o seguinte comentário: “O Google Fotos sempre usou inteligência artificial para pesquisar fotos e vídeos, e estamos entusiasmados que os LLMs possam desbloquear recursos ainda mais poderosos. Esta foi uma pesquisa interna inicial e, como sempre, se decidirmos lançar novos recursos, dedicaremos o tempo necessário para garantir que sejam úteis para as pessoas e projetados tendo em mente a privacidade e a segurança do usuário, que é nossa principal prioridade.”

O projeto proposto por Ellmann poderia ajudar o Google na corrida armamentista entre gigantes da tecnologia para criar soluções mais personalizadas. “recordações” sobre a vida. O Google Fotos e o Apple Photos oferecem aos usuários experiências de “memórias” e criam álbuns com base nas tendências fotográficas há anos.

Em novembro, o Google anunciou que, usando inteligência artificial, o Google Fotos agora pode agrupar fotos semelhantes e organizar capturas de tela em álbuns fáceis de encontrar.

Grandes corporações de tecnologia como Google, Facebook✴ e Apple adicionaram controles ao longo do tempo para minimizar “recordações”mas os usuários relatam que às vezes eles ainda aparecem e exigem a alteração de algumas configurações para minimizar as “memórias ruins”.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER.

Posts Similares

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *