Google quer contar às pessoas a história de suas vidas usando IA
O projeto do Google, de codinome Ellmann, permitirá que os usuários obtenham “retrospectiva“em sua história de vida. A ideia é usar grandes modelos de linguagem como o Gemini para processar as consultas de pesquisa de um usuário, identificar padrões em suas fotos, criar um chatbot customizado e “respostas para perguntas anteriormente impossíveis“sobre a vida humana. A equipe também demonstrou “Bate-papo Elmann» com uma descrição promissora e assustadora: “Imagine abrir o ChatGPT e ele já sabe tudo sobre a sua vida.”
Fonte da imagem: Google
A equipe do Google propôs o uso de tecnologia de inteligência artificial para criar uma imagem “retrospectiva” da vida dos usuários usando dados de telefones celulares, como fotos e consultas de pesquisa. Não está claro se a empresa planeja trazer esses recursos para o Google Fotos ou para qualquer um de seus outros produtos.
O Projeto Ellmann, em homenagem ao biógrafo e crítico literário Richard David Ellmann, usa LLMs como o Gemini para processar resultados de pesquisa, identificar padrões nas fotos de um usuário, criar um chatbot e “responder a perguntas anteriormente impossíveis”. , diz uma cópia da apresentação do Google. O objetivo do projeto, conforme explicado na apresentação, é criar “Contador da história da sua vida“
O gerente de produto do Google Fotos apresentou o projeto Ellmann às equipes Gemini em uma recente cúpula interna. As equipes passaram vários meses determinando que grandes modelos de linguagem eram a tecnologia ideal para tornar realidade essa abordagem da história de vida retrospectiva.
Ellmann pode usar o contexto de uma biografia, fotos anteriores e subsequentes para descrever as fotos específicas de um usuário com mais profundidade do que “apenas pixels com rótulos e metadados“, diz a apresentação. Ele sugere medir uma série de coisas, como anos de universidade, anos morando em um determinado lugar e anos morando como pai.
“Não podemos responder a perguntas difíceis ou contar uma boa história sem alguns insights sobre sua vida no passado.”diz a descrição de uma foto de um menino brincando com um cachorro na lama.
“Nós examinamos suas fotos, estudamos suas tags e localização para determinar o momento significativo, – diz o slide da apresentação. “Quando olhamos para trás e entendemos sua vida em sua totalidade, sua história de vida fica clara.” A apresentação observa que grandes modelos de linguagem podem determinar eventos como o nascimento do filho de um usuário. “Este LLM pode usar o conhecimento das partes superiores da árvore para inferir que este é o nascimento de Jack e que ele é o primeiro e único filho de James e Gemma.”
“Uma das razões pelas quais o LLM é tão eficaz para esta abordagem de backcasting é que ele pode pegar o contexto não estruturado de diferentes ramos da árvore do modelo e usá-lo para melhorar a compreensão de outras áreas da árvore”, – explicado no slide, acompanhado de uma ilustração de diversas vidas “momentos» E “capítulos» da vida do usuário.
Além disso, a equipe do projeto descreveu a essência de Ellmann com a seguinte frase: “Imagine que você abre o ChatGPT e ele já sabe tudo sobre a sua vida. O que você perguntaria a ele? A seguir, a equipe mostrou um exemplo de chat em que um usuário pergunta: “Eu tenho um animal de estimação?” Ao que o chat responde que sim, o usuário tem um cachorro que usa capa de chuva vermelha, depois sugere o nome do cachorro e os nomes dos dois familiares com quem o animal passa mais tempo.
Ellmann também forneceu um resumo dos hábitos alimentares do usuário. “Você parece gostar de comida italiana. Tem algumas fotos de pratos de massa e também uma foto de pizza.” A postagem dizia ainda que o usuário parecia gostar da nova comida porque uma de suas fotos mostrava um cardápio com um prato não reconhecido. A tecnologia também determinou quais produtos o usuário planejava comprar, seus interesses, planos de trabalho e viagens com base nas capturas de tela do usuário, disse a apresentação. A tecnologia será capaz de reconhecer sites e aplicativos favoritos dos usuários, citando exemplos do Google Docs, Reddit e Instagram✴.
Um porta-voz do Google forneceu o seguinte comentário: “O Google Fotos sempre usou inteligência artificial para pesquisar fotos e vídeos, e estamos entusiasmados que os LLMs possam desbloquear recursos ainda mais poderosos. Esta foi uma pesquisa interna inicial e, como sempre, se decidirmos lançar novos recursos, dedicaremos o tempo necessário para garantir que sejam úteis para as pessoas e projetados tendo em mente a privacidade e a segurança do usuário, que é nossa principal prioridade.”
O projeto proposto por Ellmann poderia ajudar o Google na corrida armamentista entre gigantes da tecnologia para criar soluções mais personalizadas. “recordações” sobre a vida. O Google Fotos e o Apple Photos oferecem aos usuários experiências de “memórias” e criam álbuns com base nas tendências fotográficas há anos.
Em novembro, o Google anunciou que, usando inteligência artificial, o Google Fotos agora pode agrupar fotos semelhantes e organizar capturas de tela em álbuns fáceis de encontrar.
Grandes corporações de tecnologia como Google, Facebook✴ e Apple adicionaram controles ao longo do tempo para minimizar “recordações”mas os usuários relatam que às vezes eles ainda aparecem e exigem a alteração de algumas configurações para minimizar as “memórias ruins”.
Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER.