Grandes modelos de linguagem de IA não conseguem contar as letras da palavra “morango” em inglês

PorFreshTabMega 27 de agosto de 2024

Apesar das capacidades impressionantes de grandes modelos de linguagem (LLMs), como GPT-4o e Claude, de escrever ensaios e resolver equações em segundos, eles ainda são imperfeitos. O exemplo mais recente, que se tornou um meme viral, demonstra que essas IAs aparentemente oniscientes não conseguem contar corretamente o número de letras “r” na palavra inglesa “morango”.

Fonte da imagem: Olga Kovalski/Unsplash

O problema está na arquitetura LLM, que é baseada em transformadores. Eles dividem o texto em tokens, que podem ser palavras completas, sílabas ou letras, dependendo do modelo. “Os LLMs são baseados nesta arquitetura Transformers, que essencialmente não lê texto. Quando você insere uma consulta, ela é convertida para a codificação” explica Matthew Guzdial, pesquisador de inteligência artificial e professor associado da Universidade de Alberta, em entrevista ao TechCrunch. Ou seja, quando o modelo vê o artigo “o”, ele tem apenas uma codificação do significado de “o”, mas não sabe nada sobre cada uma das três letras individualmente.

Os transformadores não podem processar e gerar texto real com eficiência. Em vez disso, o texto é convertido em representações numéricas, que são então contextualizadas para ajudar a IA a criar uma resposta lógica. Em outras palavras, a IA pode saber que os tokens “palha” e “baga” constituem “morango”, mas não entende a ordem das letras dessa palavra e não consegue contar quantas são. Se você perguntar ao GPT, “Quantas vezes a letra R aparece na palavra morango“, o bot responderá com “3”.

“É difícil determinar o que exatamente deveria contar como uma palavra para um modelo de linguagem, e mesmo se reuníssemos especialistas para chegar a um acordo sobre um dicionário ideal de tokens, os modelos provavelmente ainda achariam útil quebrar as palavras em pedaços ainda menores” explica Sheridan Feucht, estudante de pós-graduação da Northeastern University ( MassachussetsEUA), estudando a interpretabilidade do LLM. – Acho que não existe um tokenizador perfeito por causa dessa imprecisão” Feucht acredita que seria melhor permitir que os modelos analisassem personagens diretamente, sem impor tokenização, mas observa que isso simplesmente não é computacionalmente viável para Transformers no momento.

As coisas ficam ainda mais complicadas quando o LLM estuda vários idiomas. Por exemplo, alguns métodos de tokenização podem assumir que um espaço em uma frase sempre precede uma nova palavra, mas muitos idiomas, como chinês, japonês, tailandês, laosiano, coreano, khmer e outros, não usam espaços para separar palavras. A desenvolvedora do Google DeepMind, Yennie Jun, descobriu em um estudo de 2023 que alguns idiomas exigem 10 vezes mais tokens do que o inglês para transmitir o mesmo significado.

Enquanto circulam memes on-line sobre muitos modelos de IA que não conseguem soletrar ou contar corretamente o número de “r” na palavra inglesa morango, a OpenAI está trabalhando em um novo produto de IA com o codinome Strawberry, que deverá ser ainda mais hábil no raciocínio. e será capaz de resolver palavras cruzadas do The New York Times, que exigem pensamento criativo, bem como resolver equações matemáticas altamente complexas.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER.

Dicas | Notícias | Tecnologia

A previsão da Qualcomm não permite contar com uma recuperação precoce do mercado, o fornecimento de chips reduziu a receita em 17%

PorFreshTabMega 3 de maio de 20233 de maio de 2023

Publicidade Na véspera da Qualcomm Corporation informou sobre os resultados do último trimestre, e se seus resultados eram esperados para os investidores, a previsão para o trimestre atual os decepcionou. A administração da empresa disse não ver sinais de uma recuperação precoce no mercado, o que fez com que o preço das ações caísse 6,5%…

Sem categoria

Horseshoe On Line Casino Tunica Wikipedi

Por 25 de maio de 20236 de julho de 2024

Publicidade Horseshoe On Line Casino Tunica Wikipedia Bally’s To Endure Renovations, Become Horseshoe Las Vegas Casino Content Horseshoe Casino Tunica Horseshoe Las Vegas (2022–present) “horseshoe Las Vegas Company-histories Com Bally’s Officially Rebranding To Horseshoe Todas Las Vegas Bits & Bites: Baltimore Meets Montana Because Baltimore Chefs Head To Old Salt Festival World Number Of Poker…

Dicas | Notícias | Tecnologia

Os escritores do Portal 2 têm uma ideia ‘muito legal’ para o Portal 3, mas não é tão simples

PorFreshTabMega 2 de dezembro de 2022

Publicidade O roteirista dos jogos da Valve, incluindo as duas partes de Portal, Erik Wolpaw, em entrevista ao canal DidYouKnowGaming no YouTube, falou sobre uma possível continuação da cultuada série de quebra-cabeças de aventura. Publicidade Fonte da imagem: Válvula De acordo com Volpo, ele e o co-roteirista de Portal 2, Jay Pinkerton, “muito legal” uma…

Sem categoria

Funcionários da Amazon acusaram a empresa de distorcer seu verdadeiro desempenho ambiental

PorFreshTabMega 16 de julho de 2024

Publicidade A empresa está “deturpando a verdade” sobre quanto de seus data centers são realmente alimentados por energia renovável, disse um grupo de funcionários da Amazon. Isto contradiz um relatório recente do ESG que afirma que a gigante se tornou 100% renovável sete anos antes do planejado, de acordo com a Datacenter Dynamics. O grupo…

Sem categoria

Novo modelo OpenAI pode raciocinar melhor e até trapacear para atingir um objetivo

PorFreshTabMega 18 de setembro de 2024

Publicidade Um novo modelo OpenAI chamado o1, segundo pesquisa da Apollo, demonstra um comportamento incomum – a capacidade de gerar informações falsas e simular a execução de regras. Isso significa que o modelo, embora siga instruções externamente, pode na verdade ignorá-las e até mesmo enganá-las deliberadamente, a fim de atingir seus objetivos. Este aspecto preocupa…

Sem categoria

O próximo Apple Watch será mais fino, terá tela maior e alguns de seus componentes serão impressos em 3D.

PorFreshTabMega 17 de junho de 2024

Publicidade A nova geração de relógios inteligentes Apple Watch terá um corpo mais fino e uma tela maior, escreve o analista renomado Ming-Chi Kuo em seu blog. O Apple Watch Series 10 deverá ser lançado em setembro, junto com o anúncio dos novos iPhones. Segundo Kuo, o tamanho da tela dos dois modelos do Apple…

Posts Similares

Deixe um comentário Cancelar resposta