Fonte da imagem: Shutterstock

Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

Publicidade

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários grandes modelos de linguagem (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.


Publicidade

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

“Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos.[…]Esperamos que o Qwen2-Math contribua com os esforços da comunidade para resolver problemas matemáticos complexos.”os desenvolvedores disseram em um comunicado.

Publicidade

Os modelos de linguagem do Qwen2-Math foram testados em relação a uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Nota-se que os novos modelos apresentam algumas limitações devido “Suporte apenas ao idioma inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.





Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER.

Posts Similares

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *