$Fonte da imagem: Shutterstock$

Alibaba lançou modelos de linguagem matemática Qwen2-Math que são melhores que os análogos da OpenAI e do Google

PorFreshTabMega 13 de agosto de 2024

O Alibaba Group Holding continua a trabalhar ativamente na área de inteligência artificial. Esta semana, a gigante do comércio eletrônico lançou vários grandes modelos de linguagem (LLMs) sob o nome coletivo Qwen2-Math, que se concentram na resolução de problemas matemáticos complexos e, segundo os desenvolvedores, fazem isso melhor do que algoritmos de IA de outras empresas.

Fonte da imagem: Shutterstock

No total, foram apresentados três grandes modelos de linguagem, que se diferenciam na quantidade de parâmetros que afetam a precisão das respostas do algoritmo. O modelo com mais parâmetros, Qwen2-Math-72B-Instruct, segundo os desenvolvedores, é superior a muitos algoritmos de IA em termos de resolução de problemas matemáticos, incluindo GPT-4o da OpenAI, Claude 3.5 Sonnet da Anthropic, Gemini 1.5 Pro da Google e Llama-3.1 -405B das plataformas Meta✴.

“Durante o ano passado, fizemos muito trabalho explorando e expandindo as capacidades lógicas de grandes modelos de linguagem, com foco particular em sua capacidade de resolver problemas aritméticos e matemáticos.[…]Esperamos que o Qwen2-Math contribua com os esforços da comunidade para resolver problemas matemáticos complexos.”os desenvolvedores disseram em um comunicado.

Os modelos de linguagem do Qwen2-Math foram testados em relação a uma variedade de benchmarks, incluindo GSM8K (8.500 problemas matemáticos complexos e variados de nível de ensino médio), OlympiadBench (um benchmark científico multimodal bilíngue de alto nível) e Gaokao (um dos mais difíceis testes de nível universitário). vestibular de matemática). Nota-se que os novos modelos apresentam algumas limitações devido “Suporte apenas ao idioma inglês”. No futuro, os desenvolvedores planejam criar LLMs bilíngues e multilíngues.

Se você notar um erro, selecione-o com o mouse e pressione CTRL+ENTER.

Sem categoria

Hackers começaram a usar o Internet Explorer desativado para atacar o Windows 10 e 11

PorFreshTabMega 10 de julho de 202410 de julho de 2024

Publicidade Os hackers encontraram uma vulnerabilidade no Windows para atacar por meio do navegador Internet Explorer, há muito desatualizado e desativado, apesar das medidas de segurança da Microsoft. Para isso, são utilizados arquivos com rótulos .url e .hta. Se o usuário confirmar a abertura, o malware será baixado imediatamente para seu computador. Publicidade Fonte da…

Sem categoria

A chinesa Cixin lançou um análogo do Snapdragon X Elite – um processador Arm de 12 núcleos Cixin P1 para laptops AI

PorFreshTabMega 31 de julho de 2024

Publicidade A empresa chinesa Cixin Technology apresentou o processador Cixin P1 (CP8180) para laptops de consumo, equipado com um NPU com desempenho de IA de até 45 TOPS. De acordo com a ITHome, a Cixin levou 15 meses para desenvolver, quatro meses para se preparar para a produção e outros três para testar seu primeiro…

Sem categoria

A Oracle construirá um data center de IA de gigawatt alimentado por pequenos reatores modulares

PorFreshTabMega 10 de setembro de 2024

Publicidade As ações da Oracle subiram mais de 10% na terça-feira após a divulgação de seu relatório do primeiro trimestre fiscal de 2025, que terminou em 31 de agosto. A receita da empresa cresceu 7%, de US$ 12,5 bilhões um ano antes para US$ 13,3 bilhões, com a previsão de consenso dos analistas entrevistados. pela…

Dicas | Notícias | Tecnologia

Tribunal ouvirá caso de patente de alto-falante inteligente Sonos v Google na segunda-feira

PorFreshTabMega 5 de maio de 2023

Publicidade A Sonos e o Google entrarão em conflito na segunda-feira em um tribunal federal de San Francisco. O Google foi acusado de copiar a tecnologia de alto-falante inteligente patenteada da Sonos em seus dispositivos de áudio sem fio, como o Google Home e o Chromecast Audio. Publicidade Fonte da imagem: Google Publicidade O caso…

Sem categoria

A Intel está melhorando o XeSS, mas ainda carece de funcionalidade nativa de geração de quadros

PorFreshTabMega 21 de julho de 2024

Publicidade A Intel fez melhorias no XeSS ao lançar uma versão atualizada 1.3.1 do Intel XeSS SDK para sua tecnologia de dimensionamento de imagem. A atualização inclui correções de bugs e melhorias de estabilidade. No entanto, a tecnologia ainda carece de uma função própria de geração de quadros. Publicidade Fonte da imagem: Intel Publicidade De…

Sem categoria

O próximo Apple Watch será mais fino, terá tela maior e alguns de seus componentes serão impressos em 3D.

PorFreshTabMega 17 de junho de 2024

Publicidade A nova geração de relógios inteligentes Apple Watch terá um corpo mais fino e uma tela maior, escreve o analista renomado Ming-Chi Kuo em seu blog. O Apple Watch Series 10 deverá ser lançado em setembro, junto com o anúncio dos novos iPhones. Segundo Kuo, o tamanho da tela dos dois modelos do Apple…

Posts Similares

Deixe um comentário Cancelar resposta