Anthropic lançou uma versão aprimorada do LLM para iniciantes

Créditos da imagem: antrópico

A Anthropic, startup de IA cofundada por ex-executivos da OpenAI, lançado Uma versão atualizada do modelo de geração de texto mais rápido e barato disponível por meio da API, Claude Instant.

A versão atualizada do Cloud Instant, Cloud Instant 1.2, incorpora os pontos fortes do modelo principal recentemente anunciado da Anthropic, Cloud 2, e mostra ganhos “significativos” em áreas como matemática, codificação, raciocínio e segurança, de acordo com a Anthropic. Em testes internos, o Claude Instant 1.2 obteve 58,7% no benchmark de codificação em comparação com o Claude Instant 1.1, que obteve 52,8%, e 86,7% em um conjunto de questões matemáticas contra 80,9% do Claude Instant 1.1.

“O Instant Cloud produz respostas mais longas e estruturadas e segue melhor as diretrizes de formatação”, escreveu a Anthropic em um post de blog. O Instant 1.2 também mostra melhorias na extração de citações, recursos multilíngues e resposta a perguntas.

O Cloud Instant 1.2 é menos propenso a alucinações e mais resistente a tentativas de jailbreak, afirma a Anthropic. No contexto de grandes modelos de linguagem como Claude, uma “alucinação” é onde um formulário gera texto incorreto ou sem sentido, enquanto um jailbreak é uma técnica que usa prompts digitados de forma inteligente para contornar os recursos de segurança colocados em modelos de linguagem grandes por seus criadores.

O Claude Instant 1.2 apresenta uma janela de contexto do mesmo tamanho que a do Claude 2 – 100.000 ícones. A janela de contexto indica qual texto o formulário considera antes de criar texto adicional, enquanto os tokens representam texto bruto (por exemplo, “cool” seria dividido nos tokens “fan”, “tas” e “tic”). Claude Instant 1.2 e Claude 2 podem analisar aproximadamente 75.000 palavras, aproximadamente o tamanho de “O Grande Gatsby”.

READ O Tesla Model S Plaid Track Package prova-se a 200 mph

Em geral, modelos com grandes janelas contextuais são menos propensos a “esquecer” o conteúdo de conversas recentes.

Como mencionado anteriormente, a ambição da Anthropic é criar um “algoritmo de autoaprendizagem de última geração para inteligência artificial”, conforme descrito em uma apresentação para investidores. Um algoritmo como esse pode ser usado para criar assistentes virtuais que podem responder a e-mails, fazer pesquisas, criar obras de arte, livros e muito mais – e já temos alguns deles com modelos como GPT-4 e outros grandes modelos de linguagem.

Mas o Cloud Instant não é esse algoritmo. Em vez disso, visa competir com ofertas de nível de entrada semelhantes da OpenAI, bem como startups como Cohere e AI21 Labs, que estão desenvolvendo e produzindo seus próprios sistemas de IA de geração de texto – e em alguns casos de geração de imagem.

Até o momento, a Anthropic, lançada em 2021 e liderada pelo ex-vice-presidente de pesquisa da OpenAI, Dario Amodi, arrecadou US$ 1,45 bilhão com uma avaliação de um dígito na casa dos bilhões. Embora isso possa parecer muito, é muito menos do que a empresa estima que precisará – US$ 5 bilhões nos próximos dois anos – para criar o chatbot idealizado.

Benedicto Cabral

“Entrepreneur. Professional music nerd. Beer evangelist. Avid tv aficionado. Social mediaholic.”

bps.pt

Anthropic lançou uma versão aprimorada do LLM para iniciantes

Deixe um comentário Cancelar resposta

Os Patriots escolheram Jacoby Brissett como quarterback titular em vez de Drake May

Black Myth: a atualização 1.0.8.14860 do Wukong inclui algumas correções importantes e enfraquece um chefe em particular

Japão: Tufão Shanshan: Milhões de pessoas são instruídas a evacuar depois que um dos tufões mais fortes em décadas atinge o Japão

Kamala Harris dá primeira entrevista importante como indicada em grande teste de autenticidade | Eleições dos EUA 2024