Anthropic lançou uma versão aprimorada do LLM para iniciantes

Créditos da imagem: antrópico

A Anthropic, startup de IA cofundada por ex-executivos da OpenAI, lançado Uma versão atualizada do modelo de geração de texto mais rápido e barato disponível por meio da API, Claude Instant.

A versão atualizada do Cloud Instant, Cloud Instant 1.2, incorpora os pontos fortes do modelo principal recentemente anunciado da Anthropic, Cloud 2, e mostra ganhos “significativos” em áreas como matemática, codificação, raciocínio e segurança, de acordo com a Anthropic. Em testes internos, o Claude Instant 1.2 obteve 58,7% no benchmark de codificação em comparação com o Claude Instant 1.1, que obteve 52,8%, e 86,7% em um conjunto de questões matemáticas contra 80,9% do Claude Instant 1.1.

“O Instant Cloud produz respostas mais longas e estruturadas e segue melhor as diretrizes de formatação”, escreveu a Anthropic em um post de blog. O Instant 1.2 também mostra melhorias na extração de citações, recursos multilíngues e resposta a perguntas.

O Cloud Instant 1.2 é menos propenso a alucinações e mais resistente a tentativas de jailbreak, afirma a Anthropic. No contexto de grandes modelos de linguagem como Claude, uma “alucinação” é onde um formulário gera texto incorreto ou sem sentido, enquanto um jailbreak é uma técnica que usa prompts digitados de forma inteligente para contornar os recursos de segurança colocados em modelos de linguagem grandes por seus criadores.

O Claude Instant 1.2 apresenta uma janela de contexto do mesmo tamanho que a do Claude 2 – 100.000 ícones. A janela de contexto indica qual texto o formulário considera antes de criar texto adicional, enquanto os tokens representam texto bruto (por exemplo, “cool” seria dividido nos tokens “fan”, “tas” e “tic”). Claude Instant 1.2 e Claude 2 podem analisar aproximadamente 75.000 palavras, aproximadamente o tamanho de “O Grande Gatsby”.

READ  Funcionários da PlayStation estão irritados com o e-mail do CEO sobre direitos ao aborto discutindo aniversários de gatos

Em geral, modelos com grandes janelas contextuais são menos propensos a “esquecer” o conteúdo de conversas recentes.

Como mencionado anteriormente, a ambição da Anthropic é criar um “algoritmo de autoaprendizagem de última geração para inteligência artificial”, conforme descrito em uma apresentação para investidores. Um algoritmo como esse pode ser usado para criar assistentes virtuais que podem responder a e-mails, fazer pesquisas, criar obras de arte, livros e muito mais – e já temos alguns deles com modelos como GPT-4 e outros grandes modelos de linguagem.

Mas o Cloud Instant não é esse algoritmo. Em vez disso, visa competir com ofertas de nível de entrada semelhantes da OpenAI, bem como startups como Cohere e AI21 Labs, que estão desenvolvendo e produzindo seus próprios sistemas de IA de geração de texto – e em alguns casos de geração de imagem.

Até o momento, a Anthropic, lançada em 2021 e liderada pelo ex-vice-presidente de pesquisa da OpenAI, Dario Amodi, arrecadou US$ 1,45 bilhão com uma avaliação de um dígito na casa dos bilhões. Embora isso possa parecer muito, é muito menos do que a empresa estima que precisará – US$ 5 bilhões nos próximos dois anos – para criar o chatbot idealizado.

A Anthropic afirma ter “milhares” de clientes e parceiros atualmente, incluindo Quora, que fornecem acesso a Claude e Claude Instant por meio de seu aplicativo Poe baseado em assinatura baseado em IA. Claude executa a ferramenta DuckAssist lançada recentemente pela DuckDuckGo, que responde diretamente às consultas de pesquisa direta dos usuários, juntamente com o ChatGPT da OpenAI. E no Notion, Claude faz parte da formação técnica do Notion AI, um assistente de redação de IA integrado ao espaço de trabalho do Notion.

READ  Próximo iPhone SE parece iPhone XR e iPhone 14 Pro para obter nova câmera Ultra HD



Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *