Stability AI anuncia novo modelo de linguagem grande de código aberto

A Stability AI, a empresa por trás do gerador de imagem Stable Diffusion alimentado por IA, lançou um conjunto de modelos de linguagem grande (LLMs) de código aberto chamados coletivamente de StableLM. Em um post compartilhado na quarta-feira, a empresa anunciou que seus modelos já estão disponíveis para os desenvolvedores usarem e adaptarem no GitHub.

Como seu rival ChatGPT, o StableLM foi projetado para gerar texto e código com eficiência. Ele é treinado em uma versão maior do conjunto de dados de código aberto conhecido como Pile, que abrange informações de várias fontes, incluindo Wikipedia, Stack Exchange e PubMed. A Stability AI diz que os modelos StableLM estão atualmente disponíveis entre 3 bilhões e 7 bilhões de parâmetros, com 15 a 65 bilhões de modelos de parâmetros chegando depois.

a:hover]:text-gray-63 [&>a:hover]:shadow-underline-black dark:[&>a:hover]:text-gray-bd dark:[&>a:hover]:shadow-underline-gray [&>a]:shadow-underline-gray-63 dark:[&>a]:text-gray-bd dark:[&>a]:shadow-underline-gray”>Imagem: Estabilidade AI

Enquanto o StableLM expande os modelos de linguagem de código aberto nos quais o Stability AI já trabalhou em colaboração com a organização sem fins lucrativos EleutherAI, ele também se baseia em sua missão de tornar as ferramentas de IA mais acessíveis, como fez com o Stable Diffusion. A empresa disponibilizou sua IA de texto para imagem de várias maneiras, incluindo uma demonstração pública, um software beta e um download completo do modelo, permitindo que os desenvolvedores brinquem com a ferramenta e criem várias integrações.

Podemos até ver o mesmo acontecer com o StableLM, junto com o modelo de linguagem LLaMa de código aberto da Meta que vazou online no mês passado. Conforme apontado por meu colega James Vincent, o lançamento do Stable Diffusion levou “a mais coisas boas e mais coisas ruins acontecendo” e “provavelmente veremos uma dinâmica semelhante se desenrolar mais uma vez com a geração de texto de IA: mais coisas, mais vezes”.

a:hover]:text-gray-63 [&>a:hover]:shadow-underline-black dark:[&>a:hover]:text-gray-bd dark:[&>a:hover]:shadow-underline-gray [&>a]:shadow-underline-gray-63 dark:[&>a]:text-gray-bd dark:[&>a]:shadow-underline-gray”>Captura de tela: Emma Roth / The Verge

Você pode experimentar uma demonstração do modelo de bate-papo aprimorado do StableLM hospedado no Hugging Face, que me deu uma receita muito complexa e um tanto sem sentido quando tentei perguntar como fazer um sanduíche de manteiga de amendoim. Também sugeriu que eu adicionasse um “desenho engraçado” a um cartão de condolências. A Stability AI adverte que, embora os conjuntos de dados usados ​​devam ajudar a “orientar os modelos de linguagem base para distribuições de texto ‘mais seguras’, nem todos os vieses e toxicidade podem ser mitigados por meio de ajustes finos”.




https://www.jobclas.com/stability-ai-anuncia-novo-modelo-de-linguagem-grande-de-codigo-aberto.html
Share on Google Plus

Sobre Anônimo

Esta é uma breve descrição no blog sobre o autor. Editá-lo, No html e procurar esse texto
    Blogger Comment
    Facebook Comment

0 comentários:

Postar um comentário

Postagem mais recente Postagem mais antiga Página inicial