O ChatGPT iniciou um novo tipo de corrida de IA - e tornou as caixas de texto legais novamente

É bastante óbvio que ninguém viu o ChatGPT chegando. Nem mesmo OpenAI. Antes de se tornar, segundo algumas medidas, o aplicativo de consumidor que mais cresce na história, antes de transformar a frase “transformadores generativos pré-treinados” em vernáculo comum, antes de todas as empresas que você pode imaginar correrem para adotar seu modelo subjacente, o ChatGPT foi lançado em novembro como uma “visualização da pesquisa”.

A postagem do blog anunciando o ChatGPT agora é um estudo de caso hilário sobre vendas abaixo do esperado. “O ChatGPT é um modelo irmão do InstructGPT, que é treinado para seguir uma instrução em um prompt e fornecer uma resposta detalhada. Estamos entusiasmados em apresentar o ChatGPT para obter feedback dos usuários e aprender sobre seus pontos fortes e fracos.” É isso! Esse é o lance todo! Nada de ser poético sobre mudar fundamentalmente a natureza de nossas interações com a tecnologia, nem mesmo, tipo, uma linha sobre como isso é legal. Foi apenas uma prévia da pesquisa.

Mas agora, apenas quatro meses depois, parece que o ChatGPT realmente vai mudar a forma como pensamos sobre tecnologia. Ou, talvez com mais precisão, mude de volta. Porque do jeito que estamos indo, o futuro da tecnologia não é interfaces geniais ou o metaverso. É “digitar comandos em uma caixa de texto em seu computador”. A linha de comando está de volta – é muito mais inteligente agora.

Realmente, a IA generativa está indo em duas direções simultâneas. O primeiro é muito mais infraestrutural, adicionando novas ferramentas e recursos ao que você já usa. Grandes modelos de linguagem como GPT-4 e LaMDA do Google irão ajudá-lo a escrever e-mails e memorandos; eles vão enfeitar automaticamente seus conjuntos de slides e corrigir quaisquer erros em suas planilhas; eles vão editar suas fotos melhor do que você; eles irão ajudá-lo a escrever o código e, em muitos casos, apenas farão isso por você.

Esse é mais ou menos o caminho que a IA segue há anos, certo? O Google vem integrando todos os tipos de IA em seus produtos nos últimos anos, e até mesmo empresas como a Salesforce construíram fortes projetos de pesquisa em IA. Esses modelos são caros para criar, caros para treinar, caros para consultar e potencialmente revolucionários para a produtividade corporativa. Os aprimoramentos de IA em produtos que você já usa são um grande negócio – ou, pelo menos, estão sendo investidos como um – e serão por muito tempo.

A outra direção da IA, aquela em que a interação com a IA se torna um produto de consumo, foi um desenvolvimento muito menos óbvio. Faz sentido agora, é claro: quem não quer falar com um robô que sabe tudo sobre filmes e receitas e o que fazer em Tóquio, e se eu disser que as coisas certas podem sair totalmente dos trilhos e tentar ficar com você? Mas antes que o ChatGPT tomasse o mundo como uma tempestade, e antes que Bing e Bard pegassem a ideia e tentassem construir seus próprios produtos a partir dela, eu certamente não teria apostado que digitar em uma janela de bate-papo seria a próxima grande novidade em interfaces.

De certa forma, este é um retorno a uma ideia muito antiga

De certa forma, este é um retorno a uma ideia muito antiga. Por muitos anos, a maioria dos usuários apenas interagia com computadores digitando em uma tela em branco – a linha de comando era como você dizia à máquina o que fazer. (Sim, ChatGPT é um muito de máquinas, e elas não estão na sua mesa, mas dá para ter uma ideia.)

Mas aí aconteceu uma coisa engraçada: inventamos interfaces melhores! O problema com a linha de comando era que você precisava saber exatamente o que digitar e em que ordem fazer o computador se comportar. Apontar e clicar em ícones grandes era muito mais simples, além de ser muito mais fácil ensinar às pessoas o que o computador podia fazer por meio de imagens e ícones. A linha de comando deu lugar à interface gráfica do usuário e a GUI ainda reina suprema.

Os desenvolvedores nunca pararam de tentar fazer a interface do usuário do chat funcionar. O WhatsApp é um bom exemplo: a empresa passou anos tentando descobrir como os usuários podem usar o chat para interagir com as empresas. O Allo, um dos muitos aplicativos de mensagens com falha do Google, esperava que você pudesse interagir com um assistente de IA em bate-papos com seus amigos. A primeira rodada de hype do chatbot, por volta de 2016, fez com que muitas pessoas muito inteligentes pensassem que os aplicativos de mensagens eram o futuro de tudo.

Há algo de atraente na interface de mensagens, a “IA de conversação”. Começa com o fato de que todos sabemos como usá-lo; aplicativos de mensagens são como mantemos contato com as pessoas de quem mais gostamos, o que significa que eles são um lugar onde gastamos muito tempo e energia. Você pode não saber como navegar pelos recessos do aplicativo Uber ou como encontrar seu número de passageiro frequente no aplicativo Southwest, mas “envie essas palavras para este número” é um comportamento que quase todo mundo entende. Em um mercado onde as pessoas não querem baixar aplicativos e sites móveis ainda são péssimos, as mensagens podem simplificar bastante as experiências.

a:hover]:text-gray-63 [&>a:hover]:shadow-underline-black dark:[&>a:hover]:text-gray-bd dark:[&>a:hover]:shadow-underline-gray [&>a]:shadow-underline-gray-63 dark:[&>a]:text-gray-bd dark:[&>a]:shadow-underline-gray”>Imagem: Microsoft

Além disso, embora as mensagens não sejam a interface mais avançada, ela pode ser a mais expansível. Veja o Slack, por exemplo: você provavelmente pensa nele como um aplicativo de bate-papo, mas nessa interface de vaivém você pode incorporar links, documentos editáveis, enquetes interativas, bots informativos e muito mais. O WeChat é notoriamente uma plataforma inteira – basicamente uma internet inteira – compactada em um aplicativo de mensagens. Você pode começar com mensagens e ir a muitos lugares.

Mas muitas dessas ferramentas tropeçam da mesma maneira. Para trocas rápidas de informações, como horário comercial, o bate-papo é perfeito — faça uma pergunta, obtenha uma resposta. Mas navegar em um catálogo como uma série de mensagens? Não, obrigado. Comprar uma passagem de avião com mil mensagens de ida e volta? Passe difícil. Não é diferente dos assistentes de voz, e que Deus o ajude se você já tentou comprar coisas simples com o Alexa. (“Para Charmin, diga ‘três.’”) Para as coisas mais complicadas, uma IU visual e dedicada é muito melhor do que uma janela de mensagens.

E quando se trata de ChatGPT, Bard, Bing e outros, as coisas se complicam muito rápido. Esses modelos são inteligentes e colaborativos, mas você ainda precisa saber exatamente o que pedir, de que maneira e em que ordem para obter o que deseja. A ideia de um “engenheiro de prompt”, a pessoa que você paga para saber exatamente como obter a imagem perfeita do Stable Diffusion ou fazer com que o ChatGPT gere apenas o Javascript certo, parece ridícula, mas na verdade é uma parte totalmente necessária da equação. Não é diferente do início da era do computador, quando apenas algumas pessoas sabiam como dizer ao computador o que fazer. Já existem mercados nos quais você pode comprar e vender ótimos prompts; existem gurus do prompt e livros sobre prompts; Presumo que Stanford já esteja trabalhando em uma especialização em Engenharia Prompt que todos farão em breve.

O notável sobre a IA generativa é que parece que ela pode fazer quase tudo. Esse também é o problema. Quando você pode fazer qualquer coisa, o que você faz? Por onde você começa? Como você aprende a usá-lo quando sua única janela para suas possibilidades é um cursor piscando? Eventualmente, essas empresas podem desenvolver ferramentas mais visuais e interativas que ajudem as pessoas a realmente entender o que podem fazer e como tudo funciona. (Esta é uma razão para ficar de olho no novo sistema de plug-ins do ChatGPT, que é bastante simples por enquanto, mas pode expandir rapidamente as coisas que você pode fazer na janela de bate-papo.) No momento, a melhor ideia que qualquer um deles tem é oferecer algumas sugestões sobre coisas que você pode digitar.

IA seria um recurso. Agora é o produto. E isso significa que a caixa de texto está de volta. Mensagens é a interface, novamente.




https://www.jobclas.com/o-chatgpt-iniciou-um-novo-tipo-de-corrida-de-ia-e-tornou-as-caixas-de-texto-legais-novamente.html
Share on Google Plus

Sobre Anônimo

Esta é uma breve descrição no blog sobre o autor. Editá-lo, No html e procurar esse texto
    Blogger Comment
    Facebook Comment

0 comentários:

Postar um comentário

Postagem mais recente Postagem mais antiga Página inicial