Notícias

ChatGPT: o que é, como funciona e por que é revolucionário

14 de setembro de 2023385 views0

Você já imaginou conversar com um robô que entende e responde em linguagem natural, como se fosse uma pessoa? Essa é a proposta do ChatGPT, um sistema de linguagem artificial desenvolvido pela OpenAI, uma empresa de pesquisa em inteligência artificial cofundada por Elon Musk.

Esse sistema faz parte da família de modelos GPT, que são treinados com uma grande quantidade de dados de texto da internet, usando técnicas de aprendizagem profunda. O objetivo é gerar texto similar ao humano, baseado na entrada fornecida pelo usuário.

Com o ChatGPT, é possível realizar diversas tarefas relacionadas a texto, desde responder perguntas, dar informações, criar conteúdo criativo, até interagir de forma divertida e empática. O formato de diálogo permite que o sistema responda a perguntas de acompanhamento, admita seus erros, desafie premissas incorretas e rejeite pedidos inadequados.

Como surgiu o ChatGPT?

A OpenAI introduziu o ChatGPT em novembro de 2022, como um modelo irmão do InstructGPT, que é treinado para seguir uma instrução em um prompt e fornecer uma resposta detalhada. A ideia era obter o feedback dos usuários e aprender sobre os pontos fortes e fracos do modelo.

Para treinar o ChatGPT, foi usado Aprendizagem por Reforço a partir de Feedback Humano (RLHF), usando os mesmos métodos do InstructGPT, mas com pequenas diferenças na configuração da coleta de dados. Um modelo inicial foi treinado usando ajuste fino supervisionado: treinadores humanos forneceram conversas nas quais eles desempenharam ambos os lados – o usuário e um assistente de IA. Os treinadores tiveram acesso a sugestões escritas pelo modelo para ajudá-los a compor suas respostas. Esse novo conjunto de dados de diálogo foi misturado com o conjunto de dados do InstructGPT, que foi transformado em um formato de diálogo.

Para criar um modelo de recompensa para aprendizagem por reforço, foi necessário coletar dados de comparação, que consistiam em duas ou mais respostas do modelo classificadas por qualidade. Para coletar esses dados, foram usadas conversas que os treinadores de IA tiveram com o chatbot. Uma mensagem escrita pelo modelo foi selecionada aleatoriamente, várias conclusões alternativas foram amostradas e os treinadores de IA as classificaram. Usando esses modelos de recompensa, foi possível ajustar o modelo usando Otimização da Política Proximal. Várias iterações desse processo foram realizadas.

O modelo base do ChatGPT é um modelo da série GPT-3.5, que terminou o treinamento no início de 2022. O ChatGPT e o GPT-3.5 foram treinados em uma infraestrutura de supercomputação da Azure AI.

Quais são as limitações do ChatGPT?

Às vezes, o sistema escreve respostas plausíveis, mas incorretas ou sem sentido. Corrigir esse problema é desafiador, pois: (1) durante o treinamento por RL, não há atualmente uma fonte de verdade; (2) treinar o modelo para ser mais cauteloso faz com que ele recuse perguntas que pode responder corretamente; e (3) o treinamento supervisionado engana o modelo porque a resposta ideal depende do que o modelo sabe, em vez do que o demonstrador humano sabe.

Além disso, o sistema é sensível a ajustes na formulação da entrada ou tentar o mesmo prompt várias vezes. Por exemplo, dada uma forma de uma pergunta, o modelo pode afirmar que não sabe a resposta, mas dada uma pequena reformulação, pode responder corretamente.

Outro problema é que o sistema é frequentemente excessivamente verboso e usa demais certas frases, como reafirmar que é um modelo de linguagem treinado pela OpenAI. Esses problemas surgem de vieses nos dados de treinamento (treinadores preferem respostas mais longas que parecem mais abrangentes) e problemas bem conhecidos de sobre-otimização.

Por que o ChatGPT é revolucionário?

Esse sistema representa um avanço na capacidade dos sistemas de linguagem artificial de se comunicarem com os humanos de forma natural e inteligente. O ChatGPT pode ser usado para diversos fins, desde entretenimento, educação, pesquisa, até negócios.

Você pode acessar o sistema gratuitamente pelo site chat.openai.com, onde é possível experimentar o modelo em diferentes idiomas e modos. O aplicativo para iOS permite conversar com o modelo pelo celular. Além disso, o sistema tem plugins que permitem integrá-lo a outras plataformas, como WordPress, Discord, Slack, entre outras.

A inteligência artificial pode ser usada para criar experiências incríveis e enriquecedoras para os usuários, e o ChatGPT é um exemplo disso. O ChatGPT é um modelo em constante evolução, que aprende com o feedback humano e se adapta às necessidades e preferências dos usuários. O ChatGPT é um chatbot que não só responde, mas também conversa.