A OpenAI, empresa dona do ChatGPT, criou uma nova ferramenta chamada Operator. Lançada nos EUA em janeiro de 2025, a ferramenta chegou a mais países, incluindo o Brasil, nesta sexta-feira (21/02). Prometendo trabalhar de forma semiautônoma, o Operator ainda está em fase experimental. A OpenAI disponibilizou a ferramenta apenas para os usuários Pro do ChatGPT por US$ 200 mensais.
O Operator é um dos primeiros agentes, IAs capazes de realizar tarefas de forma independente. Você dá uma tarefa a ele, e ele a executa. Além disso, ele pode navegar na web por meio de seu próprio navegador para coletar dados para pesquisa ou concluir uma tarefa. De acordo com a OpenAI, o plano é expandir o acesso para usuários Plus, Team e Enterprise, além de integrar esses recursos ao ChatGPT no futuro.
A ideia do Operator é realizar tarefas complexas, que necessitam de muitos passos, a partir de um comando simples. Por exemplo, no site da OpenAI, o prompt “Encontre-me um hotel em Nova York de 1 a 7 de outubro. Não tenho preferência pelo tamanho do quarto” é dado. Em seguida, o agente navega pelo site, faz a busca, organiza os resultados, seleciona o melhor avaliado e realiza a reserva, como se fosse um humano. Também é possível criar tarefas salvas para fluxos de trabalho repetitivos, como gerar relatórios de desempenho, enviar lembretes de prazos, atualizar planilhas financeiras. É possível salvar tarefas diretamente da conversa clicando em ‘Salvar tarefa’ ou no menu Configurações. Essas tarefas salvas aparecem na sua página inicial, facilitando o início com um único clique.
Como funciona o Operator
A tecnologia chamada Computer-Using Agent (CUA) alimenta o operador. Combinando os recursos de visão do GPT-4o com raciocínio avançado por meio de aprendizado por reforço, o CUA é treinado para interagir com interfaces gráficas de usuário (GUIs). Dessa forma, ele lida com botões, menus e campos de texto que as pessoas veem em uma tela.
Com esta tecnologia, o operador “vê” as páginas por meio de capturas de tela e “interage” usando todas as ações que um mouse e teclado permitem com um navegador. Dessa forma, ele executa ações na web sem exigir integrações de API personalizadas.
Na prática, se encontrar algum problema, o Operator pede ajuda ao humano. Em algumas situações específicas, como fazer login, fornecer dados de cartão de crédito ou resolver CAPTCHAs, a intervenção humana é sempre necessária. Nesses casos, o próprio Operator devolve o controle ao usuário, garantindo uma experiência tranquila e colaborativa. Além disso, a OpenAI destaca que os usuários podem assumir o controle da navegação remota a qualquer momento.
Segurança e privacidade
A OpenAI prioriza a segurança do Operator, implementando três camadas de salvaguardas para evitar abusos. Além disso, essas medidas garantem que os usuários mantenham controle firme sobre suas ações.
Primeiro, o Operator assegura que a pessoa que o utiliza esteja sempre no controle e solicite informações em pontos críticos.
No Modo Takeover, o Operator pede ao usuário para assumir o controle ao inserir informações sensíveis no navegador, como credenciais de login ou informações de pagamento. Durante este modo, o Operator não coleta nem captura informações inseridas pelo usuário. Além disso, antes de finalizar qualquer ação significativa, como enviar um pedido ou um e-mail, o Operator solicita confirmações do usuário. O Operator é treinado para recusar certas tarefas confidenciais, como transações bancárias ou decisões de alto risco, como tomar uma decisão sobre uma candidatura a emprego, através das limitações da tarefa. Em sites particularmente sensíveis, como e-mail ou serviços financeiros, o Operator exige supervisão rigorosa de suas ações, permitindo que os usuários identifiquem diretamente quaisquer erros potenciais no Modo de Observação.
Em seguida, o gerenciamento da privacidade de dados é facilitado.
O usuário pode desativar o treinamento ao desativar ‘Melhorar o modelo para todos’ nas configurações do ChatGPT, isso garante que os dados no Operator não sejam usados para treinar os modelos. Além disso, o gerenciamento transparente de dados permite que os usuários excluam todos os dados de navegação e saiam de todos os sites com um clique na seção Privacidade das configurações do Operator. Também é possível excluir conversas antigas com um clique.
Por fim, a OpenAi criou defesas contra sites adversários que podem tentar enganar o Operator por meio de avisos ocultos, códigos maliciosos ou tentativas de phishing.
Eles projetaram a navegação cautelosa para detectar e ignorar injeções rápidas. Além disso, um modelo de monitoramento dedicado observa comportamentos suspeitos e pode pausar a tarefa se algo parecer estranho. O pipeline de detecção inclui processos de revisão automatizados e humanos que identificam continuamente novas ameaças e atualizam rapidamente as proteções.
Considerando a possibilidade de mau uso por atores mal-intencionados, o Operator foi projetador para recusar solicitações prejudiciais e bloquear conteúdo não permitido. Além disso, sistemas de moderação podem emitir avisos ou revogar o acesso por violações repetidas. Processos de revisão adicionais detectam e abordam o uso indevido, garantindo uma camada extra de segurança.
Sabemos que nenhum sistema é perfeito, especialmente em uma fase de prévia. No entanto, mesmo com essas salvaguardas em vigor, o compromisso é com a melhoria contínua, utilizando de feedback do mundo real e realizando testes rigorosos para aprimorar constantemente o Operator.