Inteligência Artificial encara questionário, trava, mas revela marcas “que lhe vem à cabeça”

Alessandro Janoni é diretor de pesquisas e tendências na Imagem Corporativa 01 de setembro de 2023
IC

Robô que aplica questionário não é novidade. O papel importante de mediação técnica do pesquisador, em boa parte dos casos, cedeu à tecnologia já há algum tempo. Mas e os entrevistados? Qual o desempenho de um sistema de inteligência artificial ao responder perguntas formuladas para abordagem de alguém de carne, osso e… alma?

Sem pretensão científica ou controle amostral, apenas como teste de linguagem, a Imagem Corporativa aplicou no ChatGPT um questionário de Top of Mind, com 70 categorias da pesquisa Datafolha de 2022. Calibrado para a língua portuguesa, seria razoável supor que à pergunta “Qual é a primeira marca que lhe vem à cabeça quando se fala em banco?”, o sistema retornasse a clássica “Como inteligência artificial, não tenho experiência pessoal ou opiniões, então não tenho uma marca específica que me vem à mente em primeiro lugar.”

Mas não é o que acontece – na rápida resposta já aparece Banco do Brasil, marca também mais citada pelos brasileiros no levantamento tradicional. E a tendência se repete na maioria dos segmentos – em 67% deles, de “aparelho de TV” à “panela”, a menção do sistema coincide com as mais citadas pela população em uma única consulta. Em uma segunda tentativa, ao se aprimorar a pergunta, remetendo-a ao Brasil, a taxa vai a 78%.

Os setores onde há, logo de início, maior intersecção (superior a 75%) são finanças (banco incluído), bebidas, compras (de “supermercado” à “faca de churrasco”), transporte (“carro”, “moto” etc.), higiene e beleza. O desempenho fica abaixo da média especialmente nas categorias reunidas em eletrodomésticos, turismo e comunicação (igual ou inferior a 50%).

Vinculando-se a pergunta ao país, a grande maioria das marcas coincide (78%). Apenas as que pertencem ao ramo de turismo mantêm baixa correlação.  Quando se faz a mesma comparação com as líderes da pesquisa de 2021, o resultado segue a tendência.

Óbvio que, mesmo sem citar o termo técnico na pergunta – Top of Mind – o sistema se alimenta do histórico de um levantamento longevo e que repercute em diferentes plataformas. Talvez por isso, tenha travado algumas vezes na busca por informações, e em três ocasiões as consultas foram interrompidas por tempo excedido.

Vale a observação – apesar da base defasada (o rastreamento da máquina vai até setembro de 2021, ou seja, não contempla a divulgação daquele ano, em outubro), ele arrisca e crava marcas de categorias que nunca tinham sido pesquisadas, como “comércio atacadista” e “sandália”, enquanto insiste em citar nomes diferentes das que são líderes há anos nas tradicionais “companhia aérea” e “geladeira”.

Com esse resultado, difícil não cair na tentação de aplicar no robô a técnica da “primeira lembrança” para outras categorias de consumo ou para temas aleatórios. Por exemplo, à pergunta “Qual é o primeiro líder mundial que lhe vem à cabeça?”, a resposta foi:

“O primeiro líder mundial que me vem à cabeça é o presidente dos Estados Unidos, Joe Biden. Biden assumiu o cargo em janeiro de 2021 … e a resposta é baseada no conhecimento disponível até meus dados de corte em setembro de 2021…”

Quando a pergunta se refere ao primeiro líder brasileiro que vem à cabeça, Jair Bolsonaro ainda ocupava o cargo de presidente na data de corte do ChatGPT, mas a resposta foi: “O primeiro líder brasileiro que me vem à cabeça é o ex-presidente Luiz Inácio Lula da Silva, mais conhecido como “Lula”. Ele foi presidente do Brasil de 2003 a 2010 e é uma figura política proeminente no país…”

Outra menção interessante ocorre quando se pergunta a primeira marca de inteligência artificial que lhe vem à cabeça – o sistema não se mostra cabotino e responde: “IBM Watson”.

Claro que não necessariamente o ChatGPT fornecerá sempre a mesma resposta para uma pergunta idêntica de Top of Mind (o que, aliás o torna assustadoramente humano). Em algumas categorias, como “molho de tomate” por exemplo, com poucas tentativas há variabilidade. Mas antes que alguém programe robôs para 2000 consultas no sistema, fica o alerta – o repertório da máquina se retroalimenta e, pelo menos por enquanto, robôs não usam “sandália” ou consomem “iogurte grego”. Esse tipo aí, nem de “óleo lubrificante” carece.

O que procura?