7 min de leitura

ChatGPT-4o e Google Astra: em busca do sentido adulterado

“Quem desconfia fica sábio”, já dizia Guimarães Rosa

Cássio Pantaleoni
12 de julho de 2024
ChatGPT-4o e Google Astra: em busca do sentido adulterado
Este conteúdo pertence à editoria Tecnologia, IA e dados Ver mais conteúdos
Link copiado para a área de transferência!

O caso é que o tiro veio bem no meio da testa, entre os olhos de pisca-surpresa. Matou porque podia. Tinha a arma, o ódio, e o sujeitinho de frente, com dedo em riste. Podia sim. Nem mira precisava. Por que não?

“Está morto: podemos elogiá-lo à vontade”, escreveria Machado de Assis.

Este caricato episódio ilustra distorções éticas de nossa sociedade. Compreende aspectos complexos da natureza humana que influenciam o que decidimos fazer com uma arma em punho, com um clique de um mouse nas redes sociais ou com algoritmos de sistemas de inteligência artificial.

Não houvesse um sistema de valores morais, como imaginar que seríamos capazes de conter nosso “poder de poder”? Um mundo imoral é um mundo ameaçado, quiçá até sem sentido.

Esta é a lente com a qual acompanho a evolução da inteligência artificial (IA). Principalmente no que diz respeito ao exercício deste “poder de poder” que se aproveita das lacunas regulatórias que funcionariam como bastião dos interesses morais. Não quero dizer com isso, entretanto, que o desenvolvimento da IA seja de algum modo imoral. Porque de fato não é. Mas desconfio que certos entusiasmos atalham discussões morais.

Ao assistir às demonstrações da OpenAI e da Google das suas novas versões dos motores de IA generativa (o ChatGPT-4o e o Astra), ocorreu-me refletir acerca de pequenas distorções nas intenções de fundo que acompanham a jornada de evolução da inteligência artificial.

Se nos outorgamos o uso do “poder de poder”, é inevitável provocar rachaduras na estrutura ética e moral das diferentes culturas. Quando autorizados pela máxima do bem maior, não há nada que possa restringir nossa disposição de explorar o outro, conscientemente ou não.

O rally entre o ChatGPT-4o e o Astra, em que cada qual protagoniza a coreografia mais convincente das características multimodais da sua IA generativa, impressiona até mesmo a mais desinteressada audiência.

Os efeitos deste processamento combinado de linguagem natural, reconhecimento e sintetização da voz e reconhecimento de imagem contextual, suspende qualquer indiferença. Afinal, nos perguntamos, como é possível que tudo seja processado simultaneamente? Ora, temos o poder de poder. Não é maravilhoso?

A IA multimodal acontece pelo investimento de muitos bilhões de dólares. Não se trata de, enfim, conseguirmos interagir com as máquinas por voz e vídeo. Agora é possível proporcionar essa experiência com tempo de resposta de milissegundos. Uma IA que conversa com voz “descolada”, cheia de positividade, jovial, simulando convincentemente um humano.

Se você não aprecia este jeitão “maneiro” de conversar, basta alterar as configurações do seu “escravo digital”. Afinal, foi feito assim porque é possível ser feito!

Tanto o ChatGPT-4o como o Astra, em suas versões multimodais, apelam para casos de uso predominante orientados para indivíduos, consumidores ansiosos. Porém adotam vieses sutilmente distintos.

No caso da OpenAI tudo é apresentado como aquela boneca que fala, anda e sorri. A empresa de Sam Altman alude a usos “engraçadinhos”, como, por exemplo, pedir que a IA cante “parabéns a você” para um aniversariante ou que ela ria de suas piadas, que julgue sua aparência, que cante canções de ninar para as crianças, que reconheça a roupa que você está usando para uma entrevista e avalie se está adequada. Tudo pela bagatela de trilhões de dólares de investimento e um consumo insano de energia. Mas com a promessa de livre acesso. Afinal, esta é a melhor maneira de garantir que os modelos da IA sejam treinados continuamente.

Já o Google Astra se apresenta com uma roupagem levemente mais sóbria, tentando se ajustar ao protocolo da utilidade. Na prática, a demonstração alude a solicitações de identificação de objetos conhecidos ou à memorização do lugar onde você deixou seus óculos ou, ainda, à capacidade de sumarização de informação ou de identificação de locais com base no gigantesco banco de dados do Google Maps. Tudo por mais uma bagatela de alguns bilhões de dólares.

Mas precisamos ser justos. As duas IAs proporcionam tarefas realmente úteis, como a tradução simultânea, a intermediação de conversas ou modos humanamente desassistidos de ensino. No campo organizacional, o foco prevalente é o relacionamento com clientes. O que me soa paradoxal dado a finalidade última destes assistentes virtuais. Explico.

Quando cada pessoa carregar o seu smart device com AI Assistant embarcada (seu Personal Digital Slave – PDS), serão mesmo necessárias as centrais de atendimento operadas por AI Assistants interagindo com humanos? Não sei vocês, mas de minha parte acharia bastante útil pedir ao meu PSD que resolva o atraso na entrega do novo drone que adquiri hoje pela manhã. Ou seja, meu PSD pode ligar autonomamente para a central de atendimento onde um AI Representative, com uma “vozinha descolada” trataria de entender e resolver a solicitação.

Um momento! Para que eu preciso de linguagem humana simulada entre duas máquinas mesmo?

Mas há mais sobre o que se pensar. Como tais capacidades desta IA multimodal darão sentido às nossas vidas ou eliminarão as mazelas do mundo? O que isso significa para um mundo multicultural? Como isso altera o conceito de sociedade e, consequentemente, a sua estrutura? O que significa “ser” diante das possibilidades deste novo degrau tecnológico? Que tipo de ontologia o futuro nos reserva?

Não me julguem equivocadamente. Eu sou um entusiasta da IA. Na verdade, sou um evangelista das possiblidades de, por meio dela, trazer benefícios aos negócios, à economia e à sociedade. Creio profundamente que uma IA que possa desmascarar as intenções subliminares de sociopatas ou identificar negociatas que machucam um contingente significativo de almas humanas tem um valor inestimável. Uma IA que possa prever situações caóticas do clima ou riscos de patogenias é absolutamente extraordinária. Contudo, me incomoda esta ideia de interferir diretamente nos quesitos fundamentais que nos fazem humanos: o convívio, a linguagem e a colaboração.

Nossa espécie deixou as árvores para se aventurar nas savanas, aprendeu a caminhar ereto sobre os membros inferiores. Conquistamos o mundo, cooperando e cuidando de conceber uma cultura que permitiu superar não somente as dificuldades do presente, mas também as do futuro.

Subitamente, nossa brilhante capacidade de “fazer porque é possível fazer” nos oferece um novo caminho. Podemos enfim deixar as savanas edificadas e pavimentadas para ficar reclusos entre quatro paredes virtuais.

Temos a garantia de que a IA nos suprirá com todas as alucinações sensíveis capazes de eliciar nossos sentidos para sermos atendidos de modo personalizado, seguros e “quentinhos” o tempo todo. Ganhamos um “brinquedinho” com uma “vozinha” que faz graça.

Isso vale o investimento. Dados de 2021, veiculados pela PwC, informava que a receita total do mercado de mídia e entretenimento valia US$ 2,34 trilhões. É um investimento bem justificado. A hiperpersonalização e a contínua interação que a IA generativa proporciona, quando embarcada nos smart devices, apela muito mais às nossas necessidades de distração do que um livro, um seriado de streaming ou uma conversa no mundo físico. É possível se distrair continuamente sem a necessidade de se deslocar. Todo o resto pode ser operado pelo nosso PSD.

Para os investidores, este mercado é uma mina de ouro. Os consumidores pagarão o preço de ter o seu PSD, que promete livrá-los do tédio recalcitrante.

Estamos perto da realização daquele sonho de não estarmos nunca mais sozinhos ou fora de lugar. Temos uma IA que finge nos entender de maneira tão convincente, que nunca mais nos sentiremos uma pessoa decaída num mundo imperfeito. Podemos retocar o mundo como nos aprouver. Podemos até inventar a nossa própria linguagem e amar este ser que sempre é o que queremos que ele seja. O estágio da IA generativa a transformou em dispositivo teleológico. Afinal, quem precisa de outros humanos quando está suficientemente eliciado por estímulos que correspondem às nossas alucinações mais profundas?

A OpenAI e o Google provaram aos investidores que se pode fazer qualquer coisa com o capital adequado. E os donos do capital entenderam o quanto isso mudará a indústria de entretenimento.

Só não podemos esquecer que enquanto estamos entretidos, de fato não estamos fazendo nada. E a vida passa. Exceto para os que ganharam dinheiro o suficiente para comprar a imortalidade.

A mira vai bem no meio da testa. E depois que a moral morrer, poderemos elogiá-la à vontade.

Cássio Pantaleoni
Cássio Pantaleoni é managing director da Quality Digital e membro do conselho consultivo da ABRIA (Associação Brasileira de Inteligência Artificial). Tem mais de 30 anos de experiência no setor de tecnologia, é graduado e mestre em filosofia, e reúne experiências empreendedoras e executivas no currículo. Vencedor do prestigioso prêmio Jabuti, com a obra *Humanamente Digital: Inteligência Artificial centrada no Humano*.

Deixe um comentário

Você atualizou a sua lista de conteúdos favoritos. Ver conteúdos
aqui