Essa pode ser a melhor solução para a sua empresa
Dados são o combustível essencial para analytics e machine learning nas organizações, mas, entre desafios de privacidade e problemas de processo, nem sempre é fácil para os pesquisadores conseguirem o que precisam. Um novo caminho promissor a ser explorado é o dos dados sintéticos, que podem ser compartilhados e usados de maneiras que os dados do mundo real não podem. No entanto, essa abordagem oferece riscos, e é essencial que as organizações explorem cuidadosamente onde e como investem seus recursos.
O que são dados sintéticos? São dados gerados artificialmente por um algoritmo de inteligência artificial (IA) que foi treinado em um conjunto de dados reais. Têm o mesmo poder preditivo dos dados originais, mas os substituem em vez de anonimizá-los ou modificá-los. O objetivo é reproduzir as propriedades estatísticas e os padrões de um conjunto de dados existente, modelando sua distribuição de probabilidade e fazendo uma amostragem. O algoritmo cria novos dados que possuem as mesmas características dos dados originais – levando às mesmas respostas. No entanto, é praticamente impossível resgatar os dados originais (incluindo os mais pessoais) no algoritmo ou nos dados sintéticos que ele criou.