Home > Acontece > Acontece no Mercado > Big data: milhões de trilhões de bytes

Big data: milhões de trilhões de bytes

Avalanche de dados e informações virá numa escala gigantesca

por Udo Simons

Estamos prestes a viver uma “avalanche” inédita de dados e informação no planeta. Ela virá numa escala tão absurdamente grande que sequer temos, hoje, capacidade de quantificar o seu tamanho. “Será um volume descomunal. Não teremos como guardar todos os dados coletados”, prevê o astrofísico, Márcio Maia, vice-coordenador do LIneA, Laboratório Interinstitucional ligado ao Ministério da Ciência, Tecnologia e Informação (MCTI).

Ele se refere a um dos mais ambiciosos projetos de astronomia da atualidade. Em 2020, entrará em funcionamento o Large Synoptic Survey Telescope (LSST), concebido por universidades norte-americanas, com participação de instituições francesas e japonesas. “O Brasil ainda não faz parte desse consórcio, mas queremos entrar”, diz Maia.

Três bilhões de pixels
Com 8,4 metros, e localizado numa área montanhosa do Chile, o LSST observará todo o céu visível, semanalmente, com uma câmera digital de três bilhões de pixels. De longe, a maior do mundo. Os dados dessa empreitada serão compartilhados com qualquer pessoa com acesso a um computador. O projeto foi concebido para essa “viagem” ser acompanhada em seus detalhes. Serão observados objetos a milhões de quilômetros de distância da Terra.

“Haverá a transferência de 40 gigabytes por segundo, com eventual crescimento para 80 gigabytes/segundo. Isso é inconcebível. Não se fala desse montante,” acrescenta. Para isso acontecer é preciso construir infovias rápidas, que deem conta desse transporte. Além de se estabelecer sistemas eficientes de transferência com redundância, entre outras questões técnicas.

O LSST pode soar distante para muitos, mas é exemplo de uma dinâmica presente na vida de todos, o chamado big data. Essa expressão, em inglês, refere-se ao setor (acadêmico e de trabalho) que lida com quantidades enormes de dados/informação.

Universo digital dobra a cada dois anos
Estudos da consultoria especializada em indústria e tecnologia da informação IDC indicam que o universo digital dobra a cada dois anos. Assim, os 4,4 trilhões de gigabytes existentes no mundo, em 2013, serão 44 trilhões, em 2020. “É um caminho sem volta de crescimento exponencial. Terabyte será uma escala ultrapassada”, acredita Maia. Para entender melhor essa dimensão saiba que, gigabytes são bilhões de bytes, terabytes, trilhões. “Espera-se a chegada dos petabytes [milhares de trilhões] e depois exabytes [milhões de trilhões].”

Márcio Maia, vice-coordenador do LIneA, Laboratório Interinstitucional ligado ao Ministério da Ciência, Tecnologia e Informação

Tudo isso vem acompanhado de investimento no setor e geração de empregos em diversos países. Levantamento da ABI Research, citado no site do MCTI, estima crescimento do investimento para 114 bilhões de dólares, em 2018. Ano passado, esse valor era de US$ 31 bilhões.

Essa realidade big data é comum a inúmeros setores. Sistema financeiro e bancário, comunicação, telecomunicação. “São diversos. Alguns são mais conhecidos por sua natureza como Google e Facebook”, acrescenta Maia (foto acima). Aliás, de acordo com ele, o montante de informação que o Google enfrenta é tão grande quanto as coletadas pela astronomia moderna.

Procurando agulha no palheiro
Lidar com quantidades gigantescas de informação é desafiante porque é preciso identificar o dado/informação desejado junto a centena de milhares de outros dados/informação. “É literalmente encontrar uma agulha no palheiro. Para isso acontecer é preciso ter estratégia de ação,” garante Maia. E são diversos os profissionais habilitados para esse setor, vão de matemáticos, físicos, analistas de sistemas, programadores, até funções mais simples, que necessitam de menor capacitação acadêmica. “Mas o profissional dessa área precisa ter persistência, curiosidade, interesse pelo novo.”