Tecnologia
Ciência de Dados: O que é e porque é importante
5 minutos de leitura
Ciência de Dados, ou Data Science, atingiu o auge da sua popularização trazendo um certo misticismo ao empregar técnicas de estatística, aprendizado de máquina, redes neurais e outras técnicas que só profissionais especializados possuiriam conhecimento.
Vamos começar a explorar esse universo para desvendar o poder da Ciência de Dados!
Mas o que é Ciência de Dados?
É um campo interdisciplinar que resolve problemas reais de negócios, utilizando o método científico, técnicas de análise e visualização de dados e aprendizado de máquina, onde o combustível indispensável são os DADOS.
Na sua essência, a Data Science envolve o uso de métodos automatizados (ciência da computação) para analisar dados (matemática e estatística) extraindo conhecimento e resolvendo problemas (áreas de negócio) a partir deles.
Antes de continuar, vamos esclarecer algumas coisas:
Ciência de Dados não é a mesma coisa que Business Intelligence (BI).
BI nos diz o que aconteceu (análise descritiva) e o porquê aconteceu (análise diagnóstica).
Ciência de Dados, além da análise descritiva e diagnóstica, também nos diz o que acontecerá (análise preditiva) e o que deve ser feito (análise prescritiva).
Ciência de Dados não é estatística!
A estatística desempenha um papel fundamental dentro da área. Porém, a Data Science compreende outras áreas de conhecimento, como já vimos anteriormente.
“Por meio dessa declaração, a ASA e seus membros reconhecem que a ciência de dados abrange mais do que estatísticas, mas, ao mesmo tempo, também reconhecem que a ciência estatística desempenha um papel crítico nesse campo de rápido crescimento. Esperamos que esta declaração reforce a relação das estatísticas com a ciência de dados e promova ainda mais relacionamentos de colaboração mútua entre todos os principais contribuintes da ciência de dados.”
American Statistical Association (ASA), Washington, 2015. [1]
O principal objetivo da Ciência de Dados é extrair informações dos dados e transformá-las em conhecimento que possa ser usado na tomada de decisões.
Onde se aplica?
A Ciência de Dados pode ser utilizada em praticamente todas as atividades humanas, desde que dados sejam gerados e possam ser coletados.
Organizações a aplicam para resolver diversos problemas de negócio. Veja alguns casos:
Amazon
Utiliza para personalizar a experiência de compra online. Cada cliente possui sua própria loja, com recomendações de produtos baseadas nas suas preferências e avaliações de outros usuários.
Citibank
A análise de cada uma das transações realizadas pelo banco, nos mais de 100 países em que opera, permite a geração de insights relacionados a investimentos, previsão de mudanças de mercado, padrões de operação e condições econômicas.
Nasa
Uma das várias aplicações na NASA é a previsão de vida útil dos componentes de orientação do telescópio Hubble, ajudando a operá-lo de forma a aumentar a sua durabilidade.
“A ciência de dados pode resolver problemas simples e complexos, não apenas complexos. Existem problemas simples que geram grandes impactos nas operações e até nas estratégias de longo prazo.”
Joni Hoppen (Aquarela Advanced Analytics) [2]
O Unicórnio
Agora que já conhecemos um pouco do conceito e possuímos uma visão geral do que encontrar dentro do universo de Ciência de Dados, vamos falar sobre o unicórnio.
De fato, as três grandes áreas que abrangem a Data Science (matemática e estatística, computação, área de negócio) podem ser bem amplas, e conhecer em profundidade tudo que as envolve é algo realmente trabalhoso.
A expressão “unicórnio” é usada para se referir a um profissional que domina todas as áreas correlatas… algo muito raro e, talvez, desnecessário.
De qualquer forma, Swami Chandrasekaran, que foi CTO da IBM na plataforma Watson, criou esse mapa inspirado em linhas de metrô, onde cada linha representa uma subárea da Ciência de Dados.
As paradas das linhas representam os tópicos a se aprender e nos mostra a sequência recomendada de aprendizado.
Mas o unicórnio é um mito! Não tente aprender tudo de uma vez. Mantenha-se informado sobre as tecnologias, entretanto não se cobre demais por isso.
Sobre Dados
No decorrer dos últimos 30 anos, os dados, em geral, vieram se tornando cada vez mais críticos para todas as áreas da vida humana e, na última década e meia, testemunhamos uma transformação praticamente completa do analógico para o digital em todos os setores, conforme aponta o relatório Data Age 2025 [4], da IDC (International Data Corporation).
A tendência é um aumento exponencial na geração de dados para os próximos anos, como indica as projeções da IDC, e não é à toa que a Ciência de Dados tem ganhado cada vez mais visibilidade, com uma demanda crescente em todo o mundo.
Só no Brasil, a demanda aumentou quase 500% no primeiro semestre de 2021 em relação ao mesmo período do ano anterior, conforme pesquisa da hrtech de recrutamento digital Intera [5].
Os dados são extremamente valiosos, pois são a matéria prima para todo o processo. Sem eles Data Science não existe.
“O recurso mais valioso do mundo deixou de ser o petróleo, mas sim dados.”
The Economist, 2017 [6]
Visto a grande quantidade de dados que são e serão gerados no mundo, cabe a nós a capacidade de extrair o seu valor, e uma ferramenta poderosa para isso é a Ciência de Dados.
Então, sempre que começar um projeto, ou qualquer outra atividade, é extremamente recomendável que se tenha atenção aos dados que serão gerados a partir dessa atividade, de forma que possamos extrair o seu valor para tomarmos melhores decisões de negócio.
Conclusões
Como vimos, Data Science vai muito além de algoritmos de machine learning. Ao aplicá-la estamos unificando três grandes áreas de conhecimento, utilizando métodos científicos, para resolver problemas de negócios.
Realmente dominar todas as áreas no domínio das Ciências de Dados é trabalhoso e exige muito estudo, contudo o unicórnio é um mito! Não há necessidade de ser um unicórnio para aplicar ciência de dados, muito menos para começar a aprender.
Vimos também que o combustível primordial para tudo isso são os dados, que são considerados o novo petróleo, visto o valor que podem gerar ao se transformarem em inteligência para resolvermos problemas de negócio. Cuidem bem dos dados!
Um estudo recente da Forrester Consulting mostrou que as organizações capazes de extrair inteligência dos dados possuem 162% mais chances de superar as suas metas de receita do que as empresas que não utilizam ciência de dados.
Sendo assim, não há motivos para não investirmos nesse conhecimento e gerarmos valor para o nosso negócio ?
Referências
[1] ASA issues statement on role of statistics in data science, American Statistical Association (ASA), Washington, 2015. (https://www.amstat.org/asa/files/pdfs/pressreleases/2015-ASA-StatisticsFoundationaltoDataScience.pdf)
[2] O que é Ciência de Dados e como aplica-la nos negócios, Aquarela Inovação Tecnológica do Brasil S.A., 2017. (https://www.aquare.la/o-que-e-ciencia-de-dados-data-science-para-negocios/)
[3] Becoming a Data Scientist – Curriculum via Metromap, Swami Chandrasekaran, 2013 (http://nirvacana.com/thoughts/2013/07/08/becoming-a-data-scientist/)
[4] Data Age 2025: The Evolution of Data to Life-Critical, ICD, 2017. (https://www.import.io/wp-content/uploads/2017/04/Seagate-WP-DataAge2025-March-2017.pdf)
[5] Intera Talent Hacking. (https://byintera.com/)
[6] The world’s most valuable resource is no longer oil, but data, The Economist, 2017. (https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data)
[7] The Business Impact of Data Intelligent Management, Forrester Consulting, 2020. (https://www.collibra.com/download/data-intelligent-management)