Nos últimos anos, várias tecnologias de TI se integraram perfeitamente ao estilo de vida das pessoas, facilitando tarefas do dia-a-dia, como comunicações sociais, monitoramento de cuidados de saúde e gestão ambiental. O paradigma "Computação Verde" na perspectiva das tecnologias emergentes de TI e sua iniciativa verde. Computação em nuvem, análise de big data baseadas em software como tecnologias emergentes de TI.

A Computação Verde é um paradigma de computação onde: a eficiência dos recursos de TI são maximizadas, recursos (em particular, energia) são reutilizados sempre que possível, produtos sustentáveis e práticas de fabricação são adotados e iniciativas verdes em outras indústrias são apoiadas por meio de ferramentas de monitoramento e gestão. A eficiência dos recursos tem duplo contexto para desempenho e energia. Vários recursos e seus backups alternativos são utilizados para uma computação eficiente de alto desempenho. Em contrapartida, as práticas de eficiência energética envolvem redução de recursos e computação proporcional à energia.

O reuso energético em sistemas de computação deriva das interações cibernéticas dos recursos de TI e do resfriamento de centros de TI em larga escala. Da mesma forma, a sustentabilidade na computação é alcançada pela utilização de recursos de energia renovável, limitando a footprint de carbono das operações de TI. As práticas de fabricação que aumentam o reutilização de componentes de computação fora de exposição e limitam o lixo eletrônico também contribuem para os esforços de sustentabilidade. Além das abordagens autoconscientes para a computação verde, as tecnologias de TI são utilizadas como uma plataforma para promover os esforços de greening e sustentabilidade de outras indústrias por meio do monitoramento ambiental e da conscientização social.

Descrição do problema

O crescimento industrial global teve dois efeitos exigentes no meio ambiente humano. Primeiro, os recursos energéticos naturais estão sendo consumidos em um ritmo acelerado. Operações eficientes e recursos energéticos alternativos são buscados para reduzir a taxa atual de esgotamento dos recursos energéticos naturais. Em segundo lugar, o crescimento industrial global resultou no aumento das emissões de carbono. As emissões de carbono, conhecidas como Gases de Efeito Estufa (GEE) em geral, levam a taxas mais altas de doenças, aquecimento global e esgotamento da camada de ozônio.

A Tecnologia da Informação (TI) é uma indústria global emergente e uma tecnologia de suporte para muitas empresas. Buscamos informações a taxas crescentes e em múltiplas formas para facilitar nosso estilo de vida. A indústria de TI, ou computação em geral, contribui tanto para o alto consumo de energia quanto para as emissões de carbono. Portanto, as tecnologias emergentes de TI, as práticas existentes e os algoritmos precisam ser redefinidos para operações eficientes em termos de energia, proporcionais e sustentáveis. Além disso, as tecnologias de TI têm a responsabilidade de limitar o consumo de energia e a footprint de carbono de outras indústrias e organizações, ao mesmo tempo em que facilitam as práticas ambientais verdes em suas operações diárias.

Objetivo Geral

O big data introduz a era dos dados com novos desafios, como a escala de petabyte estruturados e conjuntos de dados não estruturados que estão crescendo a uma taxa exponencial e têm formatos heterogêneos. A rápida recuperação de dados e a precisão da pesquisa de um pool de big data são os principais desafios para maximizar o valor para a tomada de decisões em análise de big data. Os sistemas tradicionais de gerenciamento de dados não têm a capacidade de lidar com os requisitos de armazenamento e análise de big data e, portanto, a tecnologia NoSQL está contribuindo para fornecer soluções adequadas para recuperação oportuna de dados e processamento eficiente de dados. O processo de greening é crucial para o big data, pois a análise sobre o tamanho tremendo dos conjuntos de dados requer alto poder de computação, espaço de armazenamento escalável e eficiente, alta disponibilidade de memória principal e mídia de comunicação rápida em servidores de nuvem físicos ou corporativos locais. Consequentemente, a análise de big data verde requer eficiência na utilização de recursos, consumo de energia e escalabilidade de infraestrutura.

Os procedimentos de análise de big data podem contribuir para preservar o uso de recursos de processamento e armazenamento, escalabilidade de sistemas e melhoria da produtividade. Os requisitos de análise de big data, como alta disponibilidade, confiabilidade e consistência, são significativos no desenvolvimento de infraestruturas tecnológicas. No entanto, a preservação de energia e a otimização de recursos são os aspectos da computação verde e das análises que não têm sido relatadas na literatura com tanta frequência como as convencionais. A computação em nuvem é revelada como uma tecnologia de análise de big data que oferece terceirização de recursos para evitar ocupação física e, portanto, vários usuários com diferentes requisitos de análise podem utilizar recursos remotamente acessíveis. Espera-se que o avanço na computação em nuvem para análise de big data leve à baixa dependência do uso de computadores pessoais na nova era da computação. Juntamente com a preservação de recursos, a computação em nuvem também oferece menor consumo de energia para a execução de procedimentos computacionais elevados em big data. A computação em nuvem tem grande importância como sendo uma plataforma altamente disponível para análise de big data que permite a minimização na utilização de recursos e consumo de energia.

Há um avanço visível na tecnologia atual para a análise de big data verde. Por exemplo, GreenPlum e GreenHadoop são propostos em análise de big data para computação verde. GreenPlum é um data warehouse de código aberto, licenciado pela Apache Inc., que oferece análises rápidas em dados em escala de petabyte com processamento eficiente de consulta via processamento e otimização paralelas. A otimização de consulta baseada em custos introduzida pelo GreenPlum garante altas análises em conjuntos de dados de grande volume com eficiência de uso. O GreenHadoop, por outro lado, traz a ideia de fontes de energia renovável para equilibrar a oferta e a demanda de fontes de energia associadas à análise de big data. A estrutura greenhadoop usa uma matriz solar fotovoltaica e recursos de energia da rede elétrica. A estrutura greenHadoop para análise verde alcança o consumo maximizado de energia, estimando a energia solar disponível e programando os empregos da MapReduce em conformidade. O GreenPlum oferece suporte aos modos de processamento em lote e interativos. No entanto, o GreenHadoop alcança estimativas de energia em tempo real com base na carga de trabalho anterior do data center.

A Figura abaixo mostra um processo de análise de big data verde onde os recursos de armazenamento e processamento residem em nuvens e podem ser solicitados sob demanda. A tecnologia de computação em nuvem fornece a base para a análise de big data verde como a utilização ideal de recursos com consumo de energia reduzido. Atualmente, as principais fontes de big data e consumidores são redes sociais, saúde, indústrias, comércio e empresas. Os dados dessas fontes e consumidores são extensivamente escaláveis e trazem requisitos críticos de análise para a tomada de decisões oportunas. Essa carga de armazenamento e processamento de big data são tratadas eficientemente por data centers e processadores residentes na nuvem, o que garante análises verdes. O conceito de reciclagem está declarado em que sugere que a tecnologia de energia renovável será uma escolha preferencial de investimento na busca de recursos energéticos. A tecnologia de energia renovável está emergindo com custo reduzido de adaptação, hospedagem verde eficiente e aumento das demandas de renovabilidade que visam alcançar a redução da descarga de carbono, custos de energia mais baixos e estáveis e acesso a fontes de energia confiáveis. 64% da indústria de TI está cumprindo suas metas de economia de energia usando tecnologia de energia renovável.

A análise de big data verde é significativa na otimização do consumo de energia e na re-usabilidade das fontes disponíveis para atender aos extensos requisitos de análise de big data. A computação verde é análoga à química verde e permite a minimização de uso para enormes recursos de computação e armazenamento exigidos pelo big data. A computação verde alinha as tecnologias de análise de big data com o conceito de sustentabilidade, ou seja, redução, reutilização e reciclagem. Pesquisadores sugerem que a indústria de tecnologia parece mais preocupada com a eficiência da análise do que com a sustentabilidade ambiental e a complexidade computacional. No entanto, a implementação de análises verdes sobre big data certamente resulta em redução do uso da memória e custo computacional.

Desafios  da big data verde com alto desempenho e baixo custo

As práticas de computação verde enfatizam a implementação de tecnologias verdes em nível industrial e organizacional. O custo da energia por unidade aumentará significativamente devido a uma diminuição considerável dos recursos energéticos globais. Como resultado, tornou-se necessário que os setores público e governamental proponham e pratiquem estratégias e planos de última geração para a computação verde. As práticas de computação verde de última geração consideram a implementação de equipamentos de TI amigáveis à energia, protocolos leves de consumo de recursos e o descarte de resíduos eletrônicos. As práticas de computação verde enfatizam o desvio dos recursos de TI quando não utilizados por um longo período de tempo.

As práticas de computação verde também programam recursos de TI em estados de baixa potência do sistema e ociosos. O modo de execução em standby é aplicado para economizar energia se o estado de potência de execução for inferior a um limiar. A gestão dos recursos de TI do envelhecimento é outra questão importante na computação verde. Dispositivos de hardware mais antigos aumentaram o consumo de energia e exigem substituições e descartes de recursos. Por isso, a prática da reciclagem precisa ser aplicada ao envelhecimento dos recursos de TI. Da mesma forma, as práticas que limitam a utilização de impressões em papel devem ser aplicadas a nível organizacional.

A estimativa e o cálculo do consumo de energia para análise de big data é desafiador. Altas e rápidas demandas analíticas de big data só são satisfeitas quando uma estimativa eficiente está disponível. Da mesma forma, para o GreenHadoop, é desafiador estimar os requisitos de energia e tempo para um trabalho baseado no qual as decisões de agendamento são tomadas. A estimativa também é significativa em tecnologia de energia renovável e, portanto, requer um amplo trabalho da academia e da indústria. Aumentar continuamente o volume de big data requer incremento escalável nos recursos e custos analíticos disponíveis. No entanto, o conceito de computação verde sugere sustentabilidade dos recursos energéticos e de processamento. Consequentemente, a tecnologia de análise de big data com impacto minimizado no meio ambiente é altamente desejável.

Conclusões e Recomendações

A demanda e a integração social das tecnologias de TI estão aumentando rapidamente, aumentando, portanto, o consumo de energia. Com um foco renovado na crise energética global, pesquisadores e profissionais de TI propuseram e implementaram vários algoritmos e protocolos para a operação verde do setor de TI. Esses algoritmos e protocolos implementam mecanismos como estados de ibernação ociosos, tomada de decisões com reconhecimento de energia e agendamento de recursos. No entanto, minimizar o consumo de energia de um sistema afeta significativamente seus parâmetros de desempenho. O nível de otimização de energia para um dispositivo depende muito do caso de uso do aplicativo. Políticas agressivas de minimização de energia afetam a durabilidade do sistema devido à frequente desligar de energia e às rotinas do sistema.

Uma análise geral do estado da arte na computação verde mostra que os algoritmos e protocolos verdes estão atingindo um alto nível de maturidade, e eficiências significativas são possíveis. Em contrapartida, o estudo demonstrou que, no setor de TI, a governança está ficando significativamente para trás e, portanto, a consideração das práticas verdes é uma alta prioridade. Em particular, as práticas de computação verde precisam ser implementadas no nível organizacional para complementar e aplicar as técnicas e tecnologias de otimização subjacentes propostas pelos pesquisadores.

A força das soluções de computação verde reside em sua diversidade, com a consideração de componentes de processador, memória e rede de baixo nível para otimização do sistema, juntamente com heurística gananciosa e evolutiva. No entanto, mais uma vez, isso deve coincidir com estratégias robustas e inteligentes que consideram as compensações globais de energia de desempenho em termos de otimização multiprofissionais. Novas pesquisas são necessárias para analisar o impacto das técnicas de otimização de energia nos parâmetros de desempenho do sistema, como throughput e tempo de resposta. Essa análise de desempenho e da energia do sistema levará a soluções mais afinadas para a computação verde que serão mais aceitáveis para os governadores do setor de TI que priorizam parâmetros de desempenho em vez de energia.

REFERÊNCIAS

ARTIGO IBERDROLA

'Green data': A estatística pode ajudar o meio ambiente?: https://www.iberdrola.com/meio-ambiente/big-data-e-meio-ambiente

ARTIGO UOL

Do Google ao Facebook, big data lidera adoção de energia verde: https://economia.uol.com.br/noticias/bloomberg/2018/11/13/do-google-ao-facebook-big-data-lidera-adocao-de-energia-verde.htm

LIVRO O´REILLY

Armazenamento de dados com Greenplum: Open Source Massively Parallel Data Analytics: https://tanzu.vmware.com/content/ebooks/data-warehousing-with-greenplum

BOOKS GOOGLE

Cloud Computing Technologies for Green Enterprises: https://books.google.com.br/books?id=E9k1DwAAQBAJ&pg=PA235&lpg=PA235&dq=Green+Hadoop&source=bl&ots=CulaBLozP&sig=ACfU3U0PCGEW_9uaG9kJ14d5ZLlY44biOQ&hl=ptBR&sa=X&ved=2ahUKEwi6xIWi0IHqAhUwH7kGHXA2AWIQ6AEwEXoECAYQAQ#v=onepage&q=Green%20Hadoop&f=false

BOOKS GOOGLE

Gestão e Processamento de Big Data: https://books.google.com.br/booksid=JVkkDwAAQBAJ&pg=PT653&lpg=PT653&dq=green+hadoop&source=bl&ots=kofVWQKXv&sig=ACfU3U2FbkWR7hwVQYsaBew_4YXkqkMPfg&hl=ptBR&sa=X&ved=2ahUKEwjP8p6yiYLqAhXsLLkGHQhWAkMQ6AEwBHoECAYQAQ#v=onepage&q=green%20hadoop&f=false

ARTIGO RESEARCHGATE

Uma revisão sobre o processamento de big data usando o GreenHadoop:https://www.researchgate.net/publication/330824370_A_Review_on_Big_Data_Processing_using_Green_Hadoop