Páginas

segunda-feira, 4 de novembro de 2024


              Diferenças entre AWS Athena e AWS Glue

 


AWS Athena

 

AWS Athena é um serviço de consulta interativo usado para analisar dados armazenados no Amazon S3. O Athena facilita muito o uso porque os serviços já estão interligados. Tudo o que você precisa fazer é apontar o Athena para seus dados S3, definir o esquema que deseja usar e começar a consultar com a linguagem de consulta SQL.

Melhor ainda, você não precisa se preocupar em preparar seus dados para a consulta. Por causa disso, tudo que você precisa são conhecimentos básicos de SQL para analisar até mesmo conjuntos de dados enormes e complexos hospedados no S3.

 

 Os benefícios do Atenas incluem:

    Não tem servidor, sem a necessidade de pagar nenhuma taxa de configuração.
    Aproveite todos os seus dados com conhecimento básico de SQL.
    Pagar por consulta significa que você paga apenas pelo que faz.
    Suporta a maioria dos formatos de dados padrão, como CSV, JSON, ORC, Avro e Parquet.
    As consultas são realizadas em paralelo para obter resultados extremamente rápidos.

Portanto, se você tiver grandes quantidades de dados armazenados no Amazon S3, seu melhor caminho para análise e consulta provavelmente será o AWS Athena.

 

 AWS Glue

AWS Glue é um ecossistema de ferramentas para capacitar a descoberta de esquemas e ETL (Extrair, Transformar, Carregar) usando scripts gerados automaticamente. Para ser mais sucinto, o AWS Glue é um serviço de integração de dados sem servidor que facilita a complexidade de descobrir, preparar, mover e integrar dados de várias fontes.

As ferramentas mais utilizadas no Glue são o Glue Metastore (um metastore sem servidor compatível com o Hive que pode ser usado no lugar de um Hive autogerenciado) e o Glue ETL (um serviço Spark que permite aos clientes executar jobs do Spark sem ter que primeiro lidar com configurações complicadas ou gerenciar a infraestrutura Spark). 

 

AWS Glue pode ser usado para:

    Análise
    Aprendizado de máquina
    Desenvolvimento de aplicativos
    Criação e execução de jobs
    Implementando fluxos de trabalho de negócios

 

Enquanto o AWS Athena é um meio de interagir com os dados, o AWS Glue facilita a integração de dados de vários serviços de armazenamento.

Um recurso muito interessante do AWS Glue é que ele inclui uma interface GUI para simplificar a criação, execução, monitoramento e gerenciamento de todos os seus trabalhos de integração de dados. Com esta GUI você pode criar fluxos de trabalho contínuos e eficientes e executá-los em um mecanismo ETL Apache Spark (sem servidor).

O AWS Glue Studio também simplifica a tarefa de coletar, transformar e limpar seus dados

.

Nenhum comentário:

Postar um comentário