Diferenças entre AWS Athena e AWS Glue
AWS Athena
AWS Athena é um serviço de consulta interativo usado para analisar dados armazenados no Amazon S3. O Athena facilita muito o uso porque os serviços já estão interligados. Tudo o que você precisa fazer é apontar o Athena para seus dados S3, definir o esquema que deseja usar e começar a consultar com a linguagem de consulta SQL.
Melhor ainda, você não precisa se preocupar em preparar seus dados para a consulta. Por causa disso, tudo que você precisa são conhecimentos básicos de SQL para analisar até mesmo conjuntos de dados enormes e complexos hospedados no S3.
Melhor ainda, você não precisa se preocupar em preparar seus dados para a consulta. Por causa disso, tudo que você precisa são conhecimentos básicos de SQL para analisar até mesmo conjuntos de dados enormes e complexos hospedados no S3.
Os benefícios do Atenas incluem:
Não tem servidor, sem a necessidade de pagar nenhuma taxa de configuração.
Aproveite todos os seus dados com conhecimento básico de SQL.
Pagar por consulta significa que você paga apenas pelo que faz.
Suporta a maioria dos formatos de dados padrão, como CSV, JSON, ORC, Avro e Parquet.
As consultas são realizadas em paralelo para obter resultados extremamente rápidos.
Portanto, se você tiver grandes quantidades de dados armazenados no Amazon S3, seu melhor caminho para análise e consulta provavelmente será o AWS Athena.
Aproveite todos os seus dados com conhecimento básico de SQL.
Pagar por consulta significa que você paga apenas pelo que faz.
Suporta a maioria dos formatos de dados padrão, como CSV, JSON, ORC, Avro e Parquet.
As consultas são realizadas em paralelo para obter resultados extremamente rápidos.
Portanto, se você tiver grandes quantidades de dados armazenados no Amazon S3, seu melhor caminho para análise e consulta provavelmente será o AWS Athena.
AWS Glue
AWS Glue é um ecossistema de ferramentas para capacitar a descoberta de esquemas e ETL (Extrair, Transformar, Carregar) usando scripts gerados automaticamente. Para ser mais sucinto, o AWS Glue é um serviço de integração de dados sem servidor que facilita a complexidade de descobrir, preparar, mover e integrar dados de várias fontes.
As ferramentas mais utilizadas no Glue são o Glue Metastore (um metastore sem servidor compatível com o Hive que pode ser usado no lugar de um Hive autogerenciado) e o Glue ETL (um serviço Spark que permite aos clientes executar jobs do Spark sem ter que primeiro lidar com configurações complicadas ou gerenciar a infraestrutura Spark).
As ferramentas mais utilizadas no Glue são o Glue Metastore (um metastore sem servidor compatível com o Hive que pode ser usado no lugar de um Hive autogerenciado) e o Glue ETL (um serviço Spark que permite aos clientes executar jobs do Spark sem ter que primeiro lidar com configurações complicadas ou gerenciar a infraestrutura Spark).
AWS Glue pode ser usado para:
Análise
Aprendizado de máquina
Desenvolvimento de aplicativos
Criação e execução de jobs
Implementando fluxos de trabalho de negócios
Aprendizado de máquina
Desenvolvimento de aplicativos
Criação e execução de jobs
Implementando fluxos de trabalho de negócios
Enquanto o AWS Athena é um meio de interagir com os dados, o AWS Glue facilita a integração de dados de vários serviços de armazenamento.
Um recurso muito interessante do AWS Glue é que ele inclui uma interface GUI para simplificar a criação, execução, monitoramento e gerenciamento
de todos os seus trabalhos de integração de dados. Com esta GUI você pode criar fluxos de trabalho contínuos e eficientes e executá-los em um mecanismo ETL Apache Spark (sem servidor).
O AWS Glue Studio também simplifica a tarefa de coletar, transformar e limpar seus dados
O AWS Glue Studio também simplifica a tarefa de coletar, transformar e limpar seus dados
.
Nenhum comentário:
Postar um comentário