Diferenças entre AWS Athena e AWS Glue
AWS Athena
Melhor ainda, você não precisa se preocupar em preparar seus dados para a consulta. Por causa disso, tudo que você precisa são conhecimentos básicos de SQL para analisar até mesmo conjuntos de dados enormes e complexos hospedados no S3.
Os benefícios do Atenas incluem:
Aproveite todos os seus dados com conhecimento básico de SQL.
Pagar por consulta significa que você paga apenas pelo que faz.
Suporta a maioria dos formatos de dados padrão, como CSV, JSON, ORC, Avro e Parquet.
As consultas são realizadas em paralelo para obter resultados extremamente rápidos.
Portanto, se você tiver grandes quantidades de dados armazenados no Amazon S3, seu melhor caminho para análise e consulta provavelmente será o AWS Athena.
AWS Glue
As ferramentas mais utilizadas no Glue são o Glue Metastore (um metastore sem servidor compatível com o Hive que pode ser usado no lugar de um Hive autogerenciado) e o Glue ETL (um serviço Spark que permite aos clientes executar jobs do Spark sem ter que primeiro lidar com configurações complicadas ou gerenciar a infraestrutura Spark).
AWS Glue pode ser usado para:
Aprendizado de máquina
Desenvolvimento de aplicativos
Criação e execução de jobs
Implementando fluxos de trabalho de negócios
O AWS Glue Studio também simplifica a tarefa de coletar, transformar e limpar seus dados
.