Trino 란?

Trino

비번변경 2023. 3. 1. 21:52

하나 이상의 종류의 데이터 소스에 분산된 대규모 데이터 세트를 쿼리 하도록 설계된 분산 SQL 쿼리 엔진

분산 쿼리를 사용해 방대한 데이터를 효율적으로 쿼리하도록 설계된 도구이다.

표준 데이터베이스 기능을 제공하고 SQL을 다루지만 데이터베이스라고 할 순 없다. 즉, MySQL, PostgreSQL, Oracle을 대체하지 않는다.

Trino는 Hive와 Pig처럼 MapReduce 작업의 파이프라인을 사용해 HDFS를 쿼리 하는 도구의 대안으로 설계되었다. 다만 HDFS 접근에 대해서만 사용하지는 않으며, 관계형 데이터베이스나 Cassandra 같은 여러 데이터 소스를 다룰 수 있다.

Presto는 페이스북이 개발해 오픈소스로 공개한 대화식 데이터 쿼리 서비스이다. Trino는 Presto 초기 멤버가 페이스북을 나와서 만든 PrestoSQL 프로젝트를 리브랜딩 한 것이다.

원래 페이스북을 위한 개발되었으나 포괄적인 SQL 쿼리 엔진으로 발전하여, 확장성과 유연성이 뛰어나 빅데이터에 의존하는 산업에 적합하다.

특히 컴퓨팅과 스토리지가 분리되어 있기 때문에 커넥터라는 별도의 요소를 사용해 데이터 소스에서 데이터를 검색한다. 기존 데이터베이스, 비관계형 데이터베이스 등의 데이터 소스를 쿼리할 때 높은 수준의 다기능성을 제공한다.

아무튼 개발자. 모르는 걸 적습니다.

airflow, 오블완, Linux, pandas, gitlab, 티스토리챌린지, 프로그래머스, Azure, mysql, superset, AWS, Docker, Git, jenkins, Trino, BOJ, SH, k8s, python, awscli,

250x250

Passwd