Trino
하나 이상의 종류의 데이터 소스에 분산된 대규모 데이터 세트를 쿼리 하도록 설계된 분산 SQL 쿼리 엔진
분산 쿼리를 사용해 방대한 데이터를 효율적으로 쿼리하도록 설계된 도구이다.
표준 데이터베이스 기능을 제공하고 SQL을 다루지만 데이터베이스라고 할 순 없다. 즉, MySQL, PostgreSQL, Oracle을 대체하지 않는다.
Trino는 Hive와 Pig처럼 MapReduce 작업의 파이프라인을 사용해 HDFS를 쿼리 하는 도구의 대안으로 설계되었다. 다만 HDFS 접근에 대해서만 사용하지는 않으며, 관계형 데이터베이스나 Cassandra 같은 여러 데이터 소스를 다룰 수 있다.
Presto와의 관계
Presto는 페이스북이 개발해 오픈소스로 공개한 대화식 데이터 쿼리 서비스이다. Trino는 Presto 초기 멤버가 페이스북을 나와서 만든 PrestoSQL 프로젝트를 리브랜딩 한 것이다.
특징
원래 페이스북을 위한 개발되었으나 포괄적인 SQL 쿼리 엔진으로 발전하여, 확장성과 유연성이 뛰어나 빅데이터에 의존하는 산업에 적합하다.
특히 컴퓨팅과 스토리지가 분리되어 있기 때문에 커넥터라는 별도의 요소를 사용해 데이터 소스에서 데이터를 검색한다. 기존 데이터베이스, 비관계형 데이터베이스 등의 데이터 소스를 쿼리할 때 높은 수준의 다기능성을 제공한다.
참고 문서
https://pandio.com/difference-between-trino-and-prestodb/