各種データソースへの接続が簡単、速い
- スキーマを事前に定義しなくてもクエリできる
- CSV, JSON, Parquet, Excelなどのファイル
- PostgreSQL/MySQLなどのリレーショナルDBと接続できる(federationぽいもの)
- S3に置いたファイル群を直接クエリできる
- パターンに一致した複数ファイルをマルチスレッドで読み込める
- DeltaLake/Icebergにも対応(個人的には現時点だと不十分)
- Python, Rustなどの言語のSDK, WASMでの利用に対応