DuckDBでSQLクエリを叩くときにCSV形式よりもApache Parquet形式のほうが早い理由

先に理由を書きますが、ParquetのRow Group単位で並列処理できるしフルスキャンを避けれるからです。 システムでも分析タスクでもSQLクエリを叩く(問い合わせ)したらなる早でレスポンス欲しいですよね。この記事で […]