BigQuery キャッシュ解説

product_id	total
PROD-123	150,000
PROD-456	120,000
...	...

🔄

1. テーブルが更新された

クエリが参照するテーブルにINSERT、UPDATE、DELETE、MERGEなどが実行された場合

-- テーブルにデータ挿入 INSERT INTO dataset.sales VALUES (...); -- ↓ このクエリのキャッシュは無効化される SELECT * FROM dataset.sales WHERE ...;

⏰

2. 24時間が経過した

キャッシュの有効期限（24時間）が切れた場合

🎲

3. 非決定的関数を使用

CURRENT_TIMESTAMP()、RAND()、SESSION_USER()などの実行ごとに結果が変わる関数

-- 非決定的 → キャッシュされない SELECT *, CURRENT_TIMESTAMP() AS query_time FROM dataset.table; -- 非決定的 → キャッシュされない SELECT *, RAND() AS random_value FROM dataset.table;

🌊

4. ストリーミングバッファを参照

ストリーミングインサートで挿入された直後のデータ（まだバッファにある）を含む場合

🎯

5. DML文を実行

INSERT、UPDATE、DELETE、MERGEなどのDML文自体はキャッシュされない

🌐

6. 外部データソースを参照

Cloud Storage、Google Drive、Cloud Bigtableなどの外部テーブルを参照する場合

⚙️

7. キャッシュを明示的に無効化

クエリオプションでuse_query_cache=falseを設定した場合

-- キャッシュを使用しない SELECT * FROM dataset.table OPTIONS(use_query_cache=false);

📊

8. テーブルのメタデータが変更された

スキーマ変更、パーティション追加など、テーブルの構造が変わった場合

項目	詳細
キャッシュの保存場所	Google管理の分散キャッシュシステム（ユーザーからは不可視）
キャッシュのサイズ制限	128 MB（圧縮後）。超える場合は自動的にキャッシュされない
キャッシュの共有	同じプロジェクト内の全ユーザーで共有される
パーティション	パーティションが異なれば別のクエリとして扱われる
リージョン	データセットのロケーションごとに独立したキャッシュ
暗号化	キャッシュデータも暗号化されて保存される

⚡ BigQuery キャッシュの仕組み

📖 BigQueryキャッシュとは

🎯 概要

キャッシュヒット時の流れ

🔑 キャッシュの保存単位：クエリテキスト単位

🎯 重要な概念

キャッシュの構造

具体例：クエリテキストの違いによるキャッシュへの影響

⏱️ キャッシュの有効期間

キャッシュの24時間ライフサイクル

🚫 キャッシュが無効化される条件

キャッシュが使われない・無効化されるケース

💰 キャッシュヒットによるコスト削減

✅ キャッシュヒット

❌ キャッシュミス

💡 コスト削減の具体例

🎯 キャッシュの有効活用方法

✅ 推奨される使い方

❌ 避けるべき使い方

実践的なテクニック

1️⃣ クエリの標準化

2️⃣ 保存されたクエリの活用

3️⃣ パラメータ化されたクエリ

4️⃣ 時刻関数の最適化

📊 キャッシュの確認方法

クエリ実行後の確認

APIでの確認

🔍 高度なキャッシュの仕組み

📚 まとめ

🎓 BigQueryキャッシュの重要ポイント