Dataflow スライディングウィンドウ解説

1. Sliding Window Algorithm (スライディングウィンドウアルゴリズム)

分野: データ構造とアルゴリズム、競技プログラミング

概要: 配列やリストに対して固定サイズの部分範囲を移動させながら処理を行う手法

# 典型的なスライディングウィンドウアルゴリズム def max_sum_subarray(arr, k): # サイズkの部分配列の最大和を求める n = len(arr) if n < k: return None # 最初のウィンドウの和を計算 window_sum = sum(arr[:k]) max_sum = window_sum # ウィンドウをスライド for i in range(n - k): window_sum = window_sum - arr[i] + arr[i + k] max_sum = max(max_sum, window_sum) return max_sum # 例: [1, 4, 2, 10, 23, 3, 1, 0, 20] でk=4 # ウィンドウ1: [1, 4, 2, 10] → 17 # ウィンドウ2: [4, 2, 10, 23] → 39 # ウィンドウ3: [2, 10, 23, 3] → 38

✅ 共通点

固定サイズの範囲を移動
重複するデータを処理
効率的な増分計算
O(n)の時間計算量

⚠️ 相違点

配列 vs ストリーム
静的 vs 動的
メモリ内 vs 分散処理
同期 vs 非同期

2. Moving Average (移動平均)

分野: 統計学、時系列解析、金融工学

概要: 時系列データの一定期間の平均を、時間とともに移動させながら計算

# 単純移動平均 (SMA: Simple Moving Average) def simple_moving_average(prices, window): sma = [] for i in range(len(prices) - window + 1): window_avg = sum(prices[i:i+window]) / window sma.append(window_avg) return sma # 例: 株価の5日移動平均 prices = [100, 102, 98, 105, 110, 108, 112] sma_5 = simple_moving_average(prices, 5) # [103.0, 104.6, 106.6]

移動平均の種類	特徴	用途
SMA (単純移動平均)	全データ点が同じ重み	トレンド分析、ノイズ除去
EMA (指数移動平均)	最近のデータに高い重み	反応速度重視の分析
WMA (加重移動平均)	線形的に重み付け	中期的なトレンド把握

3. TCP Sliding Window (TCPスライディングウィンドウ)

分野: ネットワークプロトコル、フロー制御

概要: 確認応答を待たずに送信できるデータ量を動的に調整

仕組み: 受信者の処理能力に応じてウィンドウサイズを調整し、効率的なデータ転送を実現

4. Circular Buffer / Ring Buffer (リングバッファ)

分野: データ構造、組み込みシステム、音声/映像処理

概要: 固定サイズのバッファを循環的に使用し、最新のN個のデータを保持

class CircularBuffer: def __init__(self, size): self.size = size self.buffer = [None] * size self.head = 0 self.count = 0 def add(self, item): self.buffer[self.head] = item self.head = (self.head + 1) % self.size self.count = min(self.count + 1, self.size) def get_window(self): return [self.buffer[i] for i in range(self.count)] # 最新5件のログを保持するバッファ log_buffer = CircularBuffer(5)

概念	適用分野	主な用途
Dataflow Sliding Window	ストリーム処理	リアルタイム分析、イベント集計
Sliding Window Algorithm	アルゴリズム	部分配列問題、最適化
Moving Average	統計・金融	トレンド分析、ノイズ除去
TCP Sliding Window	ネットワーク	フロー制御、輻輳制御
Circular Buffer	データ構造	固定サイズ履歴、ストリーミング

🪟 Dataflow スライディングウィンドウ

📖 スライディングウィンドウとは

📊 ウィンドウの動作イメージ

🔄 Dataflowの主なウィンドウタイプ

🪟 Fixed Window (固定ウィンドウ)

🎯 Sliding Window (スライディング)

⏱️ Session Window (セッション)

🌍 Global Window (グローバル)

🧮 同等の概念を持つアルゴリズム

1. Sliding Window Algorithm (スライディングウィンドウアルゴリズム)

✅ 共通点

⚠️ 相違点

2. Moving Average (移動平均)

3. TCP Sliding Window (TCPスライディングウィンドウ)

4. Circular Buffer / Ring Buffer (リングバッファ)

🎯 実際のユースケース

📊 リアルタイム分析

💰 金融データ処理

🔍 異常検知

🎮 ゲーム・IoT

⚖️ メリット・デメリット

✅ メリット

❌ デメリット

📚 まとめ