Real-time Chunking (RTC)

フローマッチングベースの行動チャンク方策を、推論レイテンシ下でも滑らかに継続実行するための非同期アルゴリズム。Kevin Black, Sergey Levine ら(Physical Intelligence)による “Real-time Execution of Action Chunking Flow Policies” / “Training-time action conditioning for efficient real-time chunking”(arXiv:2512.05964)。

背景:チャンク方策の継ぎ目問題

ACTpi0 等は H ステップ分の行動チャンクをまとめて生成する。推論に数百 ms かかると、新しいチャンクが届くまで古いチャンクを消費し続ける必要があり、チャンク境界で軌道が不連続になりジッタを生む。チャンク全体を生成し終えてからでないと使えない(10 denoise step 完了待ち)点も即応性を損なう。

核となる考え方:prefix-matching と receding horizon

  • 直前チャンクの未実行部分を固定 prefixとして保持し、新チャンクの denoise を prefix に整合させて生成する。これによりチャンク境界で軌道が連続する。
  • チャンクの先頭は推論・通信遅延に「埋もれる (receding horizon)」。中間が usable な区間で、後半はモデル予測が不確実になる。高速化で usable chunk が縮むと、control bounded(faster-than-demonstration-execution の上限解析)に達する。

Full Streaming への展開

full-streaming-inference では、RTC の「逐次生成」発想を AE に持ち込み、flow matching を自己回帰的に書き換えて各 denoise step が行動列の一部を出力するようにする。これにより 480 Hz の力ループで未 commit ノードのみを継続更新する設計が可能になる。V2 の軌道後処理(Temporal/Spatial Optimization)は RTC の prefix-matching と独立に動くよう設計され、RTC を壊さない。

関連: flow-matching / full-streaming-inference / pi0