第7章償却を除去する

memo: スケジューリングの役割

イメージ的には銀行員の手法での__支払い__を実装に反映した感じ
後ろに重いサスペンションが控えている場合の挙動の違い:
- 6章(償却):「軽い操作で__仮想的に__その内のN個のデビットを払ったことにしておこう」
- 7章(最悪):「軽い操作で__実際に__その内のN個の(小さな)サスペンションを事前に評価しておこう」
支払い(or 評価)が終わっていないオブジェクト(サスペンション)に対するアクセスは許可されない

7.1 スケジューリング

省略

7.2 リアルタイムキュー

省略

7.3 二項ヒープ

目的:

遅延二項ヒープ(6.4.1)では挿入コストが__償却__でO(1)だったのを、__最悪__でO(1)にする

基本的な流れ(他の箇所と同様):

モノリシックなデータ構造(list)から、インクリメンタルなデータ構造(stream)への変換
スケジュールの導入

変更1: insTree関数をインクリメンタルにする

変更内容:

一番上の遅延リストをストリームに変更 (ノード単位で遅延可能)
0bitを表すノードの導入
- 旧版で仮想的な接頭0bitをスキップするために必要だったO(log n)の再帰(モノリシック)部分が除去可能となった

もともと(6.4.1)のモノリシックな実装:

(* データ定義: Heapは一番外側のsusp以外は非遅延かつモノリシック *)
datatype Tree = NODE of int x Elem.T x Tree list  (* rank(ビット位置) x elem x children *)
type Heap = Tree list susp  (* 数値表現の1bitに対応するツリーだけを保持する *)

(* insTree関数: 遅延を含まないので log(N) の実コストが掛かる *)
fun insTree (t, []) = [t]
  | insTree (t, ts as t' :: ts') =
    if rank t < rank t' then t :: ts else insTree (link (t, t'), ts') (* この再帰で O(log n) 必要 *)

本節でのインクリメンタルな実装:

(* データ定義 *)
datatype Tree = NODE of Elem.T x Tree list (* ビット位置の情報が不要となった *)
datatype Digit = ZERO | ONE of Tree (* 0bitの概念を導入するために一階層増えた *)
type Heap = Digit Stream

(* insTree関数: インクリメンタル版 *)
fun lazy insTree (t, $NIL) = $CONS (ONE t, $NIL)
       | insTree (t, $CONS (ZERO, ds)) = $CONS (ONE t, ds)
       | insTree (t, $CONS (ONE t', ds)) =
            $CONS (ZERO, insTree (link (t, t'), ds)) (* 全ての関数節が再帰を挟まずに遅延可能になった *)

変更2: スケジュールの追加

データ定義の修正およびinsert関数にスケジュール管理を追加:

スケジュールはジョブのリスト
- 各ジョブの型はDigit Streamで、これは「insTree呼び出しの未実行部分」を表す
insert関数の償却コストは2だった(6.4.1)ので、各呼び出しに付き二回のスケジュール実行を行えば良い

(* データ定義 *)
type Schedule = Digit Stream list
type Heap = Digit Stream x Schedule

(* スケジュール実行関数 *)
fun exec [] = [
  | exec (($CONS (ONE t, _)) :: sched) = sched  (* 1bit部分に達したので遅延されたinsTree呼び出しは実行完了 *)
  | exec (($CONS (ZERO, job)) :: sched) = job :: sched (* 先頭一つ分の0bitをスキップ *)
 (* memo: `job`は、insTree内の`insTree(link(t,t'), ds)`(の結果)に対応し、このパターンマッチはこの(遅延されていた)式を実行するに等しい  *)

(* insert関数 *)
fun insert (x, (ds, sched)) =
      let val ds' = insTree (NODE (x, []), ds)  (* 通常通りinsTreeを呼び出して、遅延ストリームを取得する *)
      in (ds', exec (exec (ds' :: sched))) end  (* 二回分スケジュールを実行する *)

実装変更は完了。

insert関数の最悪コストがO(1)であることを示すために必要なことは？

内部で呼んでいるinsTreeとexecの両方がO(1)であることを示す必要がある
insTreeのunshared-costはO(1)であることが自明 (lazy付きで宣言されているため)
execは常に二回呼びだされる:
- 各呼び出しのコストがO(1)なら全体もO(1)
- execのパターンマッチでforceされるサスペンションの依存先が既にforce済みなら、execの実行コストはO(1)
- 依存先:
  - 各サスペンションは、同じインデックス(ビット位置)の以前のサスペンションに依存している
  - 依存先が常に評価済みであることの証明は定理7.1で行う

# サスペンションの依存の例

init : 0
add-1: 1
add-2: 0 1
add-3: 1 1
add-4: 0 0 1
add-5: 1 0 1
add-6: 0 1 1
add-7: 1 1 1
add-8: 0 0 0 1
       ↑
例えばスケジュールを使わずに、連続して8要素を(遅延)追加後に、先頭要素を取得しようとすると、
その依存先(同じビット位置 = 0bit目)の遅延されていた処理が一度に実行されてしまう。
(この例だとforceが7回再帰的に呼ばれ、その中でlinkが四回実行される)

用語定義:

範囲(range):
- ジョブに対応するdigit列
- 各__範囲__はZERO*ONEのdigit列を含む (! 正規表現)
- 評価済みのdigitはスケジュール(ジョブ)からは抜けるので__範囲__には含まれない
- 例:
  - 一度もexecが適用されていないジョブの__範囲__に含まれるインデックス0..mとなる (m = ONEのインデックス)
  - 二回execが適用された後のジョブの__範囲__に含まれるインデックスは2..mとなる (m >= 2 が前提)
オーバーラップ:
- 二つのジョブの__範囲__内のdigit列のインデックスに重複がある状態を表す呼称
- __オーバーラップ__が存在するということは、依存先が未評価のサスペンションが存在する、ということ
  - そのため__オーバーラップ__が存在しないことを証明する必要がある (定理7.1)
- 定義上、__オーバーラップ__が存在しないのであれば、ヒープ全体での未評価のサスペンションは最大でO(log n)となる
完了ZERO(completed zero):
- ストリーム内の対応するセルが既に評価(and メモ)されているZEROのこと

定理 7.1

全ての有効なヒープは、以下の条件を満たしている:

スケジュール上での最初の__範囲__の前方に、少なくとも二つの__完了ZERO__を有している
スケジュール上で隣接する二つの__範囲__の間に、少なくとも一つの__完了ZERO__を有してる
- ! これが__オーバーラップ__がないことを保証している

証明

定義:

r1とr2: スケジュール内の最初の二つの__範囲__
z1とz2: r1より前の二つの__完了ZERO__
z3: r1とr2の間の__完了ZERO__
r0: これから追加される新しい__範囲__
- insert関数は、スケジュールの先頭にr0を追加し、すぐにexecを二回呼び出す
- NOTE: r0の終端のONEは、z1を置換する
m: r0内のZEROの数

ケース分析:

ケース1: m = 0
- r0内の唯一のdigitはONE
- r0は最初のexecで除去される
- 次のexecはr1の最初のdigitをforceする
- もしそれがZEROなら、それは最初の__範囲__より前の二番目の__完了ZERO__となる (一番目はz2)
- もしそれがONEなら、r1は除去されてr2が最初の__範囲__となる
  - r2に先行する二つの__完了ZERO__はz2とz3
ケース2: m = 1
- r0内の二つのdigitはZEROとONE
- 二回のexecによってr0は除去される
- 先頭のZEROはz1の代わりに、r1の前の二つの__完了ZERO__の一つとなる
ケース3: m >= 2
- r0の最初の二つのdigitはZERO
- 二回のexecの後に、それらは(新しい__範囲__であるr0の残り部分の前方の)二つの__完了ZERO__となる
- z2はr0とr1の間の単一の__完了ZERO__となる

! __範囲__がスケジュール上に存在しない場合のケースが記述されていないのは、そもそも__範囲__が二つ未満なら__オーバーラップ__が発生し得ないため

演習 7.3

問: insTree関数からlazy宣言を外しても実行時間には悪影響を与えないことを示せ

lazyの有無で実装を比較してみる:

(* lazy有り版の展開形 *)
fun insTree (t, ds) =
      $case ds of
          $NIL => CONS (ONE t, $NIL)
        | $CONS (ZERO, ds') => CONS (ONE t, ds')
        | $CONS (ONE t', ds') => CONS (ZERO, insTree (link (t, t'), ds'))

(* lazy無し版 *)
fun insTree (t, $NIL) = $CONS (ONE t, $NIL)
  | insTree (t, $CONS (ZERO, ds)) = $CONS (ONE t, ds)
  | insTree (t, $CONS (ONE t', ds)) =
      $CONS (ZERO, insTree (link (t, t'), ds)) (* 全ての関数節が再帰無しに遅延されるようになった *)

差異はinsTree関数呼び出し時にdsにパターンマッチ(force)するかどうかだけ:

dsは一つ前のinsTree呼び出しの結果(r0だったもの)
そしてr0には必ず二回execが適用されているので、先頭要素が既にforce済みであることは確実
そのためここで先頭要素にパターンマッチ(force)しても評価が始まることはないので、実行コストには影響を与えない

! 以降は本筋とはあまり関係がないので、省略予定 (時間に余裕がありそうなら含める)

insert以外の関数を新しいデータ構造に合わせて修正するのは難しくない。

四つの有用なコメントを書いておく:

1. mergeとdeleteMinは全てのサスペンションを評価している
1. 定理7.1からヒープは最大でO(log n)個の未評価サスペンションしか保持していない
- そのため全てのサスペンションを評価してもmerge,findMin,deleteMinの最悪コストのオーダは変わらない
1. removeMinTreeは時々ZEROで終わるストリームを生成するが、以下のいずれかなので問題ない:
- findMinによって捨てられる
- deleteMin内で全要素がONEのリストによってマージされる
1. deleteMinは以前よりも仕事している
- 子供のリストを有効なヒープに変換する仕事が増えた
- listToStream (map ONE (rev children))

演習 7.4

問: 特定用途向けの最適化されたmrg関数(mrgWithList)を実装せよ。 mrgWithList(rev c, ds') = mrg (listToStream (map ONE (rev c)), ds')

fun mrgWithList(cs, $NIL) = listToStream(map ONE cs)
  | mrgWithList([], ds) = ds
  | mrgWithList((c :: cs), $CONS(ZERO, ds)) = $CONS(c, mrgWithList(cs, ds))
  | mrgWithList((c :: cs), $CONS(ONE t, ds)) =
      $CONS(ZERO, insTree (link(c, t), mrgWithList(cs, ds)))

7.4 共有ボトムアップマージソート

目的:

6.4.3のマージソートのコストを償却から最悪に変換する
- add関数: O(log n)
- sort関数: O(n)

add関数:

もともとはaddSeg関数だけがモノリシックな遅延評価関数だった (全体で)
インクリメンタルにする必要がある
- ただしmrgだけをインクリメンタルすれば十分
- mrgを除けば、addSegはO(log n)ステップなので、正格に実行するだけ要求を満たせる
mrg
- fun lazyを付与 + 対象をstreamにすることでインクリメンタル(各ステップをO(1))に実行可能にした
- sort実行時に未評価サスペンションがO(n)に収まるように、addの各呼び出しでスケジュールを実行する必要がある

sort関数:

ソート自体のunshared-costは(以前と変わらず)O(n)
- 今回は最後にstreamToListの呼び出しが増えたが、それもO(n)
shared-costに関しては、add関数が適切にスケジュールを実行してくれればO(n)に収まる

セグメントの表現は変更する:

listからstreamに変更
また各セグメントにスケジュールを持たせる
- 償却解析では、addの償却コストはおおよそ2B'であった
  - B'は、n' = n + 1内の1bitの数
  - つまり、セグメント(数値表現なら1bit)毎に二つのサスペンションを実行すれば良い
- セグメントの型はElem.T Stream list
- 各ストリームは遅延されたmrg呼び出しに対応する

最終的なデータ型定義とスケジュール実行関数:

(* データ型定義 *)
type Schedule = Elem.T Stream list
type Sortable = int x (Elem.T Stream x Schedule) list

(* スケジュール実行: mrg関数の遅延された各ステップを実行する *)
fun exec1 [] = []
  | exec1 (($NIL) :: sched) = exec1 sched (* ストリーム一つ分のマージが完了した *)
  | exec1 (($CONS (x, xs)) :: sched) = xs :: sched

(* exec1関数を二回呼び出すだけ *)
(* add関数は、exec2関数を、各セグメントに対して呼び出す *)
fun exec2 (xs, sched) = (xs, exec1 (exec1 sched))

add関数の定義:

(* add関数: 基本的な処理の流れは以前と同様 *)
fun add (x, (size, segs)) =
     let fun addSet (xs, segs, size, rsched) =
              if size mod 2 = 0 then (xs, rev rsched) :: segs (* マージ時の依存関係を考慮してスケジュールは要素数が少ないストリーム順にスケジュールに格納する *)
              else let val ((xs', []) :: segs') = segs (* []は未評価の古いセグメントが残っていないことのアサート *)
                       val xs'' = mrg (xs, xs')  (* mrgはインクリメンタル *)
                   in addSet (xs'', segs', size div 2, xs'' :: rsched) end
         val segs' = addSeg ($CONS (x, $NIL), segs, size, []) (* addSegは正格になった *)
     in (size+1, map exec2 segs') end (* 各セグメントにexec2を適用 *)

add関数のunshared-costはO(log n)
- => O(log n)回のexec2呼び出しがO(1)で終わることが証明できればOK
sort関数のunshared-costはO(n)
- => 未評価のサスペンションがO(n)であることが証明できればOK

マージの各ステップは他の二つのストリームに依存している:

現在のストリームはS'[i]
依存のストリームはS'[i-1]とS[i]
- S'[i] = merge(S'[i-1], S[i])
S'[i-1]は、S'[i]の前にスケジュールされているので、S'[i]の実行前に完全に評価されている
S[i]は、S'[i]を生成するadd呼び出しの前に、完全に評価されているはず
- 補助定理 7.2で証明
上の二つにより、exec2の各呼び出しの最悪コストはO(1)

補助定理 7.2

サイズnの任意のソート可能コレクションに関しては、サイズがm=2^kのセグメント用のスケジュールは、最大で2*m - 2*(n mod m + 1)要素を含んでいる

この補助定理により、次の二つが成立する:

addSegでのマージ対象となるストリームは全て完全に評価済みである
全体の未評価サスペンションは最大でもO(n)である

2*m - 2*(n mod m + 1)に関する補足:

最大値: (数値表現で)下位kビットが全て0
- セグメントができた直後
- 2*m - 2
最小値: (数値表現で)下位kビットが全て1
- セグメントがマージされる直前 (後一つでも要素が増えたらマージされる)
- 2*m - 2*m = 0

証明

状況:

サイズnのソート可能コレクション
nの下位kビットが1
- nはc * 2^(k+1) + (2^k - 1)と書ける (cは適切な整数値)
addはサイズがm = 2^kの新しいセグメントを生産する (! 新セグメントができたケース)
- スケジュールは2,4,8,...,2^kのストリーム群を含んでいる
- スケジュールの合計サイズは2^(k+1) - 2 = 2*m - 2
- exec2実行後に、スケジュールのサイズは2*m - 4になる
- 新しいコレクションのサイズはn' = n + 1 = c*2^(k+1) + 2^k
- 2*m - 4 < 2*m - 2*(n' mod m + 1) = 2*m - 2なので、このセグメント関しては補助定理が成立する
mより大きいサイズm'のセグメントは、原則addによる影響は受けない (! 小さいセグメントへの要素追加があったケース)
- exec2の実行だけは例外
- スケジュールのサイズが2減る
  - 新しい上界: 2*m' - 2*(n mod m' + 1) - 2 = 2*m' - 2*(n' mod m' + 1)
  - => 条件を満たしている
nの下位kビットが1だとする (! セグメントがマージされたケース)
- m = 2^i where i < kが成り立つ任意のセグメントに関して、スケジュール内の要素数は最大でも、
- 2*m - 2*(n mod m + 1) = 2*m - 2*((m - 1) + 1) = 0
- 完全に評価済み

コレクション内のスケジュール群の要素数合計は最大でも:

式は本を参照
- 直感的には、セグメント作成後に要素が追加(1bit部分)が追加される度にスケジュールは減っていくので、一番最上位のセグメントの生成直後が最も要素数が多い (きっと...)
- 上限: 2n
- => sort関数の最悪コストはO(n)
6.4.3の物理学者の手法のポテンシャル関数に似てるね

7.5 章末注

省略

sile/pfds-7.md

第7章 償却を除去する