Вот этот код:
0x00: subs r0, r0, #1 0x04: bne 0x0C 0x08: mov r1, #0 0x0C: mov r1, #1
После выполнения этого кода в зависимости от равенства начального значения регистра r0
единице в регистре r1
окажется либо один, либо ноль.
Сначала скажу еще несколько слов о самом ассемблерном коде. В данном случае речь идет не об ассемблере как языке программирования, а о машинных кодах. То есть здесь будет доказано некоторое утверждение о следующей программе в бинарном виде:
0xE2500001 0x1A000000 0xE3A01000 0xE3A01001
Если бы мы говорили об ассемблере, то проблемы доказательств утверждений о коде на высокоуровневых языках программирования остались бы в силе. А именно необходимость не только иметь и доверять имеющейся модели языка программирования, но и доверять компилятору, а в идеале и верифицировать его. Современные ассемблеры предоставляют множество возможностей, например, возможность модульного программирования, а значит становится необходима компоновка. Здесь же стадия компиляции и компоновки отсутствует.
Для доказательств я буду пользоваться средством для интерактивного доказательства теорем HOL (или на github’е) и созданной для него моделью ассемблерных инструкции для ARMv4. После того как вы получили последнюю версию HOL, скомпилировали её и модель ARMv4 — можете проделать все доказательства. Код я приведу целиком, чтобы у тех, кому интересно, была возможность полностью повторить все шаги доказательства.
Будет доказано две теоремы. Первая goal_eq1
о том, что если начальное значение регистра r0
равно 1, то через три шага исполнения в регистре r1
будет 0, также как и во всех остальных регистрах общего назначения:
|- ((x :bool[32]) = (1w :bool[32])) ⇒ (STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) <|registers := (r0 =+ x) (λ(n :register). (0w :bool[32])); psrs := (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|> = <|registers := (pc =+ (12w :bool[32])) (λ(n :register). (0w :bool[32])); psrs := (CPSR =+ SET_NZCV (F,T,T,F) (SET_IFMODE F F usr (0w :bool[32]))) (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|>)
Вторая теорема goal_ne1
, о том если начальное значение регистра r0
не равно 1, то через три шага исполнения в регистре r1
будет 1:
|- (x :bool[32]) ≠ (1w :bool[32]) ⇒ ∃(a :bool) (c :bool) (d :bool). STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) <|registers := (r0 =+ x) (λ(n :register). (0w :bool[32])); psrs := (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|> = <|registers := (pc =+ (16w :bool[32])) ((r1 =+ (1w :bool[32])) ((r0 =+ (n2w (MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num))) : bool[32])) (λ(n :register). (0w :bool[32])))); psrs := (CPSR =+ SET_NZCV (a,F,c,d) (SET_IFMODE F F usr (0w :bool[32]))) (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|>
Код доказательства этих теорем я почти не буду комментировать — ясно, что по сравнению с, казалось бы, простотой и почти очевидностью доказательств код для проверки машиной должен быть несуразно подробным.
Вначале необходимо загрузить модель ARMv4, определить основные константы и собственно программу.
FileSys.chDir "/home/path/to/your/HOL/examples/ARM/v4"; load "arm_evalLib"; open arm_evalLib; val _ = overload_on("sp", ``r13``); val _ = overload_on("lr", ``r14``); val _ = overload_on("pc", ``r15``); fun evaluate_st n state = let val memory = (rhs o concl) (SIMP_CONV (srw_ss()) [] ``^(state).memory``) val registers = (rhs o concl) (SIMP_CONV (srw_ss()) [] ``^(state).registers``) val psrs = (rhs o concl) (SIMP_CONV (srw_ss()) [] ``^(state).psrs``) in evaluate(n, memory, registers, psrs) end; fun evaluate_CONV state = evaluate_st 1 state; val reg_r0_x = set_registers empty_registers `[(r0,x)]`; val reg_r0_1 = set_registers empty_registers `[(r0,1w)]`; val psr = set_status_registers empty_psrs `[(CPSR,SET_NZCV (F,F,F,F) (SET_IFMODE F F usr 0w))]`; val prog = list_assemble empty_memory ["0x00: subs r0, r0, #1", "0x04: bne 0x0C", "0x08: mov r1, #0", "0x0C: mov r1, #1"];
Теперь доказательство первой из теорем и необходимых лемм. Доказательство происходит так: сначала доказывается, что после одного шага будет некоторое конкретное состояние регистров, затем доказывается, что необходимый бит регистра статуса будет равен 1, затем доказывается теорема про следующие два шага исполнения, и эти два доказательства используются для доказательства целевой теоремы.
val f1vx = evaluate(1,prog,reg_r0_x,psr); val f1vx_lhsc = (lhs o concl) f1vx; val f1vx_rhsc = (rhs o concl) f1vx; val f1v1 = evaluate(1,prog,reg_r0_1,psr); val f1v1_rhsc = (rhs o concl) f1v1; val f1v_thm = prove(``(x = 1w) ==> (^(f1vx_lhsc) = ^(f1v1_rhsc))``, SIMP_TAC (srw_ss()) [f1vx, combinTheory.UPDATE_def]); val f2v1 = evaluate_CONV f1v1_rhsc; val f2v1_rhsc = (rhs o concl) f2v1; val f2vx = evaluate_CONV f1vx_rhsc; val f2vx_lhsc = (lhs o concl) f2vx; val f2v_thm = prove(``(x = 1w) ==> (^(f2vx_lhsc) = ^(f2v1_rhsc))``, SIMP_TAC (srw_ss()) [f2vx, combinTheory.UPDATE_def]); val f2v_thm_rhsc = (rhs o concl) (UNDISCH f2v_thm); val f2f1v_thm = prove(``STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) x = STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) (STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) x)``, REWRITE_TAC [systemTheory.STATE_ARM_MMU_def, numLib.num_CONV ``2``, numLib.num_CONV ``1``]); val subgoal_eq1 = prove(``(x = 1w) ==> (STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) <|registers := (r0 =+ (x :bool[32])) (λ(n :register). (0w :bool[32])); psrs := (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|> = ^(f2v1_rhsc))``, REWRITE_TAC [f1vx, f2v_thm, f2f1v_thm]); val f3v1 = evaluate_CONV f2v_thm_rhsc; val f3v1_rhsc = (rhs o concl) f3v1; val f3f2v_thm = prove(``STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) x = STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) (STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) x)``, REWRITE_TAC [systemTheory.STATE_ARM_MMU_def, numLib.num_CONV ``3``, numLib.num_CONV ``1``]); val goal_eq1 = prove(``(x = 1w) ==> (STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) <|registers := (r0 =+ (x :bool[32])) (λ(n :register). (0w :bool[32])); psrs := (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|> = ^(f3v1_rhsc))``, DISCH_TAC THEN REWRITE_TAC [f3v1, UNDISCH subgoal_eq1, f3f2v_thm]);
Доказательство второй теоремы несколько сложней, так как там участвует отрицание. Отличия от доказательства первой теоремы в том, что для того чтоб не тянуть за собой символические выражения для значений несущественных битов регистра статуса используются кванторы существования.
val ef1vx = prove(``?a c d. ^(f1vx_lhsc) = <|registers := (pc =+ (4w :bool[32])) ((r0 =+ (n2w (MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num))) :bool[32])) (λ(n :register). (0w :bool[32]))); psrs := (CPSR =+ SET_NZCV (a, MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num)) = (0 : num), c, d) (SET_IFMODE F F usr (0w :bool[32]))) (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|>``, EXISTS_TAC ``(BIT (31 :num) (MOD_2EXP (32 :num) (w2n (x :bool[32]) + (4294967294 :num) + (1 :num))))`` THEN EXISTS_TAC ``ODD (DIV_2EXP (32 :num) (w2n (x :bool[32]) + (4294967294 :num) + (1 :num)))`` THEN EXISTS_TAC ``word_msb (x :bool[32]) /\ (BIT (31 :num) (MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num))) <> word_msb x)`` THEN REWRITE_TAC [f1vx]); val MODlem1 = prove(``!x. (x MOD 4294967296 = 0) ==> (?k. (x = 4294967296*k))``, RW_TAC arith_ss [] THEN ASSUME_TAC (SPEC ``x :num`` (SIMP_RULE (srw_ss()) [] (SPEC ``4294967296`` arithmeticTheory.DIVISION))) THEN EXISTS_TAC ``x DIV (4294967296 :num)`` THEN RW_TAC arith_ss []); val CPSRlem1 = prove(``((x :bool[32]) <> 1w) ==> ((MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num)) = (0 : num)) = F)``, SIMP_TAC (arith_ss) [arithmeticTheory.MOD_2EXP_def] THEN DISCH_TAC THEN SPOSE_NOT_THEN ASSUME_TAC THEN UNDISCH_TAC ``(x :bool[32]) <> (1w :bool[32])`` THEN RW_TAC bool_ss [] THEN SIMP_TAC arith_ss [MODlem1] THEN ASSUME_TAC (SPEC ``w2n (x :bool[32]) + (4294967295 :num)`` MODlem1) THEN `?(k :num). w2n x + (4294967295 :num) = (4294967296 :num) * k` by (RW_TAC arith_ss []) THEN `(k :num) > 0` by FULL_SIMP_TAC arith_ss [] THEN `?(r :num). w2n (x :bool[32]) = (4294967296 :num) * (r :num) + 1` by EXISTS_TAC ``(k :num) - 1`` THEN ASM_SIMP_TAC arith_ss [] THEN ` w2n (x :bool[32]) = (1 :num)` by ASSUME_TAC (SPEC ``(x :bool[32])`` (INST_TYPE [alpha |-> ``:32``] wordsTheory.w2n_lt)) THEN FULL_SIMP_TAC (arith_ss ++ wordsLib.SIZES_ss) [] THEN PROVE_TAC [wordsTheory.n2w_w2n]); val subgoal_ne1 = prove(``((x :bool[32]) <> 1w) ==> (?a c d. ^(f1vx_lhsc) = <|registers := (pc =+ (4w :bool[32])) ((r0 =+ (n2w (MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num))) :bool[32])) (λ(n :register). (0w :bool[32]))); psrs := (CPSR =+ SET_NZCV (a, F, c, d) (SET_IFMODE F F usr (0w :bool[32]))) (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|>)``, DISCH_TAC THEN ASSUME_TAC (UNDISCH CPSRlem1) THEN ASSUME_TAC ef1vx THEN FULL_SIMP_TAC pure_ss [] THEN EXISTS_TAC ``a :bool`` THEN EXISTS_TAC ``c :bool`` THEN EXISTS_TAC ``d :bool`` THEN REWRITE_TAC []); val f3f1v_thm = prove(``STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) x = STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) (STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) x)``, REWRITE_TAC [systemTheory.STATE_ARM_MMU_def, numLib.num_CONV ``3``, numLib.num_CONV ``2``, numLib.num_CONV ``1``]); val f32vx = evaluate_st 2 (rhs (# 2 (strip_exists (concl (UNDISCH subgoal_ne1))))); val f32vx_rhsc = (rhs o concl) f32vx; val goal_ne1 = prove(``((x :bool[32]) <> 1w) ==> (?a c d. (STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) <|registers := (r0 =+ (x :bool[32])) (λ(n :register). (0w :bool[32])); psrs := (λ(x :psr). SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32]))); memory := ((0w :bool[30]) |: [ enc (SUB AL T (0w :bool[4]) (0w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8])) : arm_instruction); enc (B NE (0w :bool[24])); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (0w :bool[8]))); enc (MOV AL F (1w :bool[4]) (Dp_immediate (0w :bool[4]) (1w :bool[8]))) ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F; cp_state := ()|> = ^(f32vx_rhsc)))``, DISCH_TAC THEN ASSUME_TAC (UNDISCH subgoal_ne1) THEN FULL_SIMP_TAC pure_ss [f3f1v_thm] THEN EXISTS_TAC ``a :bool`` THEN EXISTS_TAC ``c :bool`` THEN EXISTS_TAC ``d :bool`` THEN REWRITE_TAC [f32vx]);
Доказательства, на мой взгляд, достаточно трудоемкие, особенно если их проводить для чего-то существенного, но те аспиранты, которые делали модель, пишут в своих статьях, что с помощью разработанных ими моделей они верифицировали какие-то нетривиальные вещи. Так что, может быть, подобные доказательства это будущее программ существенных для безопасности.
ссылка на оригинал статьи http://habrahabr.ru/post/156413/
Добавить комментарий