Верификация программ на ARM ассемблере

от автора

В своей прошлой статье я описал процесс верификации примитивной функции на Си. Параллельно привел соображения, почему верификация Си кода недостаточна для того, чтоб считать программу безошибочной. В основном эти соображения сводятся к мысли, что написать код — это только часть истории о получении работающей программы. Следующим приближением к тому, чтобы получить действительно безошибочную программу, является верификация ассемблерных кодов, их уже не нужно будет транслировать и поэтому полностью исключится обширное поле для возникновения ошибок. В данной статье я опишу процесс доказательства некоторых свойств уже для ассемблерного кода, который на порядок примитивней, чем даже простейшая функция на Си, о которой говорилось в прошлой статье.
Вот этот код:

0x00: subs r0, r0, #1 0x04: bne 0x0C 0x08: mov r1, #0 0x0C: mov r1, #1 

После выполнения этого кода в зависимости от равенства начального значения регистра r0 единице в регистре r1 окажется либо один, либо ноль.

Сначала скажу еще несколько слов о самом ассемблерном коде. В данном случае речь идет не об ассемблере как языке программирования, а о машинных кодах. То есть здесь будет доказано некоторое утверждение о следующей программе в бинарном виде:

0xE2500001 0x1A000000 0xE3A01000 0xE3A01001 

Если бы мы говорили об ассемблере, то проблемы доказательств утверждений о коде на высокоуровневых языках программирования остались бы в силе. А именно необходимость не только иметь и доверять имеющейся модели языка программирования, но и доверять компилятору, а в идеале и верифицировать его. Современные ассемблеры предоставляют множество возможностей, например, возможность модульного программирования, а значит становится необходима компоновка. Здесь же стадия компиляции и компоновки отсутствует.

Для доказательств я буду пользоваться средством для интерактивного доказательства теорем HOL (или на github’е) и созданной для него моделью ассемблерных инструкции для ARMv4. После того как вы получили последнюю версию HOL, скомпилировали её и модель ARMv4 — можете проделать все доказательства. Код я приведу целиком, чтобы у тех, кому интересно, была возможность полностью повторить все шаги доказательства.

Будет доказано две теоремы. Первая goal_eq1 о том, что если начальное значение регистра r0 равно 1, то через три шага исполнения в регистре r1 будет 0, также как и во всех остальных регистрах общего назначения:

|- ((x :bool[32]) = (1w :bool[32])) ⇒    (STATE_ARM_MMU (NO_CP :unit coproc) (3 :num)       <|registers := (r0 =+ x) (λ(n :register). (0w :bool[32]));         psrs :=           (λ(x :psr).              SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));         memory :=           ((0w :bool[30]) |:            [             enc               (SUB AL T (0w :bool[4]) (0w :bool[4])                  (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                  arm_instruction);             enc (B NE (0w :bool[24]));             enc               (MOV AL F (1w :bool[4])                  (Dp_immediate (0w :bool[4]) (0w :bool[8])));             enc               (MOV AL F (1w :bool[4])                  (Dp_immediate (0w :bool[4]) (1w :bool[8])))             ]) (λ(a :bool[30]). (0xE6000010w :bool[32]));         undefined := F; cp_state := ()|> =     <|registers :=         (pc =+ (12w :bool[32])) (λ(n :register). (0w :bool[32]));       psrs :=         (CPSR =+ SET_NZCV (F,T,T,F) (SET_IFMODE F F usr (0w :bool[32])))           (λ(x :psr).              SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));       memory :=         ((0w :bool[30]) |:          [           enc             (SUB AL T (0w :bool[4]) (0w :bool[4])                (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                arm_instruction);           enc (B NE (0w :bool[24]));           enc             (MOV AL F (1w :bool[4])                (Dp_immediate (0w :bool[4]) (0w :bool[8])));           enc             (MOV AL F (1w :bool[4])                (Dp_immediate (0w :bool[4]) (1w :bool[8])))           ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;       cp_state := ()|>) 

Вторая теорема goal_ne1, о том если начальное значение регистра r0 не равно 1, то через три шага исполнения в регистре r1 будет 1:

|- (x :bool[32]) ≠ (1w :bool[32]) ⇒    ∃(a :bool) (c :bool) (d :bool).      STATE_ARM_MMU (NO_CP :unit coproc) (3 :num)        <|registers := (r0 =+ x) (λ(n :register). (0w :bool[32]));          psrs :=            (λ(x :psr).               SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));          memory :=            ((0w :bool[30]) |:             [              enc                (SUB AL T (0w :bool[4]) (0w :bool[4])                   (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                   arm_instruction);              enc (B NE (0w :bool[24]));              enc                (MOV AL F (1w :bool[4])                   (Dp_immediate (0w :bool[4]) (0w :bool[8])));              enc                (MOV AL F (1w :bool[4])                   (Dp_immediate (0w :bool[4]) (1w :bool[8])))              ]) (λ(a :bool[30]). (0xE6000010w :bool[32]));          undefined := F; cp_state := ()|> =      <|registers :=          (pc =+ (16w :bool[32]))            ((r1 =+ (1w :bool[32]))               ((r0 =+                 (n2w                    (MOD_2EXP (32 :num)                       (w2n x + (4294967294 :num) + (1 :num))) :                    bool[32])) (λ(n :register). (0w :bool[32]))));        psrs :=          (CPSR =+           SET_NZCV (a,F,c,d) (SET_IFMODE F F usr (0w :bool[32])))            (λ(x :psr).               SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));        memory :=          ((0w :bool[30]) |:           [            enc              (SUB AL T (0w :bool[4]) (0w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                 arm_instruction);            enc (B NE (0w :bool[24]));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (0w :bool[8])));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])))            ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;        cp_state := ()|> 

Код доказательства этих теорем я почти не буду комментировать — ясно, что по сравнению с, казалось бы, простотой и почти очевидностью доказательств код для проверки машиной должен быть несуразно подробным.

Вначале необходимо загрузить модель ARMv4, определить основные константы и собственно программу.

FileSys.chDir "/home/path/to/your/HOL/examples/ARM/v4"; load "arm_evalLib"; open arm_evalLib;  val _ = overload_on("sp", ``r13``); val _ = overload_on("lr", ``r14``); val _ = overload_on("pc", ``r15``);  fun evaluate_st n state = 	let val memory = (rhs o concl) (SIMP_CONV (srw_ss()) [] ``^(state).memory``) 	    val registers = (rhs o concl) (SIMP_CONV (srw_ss()) [] ``^(state).registers``) 	    val psrs = (rhs o concl) (SIMP_CONV (srw_ss()) [] ``^(state).psrs``) 	in evaluate(n, memory, registers, psrs) end; fun evaluate_CONV state = evaluate_st 1 state;  val reg_r0_x = set_registers empty_registers `[(r0,x)]`; val reg_r0_1 = set_registers empty_registers `[(r0,1w)]`;  val psr = set_status_registers empty_psrs  `[(CPSR,SET_NZCV (F,F,F,F) (SET_IFMODE F F usr 0w))]`;  val prog = list_assemble empty_memory    ["0x00: subs r0, r0, #1",     "0x04: bne 0x0C",     "0x08: mov r1, #0",     "0x0C: mov r1, #1"]; 

Теперь доказательство первой из теорем и необходимых лемм. Доказательство происходит так: сначала доказывается, что после одного шага будет некоторое конкретное состояние регистров, затем доказывается, что необходимый бит регистра статуса будет равен 1, затем доказывается теорема про следующие два шага исполнения, и эти два доказательства используются для доказательства целевой теоремы.

val f1vx = evaluate(1,prog,reg_r0_x,psr); val f1vx_lhsc = (lhs o concl) f1vx; val f1vx_rhsc = (rhs o concl) f1vx; val f1v1 = evaluate(1,prog,reg_r0_1,psr); val f1v1_rhsc = (rhs o concl) f1v1; val f1v_thm = prove(``(x = 1w) ==> (^(f1vx_lhsc) = ^(f1v1_rhsc))``, SIMP_TAC (srw_ss()) [f1vx, combinTheory.UPDATE_def]);  val f2v1 = evaluate_CONV f1v1_rhsc; val f2v1_rhsc = (rhs o concl) f2v1; val f2vx = evaluate_CONV f1vx_rhsc; val f2vx_lhsc = (lhs o concl) f2vx; val f2v_thm = prove(``(x = 1w) ==> (^(f2vx_lhsc) = ^(f2v1_rhsc))``, SIMP_TAC (srw_ss()) [f2vx, combinTheory.UPDATE_def]); val f2v_thm_rhsc = (rhs o concl) (UNDISCH f2v_thm);  val f2f1v_thm = prove(``STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) x = STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) (STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) x)``, REWRITE_TAC [systemTheory.STATE_ARM_MMU_def, numLib.num_CONV ``2``, numLib.num_CONV ``1``]); val subgoal_eq1 = prove(``(x = 1w) ==> (STATE_ARM_MMU (NO_CP :unit coproc) (2 :num)      <|registers :=          (r0 =+ (x :bool[32])) (λ(n :register). (0w :bool[32]));        psrs :=          (λ(x :psr).             SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));        memory :=          ((0w :bool[30]) |:           [            enc              (SUB AL T (0w :bool[4]) (0w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                 arm_instruction);            enc (B NE (0w :bool[24]));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (0w :bool[8])));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])))            ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;        cp_state := ()|> = ^(f2v1_rhsc))``, REWRITE_TAC [f1vx, f2v_thm, f2f1v_thm]);  val f3v1 = evaluate_CONV f2v_thm_rhsc; val f3v1_rhsc = (rhs o concl) f3v1; val f3f2v_thm = prove(``STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) x = STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) (STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) x)``, REWRITE_TAC [systemTheory.STATE_ARM_MMU_def, numLib.num_CONV ``3``, numLib.num_CONV ``1``]); val goal_eq1 = prove(``(x = 1w) ==> (STATE_ARM_MMU (NO_CP :unit coproc) (3 :num)      <|registers :=          (r0 =+ (x :bool[32])) (λ(n :register). (0w :bool[32]));        psrs :=          (λ(x :psr).             SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));        memory :=          ((0w :bool[30]) |:           [            enc              (SUB AL T (0w :bool[4]) (0w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                 arm_instruction);            enc (B NE (0w :bool[24]));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (0w :bool[8])));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])))            ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;        cp_state := ()|> = ^(f3v1_rhsc))``, DISCH_TAC THEN REWRITE_TAC [f3v1, UNDISCH subgoal_eq1, f3f2v_thm]); 

Доказательство второй теоремы несколько сложней, так как там участвует отрицание. Отличия от доказательства первой теоремы в том, что для того чтоб не тянуть за собой символические выражения для значений несущественных битов регистра статуса используются кванторы существования.

val ef1vx = prove(``?a c d. ^(f1vx_lhsc) =  <|registers :=        (pc =+ (4w :bool[32]))          ((r0 =+            (n2w               (MOD_2EXP (32 :num)                  (w2n x + (4294967294 :num) + (1 :num))) :bool[32]))             (λ(n :register). (0w :bool[32])));      psrs :=        (CPSR =+         SET_NZCV           (a,            MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num)) =            (0 :            num),            c,            d)           (SET_IFMODE F F usr (0w :bool[32])))          (λ(x :psr).             SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));      memory :=        ((0w :bool[30]) |:         [          enc            (SUB AL T (0w :bool[4]) (0w :bool[4])               (Dp_immediate (0w :bool[4]) (1w :bool[8])) :               arm_instruction);          enc (B NE (0w :bool[24]));          enc            (MOV AL F (1w :bool[4])               (Dp_immediate (0w :bool[4]) (0w :bool[8])));          enc            (MOV AL F (1w :bool[4])               (Dp_immediate (0w :bool[4]) (1w :bool[8])))          ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;      cp_state := ()|>``, EXISTS_TAC ``(BIT (31 :num) (MOD_2EXP (32 :num) (w2n (x :bool[32]) + (4294967294 :num) + (1 :num))))`` THEN EXISTS_TAC ``ODD  (DIV_2EXP (32 :num) (w2n (x :bool[32]) + (4294967294 :num) + (1 :num)))`` THEN EXISTS_TAC ``word_msb (x :bool[32]) /\ (BIT (31 :num) (MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num))) <> word_msb x)`` THEN REWRITE_TAC [f1vx]);  val MODlem1 = prove(``!x. (x MOD 4294967296 = 0) ==> (?k. (x = 4294967296*k))``, RW_TAC arith_ss [] THEN ASSUME_TAC (SPEC ``x :num`` (SIMP_RULE (srw_ss()) [] (SPEC ``4294967296`` arithmeticTheory.DIVISION))) THEN EXISTS_TAC ``x DIV (4294967296 :num)`` THEN RW_TAC arith_ss []);  val CPSRlem1 = prove(``((x :bool[32]) <> 1w) ==> ((MOD_2EXP (32 :num) (w2n x + (4294967294 :num) + (1 :num)) = (0 : num)) = F)``, SIMP_TAC (arith_ss) [arithmeticTheory.MOD_2EXP_def] THEN DISCH_TAC THEN SPOSE_NOT_THEN ASSUME_TAC THEN UNDISCH_TAC ``(x :bool[32]) <> (1w :bool[32])`` THEN RW_TAC bool_ss [] THEN  SIMP_TAC arith_ss [MODlem1] THEN ASSUME_TAC (SPEC ``w2n (x :bool[32]) + (4294967295 :num)``  MODlem1) THEN `?(k :num). w2n x + (4294967295 :num) = (4294967296 :num) * k` by (RW_TAC arith_ss []) THEN `(k :num) > 0` by FULL_SIMP_TAC arith_ss [] THEN `?(r :num). w2n (x :bool[32]) =  (4294967296 :num) * (r :num) + 1` by EXISTS_TAC ``(k :num) - 1`` THEN ASM_SIMP_TAC arith_ss [] THEN ` w2n (x :bool[32]) = (1 :num)` by ASSUME_TAC (SPEC ``(x :bool[32])`` (INST_TYPE [alpha |-> ``:32``] wordsTheory.w2n_lt)) THEN FULL_SIMP_TAC (arith_ss ++ wordsLib.SIZES_ss) [] THEN PROVE_TAC [wordsTheory.n2w_w2n]);  val subgoal_ne1 = prove(``((x :bool[32]) <> 1w) ==> (?a c d. ^(f1vx_lhsc) =  <|registers :=        (pc =+ (4w :bool[32]))          ((r0 =+            (n2w               (MOD_2EXP (32 :num)                  (w2n x + (4294967294 :num) + (1 :num))) :bool[32]))             (λ(n :register). (0w :bool[32])));      psrs :=        (CPSR =+         SET_NZCV           (a,            F,            c,            d)           (SET_IFMODE F F usr (0w :bool[32])))          (λ(x :psr).             SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));      memory :=        ((0w :bool[30]) |:         [          enc            (SUB AL T (0w :bool[4]) (0w :bool[4])               (Dp_immediate (0w :bool[4]) (1w :bool[8])) :               arm_instruction);          enc (B NE (0w :bool[24]));          enc            (MOV AL F (1w :bool[4])               (Dp_immediate (0w :bool[4]) (0w :bool[8])));          enc            (MOV AL F (1w :bool[4])               (Dp_immediate (0w :bool[4]) (1w :bool[8])))          ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;      cp_state := ()|>)``, DISCH_TAC THEN ASSUME_TAC (UNDISCH CPSRlem1) THEN ASSUME_TAC ef1vx THEN FULL_SIMP_TAC pure_ss [] THEN EXISTS_TAC ``a :bool`` THEN EXISTS_TAC ``c :bool`` THEN  EXISTS_TAC ``d :bool`` THEN REWRITE_TAC []);  val f3f1v_thm = prove(``STATE_ARM_MMU (NO_CP :unit coproc) (3 :num) x = STATE_ARM_MMU (NO_CP :unit coproc) (2 :num) (STATE_ARM_MMU (NO_CP :unit coproc) (1 :num) x)``, REWRITE_TAC [systemTheory.STATE_ARM_MMU_def, numLib.num_CONV ``3``, numLib.num_CONV ``2``, numLib.num_CONV ``1``]); val f32vx = evaluate_st 2 (rhs (# 2 (strip_exists (concl (UNDISCH subgoal_ne1))))); val f32vx_rhsc = (rhs o concl) f32vx; val goal_ne1 = prove(``((x :bool[32]) <> 1w) ==> (?a c d. (STATE_ARM_MMU (NO_CP :unit coproc) (3 :num)      <|registers :=          (r0 =+ (x :bool[32])) (λ(n :register). (0w :bool[32]));        psrs :=          (λ(x :psr).             SET_NZCV (F,F,F,F) (SET_IFMODE F F usr (0w :bool[32])));        memory :=          ((0w :bool[30]) |:           [            enc              (SUB AL T (0w :bool[4]) (0w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])) :                 arm_instruction);            enc (B NE (0w :bool[24]));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (0w :bool[8])));            enc              (MOV AL F (1w :bool[4])                 (Dp_immediate (0w :bool[4]) (1w :bool[8])))            ]) (λ(a :bool[30]). (0xE6000010w :bool[32])); undefined := F;        cp_state := ()|> = ^(f32vx_rhsc)))``, DISCH_TAC THEN ASSUME_TAC (UNDISCH subgoal_ne1) THEN FULL_SIMP_TAC pure_ss [f3f1v_thm] THEN EXISTS_TAC ``a :bool`` THEN EXISTS_TAC ``c :bool`` THEN EXISTS_TAC ``d :bool`` THEN REWRITE_TAC [f32vx]); 

Доказательства, на мой взгляд, достаточно трудоемкие, особенно если их проводить для чего-то существенного, но те аспиранты, которые делали модель, пишут в своих статьях, что с помощью разработанных ими моделей они верифицировали какие-то нетривиальные вещи. Так что, может быть, подобные доказательства это будущее программ существенных для безопасности.

ссылка на оригинал статьи http://habrahabr.ru/post/156413/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *