Стварэнне сістэмы фармальнай верыфікацыі з нуля. Частка 1: знакавая віртуальная машына на PHP і Python

Фармальная верыфікацыя - гэта праверка адной праграмы або алгарытму з дапамогай іншай.

Гэта адзін з самых магутных метадаў, які дазваляе знайсці ў праграме ўсе ўразлівасці ці ж даказаць, што іх няма.

Больш падрабязнае апісанне фармальнай верыфікацыі можна ўбачыць на прыкладзе рашэння задачы аб Ваўку, Казе, і капусце у маім папярэднім артыкуле.

У гэтым артыкуле я пераходжу ад фармальнай верыфікацыі задач, да праграм, і апішу,
якім чынам можна канвертаваць іх у сістэмы фармальных правіл аўтаматычна.

Для гэтага я напісаў свой аналаг віртуальнай машыны, на сімвальных прынцыпах.

Яна разбірае код праграмы і транслюе яго ў сістэму раўнанняў (SMT), якую ўжо можна вырашыць праграмным спосабам.

Бо інфармацыя аб сімвальных вылічэннях прадстаўлена ў інтэрнэце даволі ўрыўкава,
я коратка апішу што гэта такое.

Сімвольныя вылічэнні ўяўляюць сабой спосаб адначасовага выканання праграмы на шырокім дыяпазоне дадзеных і з'яўляюцца галоўнай прыладай для фармальнай верыфікацыі праграм.

Напрыклад, мы можам задаць уваходныя ўмовы дзе першы аргумент можа прымаць любыя станоўчыя значэнні, другі адмоўныя, трэці - нуль, а выходны аргумент, да прыкладу, 42.

Сімвольныя вылічэнні за адзін запуск дадуць нам адказ, ці магчыма атрыманне намі патрэбнага выніку і прыклад набору такіх уваходных параметраў. Альбо ж доказ таго, што такіх параметраў няма.

Больш таго, мы можам задаць уваходныя аргументы наогул як усе магчымыя, і абярэм толькі выходны, напрыклад пароль адміністратара.

У гэтым выпадку мы знойдзем усе ўразлівасці праграмы ці ж атрымаем доказ таго, што пароль адміна ў бяспецы.

Можна заўважыць, што класічнае выкананне праграмы з пэўнымі ўваходнымі дадзенымі ўяўляе сабою прыватны выпадак знакавага.

Таму мая знакавая VM можа працаваць і ў рэжыме эмуляцыі стандартнай віртуальнай машыны.

У каментарах да папярэдняга артыкула можна знайсці і справядлівую крытыку фармальнай верыфікацыі з абмеркаваннем яе слабых месцаў.

Асноўныя праблемы наступныя:

  1. Камбінаторны выбух, бо фармальная верыфікацыя ў канчатковым выніку ўпіраецца ў P=NP.
  2. Апрацоўка выклікаў да файлавай сістэмы, сеткам і іншым вонкавым сховішчам складаней паддаецца верыфікацыі.
  3. Багі ў спецыфікацыі, калі заказчык ці праграміст задумаў адно, але недастаткова дакладна апісаў гэта ў ТЗ.

У выніку праграма будзе верыфікавана і адпавядаць спецыфікацыі, але будзе рабіць зусім не тое, чаго ад яе чакалі аўтары.

Паколькі ў гэтым артыкуле я разглядаю галоўнай выявай ужыванне фармальнай верыфікацыі на практыку, то біцца лбом аб сцяну пакуль не буду, і абяру такую ​​сістэму, дзе алгарытмічная складанасць і лік вонкавых выклікаў мінімальна.

Паколькі смарт-кантракты падыходзяць пад гэтыя патрабаванні найлепшым чынам, выбар упаў на кантракты RIDE ад платформы Waves: яны не з'яўляюцца Т'юрынг-поўнымі, і іх максімальная складанасць штучна абмежавана.

Але мы будзем разглядаць іх выключна з тэхнічнага боку.

У дадатак да ўсяго, для любых кантрактаў фармальная верыфікацыя будзе асабліва запатрабавана: выправіць памылку кантракта пасля яго запуску, як правіла, немагчыма.
А кошт такіх памылак бывае вельмі высокая, бо на смарт-кантрактах часта захоўваюцца даволі буйныя сумы сродкаў.

Мая знакавая віртуальная машына напісана на PHP і Python, і выкарыстоўвае Z3Prover ад Microsoft Research для рашэння атрыманых SMT формул.

У яе ядры закладзены магутны мульты-транзакцыйны пошук, які
дазваляе знаходзіць рашэнні ці ўразлівасці, нават калі для гэтага патрабуецца шмат транзакцый.
Нават Міфрыл, адзін з самых магутных сімвальных фрэймворкаў для пошуку ўразлівасцяў Ethereum, дадаў такую ​​магчымасць толькі некалькі месяцаў таму.

Але варта заўважыць, што кантракты эфіру складаней і валодаюць Ц'юрынг-паўнатой.

PHP транслюе зыходны код смарт-кантракту RIDE у python скрыпт, у якім праграма прадстаўлена ў выглядзе сумяшчальнай з Z3 SMT сістэмы станаў кантракту і ўмоў іх пераходаў:

Стварэнне сістэмы фармальнай верыфікацыі з нуля. Частка 1: знакавая віртуальная машына на PHP і Python

Цяпер апішу, што адбываецца ўнутры, падрабязней.

Але спачатку пару слоў аб мове смарт-кантрактаў RIDE.

Гэта функцыянальная і заснаваная на выразах мова праграмавання, лянівая па задумцы.
RIDE выконваецца ізалявана ўнутры блокчейна, і можа здабываць і запісваць інфармацыю, з у прывязанага да кашалька карыстальніка сховішчы.

Да кожнага кашалька можна прывязаць RIDE кантракт, і вынікам выканання будзе толькі TRUE ці FALSE.

TRUE азначае, што смарт-кантракт дазваляе транзакцыю, а FALSE што ён яе забараняе.
Просты прыклад: скрыпт можа забараняць пераклад, у выпадку, калі баланс кашалька меншы за 100.

У якасці прыкладу я вазьму ўсё тых жа Ваўка, Казу, і Капусту, але ўжо прадстаўленых у выглядзе смарт-кантракта.

Карыстальнік не зможа вывесці грошы з кашалька, на якім разгорнуты кантракт, пакуль не пераправіць усіх на іншы бераг.

#Извлекаем положение всех объектов из блокчейна
let contract = tx.sender
let human= extract(getInteger(contract,"human"))
let wolf= extract(getInteger(contract,"wolf"))
let goat= extract(getInteger(contract,"goat"))
let cabbage= extract(getInteger(contract,"cabbage"))

#Это так называемая дата-транзакция, в которой пользователь присылает новые 4 переменные.
#Контракт разрешит её только в случае если все объекты останутся в сохранности.
match tx {
case t:DataTransaction =>
   #Извлекаем будущее положение всех объектов из транзакции
   let newHuman= extract(getInteger(t.data,"human")) 
   let newWolf= extract(getInteger(t.data,"wolf"))
   let newGoat= extract(getInteger(t.data,"goat"))
   let newCabbage= extract(getInteger(t.data,"cabbage"))
   
   #0 обозначает, что объект на левом берегу, а 1 что на правом
   let humanSide= human == 0 || human == 1
   let wolfSide= wolf == 0 || wolf == 1
   let goatSide= goat == 0 || goat == 1
   let cabbageSide= cabbage == 0 || cabbage == 1
   let side= humanSide && wolfSide && goatSide && cabbageSide

   #Будут разрешены только те транзакции, где с козой никого нет в отсутствии фермера.
   let safeAlone= newGoat != newWolf && newGoat != newCabbage
   let safe= safeAlone || newGoat == newHuman
   let humanTravel= human != newHuman 

   #Способы путешествия фермера туда и обратно, с кем-то либо в одиночку.
   let t1= humanTravel && newWolf == wolf + 1 && newGoat == goat && newCabbage == cabbage 
   let t2= humanTravel && newWolf == wolf && newGoat == goat + 1 && newCabbage == cabbage
   let t3= humanTravel && newWolf == wolf && newGoat == goat && newCabbage == cabbage + 1
   let t4= humanTravel && newWolf == wolf - 1 && newGoat == goat && newCabbage == cabbage
   let t5= humanTravel && newWolf == wolf && newGoat == goat - 1 && newCabbage == cabbage
   let t6= humanTravel && newWolf == wolf && newGoat == goat && newCabbage == cabbage - 1
   let t7= humanTravel && newWolf == wolf && newGoat == goat && newCabbage == cabbage
   let objectTravel = t1 || t2 || t3 || t4 || t5 || t6 || t7
   
   #Последняя строка в разделе транзакции описывает разрешающее транзакцию условие.
   #Переменные транзакции должны иметь значения 1 или 0, все объекты должны
   #быть в безопасности, а фермер должен переплывать реку в одиночку 
   #или с кем-то на каждом шагу
   side && safe && humanTravel && objectTravel
case s:TransferTransaction =>
   #Транзакция вывода средств разрешена только в случае если все переплыли на другой берег
   human == 1 && wolf == 1 && goat == 1 && cabbage == 1

#Все прочие типы транзакций запрещены
case _ => false

}

PHP перш за ўсё здабывае з смарт-кантракту ўсе зменныя ў выглядзе іх ключоў і які адпавядае зменнай лагічнага выраза.

cabbage: extract ( getInteger ( contract , "cabbage" ) )
goat: extract ( getInteger ( contract , "goat" ) )
human: extract ( getInteger ( contract , "human" ) )
wolf: extract ( getInteger ( contract , "wolf" ) )
fState: human== 1 && wolf== 1 && goat== 1 && cabbage== 1
fState: 
wolf: 
goat: 
cabbage: 
cabbageSide: cabbage== 0 || cabbage== 1
human: extract ( getInteger ( contract , "human" ) )
newGoat: extract ( getInteger ( t.data , "goat" ) )
newHuman: extract ( getInteger ( t.data , "human" ) )
goatSide: goat== 0 || goat== 1
humanSide: human== 0 || human== 1
t7: humanTravel && newWolf== wolf && newGoat== goat && newCabbage== cabbage
t3: humanTravel && newWolf== wolf && newGoat== goat && newCabbage== cabbage + 1
t6: humanTravel && newWolf== wolf && newGoat== goat && newCabbage== cabbage - 1
t2: humanTravel && newWolf== wolf && newGoat== goat + 1 && newCabbage== cabbage
t5: humanTravel && newWolf== wolf && newGoat== goat - 1 && newCabbage== cabbage
t1: humanTravel && newWolf== wolf + 1 && newGoat== goat && newCabbage== cabbage
t4: humanTravel && newWolf== wolf - 1 && newGoat== goat && newCabbage== cabbage
safeAlone: newGoat != newWolf && newGoat != newCabbage
wolfSide: wolf== 0 || wolf== 1
humanTravel: human != newHuman
side: humanSide && wolfSide && goatSide && cabbageSide
safe: safeAlone || newGoat== newHuman
objectTravel: t1 || t2 || t3 || t4 || t5 || t6 || t7

Затым PHP пераўтворыць іх у сумяшчальнае з Z3Prover SMT апісанне сістэмы на пітоне.
Дадзеныя ж заварочваюцца ў цыкл, дзе зменныя сховішчы атрымліваюць азначнік i, зменныя транзакцыі азначнік i + 1, а зменныя з выразамі задаюць правілы пераходу з папярэдняга стану ў наступнае.

Гэта-самае сэрца нашай віртуальнай машыны, якое і забяспечвае мульты-транзакцыйны механізм пошуку.

fState:  And( And( And( human[Steps]  ==  1 , wolf[Steps]  ==  1 )  , goat[Steps]  ==  1 )  , cabbage[Steps]  ==  1 )  
final:  fState[Steps] 
fState:   
wolf:   
goat:   
cabbage:   
cabbageSide:  Or( cabbage[i]  ==  0 , cabbage[i]  ==  1 )  
goatSide:  Or( goat[i]  ==  0 , goat[i]  ==  1 )  
humanSide:  Or( human[i]  ==  0 , human[i]  ==  1 )  
t7:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] )  , goat[i+1]  ==  goat[i] )  , cabbage  ==  cabbage[i] )  
t3:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] )  , goat[i+1]  ==  goat[i] )  , cabbage  ==  cabbage[i] + 1 )  
t6:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] )  , goat[i+1]  ==  goat[i] )  , cabbage  ==  cabbage[i] - 1 )  
t2:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] )  , goat[i+1]  ==  goat[i] + 1 )  , cabbage  ==  cabbage[i] )  
t5:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] )  , goat[i+1]  ==  goat[i] - 1 )  , cabbage  ==  cabbage[i] )  
t1:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] + 1 )  , goat[i+1]  ==  goat[i] )  , cabbage  ==  cabbage[i] )  
t4:  And( And( And( humanTravel[i] , wolf  ==  wolf[i] - 1 )  , goat[i+1]  ==  goat[i] )  , cabbage  ==  cabbage[i] )  
safeAlone:  And( goat[i+1] != wolf , goat[i+1] != cabbage )  
wolfSide:  Or( wolf[i]  ==  0 , wolf[i]  ==  1 )  
humanTravel:  human[i] != human[i+1] 
side:  And( And( And( humanSide[i] , wolfSide[i] )  , goatSide[i] )  , cabbageSide[i] )  
safe:  Or( safeAlone[i] , goat[i+1]  ==  human[i+1] )  
objectTravel:  Or( Or( Or( Or( Or( Or( t1[i] , t2[i] )  , t3[i] )  , t4[i] )  , t5[i] )  , t6[i] )  , t7[i] )  
data:  And( And( And( side[i] , safe[i] )  , humanTravel[i] )  , objectTravel[i] )  

Умовы сартуюцца і ўстаўляюцца ў шаблон скрыпту, прызначанага для апісання SMT сістэмы на пітоне.

Пусты шаблон


import json

from z3 import *

s = Solver()

  
  
    
Steps=7
Num= Steps+1

$code$



#template, only start rest
s.add(data + start)

#template
s.add(final)




ind = 0

f = open("/var/www/html/all/bin/python/log.txt", "a")



while s.check() == sat:
  ind = ind +1
  

  print ind
  m = s.model()
  print m

  print "traversing model..." 
  #for d in m.decls():
	#print "%s = %s" % (d.name(), m[d])

  
 
  f.write(str(m))
  f.write("nn")
  exit()
  #s.add(Or(goat[0] != s.model()[data[0]] )) # prevent next model from using the same assignment as a previous model



print "Total solution number: "
print ind  

f.close()
 


Для апошняга стану з усяго ланцужка прымяняюцца правілы, якія зададзены ў раздзеле транзакцыі перакладу.

А значыць, Z3Prover будзе шукаць менавіта такія сукупнасці станаў, якія ў выніку дазволяць вывесці з дамовы сродкі.

У выніку мы аўтаматычна атрымліваем поўнасцю працаздольную SMT мадэль нашага кантракту.
Можна заўважыць, што яна вельмі падобная на мадэль з майго папярэдняга артыкула, які я складаў яшчэ ўручную.

Запоўнены шаблон


import json

from z3 import *

s = Solver()

  
  
    
Steps=7
Num= Steps+1

human = [ Int('human_%i' % (i + 1)) for i in range(Num) ]
wolf = [ Int('wolf_%i' % (i + 1)) for i in range(Num) ]
goat = [ Int('goat_%i' % (i + 1)) for i in range(Num) ]
cabbage = [ Int('cabbage_%i' % (i + 1)) for i in range(Num) ]
nothing= [  And( human[i] == human[i+1], wolf[i] == wolf[i+1], goat[i] == goat[i+1], cabbage[i] == cabbage[i+1] )   for i in range(Num-1) ]


start= [ human[0] == 1, wolf[0] == 0, goat[0] == 1, cabbage[0] == 0 ]

safeAlone= [  And( goat[i+1] != wolf[i+1] , goat[i+1] != cabbage[i+1] )   for i in range(Num-1) ]
safe= [  Or( safeAlone[i] , goat[i+1]  ==  human[i+1] )   for i in range(Num-1) ]
humanTravel= [  human[i] != human[i+1]  for i in range(Num-1) ]
cabbageSide= [  Or( cabbage[i]  ==  0 , cabbage[i]  ==  1 )   for i in range(Num-1) ]
goatSide= [  Or( goat[i]  ==  0 , goat[i]  ==  1 )   for i in range(Num-1) ]
humanSide= [  Or( human[i]  ==  0 , human[i]  ==  1 )   for i in range(Num-1) ]
t7= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] )  , goat[i+1]  ==  goat[i] )  , cabbage[i+1]  ==  cabbage[i] )   for i in range(Num-1) ]
t3= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] )  , goat[i+1]  ==  goat[i] )  , cabbage[i+1]  ==  cabbage[i] + 1 )   for i in range(Num-1) ]
t6= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] )  , goat[i+1]  ==  goat[i] )  , cabbage[i+1]  ==  cabbage[i] - 1 )   for i in range(Num-1) ]
t2= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] )  , goat[i+1]  ==  goat[i] + 1 )  , cabbage[i+1]  ==  cabbage[i] )   for i in range(Num-1) ]
t5= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] )  , goat[i+1]  ==  goat[i] - 1 )  , cabbage[i+1]  ==  cabbage[i] )   for i in range(Num-1) ]
t1= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] + 1 )  , goat[i+1]  ==  goat[i] )  , cabbage[i+1]  ==  cabbage[i] )   for i in range(Num-1) ]
t4= [  And( And( And( humanTravel[i] , wolf[i+1]  ==  wolf[i] - 1 )  , goat[i+1]  ==  goat[i] )  , cabbage[i+1]  ==  cabbage[i] )   for i in range(Num-1) ]
wolfSide= [  Or( wolf[i]  ==  0 , wolf[i]  ==  1 )   for i in range(Num-1) ]
side= [  And( And( And( humanSide[i] , wolfSide[i] )  , goatSide[i] )  , cabbageSide[i] )   for i in range(Num-1) ]
objectTravel= [  Or( Or( Or( Or( Or( Or( t1[i] , t2[i] )  , t3[i] )  , t4[i] )  , t5[i] )  , t6[i] )  , t7[i] )   for i in range(Num-1) ]
data= [ Or(  And( And( And( side[i] , safe[i] )  , humanTravel[i] )  , objectTravel[i] )   , nothing[i]) for i in range(Num-1) ]


fState=  And( And( And( human[Steps]  ==  1 , wolf[Steps]  ==  1 )  , goat[Steps]  ==  1 )  , cabbage[Steps]  ==  1 )  
final=  fState 




#template, only start rest
s.add(data + start)

#template
s.add(final)




ind = 0

f = open("/var/www/html/all/bin/python/log.txt", "a")



while s.check() == sat:
  ind = ind +1
  

  print ind
  m = s.model()
  print m

  print "traversing model..." 
  #for d in m.decls():
	#print "%s = %s" % (d.name(), m[d])

  
 
  f.write(str(m))
  f.write("nn")
  exit()
  #s.add(Or(goat[0] != s.model()[data[0]] )) # prevent next model from using the same assignment as a previous model



print "Total solution number: "
print ind  

f.close()
 


Пасля запуску, Z3Prover вырашае смарт-кантракт і выводзіць нам ланцужок транзакцый, які дазволіць вывесці сродкі:

Winning transaction chain found:
Data transaction: human= 0, wolf= 0, goat= 1, cabbage= 0
Data transaction: human= 1, wolf= 0, goat= 1, cabbage= 1
Data transaction: human= 0, wolf= 0, goat= 0, cabbage= 1
Data transaction: human= 1, wolf= 1, goat= 0, cabbage= 1
Data transaction: human= 0, wolf= 1, goat= 0, cabbage= 1
Data transaction: human= 1, wolf= 1, goat= 1, cabbage= 1
Data transaction: human= 1, wolf= 1, goat= 1, cabbage= 1
Transfer transaction

Акрамя кантракту пераправы, можна паэксперыментаваць з уласнымі кантрактамі ці паспрабаваць гэты просты прыклад, які вырашаецца за 2 транзакцыі.

let contract = tx.sender
let a= extract(getInteger(contract,"a"))
let b= extract(getInteger(contract,"b"))
let c= extract(getInteger(contract,"c"))
let d= extract(getInteger(contract,"d"))

match tx {
case t:DataTransaction =>
let na= extract(getInteger(t.data,"a")) 
let nb= extract(getInteger(t.data,"b"))
let nc= extract(getInteger(t.data,"c"))
let nd= extract(getInteger(t.data,"d"))
   
   nd == 0 || a == 100 - 5
case s:TransferTransaction =>
   ( a + b - c ) * d == 12

case _ => true

}

Бо гэта самая першая версія, то сінтаксіс вельмі абмежаваны і могуць сустракацца багі.
У наступных артыкулах я планую асвятліць далейшую распрацоўку VM, і паказаць, як можна ствараць фармальна верыфікаваныя смарт-кантракты з яе дапамогай, а не толькі вырашаць іх.

Сімвольная віртуальная машына даступная па адрасе http://2.59.42.98/hyperbox/
Пасля прывядзення зыходнага код сімвальнай VM у парадак і дадання туды каментароў, я планую выкласці яго на гітхаб у вольны доступ.

Крыніца: habr.com

Дадаць каментар