Ar an Aoine, 2 Lúnasa, scaoileadh re2c, gineadóir saor in aisce d’anailíseoirí foclóireachta do na teangacha C agus C++. Scríobh Peter Bamboulis Re2c i 1993 mar ghineadóir turgnamhach anailíseoirí foclóireachta an-tapa, idirdhealú ó ghineadóirí eile ag luas an chóid a ghintear agus comhéadan úsáideora neamhghnách solúbtha a ligeann d'anailíseoirí a bheith leabaithe go héasca agus go héifeachtach i mbonn cód atá ann cheana féin. Ó shin i leith, tá an tionscadal forbartha ag an bpobal agus leanann sé de bheith ina ardán le haghaidh turgnamh agus taighde i réimse na ngramadach foirmeálta agus na meaisíní críochta stáit.
Príomhnuálaíochtaí i leagan 1.2:
Cuireadh bealach nua (simplithe) leis chun deireadh na sonraí ionchuir a sheiceáil
(Béarla “EOF rule”).
Chuige seo, cuireadh cumraíocht re2c:eof leis,
ligeann duit an carachtar teirminéil a roghnú,
agus riaghail $ speisialta a chonnaic si an lexer
d'éirigh le deireadh na sonraí ionchuir a bhaint amach.
Go stairiúil, soláthraíonn re2c rogha de roinnt modhanna fíoraithe le haghaidh
deireadh na n-ionchur éagsúil ó thaobh teorannú, éifeachtúlachta agus simplíochta
iarratais. Tá an modh nua deartha chun scríobh cód a shimpliú, agus
agus fós éifeachtach agus infheidhme go forleathan. Seanbhealaí
fós ag obair agus b'fhéidir gur fearr i gcásanna áirithe.
Cuireadh leis an gcumas comhaid sheachtracha a áireamh ag baint úsáide as treoir
/*! cuir san áireamh:re2c "file.re" */ áit a bhfuil file.re
is é seo ainm an chomhaid áireamh. Cuardaíonn Re2c comhaid san eolaire comhad lena n-áirítear,
chomh maith leis an liosta de na cosáin a shonraítear ag baint úsáide as an rogha -I.
Féadfaidh comhaid eile a bheith san áireamh i gcomhaid áirithe.
Soláthraíonn Re2c comhaid “caighdeánacha” san eolaire/ cuimsiú
tionscadal - táthar ag súil go gcruinneoidh sainmhínithe úsáideacha ann
nathanna cainte rialta, rud éigin cosúil leis an leabharlann caighdeánach.
Go dtí seo, ar iarratas na n-oibrithe, tá comhad amháin le sainmhínithe ar chatagóirí Unicode curtha leis.
Cuireadh leis an gcumas comhaid ceanntásca a ghiniúint le treallach
ábhar ag baint úsáide as na roghanna -t --type-header (nó cuí
cumraíochtaí) agus treoracha nua /*!header:re2c:ar*/ agus
/*! ceanntásc:re2c: as*/. D’fhéadfadh sé seo a bheith úsáideach i gcásanna ina
nuair is gá do re2c sainmhínithe ar athróga, struchtúir agus macraí a ghiniúint,
a úsáidtear in aonaid aistriúcháin eile.
Tuigeann Re2c anois liteartha UTF8 agus ranganna carachtair i nathanna rialta.
De réir réamhshocraithe, parsálann re2c sloinn mar "∀x ∃y" mar.
seicheamh de charachtair ASCII 1-ghiotán e2 88 80 78 20 e2 88 83 79
(cóid heicsidheachúlach), agus caithfidh úsáideoirí éalú ó charachtair Unicode de láimh:
"u2200x u2203y". Tá sé seo an-deacair agus gan choinne do go leor
úsáideoirí (mar is léir ó thuarascálacha leanúnacha ar fhabht). Mar sin anois
Soláthraíonn re2c rogha --ionchuir-ionchódaithe ,
a cheadaíonn duit an t-iompar a athrú agus "∀x ∃y" a pharsáil mar
2200 78 20 2203 79.
Ceadaíonn Re2c anois úsáid a bhaint as bloic re2c rialta i mód -r --reuse.
Tá sé seo áisiúil má tá go leor bloic sa chomhad ionchuir agus gan ach cuid acu
is gá é a athúsáid.
Anois is féidir leat formáid na teachtaireachtaí rabhaidh agus earráide a shocrú
ag baint úsáide as an rogha nua --location-format . Taispeántar formáid GNU
mar ainm comhaid: líne: colún :, agus an fhormáid MSVC mar ainm comhaid (líne, colún).
Féadfaidh an ghné seo a bheith úsáideach do lovers IDE.
Tá rogha --verbose curtha leis freisin, a phriontálann teachtaireacht bua gearr má éiríonn leis.
Feabhsaíodh an modh "comhoiriúnacht" le flex - socraíodh roinnt earráidí parsála agus
tosaíocht oibreora mícheart i gcásanna neamhchoitianta.
Go stairiúil, cheadaigh an rogha -F --flex-support duit cód a scríobh
measctha i stíl flex agus stíl re2c, rud a fhágann go bhfuil parsáil beagán deacair.
Is annamh a úsáidtear modh comhoiriúnachta flex i gcód nua,
ach leanann re2c ag tacú leis chun comhoiriúnacht siar.
Feidhmíonn oibreoir dealaithe na haicme carachtar / anois
sula leathnaítear an t-ionchódú, rud a fhágann gur féidir é a úsáid i líon níos mó cásanna,
má úsáidtear ionchódú faid carachtar athraitheach (mar shampla UTF8).
Cruthaítear an comhad aschuir anois go hadamhach: cruthaíonn re2c comhad sealadach ar dtús
agus scríobhann sé an toradh isteach ann, agus ansin déanann sé an comhad sealadach a athainmniú go dtí an t-aschur
oibríocht amháin.
Ó thaobh na bhforbróirí de, tá fochóras níos iomláine faighte ag re2c
debugging Tá an cód dífhabhtaithe díchumasaithe anois i bhfoirgnimh scaoilte agus
Is féidir é a chumasú ag baint úsáide as an rogha cumraíochta --enable-debug.
Thóg an scaoileadh seo ar feadh i bhfad - beagnach bliain iomlán.
Caitheadh an chuid is mó den am, mar a bhí i gcónaí, ar chreat teoiriciúil agus ar scríbhneoireacht a fhorbairt
Airteagal "Eastóscadh Fo-mheaitseála POSIX éifeachtach ar NFA".
Cuirtear na halgartaim a thuairiscítear san alt i bhfeidhm sa leabharlann turgnamhach libre2c
(Tá tógáil na leabharlainne agus tagarmharcanna díchumasaithe de réir réamhshocraithe agus cumasaítear é leis an rogha cumraíochta
--chumas-libs). Ní cheaptar an leabharlann mar iomaitheoir ar an leabharlann atá ann cheana féin
tionscadail cosúil le RE2, ach mar ardán taighde d'fhorbairt na nua
halgartaim (is féidir a úsáid ansin i re2c nó i dtionscadail eile).
Tá sé áisiúil freisin ó thaobh tástála, tagarmharcanna agus cruthú ceangail le teangacha eile.
Buíochas ó fhorbróirí re2c le gach duine a chabhraigh leis an eisiúint seo,
agus don phobal i gcoitinne le haghaidh smaointe, tuairiscí ar fhabht, paistí, meanma, srl. ;]