A’ cleachdadh Caractaran Unicode coltach ri chèile gus faighinn seachad air dearbhadh

GitHub thionndaidh a-mach a bhith buailteach do ionnsaigh a leigeas leat cothrom fhaighinn air cunntas tro bhith a’ làimhseachadh charactaran Unicode ann am post-d. Is e an duilgheadas a th ’ann gu bheil cuid de charactaran Unicode, nuair a bhios iad a’ cleachdadh gnìomhan tionndaidh litrichean beaga no litrichean mòra, air an eadar-theangachadh gu caractaran cunbhalach a tha coltach ri stoidhle (nuair a thèid grunn charactaran eadar-dhealaichte eadar-theangachadh gu aon charactar - mar eisimpleir, an caractar Turcach “ı” agus “i " nuair a thèid an tionndadh gu prìomh litrichean atharrachadh gu "I").

Mus dèan thu sgrùdadh air paramadairean logaidh a-steach ann an cuid de sheirbheisean is thagraidhean, thèid dàta a chaidh a sholarachadh leis an neach-cleachdaidh atharrachadh an toiseach gu cùis àrd no ìosal agus an uairsin thèid a sgrùdadh san stòr-dàta. Ma tha seirbheis a’ ceadachadh caractaran unicode a chleachdadh ann an logadh a-steach no post-d, faodaidh neach-ionnsaigh caractaran unicode coltach ris a chleachdadh gus ionnsaigh a dhèanamh a làimhsicheas tubaistean ann an tubaistean mapaidh cùise Unicode.

'ß'.toUpperCase() == 'ss'.toUpperCase() // 0x0131
'K'.toLowerCase() == 'K'.toLowerCase() // 0x212A
'John@Gıthub.com'.toUpperCase() == '[post-d fo dhìon]'.toUpperCase()

Neach-ionnsaigh air GitHub b ’urrainn tron fhoirm airson facal-faire a dhìochuimhnich fhaighinn air ais, cuir a-steach còd ath-bheothachaidh gu post-d eile le bhith a’ comharrachadh san fhoirm seòladh anns a bheil caractar Unicode a dh’ adhbhraicheas tubaist (mar eisimpleir, an àite [post-d fo dhìon] chaidh post-d m a chomharrachadhı[post-d fo dhìon]). Chaidh an seòladh seachad air an deuchainn a chionn 's gun deach a thionndadh gu litrichean mòra agus a' freagairt ris an t-seòladh tùsail ([post-d fo dhìon] ), ach nuair a chaidh an litir a chuir chaidh a chuir na àite mar a tha agus chaidh an còd ath-bheothachaidh a chuir gu seòladh meallta (mı[post-d fo dhìon]).

Cuid de caractaran, ag adhbhrachadh tubaistean nuair a thathar ag atharrachadh clàr:

ß 0x00DF SS
gu 0x0131 mi
ſ 0x017F S
ff 0xFB00 FF
0xFB01 FI
fl 0xFB02 FL
ffi 0xFB03 FFI
ffl 0xFB04 FFL
ſt 0xFB05 ST
st 0xFB06 ST
K 0x212A k

Source: fosgailtenet.ru

Cuir beachd ann