మానవ విజువల్ కార్టెక్స్లోని జీవ ప్రక్రియల ద్వారా ప్రేరణ పొందిన కన్వల్యూషనల్ న్యూరల్ నెట్వర్క్లు (CNNలు), వస్తువు మరియు ముఖ గుర్తింపు వంటి పనులకు బాగా సరిపోతాయి, అయితే వాటి ఖచ్చితత్వాన్ని మెరుగుపరచడానికి దుర్భరమైన మరియు చక్కటి ట్యూనింగ్ అవసరం. అందుకే Google AI రీసెర్చ్లోని శాస్త్రవేత్తలు CNNలను "మరింత నిర్మాణాత్మక" పద్ధతిలో స్కేల్ చేసే కొత్త మోడల్లను అన్వేషిస్తున్నారు. వారు తమ పని ఫలితాలను ప్రచురించారు
"CNN యొక్క లోతు లేదా వెడల్పును ఏకపక్షంగా పెంచడం మరియు శిక్షణ మరియు మూల్యాంకనం కోసం ఇన్పుట్ ఇమేజ్ యొక్క అధిక రిజల్యూషన్ను ఉపయోగించడం స్కేలింగ్ మోడల్ల యొక్క సాధారణ అభ్యాసం" అని స్టాఫ్ సాఫ్ట్వేర్ ఇంజనీర్ మింగ్సింగ్ టాన్ మరియు Google AI ప్రధాన శాస్త్రవేత్త Quoc V .Le) వ్రాశారు. "వెడల్పు, లోతు మరియు ఇన్పుట్ రిజల్యూషన్ వంటి నెట్వర్క్ పారామితులను ఏకపక్షంగా స్కేల్ చేసే సాంప్రదాయ విధానాల వలె కాకుండా, మా పద్ధతి ప్రతి కోణాన్ని స్థిరమైన స్కేలింగ్ కారకాలతో ఏకరీతిగా స్కేల్ చేస్తుంది."
పనితీరును మరింత మెరుగుపరచడానికి, పరిశోధకులు కొత్త బ్యాక్బోన్ నెట్వర్క్, మొబైల్ ఇన్వర్టెడ్ బాటిల్నెక్ కన్వల్యూషన్ (MBConv)ని ఉపయోగించాలని సూచించారు, ఇది ఎఫిషియెంట్ నెట్స్ ఫ్యామిలీ మోడల్స్కు ఆధారం.
పరీక్షలలో, EfficientNets ఇప్పటికే ఉన్న CNNల కంటే అధిక ఖచ్చితత్వం మరియు మెరుగైన సామర్థ్యం రెండింటినీ ప్రదర్శించింది, పారామీటర్ పరిమాణాన్ని మరియు గణన వనరుల అవసరాలను మాగ్నిట్యూడ్ క్రమంలో తగ్గిస్తుంది. మోడల్లలో ఒకటైన, EfficientNet-B7, ప్రసిద్ధ CNN Gpipe కంటే 8,4 రెట్లు చిన్న సైజు మరియు 6,1 రెట్లు మెరుగైన పనితీరును ప్రదర్శించింది మరియు పరీక్షలో 84,4% మరియు 97,1% ఖచ్చితత్వాన్ని (టాప్-1 మరియు టాప్-5) సాధించింది. 50 ఫలితాలు ఇమేజ్ నెట్ సెట్. జనాదరణ పొందిన CNN ResNet-4తో పోలిస్తే, మరొక EfficientNet మోడల్, EfficientNet-B82,6, సారూప్య వనరులను ఉపయోగించి, ResNet-76,3కి 50% కంటే XNUMX% ఖచ్చితత్వాన్ని సాధించింది.
EfficientNets మోడల్లు ఇతర డేటాసెట్లలో బాగా పనిచేశాయి, CIFAR-100 డేటాసెట్ (91,7% ఖచ్చితత్వం)తో సహా ఎనిమిది బెంచ్మార్క్లలో ఐదుపై అధిక ఖచ్చితత్వాన్ని సాధించాయి.
"న్యూరల్ మోడల్స్ యొక్క సామర్థ్యంలో గణనీయమైన మెరుగుదలలను అందించడం ద్వారా, భవిష్యత్తులో కంప్యూటర్ విజన్ పనులకు కొత్త పునాదిగా ఎఫిషియెంట్ నెట్లు పనిచేయగలవని మేము ఆశిస్తున్నాము" అని టాన్ మరియు లి రాశారు.
Google క్లౌడ్ టెన్సర్ ప్రాసెసింగ్ యూనిట్ల (TPUలు) కోసం సోర్స్ కోడ్ మరియు శిక్షణ స్క్రిప్ట్లు ఉచితంగా అందుబాటులో ఉన్నాయి
మూలం: 3dnews.ru