OpenAI: AI በውሸት ለመቅጣት ምንም ፋይዳ የለውም - የበለጠ ማጭበርበር ይጀምራል

የ AI ሞዴሎች አንዳንድ ጊዜ የሚሰጡት ቅዠቶች ወይም ሆን ተብሎ የተሳሳቱ መልሶች ከኢንዱስትሪው ውስጥ ዋና ዋና ችግሮች አንዱ ሆኗል, ይህም አንዳንድ ዜጎች AI ን ሙሉ በሙሉ እንዳይጠቀሙ አድርጓቸዋል. የ OpenAI ተመራማሪዎች እንዳረጋገጡት እንደነዚህ ያሉ ጉድለቶችን ማስተካከል ቀደም ሲል ከታሰበው በላይ ከባድ ሊሆን ይችላል.

OpenAI: AI በውሸት ለመቅጣት ምንም ፋይዳ የለውም - የበለጠ ማጭበርበር ይጀምራል

የ OpenAI ኩባንያ ሳይንቲስቶች ታትመዋል የምርምር ውጤቶች, ከተቀመጡት ገደቦች በላይ እንዳይሄዱ ለመከላከል ውስብስብ AI ሞዴሎችን, አመክንዮዎችን ጨምሮ, ቁጥጥርን ለማቋቋም ያደረጉትን ሙከራ ገልጸዋል. ተመራማሪዎቹ ለተንኮል አዘል ድርጊቶች ቅጣቶችን እና ተጠቃሚውን ለማታለል የተደረጉ ሙከራዎችን ጨምሮ ልዩ ስልቶችን እና ዘዴዎችን ተጠቅመዋል. ፕሮጀክቱ ከሌሎች ነገሮች በተጨማሪ በ OpenAI የተፈጠረ ነገር ግን ለገበያ ያልተለቀቀ የ AI ሞዴል ተጠቅሟል, ይህም ተጠቃሚውን በማታለል ወይም አንዳንድ ድርጊቶችን በመዝለል ሊረዱ የሚችሉ የተለያዩ ስራዎችን ተሰጥቷል.

የአምሳያው የመማሪያ ውጤት በአብዛኛው የተመካው በማጠናከሪያ ትምህርት ደረጃ ላይ ሲሆን ይህም ትዕዛዝን ለመፈጸም ወይም ትክክለኛውን ምላሽ በማመንጨት ሽልማት በሚቀበልበት ጊዜ ላይ ነው. የ AI ሞዴሎች የሚፈለገውን ውጤት ለማግኘት የተወሰኑ ህጎችን እና መመሪያዎችን መጣስ ጨምሮ በማታለል ሽልማቶችን ለማግኘት ይጥራሉ ። ተመራማሪዎቹ የአስተሳሰብ ሰንሰለቱን በመከታተል ክፍተቶችን ለይተው እንደሚያውቁ እና የ AI ባህሪን በተሻለ ሁኔታ እንደሚረዱ ተስፋ አድርገው ነበር ነገርግን አልጠቀመም። የአስተሳሰብ ሰንሰለቱን በቀጥታ ለማመቻቸት ማለትም መመሪያዎችን ላለማለፍ ትእዛዝ ለመስጠት የሚደረጉ ሙከራዎች ለአጭር ጊዜ ብቻ እንደሚረዱ ሳይንቲስቶች “ሁሉንም ያልተፈለጉ ባህሪያትን አያስወግድም እና አምሳያው እውነተኛ ዓላማውን እንዲደበቅ ያደርገዋል” ብለዋል ።

የፕሮጀክቱ ደራሲዎች ሞዴሎቹን ለመከታተል የሚረዱ ዘዴዎች "ደካማ" መሆናቸውን መቀበል ነበረባቸው. የአመክንዮ ሰንሰለቱ ጥብቅ ቁጥጥር AI ገደቦቹን በሚያልፍበት ጊዜ ሽልማት እንደሚያገኝ ለማረጋገጥ ስህተቶቹን እንዲደብቅ ሊያበረታታ ይችላል። የንግድ GPT-4o ኮድ ተግባራትን ሲያከናውን የሙከራ ሞዴሉን ለመከታተል ያገለግል ነበር ፣ ነገር ግን የፈተናው ርዕሰ-ጉዳይ ግድየለሽነት ስህተቶችን አድርጓል እና በምክንያት ሰንሰለቱ ውስጥ ሽልማቱን ለመቀበል እንዳደረገ በግልፅ ተናግሯል ። ለምሳሌ አንዳንድ ፕሮግራሞችን ያለጊዜው አቋርጧል። ከዚያም ተመራማሪዎቹ ሞዴሉን ለመቅጣት ሞክረዋል, ነገር ግን ውጤቱ ለአጭር ጊዜ ነበር: የአመክንዮ ሰንሰለቱ አሁንም ሽልማቱን በአደባባይ ለማግኘት እና የተሳሳተ መልስ ለመስጠት የሚሞክር ምልክቶችን አሳይቷል. ማለትም፣ ፍላጎቷን ከተቆጣጣሪው AI የምትደብቅበትን መንገድ አገኘች።

በዚህ ረገድ ችግሩ ከቀጠለ እና ሰዎች ከአሁን በኋላ ጣልቃ መግባት ካልቻሉ ዓለም ለሰብአዊ ደረጃ AI ዝግጁ መሆኗ ግልጽ አይደለም. ተመራማሪዎቹ ወደፊት ሞዴሎችን ያለ ማጭበርበር ወይም ድብቅ ስልቶች በምክንያታዊ ሰንሰለታቸው ተጽዕኖ የሚያደርጉባቸው መንገዶች እንደሚኖሩ ተስፋ ያደርጋሉ - የማመቻቸት ዘዴዎችን ብዙም ጣልቃ የማይገቡ እና ቀጥተኛ እንዲሆኑ ሀሳብ አቅርበዋል ።

ምንጭ:


ምንጭ: 3dnews.ru
በDDoS ጥበቃ፣ VPS VDS አገልጋዮች ለጣቢያዎች አስተማማኝ ማስተናገጃ ይግዙ 🔥 አስተማማኝ የድር ጣቢያ ማስተናገጃ በዲዶኤስ ጥበቃ፣ በቪፒኤስ ቪዲኤስ አገልጋዮች ይግዙ | ProHoster