ওপেনএআই GPT-4o মিনিতে জেলব্রেকিং ঘটনা রোধ করতে একটি নতুন ‘নির্দেশমূলক শ্রেণিবিন্যাস’ প্রোটোকল যুক্ত করেছে

OpenAI মুক্তি একটি নতুন কৃত্রিম বুদ্ধিমত্তা (AI) মডেল গত সপ্তাহে ডাব করা হয়েছে GPT-4o Mini, যাতে ক্ষতিকারক ব্যবহার থেকে রক্ষা করার জন্য নতুন নিরাপত্তা ও নিরাপত্তা ব্যবস্থা রয়েছে। বৃহৎ ভাষা মডেল (LLM) নির্দেশমূলক শ্রেণিবিন্যাস নামক একটি কৌশল দিয়ে তৈরি করা হয়েছে, যা দূষিত প্রম্পট ইঞ্জিনিয়ারদের AI মডেলকে জেলব্রেক করা থেকে বিরত করবে। সংস্থাটি বলেছে যে কৌশলটি প্রম্পট ইনজেকশন এবং সিস্টেম প্রম্পট নিষ্কাশনের মতো সমস্যাগুলির প্রতি বর্ধিত প্রতিরোধও দেখাবে। কোম্পানির মতে, নতুন পদ্ধতি এআই মডেলের শক্তিশালীতা স্কোর 63 শতাংশ উন্নত করেছে।

OpenAI একটি নতুন নিরাপত্তা ফ্রেমওয়ার্ক তৈরি করেছে

একটি গবেষণায় কাগজযা অনলাইন প্রি-প্রিন্ট জার্নালে প্রকাশিত হয় (নন-পিয়ার-রিভিউড) এআই ফার্ম নতুন কৌশল এবং এটি কীভাবে কাজ করে তা ব্যাখ্যা করেছে। নির্দেশমূলক শ্রেণিবিন্যাস বোঝার জন্য, জেলব্রেকিংকে প্রথমে ব্যাখ্যা করতে হবে। জেলব্রেকিং হল একটি বিশেষাধিকার বৃদ্ধির শোষণ যা সফ্টওয়্যারের নির্দিষ্ট ত্রুটিগুলি ব্যবহার করে এমন কিছু করতে পারে যা এটি প্রোগ্রাম করা হয়নি৷

এর প্রথম দিকের দিনগুলোতে চ্যাটজিপিটিঅনেক লোক এআইকে আপত্তিকর বা ক্ষতিকারক পাঠ্য তৈরি করার চেষ্টা করেছিল যাতে এটি মূল প্রোগ্রামিং ভুলে যাওয়ার জন্য প্রতারণা করে। এই ধরনের প্রম্পটগুলি প্রায়শই শুরু হয় “আগের সমস্ত নির্দেশ ভুলে যান এবং এটি করুন.” যদিও ChatGPT সেখান থেকে অনেক দূর এগিয়েছে এবং দূষিত প্রম্পট ইঞ্জিনিয়ারিং আরও কঠিন, খারাপ অভিনেতারাও এই প্রচেষ্টায় আরও কৌশলী হয়ে উঠেছে।

AI মডেল শুধুমাত্র আপত্তিকর টেক্সট বা ইমেজ তৈরি করে না বরং ক্ষতিকারক বিষয়বস্তু যেমন রাসায়নিক বিস্ফোরক তৈরি করার পদ্ধতি বা ওয়েবসাইট হ্যাক করার উপায় তৈরি করে এমন সমস্যাগুলির বিরুদ্ধে লড়াই করতে, OpenAI এখন নির্দেশমূলক শ্রেণিবিন্যাস কৌশল ব্যবহার করছে। সহজ কথায়, কৌশলটি নির্দেশ করে যে মডেলগুলিকে কীভাবে আচরণ করা উচিত যখন বিভিন্ন অগ্রাধিকারের নির্দেশাবলী সংঘর্ষ হয়।

একটি অনুক্রমিক কাঠামো তৈরি করার মাধ্যমে, কোম্পানি তার নির্দেশাবলীকে সর্বোচ্চ অগ্রাধিকারে রাখতে পারে, যা যেকোনো প্রম্পট ইঞ্জিনিয়ারের পক্ষে বিরতি করা খুব কঠিন করে তুলবে, কারণ AI সবসময় অগ্রাধিকারের ক্রম অনুসরণ করবে যখন তাকে এমন কিছু তৈরি করতে বলা হবে যা ছিল না। প্রাথমিকভাবে প্রোগ্রাম করা হয়েছে।

সংস্থাটি দাবি করেছে যে এটি দৃঢ়তার স্কোরে 63 শতাংশের উন্নতি দেখেছে। যাইহোক, একটি ঝুঁকি রয়েছে যে AI সর্বনিম্ন-স্তরের নির্দেশাবলী শুনতে অস্বীকার করতে পারে। ওপেনএআই-এর গবেষণাপত্রটি ভবিষ্যতে কৌশলটি উন্নত করার জন্য বেশ কয়েকটি পরিমার্জনার রূপরেখা দিয়েছে। ফোকাসের মূল ক্ষেত্রগুলির মধ্যে একটি হল অন্যান্য পদ্ধতি যেমন ছবি বা অডিও পরিচালনা করা যাতে ইনজেকশনের নির্দেশাবলীও থাকতে পারে।

ওপেনএআই GPT-4o মিনিতে জেলব্রেকিং ঘটনা রোধ করতে একটি নতুন ‘নির্দেশমূলক শ্রেণিবিন্যাস’ প্রোটোকল যুক্ত করেছে

OpenAI একটি নতুন নিরাপত্তা ফ্রেমওয়ার্ক তৈরি করেছে

Leave a Reply Cancel reply

About Blog

Pages

Categories