মেটা সোমবার একটি নতুন কৃত্রিম বুদ্ধিমত্তা (AI) মডেল প্রকাশ করেছে যা জটিল কম্পিউটার ভিশন কাজ সম্পাদন করতে পারে। ডাব করা সেগমেন্ট এনিথিং মডেল 2 (SAM 2), এটি তার পূর্বসূরীর অনুসরণ করে যা গত বছর লঞ্চ করা হয়েছিল এবং Instagram এর ব্যাকড্রপ এবং কাটআউট সরঞ্জামগুলিতে অন্তর্ভুক্ত করা হয়েছিল। মডেলটির উত্তরসূরি এখন উন্নত ক্ষমতা নিয়ে আসে এবং কোম্পানি বলেছে যে এটি ভিডিওতেও সেগমেন্ট সনাক্তকরণ এবং ট্র্যাকিং করতে পারে। মেটার বেশিরভাগ বড় ভাষা মডেলের মতো (LLM), SAM 2ও একটি ওপেন-সোর্স এআই মডেল।
একটা নিউজরুমে পোস্টMeta নতুন AI মডেল ঘোষণা করেছে যা প্রাথমিকভাবে ভিডিওগুলির সেগমেন্ট বিশ্লেষণের উপর ফোকাস করে, যখন এর ইমেজ সেগমেন্টেশন ক্ষমতা উন্নত করে। এর অর্জনগুলো তুলে ধরা পূর্বসূরীমেটা বলেছে যে এআই মডেলটি ইনস্টাগ্রামের ব্যাকড্রপ এবং কাটআউট বৈশিষ্ট্যগুলিতে ব্যবহৃত হয়েছিল, যখন সামুদ্রিক বিজ্ঞানীরা এটিকে “সোনার চিত্রগুলিকে ভাগ করতে এবং প্রবাল প্রাচীর বিশ্লেষণ করতে, দুর্যোগের ত্রাণের জন্য উপগ্রহ চিত্র বিশ্লেষণ এবং চিকিৎসা ক্ষেত্রে, সেলুলার চিত্রগুলিকে বিভক্ত করতে এবং সনাক্তকরণে সহায়তা করার জন্য এটি ব্যবহার করেছিলেন।” ত্বকের ক্যান্সার”।
SAM 2 একটি ইমেজ এবং ভিডিওতে অবজেক্ট সেগমেন্টেশনের পাশাপাশি রিয়েল-টাইমে একটি ভিডিওর বিভিন্ন ফ্রেমে ট্র্যাক করতে সক্ষম। এআই এমন পরিস্থিতিতেও বস্তুগুলিকে ট্র্যাক এবং সেগমেন্ট করতে পারে যেখানে বস্তুগুলি দ্রুত চলে, চেহারায় পরিবর্তন হয় বা অন্য বস্তু বা সম্পূর্ণ ভিন্ন দৃশ্য দ্বারা লুকিয়ে থাকে।
প্রম্পট-ভিত্তিক ভিজ্যুয়াল সেগমেন্টেশনের ভিত্তি মডেলটি একটি সাধারণ ট্রান্সফরমার আর্কিটেকচারের উপর নির্মিত। এটিতে একটি স্ট্রিমিং মেমরি রয়েছে যা এটিকে রিয়েল-টাইমে ভিডিওগুলি প্রক্রিয়া করার অনুমতি দেয়। কোম্পানিটি আরও দাবি করেছে যে মডেলটিকে SA-V ডেটাসেট ডাব করা তার বৃহত্তম ভিডিও সেগমেন্টেশন ডেটাসেটে প্রশিক্ষণ দেওয়া হয়েছিল।
মেটা বলেছে যে এআই মডেল ভিডিও এডিটিং বা এআই-ভিত্তিক ভিডিও তৈরির প্রক্রিয়া সহজ করতে সাহায্য করতে পারে, সেইসাথে কোম্পানির মিশ্র-বাস্তবতা ইকোসিস্টেমে নতুন অভিজ্ঞতাকে শক্তি দিতে। ভিডিওতে অবজেক্ট ট্র্যাকিং ক্ষমতা অন্যান্য কম্পিউটার ভিশন সিস্টেমকে প্রশিক্ষণের জন্য ভিজ্যুয়াল ডেটার দ্রুত টীকাতেও সহায়তা করতে পারে, কোম্পানি যোগ করেছে।
যেহেতু এটি একটি ওপেন-সোর্স AI মডেল, কোম্পানিটি তার GitHub-এ এর ওজন হোস্ট করেছে পৃষ্ঠা. আগ্রহী ব্যক্তিরা এআই মডেলটি ডাউনলোড এবং পরীক্ষা করতে পারেন। উল্লেখযোগ্যভাবে, এটি Apache 2.0 লাইসেন্সের অধীনে লাইসেন্সপ্রাপ্ত যা গবেষণা, একাডেমিক এবং অ-বাণিজ্যিক ব্যবহারের অনুমতি দেয়।