ওপেনএআই সেপ্টেম্বর 20, মঙ্গলবারের বিকেলে ওপেনএআই প্রধান কার্যকারী অধিকৃত স্যাম আল্টম্যান এইচএআই নবতম উদ্ভাবনের সাথে প্রদর্শন করেছে, ড্যাল-ই ৩ মডেল। এই চমৎকার টেক্সট-টু-ইমেজ জেনারেটরটি তার পূর্ববর্তী সংস্করণ, ড্যাল-ই ২, কে নিন্মে নামে তাদের প্রতিযোগী মডেল মিডজার্নির সাথে। পড়া যাবে যে ড্যাল-ই ৩ সংযোজন টেক্সটকে ছবির মধ্যে সহজভাবে লেখা অন্তর্ভুক্ত করতে পারে এবং এটি এআই-দ্বারা তৈরি ছবি তৈরির দিকে একটি গুরুত্বপূর্ণ ধাপ মানা উঠেছে।
ওপেনএআই ড্যাল-ই ৩ নিষ্পত্তি
একটি সাহসী প্রগতিতে, ওপেনএআই অফিসিয়ালি ড্যাল-ই ৩ এর আয়োজন ঘোষণা করেছে, এর এই নতুন টেক্সট-টু-ইমেজ জেনারেটর, যা তার পূর্ববর্তী মডেল ড্যাল-ই ২ কে দূরে পেশা করেছে। এই অতি গুরুত্বপূর্ণ আপগ্রেডের সাথে, ওপেনএআই আবারও এআই-প্রযুক্তির চেষ্টা করেছে এই ক্ষেত্রে।
ড্যাল-ই ৩ এর মধ্যে একটি স্পষ্ট বৈশিষ্ট্য হ’ল এটি তৈরি ছবিতে পড়া টেক্সটকে সমাপ্ত ভাবে সংযোজন করতে সক্ষম। এই চমৎকার উন্নতি তার পূর্ববর্তী মডেল ড্যাল-ই ২ এর জন্য একটি চ্যালেঞ্জিং কাজ ছিল এবং এটির মতো প্রতিযোগী চিত্র জেনারেটর এআই মডেলের মধ্যে অনেকগুলির ক্ষেত্রে এই সাহসী চেষ্টা এখনো সফল হয়নি, সম্মানিত মিডজার্নি সহ।
ওপেনএআই দাবি করে যে ড্যাল-ই ৩ তার সাথে গুরুত্বপূর্ণ উন্নতি সহ স্থিরভাবে মানুষের বিস্তারিত বর্ণনার মধ্যে টেক্সট তৈরি করতে সক্ষম, সেই ধারণাটি মানুষের হাতের মধ্যে সাধারণ বিস্তার করে। এই উপাধিটি ওপেনএআই-এর প্রযুক্তির বিশ্বে এসেছে এটি প্রতিযোগী এআই মডেলগুলির দিকে।
ওপেনএআই সিইও স্যাম আল্টম্যান দ্বারা সমাজ নেটওয়ার্ক এক্স এ পোস্ট করা একটি ভিডিও ডেমনস্ট্রেশন, এটির সাথে চ্যাটজিপিটির সাথে সম্প্রচারিত যোগাযোগের সম্প্রচারিত ও আকর্ষণীয় প্রম্পটিং শৈলী প্রদর্শন করে, এই এআই মডেলগুলির মধ্যে অবাধ সিনার্জি উপস্থাপন করে।
ড্যাল-ই ৩ বনাম মিডজার্নি
ওপেনএআই-র সর্বশেষ অমিটণ, ড্যাল-ই ৩, টেক্সট-টু-ইমেজ জেনারেশনের ক্ষেত্রে একটি গুরুত্বপূর্ণ উন্নতি নির্দেশ করে। বিশেষভাবে, এই সর্বশেষ এআই মডেলটি নয়াঞ্চতা সহ সূক্ষ্মভাবে প্রম্প্টগুলি বুঝতে এবং অবৈধ নির্দেশ সহ অবদানগুলি প্রাকতন গুণমূলক সাথে সাক্ষরিক অবদানের সাথে নির্মিত ছবি সৃষ্টি করতে বুঝে।
এর পাশাপাশি, মিডজার্নি এবং স্টেবল ডিফিউশন সহ পূর্বের ড্যাল-ই সংস্করণগুলির মতো এআই মডেলগুলির সবচেয়ে দীর্ঘ চ্যালেঞ্জ হ’ল জটিল মানসিক ছবি স্পষ্টভাবে বাস্তব চিত্রে পরিণত করা। তবে, ড্যাল-ই ৩ এই সংশোধন এই সম্পর্কে সঠিকভাবে স্বাধীন বোনা হয়ে গেছে বলে মনে হয়।
ড্যাল-ই ৩-এর প্রধান উন্নতি হল এর সাথে নির্দেশের বর্ণনার উপর ভিত্তি করে বিশেষ প্রকারের বস্তু এবং তাদের মধ্যকার জটিল সম্পর্ক সম্পূর্ণভাবে ব্যাক্ত করতে। প্রতিযোগীদের সাথে যা মোনালিসা চরিত্র এবং বস্তুগুলি প্রস্তুত করতে দ্বিতীয় বৃদ্ধি করে, যা প্রম্পটের বর্ণনা মোতাবেক সাথে মিলাতে।
মিডজার্নি এবং স্টেবল ডিফিউশন এবং পূর্বের ড্যাল-ই সংস্করণগুলির মতো, সক্ষম ছিল নির্দিষ্ট বস্তুর সম্পর্ক প্রয়োগ করা সহ দৃশ্য তৈরি করতে যা প্রম্পটে উল্লিখিত হয়েছে, সেই দিকে স্থায়ী ফেলে পরে।
ওপেনএআই-র অপকট্য উন্নতি মনোনিবেশ দেখাচ্ছে যে মানসিক চিত্র বনানো এবং বাস্তবায়ন মধ্যে কল্পনা এবং বাস্তবতা মধ্যে সেতু তৈরি করছে টেক্সট-টু-ইমেজ জেনারেশনে। এর পাশাপাশি, ড্যাল-ই ৩-র ঘোষণা তকনোলজি প্রেমিকদের মধ্যে বেশ উত্সাহ সৃষ্টি করেছে।