কি OpenAI মিডজার্নি মারতে সক্ষম? স্যাম আল্টম্যান ড্যাল-ই 3 প্রকাশ করেছে

ওপেনএআই সেপ্টেম্বর 20, মঙ্গলবারের বিকেলে ওপেনএআই প্রধান কার্যকারী অধিকৃত স্যাম আল্টম্যান এইচএআই নবতম উদ্ভাবনের সাথে প্রদর্শন করেছে, ড্যাল-ই ৩ মডেল। এই চমৎকার টেক্সট-টু-ইমেজ জেনারেটরটি তার পূর্ববর্তী সংস্করণ, ড্যাল-ই ২, কে নিন্মে নামে তাদের প্রতিযোগী মডেল মিডজার্নির সাথে। পড়া যাবে যে ড্যাল-ই ৩ সংযোজন টেক্সটকে ছবির মধ্যে সহজভাবে লেখা অন্তর্ভুক্ত করতে পারে এবং এটি এআই-দ্বারা তৈরি ছবি তৈরির দিকে একটি গুরুত্বপূর্ণ ধাপ মানা উঠেছে।

ওপেনএআই ড্যাল-ই ৩ নিষ্পত্তি
একটি সাহসী প্রগতিতে, ওপেনএআই অফিসিয়ালি ড্যাল-ই ৩ এর আয়োজন ঘোষণা করেছে, এর এই নতুন টেক্সট-টু-ইমেজ জেনারেটর, যা তার পূর্ববর্তী মডেল ড্যাল-ই ২ কে দূরে পেশা করেছে। এই অতি গুরুত্বপূর্ণ আপগ্রেডের সাথে, ওপেনএআই আবারও এআই-প্রযুক্তির চেষ্টা করেছে এই ক্ষেত্রে।

ড্যাল-ই ৩ এর মধ্যে একটি স্পষ্ট বৈশিষ্ট্য হ’ল এটি তৈরি ছবিতে পড়া টেক্সটকে সমাপ্ত ভাবে সংযোজন করতে সক্ষম। এই চমৎকার উন্নতি তার পূর্ববর্তী মডেল ড্যাল-ই ২ এর জন্য একটি চ্যালেঞ্জিং কাজ ছিল এবং এটির মতো প্রতিযোগী চিত্র জেনারেটর এআই মডেলের মধ্যে অনেকগুলির ক্ষেত্রে এই সাহসী চেষ্টা এখনো সফল হয়নি, সম্মানিত মিডজার্নি সহ।

ওপেনএআই দাবি করে যে ড্যাল-ই ৩ তার সাথে গুরুত্বপূর্ণ উন্নতি সহ স্থিরভাবে মানুষের বিস্তারিত বর্ণনার মধ্যে টেক্সট তৈরি করতে সক্ষম, সেই ধারণাটি মানুষের হাতের মধ্যে সাধারণ বিস্তার করে। এই উপাধিটি ওপেনএআই-এর প্রযুক্তির বিশ্বে এসেছে এটি প্রতিযোগী এআই মডেলগুলির দিকে।

ওপেনএআই সিইও স্যাম আল্টম্যান দ্বারা সমাজ নেটওয়ার্ক এক্স এ পোস্ট করা একটি ভিডিও ডেমনস্ট্রেশন, এটির সাথে চ্যাটজিপিটির সাথে সম্প্রচারিত যোগাযোগের সম্প্রচারিত ও আকর্ষণীয় প্রম্পটিং শৈলী প্রদর্শন করে, এই এআই মডেলগুলির মধ্যে অবাধ সিনার্জি উপস্থাপন করে।

ড্যাল-ই ৩ বনাম মিডজার্নি

ওপেনএআই-র সর্বশেষ অমিটণ, ড্যাল-ই ৩, টেক্সট-টু-ইমেজ জেনারেশনের ক্ষেত্রে একটি গুরুত্বপূর্ণ উন্নতি নির্দেশ করে। বিশেষভাবে, এই সর্বশেষ এআই মডেলটি নয়াঞ্চতা সহ সূক্ষ্মভাবে প্রম্প্টগুলি বুঝতে এবং অবৈধ নির্দেশ সহ অবদানগুলি প্রাকতন গুণমূলক সাথে সাক্ষরিক অবদানের সাথে নির্মিত ছবি সৃষ্টি করতে বুঝে।

এর পাশাপাশি, মিডজার্নি এবং স্টেবল ডিফিউশন সহ পূর্বের ড্যাল-ই সংস্করণগুলির মতো এআই মডেলগুলির সবচেয়ে দীর্ঘ চ্যালেঞ্জ হ’ল জটিল মানসিক ছবি স্পষ্টভাবে বাস্তব চিত্রে পরিণত করা। তবে, ড্যাল-ই ৩ এই সংশোধন এই সম্পর্কে সঠিকভাবে স্বাধীন বোনা হয়ে গেছে বলে মনে হয়।

ড্যাল-ই ৩-এর প্রধান উন্নতি হল এর সাথে নির্দেশের বর্ণনার উপর ভিত্তি করে বিশেষ প্রকারের বস্তু এবং তাদের মধ্যকার জটিল সম্পর্ক সম্পূর্ণভাবে ব্যাক্ত করতে। প্রতিযোগীদের সাথে যা মোনালিসা চরিত্র এবং বস্তুগুলি প্রস্তুত করতে দ্বিতীয় বৃদ্ধি করে, যা প্রম্পটের বর্ণনা মোতাবেক সাথে মিলাতে।

মিডজার্নি এবং স্টেবল ডিফিউশন এবং পূর্বের ড্যাল-ই সংস্করণগুলির মতো, সক্ষম ছিল নির্দিষ্ট বস্তুর সম্পর্ক প্রয়োগ করা সহ দৃশ্য তৈরি করতে যা প্রম্পটে উল্লিখিত হয়েছে, সেই দিকে স্থায়ী ফেলে পরে।

ওপেনএআই-র অপকট্য উন্নতি মনোনিবেশ দেখাচ্ছে যে মানসিক চিত্র বনানো এবং বাস্তবায়ন মধ্যে কল্পনা এবং বাস্তবতা মধ্যে সেতু তৈরি করছে টেক্সট-টু-ইমেজ জেনারেশনে। এর পাশাপাশি, ড্যাল-ই ৩-র ঘোষণা তকনোলজি প্রেমিকদের মধ্যে বেশ উত্সাহ সৃষ্টি করেছে।

কি OpenAI মিডজার্নি মারতে সক্ষম? স্যাম আল্টম্যান ড্যাল-ই 3 প্রকাশ করেছে

Leave a Reply

Recent Posts

Categories

Related Posts

Floki Inu কে 111% surge নিতে কে সাহায্য করছে ?

Litecoin $100 অতিক্রম করেছে: বিটকয়েনের Halving হওয়ার আগে আরও লাভ দেখা যাবে কি?

KuCoin 10M ডলার Airdrop দিতে চলেছে

Leave a Reply

Recent Posts

Categories