ডিপমাইন্ড এবং ওপেনএআই আন্তর্জাতিক গাণিতিক অলিম্পিয়াডে সোনার দাবি করে


এআইএস গণিতের সমস্যাগুলিতে আরও ভাল হচ্ছে

Andresr/ getty চিত্র

গুগল ডিপমাইন্ড এবং ওপেনাইয়ের পরীক্ষামূলক এআই মডেলগুলি প্রথমবারের মতো আন্তর্জাতিক গাণিতিক অলিম্পিয়াডে (আইএমও) সোনার স্তরের পারফরম্যান্স অর্জন করেছে।

সংস্থাগুলি এই মুহুর্তটিকে এআইএসের জন্য একটি গুরুত্বপূর্ণ মাইলফলক হিসাবে স্বীকৃতি দিচ্ছে যা একদিন কঠোর বৈজ্ঞানিক বা গাণিতিক সমস্যাগুলি সমাধান করতে পারে তবে গণিতবিদরা আরও সতর্ক হন কারণ মডেলগুলির ফলাফল এবং কীভাবে তারা কাজ করে তা জনসমক্ষে প্রকাশিত হয়নি।

তরুণ গণিতবিদদের জন্য বিশ্বের অন্যতম মর্যাদাপূর্ণ প্রতিযোগিতা আইএমও দীর্ঘদিন ধরে এআই গবেষকরা গাণিতিক যুক্তির জন্য লিটমাস পরীক্ষা হিসাবে দেখেছেন যে এআই সিস্টেমগুলির সাথে লড়াই করার প্রবণতা রয়েছে।

যুক্তরাজ্যের বাথে অনুষ্ঠিত গত বছরের প্রতিযোগিতার পরে, গুগল ডিপমিনডানডানডে যে এটি এআই সিস্টেমগুলি তৈরি করেছিল, যাকে আলফাপ্রুফ এবং আলফেজোমেট্রি বলা হয়, তারা একসাথে রৌপ্য পদক-স্তরের পারফরম্যান্স অর্জন করেছিল, তবে প্রতিযোগিতার সরকারী চিহ্নিতকারীরা এর এন্ট্রিগুলিকে গ্রেড করা হয়নি।

এই বছরের প্রতিযোগিতার আগে, যা অস্ট্রেলিয়ার কুইন্সল্যান্ডে অনুষ্ঠিত হয়েছিল, গুগল, হুয়াওয়ে এবং টিকটোক-মালিকের বাইড্যান্স সহ সংস্থাগুলি, পাশাপাশি একাডেমিক গবেষকরা আয়োজকদের কাছে তাদের এআই মডেলগুলির পারফরম্যান্স আনুষ্ঠানিকভাবে গ্রেড করতে পারে কিনা তা জিজ্ঞাসা করার জন্য যোগাযোগ করেছিলেন, বলেছেন, গ্রেগর ডলিনারআইএমওর রাষ্ট্রপতি। আইএমও সম্মত হয়েছিল, এই প্রোভিসোর সাথে যে সংস্থাগুলি ২৮ জুলাই পর্যন্ত তাদের ফলাফল ঘোষণা করার জন্য অপেক্ষা করেছিল, যখন আইএমওর সম্পূর্ণ সমাপনী অনুষ্ঠানগুলি সম্পন্ন হয়েছিল।

ওপেনাই আরও জিজ্ঞাসা করেছিল যে এটি প্রতিযোগিতায় অংশ নিতে পারে কিনা, তবে এটি সরকারী স্কিম সম্পর্কে অবহিত করার পরে, এটি কোনও প্রতিক্রিয়া জানায় না বা প্রবেশের নিবন্ধন করে না, ডলিনার বলেছেন।

19 জুলাই, ওপেনএআই ঘোষণা করেছে যে এটি একটি নতুন এআই তৈরি করেছে তা সরকারী প্রতিযোগিতা থেকে পৃথক তিন প্রাক্তন আইএমও পদকপ্রাপ্ত দ্বারা চিহ্নিত স্বর্ণপদক স্কোর অর্জন করেছে। ওপেনাই জানিয়েছেন, এআই প্রতিযোগীদের মতো একই ৪.৫ ঘন্টা সময়সীমাতে ছয়টি প্রশ্নের মধ্যে পাঁচটি প্রশ্নের সঠিক উত্তর দিয়েছে।

দু’দিন পরে, গুগল ডিপমাইন্ডও এটি ঘোষণা করেছিল এর এআই সিস্টেমজেমিনি ডিপ থিঙ্ক নামে পরিচিত, একই স্কোর এবং সময় সীমা সহ স্বর্ণ অর্জন করেছিল। ডলিনার নিশ্চিত করেছেন যে এই ফলাফলটি আইএমওর অফিসিয়াল চিহ্নিতকারীরা দিয়েছিল।

গুগলের আলফাপ্রুফ এবং আলফাগোমেট্রি সিস্টেমগুলির বিপরীতে, যা বিশেষত প্রতিযোগিতার জন্য তৈরি করা হয়েছিল এবং লিন নামে একটি কম্পিউটার প্রোগ্রামিং ভাষায় লিখিত প্রশ্নাবলী এবং উত্তরগুলির সাথে কাজ করেছিল, এই বছর গুগল এবং ওপেনএআইয়ের উভয় মডেলই পুরোপুরি প্রাকৃতিক ভাষায় কাজ করেছিল।

চর্বিযুক্ত কাজ করার অর্থ এআইয়ের আউটপুটটি তাত্ক্ষণিকভাবে সঠিকতার জন্য পরীক্ষা করা যেতে পারে তবে অ-বিশেষজ্ঞদের পক্ষে পড়া আরও কঠিন। লুং লুং গুগলে, যিনি জেমিনি ডিপ থিঙ্কসে কাজ করেছিলেন, তিনি বলেছেন যে প্রাকৃতিক ভাষার পদ্ধতির আরও বোধগম্য উত্তর তৈরি করতে পারে, পাশাপাশি সাধারণত দরকারী এআই সিস্টেমগুলির ক্ষেত্রে প্রযোজ্য হতে পারে।

লুং বলেছেন যে একটি বৃহত ভাষার মডেলটিতে সমাধানগুলি যাচাই করার ক্ষমতাটি শক্তিবৃদ্ধি শেখার সাথে অগ্রগতির জন্য ধন্যবাদ দেওয়া হয়েছে, একটি প্রশিক্ষণ পদ্ধতি যেখানে একটি এআই শেখানো হয় যে সাফল্য কেমন দেখাচ্ছে এবং নিয়মগুলি নির্ধারণের জন্য এবং কীভাবে কেবল পরীক্ষা এবং ত্রুটির মাধ্যমে সফল হতে হবে তা নির্ধারণের জন্য বাকি রয়েছে। এই পদ্ধতিটি গুগলের গেম-প্লে করা এআইএস যেমন আলফাজেরোর সাথে পূর্ববর্তী সাফল্যের মূল চাবিকাঠি ছিল।

গুগলের মডেল সমান্তরাল চিন্তাভাবনা নামক একটি মোডে একবারে একাধিক সমাধানও বিবেচনা করে, পাশাপাশি আইএমওর জন্য বিশেষভাবে কার্যকর গণিত সমস্যার একটি ডেটাসেটে প্রশিক্ষণ দেওয়া হচ্ছে, লুং বলেছেন।

ওপেনাই এর সিস্টেমে কয়েকটি বিবরণ প্রকাশ করেছে, এটি ছাড়াও এটি শক্তিবৃদ্ধি শেখা এবং “পরীক্ষামূলক গবেষণা পদ্ধতি” ব্যবহার করে।

“অগ্রগতি প্রতিশ্রুতিবদ্ধ, তবে একটি নিয়ন্ত্রিত বৈজ্ঞানিক ফ্যাশনে সঞ্চালিত হয়নি, এবং তাই আমি এই পর্যায়ে এটি মূল্যায়ন করতে সক্ষম হব না,” বলেছেন টেরেন্স টাও ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, লস অ্যাঞ্জেলেসে। “সম্ভবত একবার জড়িত সংস্থাগুলি আরও ডেটা সহ কিছু কাগজপত্র প্রকাশ করে এবং আশা করি অন্যদের ফলাফলগুলি প্রতিলিপি করার জন্য মডেলটিতে পর্যাপ্ত অ্যাক্সেস, কেউ আরও সুনির্দিষ্ট কিছু বলতে পারেন, তবে আপাতত, আমাদের মূলত দাবী করা ফলাফলের জন্য সংস্থাগুলিকে বিশ্বাস করতে হবে।”

জর্ডি উইলিয়ামসন অস্ট্রেলিয়ার সিডনি বিশ্ববিদ্যালয়ে সম্মত। উইলিয়ামসন বলেছেন, “আমি মনে করি এটি লক্ষণীয় যে আমরা এখানেই আছি। এটি হতাশাব্যঞ্জক।

যদিও প্রাকৃতিক ভাষায় কাজ করা সিস্টেমগুলি অ-গণতান্ত্রিকদের জন্য কার্যকর হতে পারে, তবে মডেলগুলি যদি দীর্ঘ দীর্ঘ প্রমাণগুলি যা পরীক্ষা করা শক্ত তা উত্পাদন করে তবে এটি একটি সমস্যাও উপস্থাপন করতে পারে, বলেছেন জোসেফ মায়ার্সএই বছরের আইএমওর অন্যতম আয়োজক। “যদি এআইএস কখনও উল্লেখযোগ্য অমীমাংসিত সমস্যার সমাধান তৈরি করতে পারে যা প্রশংসনীয়ভাবে সঠিক হতে পারে তবে দুর্ঘটনাক্রমে কিছু সূক্ষ্ম তবে মারাত্মক ত্রুটিও লুকিয়ে থাকতে পারে, বা সম্ভাব্যভাবে ইচ্ছাকৃতভাবে কোনও বিভ্রান্তিকর এআই থেকে, এই আইআইগুলি একটি আনুষ্ঠানিক প্রমাণ তৈরি করে এটি পড়ার চেষ্টা করার আগে দীর্ঘ এআই আউটপুটের সঠিকতার প্রতি আস্থা রাখার মূল চাবিকাঠি।”

উভয় সংস্থা বলেছে যে, আগামী মাসগুলিতে, তারা বৃহত্তর জনসাধারণের কাছে প্রকাশের আগে প্রথমে গণিতবিদদের পরীক্ষার জন্য এই সিস্টেমগুলি সরবরাহ করবে। মডেলগুলি শীঘ্রই কঠোর বৈজ্ঞানিক গবেষণা সমস্যাগুলিতে সহায়তা করতে পারে, বলেছেন জুনহিউক জং গুগলে, যারা জেমিনি ডিপ থিঙ্কসে কাজ করেছেন। “পৌঁছানোর মধ্যে অনেকগুলি, অনেক অমীমাংসিত সমস্যা হতে চলেছে,” তিনি বলেছেন।

বিষয়:



Source link

Leave a Comment