ভাবনা এআই মডেলগুলি 50x আরও সিও 2 নির্গত করে – এবং প্রায়শই কোনও কিছুর জন্য নয়


আমরা কোন এআই জিজ্ঞাসা করি তা বিবেচনা না করেই মডেলটি একটি উত্তর নিয়ে আসবে। এই তথ্য উত্পাদন করতে – উত্তরটির চেয়ে সঠিক কিনা তা নির্বিশেষে – মডেলটি টোকেন ব্যবহার করে। টোকেনগুলি শব্দ বা শব্দের অংশ যা এলএলএম দ্বারা প্রক্রিয়া করা যেতে পারে এমন সংখ্যার স্ট্রিংয়ে রূপান্তরিত হয়।

এই রূপান্তর, পাশাপাশি অন্যান্য কম্পিউটিং প্রক্রিয়াগুলি কো উত্পাদন করে2 নির্গমন অনেক ব্যবহারকারী অবশ্য এই প্রযুক্তিগুলির সাথে সম্পর্কিত যথেষ্ট পরিমাণে কার্বন পদচিহ্ন সম্পর্কে অসচেতন। এখন, জার্মানির গবেষকরা পরিমাপ করেছেন এবং কো -এর সাথে তুলনা করেছেন2 মানকযুক্ত প্রশ্নের একটি সেট ব্যবহার করে বিভিন্ন, ইতিমধ্যে প্রশিক্ষিত, এলএলএমের নির্গমন।

“প্রশ্নবিদ্ধ এলএলএমদের পরিবেশগত প্রভাব তাদের যুক্তিযুক্ত পদ্ধতির দ্বারা দৃ strongly ়ভাবে নির্ধারিত হয়, সুস্পষ্ট যুক্তিযুক্ত প্রক্রিয়াগুলি উল্লেখযোগ্যভাবে জ্বালানি খরচ এবং কার্বন নিঃসরণকে চালিত করে,” হচশুলে মেনচেন বিশ্ববিদ্যালয়ের ফলিত বিজ্ঞান বিশ্ববিদ্যালয়ের গবেষক এবং প্রথম লেখক বলেছেন, প্রথম লেখক ম্যাক্সিমিলিয়ান ডাওনার বলেছেন যোগাযোগে সীমান্ত অধ্যয়ন। “আমরা দেখতে পেয়েছি যে যুক্তিযুক্ত-সক্ষম মডেলগুলি সংক্ষিপ্ত প্রতিক্রিয়া মডেলের চেয়ে 50 গুণ বেশি সিও 2 নির্গমন উত্পাদন করেছে” “

‘চিন্তাভাবনা’ এআই বেশিরভাগ নির্গমন ঘটায়

গবেষকরা বিভিন্ন বিষয় জুড়ে এক হাজার বেঞ্চমার্ক প্রশ্নের সাত থেকে 72 বিলিয়ন পরামিতি পর্যন্ত 14 এলএলএম মূল্যায়ন করেছেন। প্যারামিটারগুলি নির্ধারণ করে যে এলএলএম কীভাবে তথ্য শিখতে এবং প্রক্রিয়া করে।

যুক্তিযুক্ত মডেলগুলি, গড়ে গড়ে 543.5 ‘চিন্তাভাবনা’ টোকেন তৈরি করেছে, যেখানে সংক্ষিপ্ত মডেলগুলির জন্য প্রতি প্রশ্নে মাত্র 37.7 টোকেন প্রয়োজন। টোকেনগুলি ভাবনা হ’ল অতিরিক্ত টোকেন যা যুক্তিযুক্ত এলএলএম উত্তর দেওয়ার আগে উত্পন্ন করে। একটি উচ্চতর টোকেন পদচিহ্নের অর্থ সর্বদা উচ্চতর সিও 2 নির্গমন। তবে এটি প্রয়োজনীয়ভাবে বোঝায় না যে ফলাফলগুলি আরও সঠিক, কারণ বিস্তৃত বিশদ যা সঠিকতার জন্য সর্বদা অপরিহার্য নয়।

সর্বাধিক নির্ভুল মডেলটি ছিল 70 বিলিয়ন পরামিতি সহ যুক্তিযুক্ত-সক্ষম করা কোগিটো মডেল, যা 84.9% নির্ভুলতায় পৌঁছেছিল। মডেলটি তিনগুণ বেশি কো উত্পাদন করেছে2 একই আকারের মডেলগুলির তুলনায় নির্গমন যা সংক্ষিপ্ত উত্তর উত্পন্ন করে। “বর্তমানে, আমরা এলএলএম টেকনোলজিসের অন্তর্নিহিত একটি স্পষ্ট নির্ভুলতা-টেকসই বাণিজ্য-বন্ধ দেখতে পাচ্ছি,” ডাউনার বলেছেন। “সিও 2 সমতুল্য 500 গ্রামের নিচে নির্গমনকে ছাড়িয়ে রাখা কোনও মডেলই 1000 টি প্রশ্নের সঠিক উত্তর দেওয়ার ক্ষেত্রে 80% এর চেয়ে বেশি অর্জন করতে পারেনি।” কো2 সমতুল্য হ’ল ইউনিট যা বিভিন্ন গ্রিনহাউস গ্যাসের জলবায়ু প্রভাব পরিমাপ করতে ব্যবহৃত হয়।

বিষয়বস্তুও সিওর উল্লেখযোগ্যভাবে বিভিন্ন স্তরের ফলস্বরূপ2 নির্গমন যে প্রশ্নগুলির জন্য দীর্ঘ যুক্তিযুক্ত প্রক্রিয়াগুলির প্রয়োজন হয়, উদাহরণস্বরূপ বিমূর্ত বীজগণিত বা দর্শন, উচ্চ বিদ্যালয়ের ইতিহাসের মতো আরও সোজা বিষয়গুলির চেয়ে ছয়গুণ বেশি নির্গমনকে নিয়ে যায়।

চিন্তাশীল ব্যবহার অনুশীলন

গবেষকরা বলেছেন যে তারা আশা করছেন যে তাদের কাজ লোকেরা তাদের নিজস্ব এআই ব্যবহার সম্পর্কে আরও অবহিত সিদ্ধান্ত নিতে পারে। “ব্যবহারকারীরা এআইকে সংক্ষিপ্ত উত্তর উত্পন্ন করতে বা উচ্চ-ক্ষমতার মডেলগুলির ব্যবহারকে এমন কার্যগুলিতে সীমাবদ্ধ করে যা প্রকৃতপক্ষে সেই শক্তির প্রয়োজন হয় তা সীমাবদ্ধ করে নির্গমনকে উল্লেখযোগ্যভাবে হ্রাস করতে পারে,” ডাউনার উল্লেখ করেছিলেন।

উদাহরণস্বরূপ, মডেলের পছন্দ কো -তে একটি গুরুত্বপূর্ণ পার্থক্য আনতে পারে2 নির্গমন উদাহরণস্বরূপ, ডিপসেক আর 1 (70 বিলিয়ন প্যারামিটার) উত্তর 600,000 প্রশ্নের উত্তর কো তৈরি করবে2 লন্ডন থেকে নিউ ইয়র্ক পর্যন্ত রাউন্ড ট্রিপ ফ্লাইটের সমান নির্গমন। এদিকে, কুইন 2.5 (72 বিলিয়ন প্যারামিটার) একই নির্গমন উত্পন্ন করার সময় একই রকম নির্ভুলতার হারের সাথে তিন বারের বেশি প্রশ্নের (প্রায় 1.9 মিলিয়ন) উত্তর দিতে পারে।

গবেষকরা বলেছিলেন যে তাদের ফলাফলগুলি গবেষণায় ব্যবহৃত হার্ডওয়্যার পছন্দ দ্বারা প্রভাবিত হতে পারে, একটি নির্গমন ফ্যাক্টর যা স্থানীয় শক্তি গ্রিড মিশ্রণের উপর নির্ভর করে আঞ্চলিকভাবে পরিবর্তিত হতে পারে এবং পরীক্ষিত মডেলগুলির উপর নির্ভর করে। এই কারণগুলি ফলাফলের সাধারণীকরণকে সীমাবদ্ধ করতে পারে।

“যদি ব্যবহারকারীরা তাদের এআই-উত্পাদিত আউটপুটগুলির সঠিক সিও 2 ব্যয় জানেন, যেমন আকস্মিকভাবে নিজেকে একটি অ্যাকশন ফিগারে পরিণত করা হয়, তবে তারা কখন এবং কীভাবে এই প্রযুক্তিগুলি ব্যবহার করে সে সম্পর্কে তারা আরও নির্বাচনী এবং চিন্তাশীল হতে পারে,” ডোনার উপসংহারে বলেছিলেন।



Source link

Leave a Comment