বায়োটেক ফার্মের লক্ষ্য ‘জীববিজ্ঞানের চ্যাটজিপ্ট’ তৈরি করা – এটি কি কাজ করবে?


বেসক্যাম্প গবেষকরা মাল্টায় জেনেটিক ডেটা সংগ্রহ করছেন

গ্রেগ ফানেল

বেসক্যাম্প রিসার্চ নামে একটি ব্রিটিশ বায়োটেক ফার্ম গত কয়েক বছর ধরে বিশ্বজুড়ে চরম পরিবেশে বসবাসকারী জীবাণু থেকে জেনেটিক তথ্য সংগ্রহের জন্য ব্যয় করেছে, যা এক মিলিয়নেরও বেশি প্রজাতি এবং বিজ্ঞানের ক্ষেত্রে প্রায় 10 বিলিয়ন জিনকে নতুন চিহ্নিত করেছে। এটি দাবি করে যে গ্রহের জীববৈচিত্র্যের এই বিশাল ডাটাবেসটি একটি “জীববিজ্ঞানের চ্যাট” প্রশিক্ষণে সহায়তা করবে যা পৃথিবীর জীবন সম্পর্কে প্রশ্নের উত্তর দেবে – তবে এটি কার্যকর হবে এমন কোনও গ্যারান্টি নেই।

জার্গ ওভারম্যান জার্মানির লাইবনিজ ইনস্টিটিউট ডিএসএমজেডে, যা বিশ্বের অন্যতম বিচিত্র সংগ্রহ মাইক্রোবায়াল সংস্কৃতিগুলির মধ্যে রয়েছে, বলেছে যে জেনেটিক সিকোয়েন্সগুলি বাড়ানো মূল্যবান, তবে যে জীবগুলি থেকে তারা সংগ্রহ করা হয়েছিল সে সম্পর্কে আরও তথ্য ছাড়াই ড্রাগ আবিষ্কার বা রসায়নের মতো বিষয়গুলির জন্য দরকারী অনুসন্ধানের ফলস্বরূপ হতে পারে না। “আমি নিশ্চিত নই যে শেষ পর্যন্ত সিকোয়েন্স স্পেসে এই ব্রুট-ফোর্স বৃদ্ধির দ্বারা সত্যই অভিনব ক্রিয়াকলাপগুলির বোঝাপড়া ত্বরান্বিত হবে,” তিনি বলেছেন।

সাম্প্রতিক বছরগুলিতে গবেষকরা প্রচুর পরিমাণে জৈবিক তথ্যের মধ্যে নিদর্শনগুলি সনাক্ত করতে এবং সম্পর্কের পূর্বাভাস দেওয়ার জন্য প্রশিক্ষিত বেশ কয়েকটি মেশিন লার্নিং মডেল বিকাশ করতে দেখেছেন। এর মধ্যে সর্বাধিক বিখ্যাত হ’ল আলফাফোল্ড, যা কেবল জেনেটিক ডেটার উপর ভিত্তি করে একটি প্রোটিনের 3 ডি কাঠামোর পূর্বাভাস দিতে পারে এবং গুগল ডিপমাইন্ডে তার নির্মাতাদের রসায়নের 2024 নোবেল পুরষ্কার অর্জন করেছে।

যদিও এই জাতীয় “জেনারেটর বায়োলজি” মডেলগুলি আরও জটিল হয়ে উঠেছে, তারা আরও ভাল হয়নি, বলেছেন ফ্রান্সেস ডিং ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ে, বার্কলে। একটি কারণ বায়োডাইভার্সের ডেটার অভাব হতে পারে। “জীববিজ্ঞানের বর্তমান মডেলগুলি ডেটাসেটগুলিতে প্রশিক্ষিত হয় যা অপ্রয়োজনীয়ভাবে সু-অধ্যয়নিত প্রজাতির প্রতিনিধিত্ব করে (যেমন, ই কোলিইঁদুর, মানুষ) এবং এই মডেলগুলি জীবনের গাছের অন্যান্য অংশগুলির ক্রমগুলি সম্পর্কে বৈশিষ্ট্যগুলির পূর্বাভাস দেওয়ার ক্ষেত্রে আরও খারাপ, “তিনি বলেছেন।

বেসক্যাম্পের গবেষকরা এই জীববৈচিত্র্যের ব্যবধানটি সমাধান করার জন্য প্রস্তুত হন। সংস্থার ক্রমবর্ধমান ডাটাবেসে এখন 26 টি দেশে 120 টিরও বেশি সাইটের নমুনা রয়েছে, এ অনুসারে রিপোর্ট সংস্থা পোস্ট করেছে। জোনাথন ফিনসংস্থার চিফ সায়েন্স অফিসার বলেছেন, সংগ্রহের প্রচেষ্টাগুলি চরম পরিবেশের উপর দৃষ্টি নিবদ্ধ করে যা এখনও আর্কটিক সাগরের বরফের নীচে ফ্রিগিড জল থেকে জঙ্গলের হট স্প্রিংস পর্যন্ত ব্যাপকভাবে নমুনা তৈরি করা হয়নি। ফিন বলেছেন, “আমরা যে নমুনাগুলি যাচ্ছিলাম তার বেশিরভাগই হ’ল প্রোকারিয়োটিক নমুনা: ব্যাকটিরিয়া, জীবাণু এবং তাদের ভাইরাস,” ফিন বলেছেন। “আমি জানি আমরা সেখানে কিছু ছত্রাক পেয়েছি।”

এই নমুনাগুলির জেনেটিক বিশ্লেষণে জীবনের গাছ জুড়ে প্রায় সর্বজনীনভাবে ভাগ করা জিনগুলির মধ্যে পার্থক্য প্রকাশিত হয়েছে – এর ভিত্তিতে সংস্থাটি অনুমান করে যে এআই বায়োলজি মডেলগুলি প্রশিক্ষণের জন্য ব্যবহৃত পাবলিক জিনোমিক ডেটাসেটে ঘটে না এমন 1 মিলিয়নেরও বেশি প্রজাতির তথ্য রয়েছে। এগুলি সম্মিলিতভাবে প্রায় 9.8 বিলিয়ন সদ্য চিহ্নিত জিন রয়েছে, যা মোট জিনের মোট সংখ্যায় 10 গুণ বৃদ্ধি পেয়েছে, যার প্রতিটিই একটি সম্ভাব্য দরকারী প্রোটিনকে এনকোড করে, গবেষকরা বলেছেন।

“এই মডেলগুলিকে প্রকৃতির একটি বৃহত অংশ দেখিয়ে জীববিজ্ঞান কীভাবে কাজ করে সে সম্পর্কে তাদের আরও ভাল ধারণা থাকা উচিত,” ফিন বলেছেন। “আমরা জীববিজ্ঞানের একটি চ্যাটজিপ্ট তৈরির চেষ্টা করছি।”

কিছু অনুমান অনুসারে, পৃথিবী হোস্ট হিসাবে একটি ট্রিলিয়ন মাইক্রোবায়াল প্রজাতি হিসাবেপ্রায় কোনওটিই ভালভাবে চিহ্নিত করা হয় না। সুতরাং, এটি সংস্থাটি এত নতুন জীবন চিহ্নিত করেছে তা অবাক করে দেয় না। “এটি প্রায় অনিবার্য যে আপনি যদি আরও বেশি অন্বেষণ করেন তবে আপনি আরও আলাদা জিনের রূপগুলি পান,” বলেছেন লিওপোল্ড অংশগুলি যুক্তরাজ্যের ওয়েলকাম স্যাঙ্গার ইনস্টিটিউটে।

তবে বেসক্যাম্প এই ধারণাটি নিয়ে ব্যাংকিং করছে যে সমস্ত নতুন উপাদান মূল্যবান হতে পারে – এবং এটি একা নয়। “এটি আমি দীর্ঘ সময়ের মধ্যে দেখেছি সবচেয়ে উত্তেজনাপূর্ণ জিনিসগুলির মধ্যে একটি,” নাথন ফ্রেমার্কিন যুক্তরাষ্ট্রে একটি বায়োটেক ফার্ম জেনেন্টেকের একটি মেশিন লার্নিং গবেষক। সাধারণভাবে, তিনি বলেছেন যে জীববিজ্ঞানের জন্য এআই মডেলগুলির উপর কাজ করা অ্যালগরিদমগুলি উন্নত করতে বা ল্যাবগুলিতে আরও বেশি ডেটা তৈরির দিকে মনোনিবেশ করেছে যা বাস্তবে বিশ্বে বাইরে গিয়ে নমুনা সংগ্রহ করার পরিবর্তে।

যাইহোক, সন্দেহজনক হওয়ার কারণ রয়েছে যে ডাটাবেসটি কোম্পানির চায় এমন আমূল উন্নত মডেলগুলির দিকে পরিচালিত করবে। একটির জন্য, প্রোটিনের এই নতুন বৈচিত্র্য কত মূল্যবান নতুন ফাংশনগুলি যেমন প্লাস্টিক-খাওয়ার এনজাইম বা প্রোটিনের প্রতিনিধিত্ব করে যা জিন সম্পাদনার জন্য পুনর্নির্মাণ করা যেতে পারে তা স্পষ্ট নয়। “তাদের দেখাতে হবে যে এই অভিনবত্বটি কোনওভাবে কার্যকর,” পার্টস বলে।

তদুপরি, যদি নতুন জিনগুলি সত্যই আমরা ইতিমধ্যে জানি তাদের থেকে যথেষ্ট আলাদা হয় তবে ওভারম্যান দেখতে পান না যে বিদ্যমান সরঞ্জামগুলি কীভাবে তাদের কার্যকারিতা সহজেই পূর্বাভাস দিতে পারে, বা কীভাবে কোনও নতুন মডেল প্রশিক্ষণের জন্য ডেটা ব্যবহার করা যায়। “জিনের বেশিরভাগ অংশ কী করে তা আপনার কাছে কোনও ধারণা নেই,” তিনি বলেছেন। সংস্থাটি নতুন জীববিজ্ঞানের একটি ধনসম্পদকে ভালভাবে একত্রিত করতে পারত, তবে আরও পুরানো ধাঁচের পরীক্ষাগার কাজ না করে কী আছে তা বোঝার জন্য এটি রহস্যজনক থাকতে পারে, এমনকি সবচেয়ে শক্তিশালী এআইয়ের কাছেও।

বিষয়:



Source link

Leave a Comment