সাক্ষাৎকার Alexandr Wang
Founder and CEO @ Scale.ai
দ্বারা 20VC with Harry Stebbings • 2024-06-12

Harry Stebbings-এর 20VC-তে Alexandr Wang, Scale AI-এর CEO, একটি আকর্ষক এবং খোলামেলা কথোপকথনে বর্তমান AI পরিস্থিতিকে গভীরভাবে উন্মোচন করেছেন, প্রচলিত ধারণাকে চ্যালেঞ্জ জানিয়ে এবং পরবর্তী প্রজন্মের মডেলের কর্মক্ষমতার জন্য আসল প্রতিবন্ধকতা তুলে ধরেছেন। পৃথিবী যখন কম্পিউট (compute) নিয়ে আচ্ছন্ন, ওয়াং যুক্তি দেন যে আসল প্রতিযোগিতা — এবং সম্ভাব্য বিভেদক — সিলিকনে নয়, ডেটাতেই নিহিত।
ডেটা দেয়াল: কেন কম্পিউট (Compute) আর যথেষ্ট নয়
সাক্ষাৎকারটি সরাসরি একটি বিতর্কিত প্রশ্নে প্রবেশ করেছে: আমরা কি AI মডেলের কর্মক্ষমতায় কার্যকারিতা হ্রাস (diminishing returns) দেখতে পাচ্ছি, যেখানে আরও বেশি কম্পিউট (compute) আর উন্নত ফলাফলের নিশ্চয়তা দেয় না? ওয়াং-এর উত্তর ছিল একটি জোরালো "হ্যাঁ"। তিনি উল্লেখ করেছেন যে, ২০২২ সালের শেষ দিক থেকে Nvidia GPU-এর খরচে ব্যাপক বৃদ্ধি (প্রতি ত্রৈমাসিকে ৫ বিলিয়ন ডলার থেকে ২০ বিলিয়ন ডলারের বেশি) সত্ত্বেও, আমরা GPT-4-এর চেয়ে "বিস্ময়করভাবে ভালো" কোনো বেস মডেল (base model) দেখিনি, যা এই বিশাল কম্পিউট (compute) পরিবর্তনের পূর্ববর্তী।
ওয়াং ব্যাখ্যা করেছেন যে AI-এর অগ্রগতি তিনটি স্তম্ভের উপর নির্ভরশীল: কম্পিউট (compute), অ্যালগরিদম (algorithms) এবং ডেটা (data)। কম্পিউট (compute) নাটকীয়ভাবে বৃদ্ধি পেলেও, অন্য দুটি তাল মেলাতে পারেনি। গুরুত্বপূর্ণভাবে, তিনি বিশ্বাস করেন যে শিল্প একটি "ডেটা দেয়াল"-এর সম্মুখীন হয়েছে। "সহজলভ্য ডেটা" (easy data) — যা উন্মুক্ত ইন্টারনেটে সহজলভ্য, কমন ক্রল (common crawls) বা টরেন্ট (torrents) থেকে সংগৃহীত — মূলত ব্যবহৃত হয়ে গেছে। এই মডেলগুলি এখন "ইন্টারনেট অনুকরণে ব্যতিক্রমীভাবে ভালো", কিন্তু প্রকৃত AGI (আর্টিফিশিয়াল জেনারেল ইন্টেলিজেন্স) বা কার্যকর AI এজেন্টদের জন্য প্রয়োজনীয় জটিল কাজ এবং যুক্তির জন্য তা যথেষ্ট নয়।
মূল অন্তর্দৃষ্টি:
- AI-এর অগ্রগতি কম্পিউট (compute), ডেটা (data) এবং অ্যালগরিদম (algorithms) এর সমন্বিত অগ্রগতির উপর নির্ভরশীল।
- GPT-4-এর পরে কম্পিউট (compute)-এ বিপুল বিনিয়োগ বেস মডেলের কর্মক্ষমতায় আনুপাতিক লাফ আনতে পারেনি।
- শিল্প মূলত "সহজলভ্য ডেটা" (ইন্টারনেট ডেটা) নিঃশেষ করে ফেলেছে, যা কর্মক্ষমতার স্থবিরতা ঘটিয়েছে।
ফ্রন্টিয়ার তৈরি: ডেটার প্রাচুর্য তৈরি করা
এই ডেটা দেয়াল অতিক্রম করতে, ওয়াং "ফ্রন্টিয়ার ডেটা" (Frontier data) ধারণাটি প্রবর্তন করেছেন। তিনি তুলে ধরেছেন যে আজকের অর্থনীতিকে চালিত করে এমন অনেক জটিল যুক্তি এবং সমস্যা সমাধান – যেমন একজন জালিয়াতি বিশ্লেষকের ডিডাক্টিভ প্রক্রিয়া (deductive process) – অনলাইনে লিপিবদ্ধ হয় না। এর অর্থ হলো, কেবল ইন্টারনেট ডেটার উপর প্রশিক্ষিত মডেলগুলির এই গভীর মানবীয় বুদ্ধিমত্তা থেকে শেখার ক্ষমতা নেই।
তাহলে, আমরা কীভাবে এই অধরা ফ্রন্টিয়ার ডেটা (Frontier data) সংগ্রহ করব? ওয়াং দুটি প্রধান পথ তুলে ধরেছেন। প্রথমত, এন্টারপ্রাইজগুলির মধ্যে প্রচুর পরিমাণে মালিকানাধীন ডেটা (proprietary data) আবদ্ধ রয়েছে। তিনি JPMorgan-এর ১৫০ পেটাবাইট (petabytes) অভ্যন্তরীণ ডেটার কথা উল্লেখ করেছেন, যা GPT-4-এর এক পেটাবাইটেরও কম ইন্টারনেট ডেটাসেটকে ম্লান করে দেয়। এই ডেটা, তবে, অত্যন্ত সংবেদনশীল এবং এন্টারপ্রাইজগুলিকে তাদের নিজস্ব AI সিস্টেমের জন্য এটি সংগ্রহ ও পরিমার্জন করতে হবে, সম্ভবত অন-প্রেম (on-prem) বা বাইরের ব্যবহারের বিরুদ্ধে কঠোর গ্যারান্টি সহ। দ্বিতীয়ত, এবং সাধারণীকৃত সাফল্যের জন্য আরও গুরুত্বপূর্ণ, হলো "ফরওয়ার্ড ডেটা প্রোডাকশন" (forward data production)। এটি কেবল বিদ্যমান ডেটা সংগ্রহ করা নয়, বরং নতুন, অত্যন্ত জটিল ডেটা তৈরি করা। এতে একটি "মানব-সিন্থেটিক হাইব্রিড প্রক্রিয়া" (human-synthetic hybrid process) জড়িত, যেখানে AI ডেটা তৈরি করে, এবং মানব বিশেষজ্ঞরা "সেফটি ড্রাইভার" (safety drivers) হিসেবে কাজ করেন, AI-কে নির্দেশনা দেন, ত্রুটি সংশোধন করেন এবং মডেল আটকে গেলে গুরুত্বপূর্ণ ইনপুট (input) প্রদান করেন। ওয়াং এই "AI ট্রেইনার" বা "কন্ট্রিবিউটর"দের সামাজিক প্রভাবের জন্য সর্বোচ্চ লিভারেজ (leverage) পদগুলির মধ্যে অন্যতম হিসেবে দেখেন। তিনি উল্লেখ করেছেন, "একজন মানব বিশেষজ্ঞ হিসেবে, এই মডেলগুলিকে উন্নত করতে ডেটা তৈরি করার মাধ্যমে আপনার সমাজব্যাপী প্রভাব ফেলার ক্ষমতা রয়েছে।"
মূল পরিবর্তনসমূহ:
- সহজলভ্য "সহজ ডেটা" (easy data) থেকে "ফ্রন্টিয়ার ডেটা" (Frontier data)-তে রূপান্তর উন্নত AI-এর জন্য অপরিহার্য।
- ফ্রন্টিয়ার ডেটা (Frontier data)-তে জটিল যুক্তির শৃঙ্খলা, সরঞ্জাম ব্যবহার এবং এজেন্টিক আচরণ (agentic behavior) অন্তর্ভুক্ত, যা উন্মুক্ত ইন্টারনেটে পাওয়া যায় না।
- মালিকানাধীন এন্টারপ্রাইজ ডেটা (proprietary enterprise data) সংগ্রহ এবং সক্রিয়ভাবে নতুন, উচ্চ-মানের ডেটা (data) তৈরির মাধ্যমে ডেটার প্রাচুর্য অর্জন করা হবে।
- সিন্থেটিক ডেটা (synthetic data) তৈরিতে AI সিস্টেমগুলিকে নির্দেশনা ও সংশোধন করার জন্য নতুন মানব ভূমিকা তৈরি হবে, যা স্বায়ত্তশাসিত গাড়ির সেফটি ড্রাইভারদের (safety drivers) মতো।
ভূ-রাজনৈতিক ডেটা প্রতিযোগিতা: একটি নতুন স্নায়ুযুদ্ধ?
কথোপকথনটি AI-এর গভীর ভূ-রাজনৈতিক প্রভাবের দিকে মোড় নেয়, যা ওয়াং-এর মতে কম আলোচিত একটি বিষয়। তিনি স্পষ্ট ভাষায় বলেছেন, "মৌলিকভাবে, এই AI প্রযুক্তির মানবজাতি যা দেখেছে তার মধ্যে অন্যতম সেরা সামরিক সম্পদ হওয়ার সম্ভাবনা রয়েছে, সম্ভবত পারমাণবিক অস্ত্রের চেয়েও বেশি সামরিক সম্পদ।" তিনি একটি উদ্বেগজনক পরিস্থিতি তুলে ধরেছেন যেখানে AGI সম্পন্ন একটি স্বৈরাচারী শাসন এটি ছাড়া একটি জাতিকে জয় করতে পারে।
ওয়াং চীনের দ্রুত AI অগ্রগতি নিয়ে যথেষ্ট উদ্বেগ প্রকাশ করেছেন। যদিও দুই বছর আগে তারা GPT-4-এর ক্ষমতার "ধারেকাছেও ছিল না", একটি সাম্প্রতিক চীনা মডেল, 0101-এর Yi-Large, এখন বিশ্বের সেরাগুলির মধ্যে স্থান পেয়েছে, GPT-4o, Gemini এবং Claude 3 Opus-এর ঠিক পিছনে। তিনি এর কারণ হিসেবে CCP-এর "গুরুত্বপূর্ণ শিল্পগুলিকে এগিয়ে নিয়ে যেতে অত্যন্ত আগ্রাসী কেন্দ্রীয় পদক্ষেপ এবং কেন্দ্রীয় শিল্পনীতি" বাস্তবায়নের ব্যতিক্রমী ক্ষমতাকে দায়ী করেছেন। সোলার (solar) এবং EV (ইভি)-তে দেখা এই প্যাটার্ন (pattern) ইঙ্গিত দেয় যে চীনের "আমাদের চেয়ে দ্রুত এগিয়ে যাওয়ার এবং প্রতিযোগিতায় এগিয়ে থাকার একটি স্পষ্ট সুযোগ" রয়েছে। এটি বিবেচনা করে, ওয়াং বিশ্বাস করেন যে একটি "দ্বিবিভাজন যা অবশ্যই উদ্ভূত হতে হবে": অত্যাধুনিক, সত্যিকারের শক্তিশালী AI সিস্টেমগুলিকে সামরিক ও ভূ-রাজনৈতিক কারণে বন্ধ রাখা উচিত, যখন কম উন্নত, উন্মুক্ত মডেলগুলি অর্থনৈতিক মূল্য চালিত করতে পারে।
মূল শিক্ষা:
- AI, বিশেষ করে AGI, মানবজাতির সবচেয়ে শক্তিশালী সামরিক সম্পদ হতে পারে, যার গভীর ভূ-রাজনৈতিক পরিণতি রয়েছে।
- চীনের কেন্দ্রীভূত শিল্পনীতি দ্রুত AI অগ্রগতির সুযোগ করে দেয়, যা পশ্চিমা সক্ষমতার সাথে ব্যবধান দ্রুত কমিয়ে আনছে।
- উন্মুক্ত এবং বন্ধ AI সিস্টেমগুলির মধ্যে একটি কৌশলগত পার্থক্য গুরুত্বপূর্ণ: অত্যাধুনিক মডেলগুলি সুরক্ষার জন্য বন্ধ রাখা প্রয়োজন হতে পারে, যখন কম শক্তিশালী মডেলগুলি ব্যাপক অর্থনৈতিক সুবিধার জন্য উন্মুক্ত থাকতে পারে।
প্রতিযোগিতার নতুন সংজ্ঞা: ডেটা (Data)ই চূড়ান্ত সুরক্ষা (Moat)
ফাউন্ডেশন মডেলগুলির অত্যন্ত প্রতিযোগিতামূলক বিশ্বে, ওয়াং দৃঢ়ভাবে বিশ্বাস করেন যে ডেটা (data) হবে চূড়ান্ত বিভেদক। তিনি উল্লেখ করেছেন যে অ্যালগরিদম (algorithms) অবশেষে রিভার্স-ইঞ্জিনিয়ার্ড (reverse-engineered) হতে পারে বা সাধারণ জ্ঞানে পরিণত হতে পারে, এবং কম্পিউট (compute) কেবল কেনা যেতে পারে। তিনি জোর দিয়ে বলেছেন, "ডেটা এমন কয়েকটি ক্ষেত্রের মধ্যে একটি, যেখানে আপনি আসলে দীর্ঘমেয়াদী টেকসই প্রতিযোগিতামূলক সুবিধা তৈরি করতে পারেন।" তিনি এই পরিবর্তনের প্রাথমিক সূচক হিসেবে Financial Times এবং Axel Springer-এর সাথে OpenAI-এর অংশীদারিত্বের কথা উল্লেখ করেছেন।
ওয়াং সাহসের সাথে ভবিষ্যদ্বাণী করেছেন যে ভবিষ্যতে AI নেতারা তাদের GPU গণনা নিয়ে গর্ব করবে না, বরং "কোন ডেটা তাদের কাছে অ্যাক্সেসযোগ্য এবং বিভিন্ন ডেটা সোর্স (data sources)-এ তাদের কী ধরনের অনন্য অধিকার রয়েছে" তা নিয়ে গর্ব করবে। অনন্য, মালিকানাধীন ডেটার উপর এই জোর বাজারকে স্বতন্ত্র করবে (market differentiation)। উপরন্তু, তিনি সফটওয়্যারে একটি উল্লেখযোগ্য পরিবর্তন অনুমান করেছেন, যা "ওয়ালড গার্ডেন" (walled garden) SaaS থেকে এন্টারপ্রাইজগুলির জন্য অত্যন্ত কাস্টমাইজড (customized), উদ্দেশ্য-নির্মিত অ্যাপ্লিকেশনগুলিতে সরে যাবে, যা Palantir-এর প্রাথমিক পদ্ধতির কথা মনে করিয়ে দেয়। AI দ্বারা সফটওয়্যার তৈরির খরচ নাটকীয়ভাবে কমানো দ্বারা এটি চালিত হবে, যা ব্যক্তিগতকৃত সফটওয়্যার সমাধানের একটি নতুন যুগের সূচনা করবে। ফলস্বরূপ, দীর্ঘস্থায়ী প্রতি-আসন (per-seat) মূল্যের মডেল সম্ভবত ব্যবহার-ভিত্তিক (consumption-based) মূল্যের দিকে ধাবিত হবে, যা মানব কর্মচারী এবং AI এজেন্ট উভয় দ্বারা সম্পাদিত কাজ প্রতিফলিত করে।
মূল অন্তর্দৃষ্টি:
- ফাউন্ডেশন মডেলের প্রতিযোগিতায় ডেটা (data) প্রাথমিক এবং সবচেয়ে টেকসই প্রতিযোগিতামূলক সুবিধা হিসেবে আবির্ভূত হচ্ছে।
- ভবিষ্যতের প্রতিযোগিতা মালিকানাধীন ডেটা অ্যাক্সেস (proprietary data access), মালিকানা এবং অনন্য ডেটাসেট (datasets) তৈরি করার ক্ষমতার উপর আবর্তিত হবে।
- সফটওয়্যার তৈরির সহজলভ্যতা এন্টারপ্রাইজগুলির জন্য কাস্টমাইজড (customized), বিশেষভাবে তৈরি অ্যাপ্লিকেশনগুলির দিকে নিয়ে যাবে, যা জেনেরিক (generic) SaaS-এর বাইরে যাবে।
- সফটওয়্যারের মূল্য নির্ধারণের মডেলগুলি প্রতি-আসন (per-seat) থেকে ব্যবহার-ভিত্তিক (consumption-based) এ বিকশিত হবে, যা মানুষ এবং AI এজেন্ট উভয় দ্বারা প্রদত্ত মূল্যের সাথে সামঞ্জস্যপূর্ণ হবে।
কোলাহল মোকাবেলা: সরাসরি চ্যানেল এবং বিশ্বাস
কোম্পানি গঠনের দিকে মনোযোগ ঘুরিয়ে, ওয়াং জনসংযোগ (public relations)-এ তার অপ্রচলিত পদ্ধতি শেয়ার করেছেন: "সেরা জনসংযোগ (PR) হলো কোন জনসংযোগ না থাকা।" তিনি যুক্তি দিয়েছেন যে ঐতিহ্যবাহী মিডিয়া (media), প্রায়শই ক্লিকের দ্বারা চালিত, আখ্যানগুলিকে চাঞ্চল্যকর করে তোলে এবং বিকৃত করে, এনগেজমেন্টের জন্য কোম্পানিগুলিকে গড়ে তোলে এবং ভেঙে দেয়। তিনি একটি আশ্চর্যজনক ব্যক্তিগত অভিজ্ঞতা প্রকাশ করেছেন: "বছরের পর বছর ধরে বিভিন্ন মিডিয়া আউটলেট (media outlets) থেকে পাওয়া আচরণের চেয়ে কংগ্রেসের সামনে সাক্ষ্য দেওয়ার সময় আমি আরও ন্যায্য আচরণ পেয়েছি।"
এই দৃষ্টিভঙ্গি Scale AI-কে সরাসরি চ্যানেলগুলিকে (যেমন পডকাস্ট এবং কোম্পানির ব্লগ) অগ্রাধিকার দিতে উৎসাহিত করেছে, যেখানে তারা তাদের বার্তাটি সত্যতা ও পরিবর্তন ছাড়াই প্রেরণ করতে পারে। তাদের আখ্যানের এই মালিকানা নিশ্চিত করে যে তাদের গল্পটি "বিশুদ্ধতম" এবং নির্ভেজাল, যা তাদের শ্রোতাদের সাথে বিশ্বাস এবং স্বচ্ছতা তৈরি করে।
মূল অনুশীলন:
- চাঞ্চল্য সৃষ্টি এবং আখ্যান বিকৃতি এড়াতে ঐতিহ্যবাহী মিডিয়ার (media) সাথে "কোন PR নয়" বা ন্যূনতম যোগাযোগের কৌশল গ্রহণ করুন।
- সত্যিকারের এবং অপরিবর্তিত বার্তার জন্য সরাসরি যোগাযোগের চ্যানেলগুলিকে (যেমন পডকাস্ট, কোম্পানির কনটেন্ট) অগ্রাধিকার দিন।
- প্রতিষ্ঠাতা এবং কোম্পানিগুলিকে ক্রমবর্ধমান কোলাহলপূর্ণ তথ্য জগতে সক্রিয়ভাবে তাদের আখ্যানের মালিকানা ও পরিচালনা করতে হবে।
"মৌলিকভাবে, এই AI প্রযুক্তির মানবজাতি যা দেখেছে তার মধ্যে অন্যতম সেরা সামরিক সম্পদ হওয়ার সম্ভাবনা রয়েছে, সম্ভবত পারমাণবিক অস্ত্রের চেয়েও বেশি সামরিক সম্পদ।" - Alexandr Wang


