எதிர்காலத்தில் மனித குலத்தை மிஞ்சி, மனிதர்களை அடிமைப்படுத்தும் அளவுக்கு ஏஐ ஆற்றல் பெறும் ஆபத்து இருக்கிறதா? இது தொடர்பான அச்சம் என்றேனும் நிஜமாகும் சாத்தியம் இருக்கிறதா? அறிவியல் புனைகதைக் களமும், ஹாலிவுட் திரைப்படங்களும், ஏஐ எழுச்சி தொடர்பான அதீத கற்பனைகளை கொண்டவையாக இருந்தாலும், நடைமுறையில் ஏஐ தாக்கம் தொடர்பான இரண்டுவிதமான கணிப்புகள் நிலவுகின்றன. ஒரு பிரிவினர் ஏஐ ஆபத்தை நிஜம் என நம்பும் நிலையில் உள்ளனர். இன்னொரு பிரிவினர் ஏஐ நுட்பத்தால் ஒரு போதும் மனித குலத்தை மிஞ்ச முடியாது என நம்புகின்றனர்.
ஏஐ மொழியில் சொல்வது என்றால், மனித அறிவை மிஞ்சும் சூப்பர் இன்டெலிஜன்ஸ் எனும் அதி அறிவை இயந்திரங்களால் ஒரு போதும் பெற முடியாது. அதி அறிவு மட்டும் அல்ல, அதற்கு முந்தைய நிலையான பொது செயற்கை நுண்ணறிவான ஜெனரல் இன்டெலிஜென்சும் கூட சாத்தியமில்ல என்றே வல்லுனர் உலகம் நம்புகிறது.
இதுவரை சாத்தியமாகி வருவது எல்லாம், வரம்புகள் கொண்ட குறுகிய செயற்கை நுண்ணறிவு எனும் நிலை மட்டுமே. இவற்றின் மத்தியில் சாட்ஜிபிடி போன்ற ஆக்கத்திறன் ஏஐ சேவைகள், ஏஐ நுட்பத்தின் எதிர்கால சாத்தியங்கள் குறித்து வியக்கவும், மிரளவும் வைக்கின்றன. சாட்ஜிபிடியால் கதை எழுத முடியும் என்றால், மனிதர்கள் போலவே ஏஐ நுட்பத்தால் படைக்கவும் முடியும் என்று தானே பொருளாகும்? எனில், எதிர்காலத்தில் ஏஐ மனிதர்களை விஞ்சும் நுட்பங்களை பெறலாம் தானே? இத்தகைய வாதங்களை ஒரு வகையில் ஏற்கவும் தோன்றலாம்.
ஆனால், ஏஐ யதார்த்தம் என்னவெனில், சாட்ஜிபிடி உள்ளிட்ட ஆச்சர்யப்பட வைக்கும் ஏஐ சேவைகளுக்கு கூட மனித வழிகாட்டுதல் தேவை என்பதுதான். மனிதர்களோடு மனிதர்கள் போலவே உரையாடும் திறன் கொண்டிருப்பதாக கொண்டாடப்படும் சாட்ஜிபிடிக்கு, மனிதர்களே பயிற்சி அளித்துக்கொண்டிருக்கின்றனர் என்பதை நாம் புரிந்துகொள்வது அவசியம்.
சாட்ஜிபிடி பின்னணியில் மனிதர்கள் இருப்பதாக சொல்வதை, ஏதோ மறைக்கப்பட்ட உண்மை போல புரிந்து கொள்ளக்கூடாது. (இது பற்றி ஓபன் ஏஐ போன்ற நிறுவனங்கள் அதிகம் வெளிப்படையாக பேசுவது இல்லை என்பது வேறு விஷயம்). மாறாக, சாட்ஜிபிடி உள்ளிட்ட சாட்பாட் சேவைகளின் பின்னணி பயிற்சியில் மனித வழிகாட்டுதல் என்பது முக்கிய அம்சமாக இருக்கிறது எனும் தகவலை உள்வாங்கிக் கொள்ள வேண்டும்.
ஏஐ சாட்பாட்கள் மனித உருவாக்கம் என்பது மட்டும் அல்ல, அவற்றுக்கு பயிற்சி அளித்ததும் மனிதர்கள் தான். இந்த பயிற்சி தொடர்ந்து கொண்டிருக்கிறது என்பதே விஷயம். ஏஐ மொழியில் இதை ’வளையத்திற்குள் மனிதர்கள் இருப்பு’ என்கின்றனர். ஆங்கிலத்தில் இது, ’ஹியூமன் இன் தி லூப்’ (Human-in-the-loop) என கொள்ளப்படுகிறது. மறு உறுதி கற்றலாகவும் (Reinforcement Learning) இது அமைகிறது. மனிதர்கள் பதிலே இதற்கு அடிப்படையாக அமைகிறது.
அதாவது, சொந்தமாக செயல்படுவதாக கருதப்படும் ஏஐ மென்பொருள்களுக்கு அடிக்கடி மனித வழிகாட்டுதல் தேவைப்படுகின்றன. அதிலும் குறிப்பாக, அடுத்து என்ன செய்வது எனத் தெரியாமல் ஏஐ நுட்பம் தடுமாறும் நிலையில், மனிதர்கள் அளிக்கும் பதில் அல்லது கருத்து குழப்பத்தை தீர்க்கிறது.
இந்த இடத்தில் ஏஐ நுட்பத்தின் முக்கிய உட்பிரிவுகளில் ஒன்றாக கருதப்படும் இயந்திர கற்றலை நினைவில் கொள்வது பொருத்தமாக இருக்கும். மனித வழிகாட்டுதல் இல்லாமல், இயந்திரங்கள் தாமாக கற்றுக்கொள்ளும் திறனாக இயந்திரக் கற்றலுக்கான விளக்கம் அமைந்தாலும், இதில் இருவிதமான கற்றல்கள் இருக்கின்றன. முதல் கற்றல் மனித தலையீடு இல்லாத மேற்பார்வையற்ற கற்றல்; இரண்டாவது மனித வழிகாட்டுதலுடன் கூடிய, மேற்பார்வையிலான கற்றல்.
தரவுகளை பெயரிடாமல் அளிப்பது மற்றும் பெயரிட்டு அளிப்பதாக என இரு வகை இயந்திர கற்றல்கள் அமைகின்றன. உதாரணத்திற்கு முதல் வகையின் கீழ், பூனை படங்களை பூனை என குறிப்பிடாமல் அளித்தாலும், படங்களின் தரவுகளுக்குள் இருக்கும் அமைப்பை கொண்டு அது பூனை என தெரிந்து கொள்ளும். இரண்டாவது வகையில், பூனை படங்களுக்கு எல்லாம் பூனை என பெயரிட்டு அடையாளம் காட்ட வேண்டும்.
இரண்டு முறையிலும், முதலில் தொடர்புடைய தரவுகளை எப்படி அணுகுவது என பயிற்சி அளிக்க வேண்டும். ஆக, மனித பயிற்சியில் இருந்தே ஏஐ கற்றுக்கொள்கிறது என்பதோடு, இனி எல்லாவற்றையும் தானாகவே கற்றுக்கொள்ளலாம் எனும் நிலையையும் ஏஐ பெற்றுவிடுவதில்லை. பூனைகள் எப்படி இருக்கும், விலங்குகள் எப்படி இருக்கும் என்றெல்லாம் தரவுகளால் பாடம் சொல்லியிருந்தாலும், பூனை எது? விலங்கு எது? என ஏஐ மயங்கி நிற்கும் தருணங்கள் அநேகம் உண்டு.
இத்தகைய தருணங்களில் மனித வழிகாட்டுதலால் ஏஐ தொடர்ந்து கற்றுக்கொண்டு தன்னைத்தானே மேம்படுத்திக்கொள்கிறது. இதற்கு உதாரணமாக, சாட்ஜிபிடி அளிக்கும் தகவலுக்கான பயனாளியின் மறுப்பை குறிப்பிடலாம்.
இந்த இடத்தில் இயந்திர கற்றல் பயிற்சியின் இன்னொரு அடிப்படை அம்சத்தையும் மனதில் கொள்ள வேண்டும். ஏஐ மென்பொருள்கள் அவற்றின் வியக்க வைக்கும் திறன்களை மீறி, அடிப்படையில் பரிசு அல்லது தண்டனை எனும் எளிய விதி அடிப்படையில் தயாராகின்றன. ஒரு நகர்வை மேற்கொள்ளும் போது குறிப்பிட்ட பலன் கிடைத்தால் அது பரிசாக கொள்ளப்பட்டு தொடர்ந்து மேற்கொள்ளப்பட வேண்டிய ஒன்றாக பதிவாகிறது. மாறாக, வேறு விதமான பலன் எனில் தண்டனையாக கொள்ளப்பட்டும்; அதுவே இனி தவிர்க்க வேண்டியதாக பதிவாகிறது.
ஆக, மிகவும் சிக்கலான செயல்முறையை சரி அல்லது தவறு என்பது சார்ந்த நகர்வாக எளிமையாக்கி அளிப்பதன் வாயிலாக ஏஐ மென்பொருள்களுக்கு பயிற்சி அளிக்கப்படுகிறது. இந்த பயிற்சி பயன்பாட்டு நிலையிலும் தொடர்கிறது என்பதே விஷயம். சாட்ஜிபிடியை பொருத்தவரை, பயனர்களுடனான உரையாடலில் அது தனது தவறுகளை திருத்தி மேம்படுத்திக்கொள்கிறது. அதனால் தான் சர்ச்சைக்குரிய கேள்விகள் கேட்கப்படும்போது அது பெரும்பாலும் தப்பித்துக்கொள்கிறது. அபிப்ராயாங்கள் கேட்கப்படும் போது, தான் ஒரு மொழிமாதிரி மட்டுமே; தனிப்பட்ட கருத்துகள் கிடையாது என பதில் அளிக்கிறது.
ஹிட்லரின் நாஸி கொள்கை தொடர்பாக தவறான பதில் அளித்து சர்ச்சையில் சிக்கிக் கொண்ட மைக்ரோசாப்டின் ’டே சாட்பாட்’டில்(Tay Chatbot) இருந்து கற்றுக்கொண்ட பாடமாகவும் இது அமைகிறது. இந்த அனுபவ பாடத்தால், பல இடங்களில் ஏஐ செயல்பாட்டில் மனித தலையீடு நேரடியாகவும் அமைகிறது.
இன்னொரு விதமாகவும் இதைப் புரிந்து கொள்ளலாம். சாட்பாட்களுக்கு பயிற்சி அளிக்க பயன்படுத்தப்படும் அடிப்படை தரவுகள் இணையத்தில் இருந்து உருவி எடுக்கப்பட்டவை என்பதால் அவற்றில் பிழைகளும், பொய்ச்செய்திகளும் மலிந்திருக்கும். எனவே, இவற்றில் அதிக நம்பகமான தரவுகளை அடையாளம் கண்டு செயல்பட அடுத்த கட்ட பயிற்சி அளிக்கப்படுகிறது. அதன் பிறகு ஏற்படும் சந்தேகங்களுக்கு தெளிவு பெற மனித வழிகாட்டுதல் பயன்படுகிறது.
இங்கு அளிக்கப்பட்ட விளக்கம் புரிதலுக்காக எளிதாக அமைந்தாலும், ஏஐ செயல்பாட்டில் மனித வழிகாட்டுதல் என்பது உண்மையில் மிகவும் சிக்கலானதாக இருக்கிறது. ஏஐ மென்பொருளுக்கு பயிற்சி அளித்த பிறகு, அதன் செயல்பாட்டிற்கான கோடிக்கணக்கான காரணிகளில் திருத்தம் செய்ய வைப்பது என்பது பொறியியல் நோக்கிலும், அல்கோரிதம் நோக்கிலும் மிகப்பெரிய சவாலாகும். ஏற்கனவே பதிவான எல்லா தரவுகளிலும் மாற்றம் செய்தாக வேண்டும் என்றால் யோசித்துப் பாருங்கள்!
ஆனால், ஏஐ தொடர்பான ஆய்வில் ஏற்பட்ட முன்னேற்றங்கள் காரணமாக, சாட்பாட் செயல்பாட்டில் கருத்தறிந்து செயல்படும் உத்தியை பின்பற்றுவது சாத்தியமாகி இருக்கிறது. துவக்கத்தில் ரோபோக்கள் போன்றவற்றுக்கு பயிற்சி அளிக்க பயன்படுத்தப்பட்ட இந்த மனித கருத்து அடிப்படையிலான கற்றல் உத்தி, இப்போது சாட்ஜிபிடி உள்ளிட்ட சாட்பாட்கள் செயல்பாட்டிலும் விரிவாக பயன்படுத்தப்படுகின்றன.
சாட்ஜிபிடி போன்ற சாட்பாட்களுக்கு அளிக்கப்படும் பயிற்சியின் பின்னணியில் இன்னும் எண்ணற்ற மனிதர்களும் இருக்கின்றனர். இவற்றோடு பரவலாக கவனிக்கப்படாத மனித உழைப்பு சுரண்டலும் நிகழ்ந்துகொண்டுதான் இருக்கிறது.
(சாட்ஜிபிடி சரிதம் தொடரும்)