சாட்ஜிபிடி சரிதம் -25; அர்த்தமற்ற மொழியில் பேசும் மென்பொருள் கிளி!


சாட்பாட் - மென்பொருள் கிளி

சாட்ஜிபிடி உள்ளிட்ட ஏஐ சாட்பாட்களின் ஆக்கத்திறன் குறித்து மிகுந்த உற்சாகமும், எதிர்பார்ப்பும் கொண்டிருப்பவர்கள் எமிலி பெண்டர் (Emily Bender) உடன் அறிமுகமாவது அவசியம். மொழியியல் பேராசிரியரான பெண்டர், சாட்ஜிபிடியின் ஆற்றல் மீது கடுமையான விமர்சனங்களை முன்வைப்பவர். பெரும்பாலனோர் சாட்ஜிபிடி போன்ற சாட்பாட்களின் ஆக்கத்திறனில் அதிசயித்து போயிருக்கும் நிலையில், இந்த ஏஐ மென்பொருள்கள் உண்மையில் அர்த்தமில்லா ஆக்கங்களை உருவாக்கும் தன்மை கொண்டவை என வலியுறுத்தி வருகிறார்.

சாட்பாட்

சாட்ஜிபிடி தொடர்பாக பெண்டர் முன்வைக்கும் வாதங்களை பார்ப்பதற்கு முன், டேனியலா அமோடி (Daniela Amodei) சொல்லும் கருத்தையும் அறிந்து கொள்வது அவசியம். ”ஏதேனும் ஒருவிதமான மாயத்தன்மையை கொண்டிராத மொழி மாதிரி இருப்பதாக நினைக்கவில்லை” என்கிறார் அமோடி.

நாம் ஏற்கனவே பார்த்த, சாட்ஜிபிடி போன்ற ஏஐ சாட்பாட்களின் இல்லாததை இருப்பதாக கூறும் மாயத்தோற்றம் (Hallucination) விவாதத்தின் போது அவர் இவ்வாறு கூறியிருக்கிறார். சாட்ஜிபிடிக்கு போட்டியாக கருதப்படும் கிளாட் 2 (Claude 2) சாட்பாட்டை உருவாக்கிய ஆந்த்ரோபிக் நிறுவனத்தின் தலைவர் இவர் என்பது குறிப்பிடத்தக்கது.

ஏஐ சாட்பாட்கள், அடுத்த வார்த்தையை யூகிக்கும் திறன் கொண்டவையாக உருவாக்கப்பட்டதால், இதை மொழி மாதிரிகள் பிழையாக செய்யும் ஏதேனும் தருணங்கள் இருக்கவே செய்யும் என்றும் அவர் கூறியிருக்கிறார்.

இந்த குறைகளை சரி செய்து, ஏஐ சாட்பாட்களை இயக்கும் மொழி மாதிரி நுட்பத்தை மேலும் உண்மை சார்ந்ததாக உருவாக்கும் முயற்சியில் தொடர்ந்து ஏஐ நிறுவனங்கள் ஈடுபட்டிருக்கின்றன.

ஆனால் இது நடக்காத கதை என்கிறார் எமிலி பெண்டர்.

ஏஐ சாட்பாட் தொழில்நுட்பம் மற்றும் அதன் பயன்பாடு தொடர்பான உள்ளார்ந்த பொருத்தமின்மையால் உண்டாகும் பிழை இது என்கிறார். மொழி மாதிரிகளை மேம்படுத்துவது எந்த விதத்திலும் இவற்றின் அடிப்படை பிழையை சரி செய்யாது என பெண்டர் நம்புகிறார்.

மொழி மாதிரிகள் என்பவை, பயிற்சி அளிக்கப்பட்ட வார்த்தை தரவுகள் கொண்டு வார்த்தைகளின் வெவ்வேறு தொகுப்பின் சாத்தியக்கூற்றை கணிப்பவை என்று விளக்கம் தருபவர் இலக்கு மொழியின் தன்மைக்கேற்ப, வழக்கமான எழுத்து வடிவம் போல, தங்கள் ஆக்கத்தை சாட்பாட்கள் தோன்றச்செய்கின்றன என்கிறார். வார்த்தைகளை கணித்து அவற்றை இட்டு நிரப்பும் ’ஆட்டோ கம்ப்ளீட்’ உத்தி போன்றது தான் இது.

ஏஐ மொழி மாதிரி

எழுத்து வடிவத்தை உருவாக்கும் போது, மொழி மாதிரிகள் (Language Models ) இல்லாததை உருவாக்கும் தன்மை கொண்டிருக்கின்றன. இவற்றின் திறன் அவ்வளவு தான் என்கிறார். உண்மையில், இவை அர்த்தமற்ற சொற்றொடர்களை தான் உருவாக்குகின்றன, பயனாளிகள் தான் அவற்றுக்கு பொருள் காண்கின்றனர் என்றும் பெண்டர் சொல்வதை புரிந்து கொள்ளலாம்.

அதாவது, சாட்ஜிபிடி எதையும் புரிந்து கொள்ளாமல் அதற்கு பயிற்சி அளிக்கப்பட்ட முறையில் எதையோ உருவாக்கி அளிக்கிறது. மனிதர்கள் தங்களுக்கு பழக்கப்பட்ட எழுத்து வடிவிற்கு பொருந்தும் தருணங்களில் பயனாளிகள் அதன் பொருளை புரிந்து கொள்கின்றனர். தவறும் நேரங்களில் பிழை பெரிதாக தெரிகிறது.

ஏஐ சாட்பாட்களின் இந்த பொருள் கொள்ள முடியா தன்மையை சுட்டிக்காட்டும் வகையில் அவற்றை, ஸ்டாகஸ்டிக் பேரட் (Stochastic Parrot) என எமிலி பெண்டர் குறிப்பிடுகிறார். அதாவது வாய்ப்பியல் கிளி என்கிறார்.

வாய்ப்பியல் கிளி

பேசும் கிளி எனும் வர்ணனையை பயன்படுத்துகிறோம் அல்லவா, அது போல, ஏஐ சாட்பாட்களை, குறிப்பாக அவற்றின் பின்னணியில் உள்ள மொழி மாதிரியை வாய்ப்பியல் கிளி என்கிறார். சொன்னதை சொல்கிறதே தவிர கிளிக்கு மொழி தான் தெரியமா அல்லது அதன் பொருள் தான் தெரியுமா? அதே போல, மொழி மாதிரி நுட்பம் வார்த்தைகள் தரக்கூடிய பொருள் தொடர்பான எந்த புரிதலும் இயந்திரதனமாக, அவை தோன்றக்கூடிய வரிசை சாத்தியங்களை புள்ளியியல், நிகழ்தகவு அடிப்படையில் கணித்துச் சொல்கின்றன.

இதை சாத்தியமாக்க, மனித மொழி பயன்பாடு சார்ந்து கோடிக்கணக்கான எழுத்து வடிவம், அவற்றுக்கு இடையிலான பொதுத்தன்மையை குறிக்கும் கோடானுகோடி காரணிகள் கொண்டு பயிற்சி அளிக்கப்பட்டுள்ளதால், அவை ஆக்கத்திறன் பெற்றிருப்பது போல தோற்றம் ஏற்படுகிறது.

நாம் ஏற்கனவே பார்த்த உதாரணம் போல, மதில் மேல் என எழுதி அடுத்த வார்த்தைக்கு இடம் விட்டால், பூனை என யூகிக்கலாம். அதே போலவே, எழுத்து வடிவங்களில் பொதுவாக காணக்கூடிய வார்த்தை வரிசை சாத்தியங்களை கணக்கிட்டு மொழி மாதிரிகள் செயல்படுகின்றன.

இதை விளக்க பெண்டர் சுவாரஸ்யமான கதை ஒன்றை சொல்கிறார்.

ஏ மற்றும் பி எனும் பெயர் கொண்ட ஆங்கிலம் பேசும் இருவர் தனித்தனி தீவுகளில் சிக்கி கொள்கின்றனர். அதற்கு முன் அங்கிருந்தவர்கள் தந்தி தொடர்பை மேற்கொண்டு வந்ததை தற்செயலாக கவனித்து, அதன் வாயிலாக தாங்களும் பேசிக்கொள்ளத் துவங்குகின்றனர்.

இதனிடையே இரண்டு தீவுகள் பற்றிய எந்த அறிவும் இல்லாத ஓ எனும் ஆக்டோபஸ், கடலில் செல்லும் கம்பிகள் வாயிலாக இந்த செய்திகளை இடைமறித்து கவனிக்கத்துவங்குகிறது. உரையாடல் போக்கை நன்கு கவனிக்கும் ஆக்டோபஸ், பி பேசும் விதத்தில் தேர்ச்சி பெற்று ஒரு கட்டத்தில் அவரைப்போல தான் பேசத்துவங்குகிறது. மறுமுனையில் இருக்கும் ஏ உரையாடலில் எந்த வித்தியாசத்தையும் உணராமல் இருக்கிறார். ஏனெனில் பி எப்படி பதில் அளிப்பாரோ அதே போலவே ஆக்டோபஸ் பேசுகிறது.

சாட்ஜிபிடி மொழி மாதிரி

இந்நிலையில் ஒரு நாள், ஏ விலங்கு ஒன்றின் தாக்குதலுக்கு உள்ளாகும் சூழலில் அதிலிருந்து தப்பிக்கும் வழி கேட்கிறார். இது வழக்கமான உரையாடலில் இருந்து விலகிய கோரிக்கை என்பதால் ஆக்டோபஸ் பதில் சொல்ல முடியாமல் திகைக்கிறது. ஏனெனில் அதற்கு இந்த கேள்வியும் புரியவில்லை, பதிலும் தெரியவில்லை.

இப்படி தான் மொழி மாதிரிகள் சார்ந்த சாட்பாட்களும் செயல்படுகின்றன என்கிறார் பெண்டர். இந்த தன்மையை குறிக்கவே அவற்றை வாய்ப்பியல் கிளி என்கிறார். தயவு செய்து வார்த்தைகளை பொருளில் இருந்து பிரிக்காதீர்கள் என்கிறார் அவர். சாட்பாட்கள் உண்மையில் எதையும் புரிந்து கொள்ளாமல், கற்பனை இல்லாமல், அறிவு இல்லாமல், யூகத்தின் அடிப்படையில் ஆக்கத்தை அளிக்கின்றன. இதை எப்படி பொருள் காண முடியும் என கேட்கிறார்.

மனிதர்கள் கதை எழுதுவதாக கொண்டாடுகிறோம், பொய் சொல்லும் போது கதைவிடுவதாக கேலி செய்கிறோம். கற்பனை என்கிறோம். உள்ளுணர்வு என்கிறோம். ஆனால் சாட்பாட்களோ எந்த உணர்வும் இல்லாமல் வெறும் யூகத்தின் அடிப்படையில், அதிவேகமாக அடுத்த வார்த்தையை கணித்து ஆக்கத்தை முன்வைக்கிறது. மொழியியல் நோக்கில் இது அபத்தமானது என்பது பெண்டரின் வாதம்.

மனித மனம் மொழியின் நுட்பங்களை உள்வாங்கி கொள்ளும் தன்மையை புள்ளியியல் கணக்காக சுருக்கிவிட முடியாது என்கிறார். அர்த்தமில்லா ஆக்கத்தை உருவாக்கும் ஒரு இயந்திர அமைப்பை நாம் கொண்டாடி கொண்டிருக்கிறோம் என்றும் அவர் கடுமையாக விமர்சிக்கிறார். பெண்டர் இந்த கருத்துக்களை விரிவாக விவரித்து 2020-ம் ஆண்டு ஒரு ஆய்வுக் கட்டுரையை எழுதியிருக்கிறார். இந்த கட்டுரையின் இணை ஆசிரியர் ஒருவர் இதன் காரணமாக அவர் பணியாற்றிக் கொண்டிருந்த கூகுள் நிறுவனத்தில் இருந்து நீக்கப்பட்டிருக்கிறார்.

மொழி மாதிரிகளின் புத்திசாலித்தனம் செயற்கைத்தனமானது மட்டும் அல்ல அர்த்தம் இல்லாத அபத்தம் என்கிறார் பெண்டர். அதோடு, இவை பயிற்சி அளிக்கப்பட்டிருக்கும் தரவுகளில் பிழைகளும், தவறுகளும் இருக்கின்றன. மனிதர்களிடம் காணப்படும் உள்ளார்ந்த சார்புகளையும் இவை கொண்டிருக்கின்றன. இவற்றின் அர்த்தமில்லா ஆக்கங்களில் இந்த பிழைகளும், சார்புகளும் வெளிப்படும் வாய்ப்பு தான் உண்மையான ஆபத்து என்கிறார். உண்மையில் அர்த்தமில்லாமல் பேசும் மென்பொருள் கிளிகளுக்குள் மறைந்திருக்கும் இந்த சார்பு தன்மை தான் மனிதகுலத்திற்கு பெரும் பிரச்சனை என்றும் எச்சரிக்கிறார்.

(சாட்ஜிபிடி சரிதம் தொடரும்)

x