செயற்கை நுண்ணறிவியல் என்று அழைக்கப்படும் நுண்ணறி நுட்பம் எப்போது இருந்து கேள்விப்பட ஆரம்பித்திர்கள்.. வரலாற்றை புரட்டி பார்த்தால். கிரேக்க செவ்விலக்கியங்களில் நாம் வாசிக்கும் ஹெபாஸ்தஸ் (Hephaestus) – கிரேக்க கடவுள் ஜீயஸுக்கும் ஹிராவுக்கும் பிறந்தவர். ஒலிம்பஸில் இவருக்கு என தனி அரண்மனை. மற்ற கடவுளருக்கு பல்வகை இரும்பு கருவிகளை செய்து கொடுத்தவர் ஹெப்பாஸ்தஸ். ஹோமர் எழுத்தில் படித்தால் ஹெப்பாஸ்தஸ் உருவாக்கிய மூன்று கால்களை கொண்ட தங்க சக்கரங்களை கொண்ட “ரோபாட்” அவருக்கு பல வேலைகளை செய்து கொடுத்தது என்று பார்க்கிறோம். நாம் செய்ய வேண்டிய பணிகளை ரோபோட் கையில் கொடுப்பது தானே இப்போது நடந்து கொண்டு இருக்கிறது …விமானம் உருவாகாத காலத்தில் புஷ்பக விமானத்தை நமது காப்பியங்களில் வடித்தது போல..
1950களில் Computing Machinery and Intelligence என்று ஆலன் டூரிங் எழுதிய அறிவியல் ஆய்வு கட்டுரை தான் இன்றைய நவீன செயற்கை நுண்ணறிவியல் துறைக்கு முன்னோடி. இணையத்தில் கிடைத்தால் இந்த கட்டுரையை தேடி படித்து பாருங்கள். நானும் இந்த கட்டுரையின் தரவாக அதனை கொடுத்துவிடுகிறேன். இந்த அறிவியல் கட்டுரையை மையமாக வைத்து நுண்ணறிவியல் துறையில் பல ஆராய்ச்சிகள் கடந்த 70 ஆண்டுகளாக நடந்துகொண்டு தான் இருக்கிறது.
கூகிள், பேஸ்புக், மைக்ரோசாப்ட் போன்ற நிறுவனங்கள் பல செயற்கை நுண்ணறிவியல் (நுண்ணறி) கருவிகள் பல ஆண்டுகளாக பயன்படுத்தி கொண்டு தான் இருக்கின்றன என்றாலும், இந்த நுண்ணறி துறையை ChatGPT க்கு முன், அல்லது ChatGPT க்கு பின் என இரண்டு வகையாக பிரித்து விடலாம்.
அதே நேரம் ChatGPT இந்த துறையின் தாக்கத்தை விரிவுபடுத்தி, மக்கள் மயப்படுத்தியது என்பதை தாண்டி, இந்த துறை அதன் இலக்கை அடைந்தே இருக்கும் என்பது என் கருத்து.
அந்த வகையில் இன்றைக்கு விரிவாக எழுத இருப்பது https://huggingface.co என்ற செயற்கை நுண்ணறிவியலுக்கான தளம் பற்றி. இன்றைக்கு செயற்கை நுண்ணறிவியலில் ஆராய்ச்சி செய்துகொண்டு இருக்கும் அனைவரும் சுற்றிக்கொண்டு இருப்பது இங்கே தான். ஆயிரக்கணக்கான வல்லுநர்கள் சுற்றி சுற்றி வருவதால் இதை செயற்கை நுண்ணறிவியல் சமூக ஊடகம் என்று கூட அழைக்கலாம் என்று நினைக்கிறேன்
இதில் பல ஆயிரம் செயற்கை நுண்ணறிவியல் (நுண்ணறி) மாடல்கள் இருக்கிறது (இனிமேல் செயற்கை நுண்ணறிவியல் என்று நீட்டி முழக்காமல் நுண்ணறி என்று எழுதலாம் என்று இருக்கிறேன்).
Artificial intelligence (AI) model என்பது ஒரு நிரல் தொகுப்பு – புரோகிராம் – that analyzes datasets (தரவு தொகுப்புகள்) to find patterns (மீண்டும் மீண்டும் வரக்கூடிய வடிவங்கள்) and make predictions (கணிப்புகள் – இது இப்படி வரும் அப்படி வரும் என்று கணிப்பது).
இந்த இணையத்தில் தரவேற்றம் செய்யப்பட்ட நுண்ணறி மாடல்களின் எண்ணிக்கை 30 ஆயிரத்துக்கும் அதிகம். இந்த முப்பது ஆயிரத்தில் ஒன்று தான் ChatGPT 3.5 பயன்படுத்தும் gpt3.5-turbo. இப்போது புரிகிறதா..
இந்த நுண்ணறி நிரல் தொகுப்புகளை (AI மாடல்கள்) சிறப்பாக பணியாற்ற வைக்க வேண்டும் என்றால் அதற்கு தேவை தரவு தொகுப்புகள் (datasets). உதாரணமாக உணவை பற்றிய ஒரு நுண்ணறி மென்பொருள் தயாரிக்க வேண்டும், அந்த மென்பொருள் உலகில் இருக்கும் அத்தனை உணவு வகைகளையும் ஆராய்ந்து, தைராயிடு அல்லது டயபடிஸ் (நீரழிவு) குறைபாட்டுக்கான உணவை பரிந்துரை செய்ய வேண்டும் என்றால், நமக்கு உலகின் மக்கள் எந்த நாட்டில் எந்த உணவு உண்கிறார்கள், அந்த உணவின் கலோரி கணக்கு என்ன என்ற தகவல் தரவுகள் (datasets) தேவை.
இந்த huggingface இடைமுகத்தில் 5000 த்துக்கும் அதிகமான தரவு கிடங்குகள் இருக்கிறது. மருத்துவ துறை சார்ந்து தரவு சேமிப்புகள் கிடைப்பது மிகவும் அரிது, அதற்கு காரணம் அவை பாதுகாக்கப்பட்ட தரவுகள், தனி மனிதர்களின் தரவுகள். அதனை அறிவியல் பயன்பாட்டுக்கு பெறுவது மிகவும் நேரம் பிடிக்கும். அதனால் தான் 6 ஆண்டுகளுக்கு முன்னால் நான் தயாரிக்க முயன்ற நுண்ணறி மென்பொருளை முடிக்க முடியாமல் போனது. ஆமாம் 6 ஆண்டுகளுக்கு முன்பே செயற்கை நுண்ணறிவியல் துறையில் பலர் பணியாற்றினோம். சொல்ல போனால் செயற்கை நுண்ணறிவியல் இன்று நேற்று வந்த துறை அல்ல. இது பற்றி தனியாக விரிவாக எழுதலாம். மற்றபடி இந்த கட்டுரையில் நான் சொல்ல வந்த விடயம், இந்த HuggingFace தளத்தை பயன்படுத்துதல் மூலம் (5000- திற்கும் மேல் இருக்கும் தரவுகள் மூலம்) பல வகையான மென்பொருட்களை உருவாக்கலாம்.
இது நாள் வரை வந்துள்ள நுண்ணறி மென்பொருட்களில் ChatGPT தவிர வேறு என்ன கேள்விப்பட்டு இருக்கிறீர்கள் ஒரு லிஸ்ட் போட முடியுமா ? இங்கே 2000 த்துக்கும் அதிகமான மென்பொருட்களை பயன்படுத்தி பார்க்கலாம். பேஸ்புக் கூட அவர்களுடைய Text to Music (எழுத்தை இசையாக மாற்றும் நுண்ணறி மென்பொருள்) இங்கே இறக்கி இருக்கிறார்கள், பயன்படுத்தி பார்க்கலாம்.
இதில் முக்கியமான விடயம், இந்த மென்பொருள் என்ன வகையான வன்பொருளில் இயங்குகிறது என்பதையும் நாம் வெளிப்படையாக பார்க்க இயலும். உதாரணமாக NVIDIA V100 TENSOR CORE GPU என்ற வன்பொருளை குறிப்பிட்ட மென்பொருள் பயன்படுத்தி விடயங்களை தருகிறது என்றால் அதனை வெளிப்படையாக பார்க்க இயலும். அதன் மூலம் பல மேலதிக தகவல்களை ஒரு வல்லுனராக யூகித்துக்கொள்ள முடியும்.
ஏற்கனவே இந்த வன்பொருட்களை பற்றி சொல்லி இருக்கிறேன். ஒரு வன்பொருள் 40000 அமெரிக்க டாலர் வரை – சுமார் 35 லட்சம் வரை – ஆகிறது, இதில் ஒரு ஜி.பி.யு இல் 32 சி.பி.யு க்களை பயன்படுத்தும் அளவுக்கு சூப்பர் பவர் இருக்கிறது. இந்தியாவில் வெகு சில இன்று இருக்கலாம், மற்றவை எல்லாம் அமெரிக்காவிலும், ஐரோப்பாவிலும், சீனாவிலும் இருக்கிறது. இந்த தொழில் நுட்பத்தையும் வரும் காலத்தில் எப்.16, ரபேல், சுகோய் போன்ற அதி நவீன விமானம், அணு / ராக்கெட் தொழில் நுட்பம் ஆகியவற்றை போல மேற்குலகு கட்டுப்படுத்த வாய்ப்பு இருக்கிறது.
இப்போதைக்கு நீங்கள் இந்த இரண்டாயிரத்துக்கும் மேற்பட்ட நுண்ணறி மென்பொருட்களை பயன்படுத்த இங்கே செல்லலாம்.
இதில் மென்பொருள் வல்லுனர்களின் பணியை குறைக்க நாம் பொதுவாக பயன்படுத்தும் மென்பொருள் லைப்ரரிகள் (முன் கட்டமைக்கப்பட்ட நிரல்கள்) இருக்கிறது, அதையும் பயன்படுத்தி பணிகளை இலகுவாக்கலாம்.
huggingface இணைய தளம் பற்றி அறிமுகம் கொடுக்க போய் செயற்கை நுண்ணறிவியலை நுண்ணறி என்று சுருக்கி, மேலும் சில விடயங்களையும் எழுதி இருக்கிறேன். இதை எல்லாம் நான் எழுதுவதால் நான் பெரிய வல்லுநர் அல்ல, நானும் தினமும் கற்றுக்கொண்டு தான் இருக்கிறேன்.
செந்தழல் ரவி