Indic LLMகளில் குறிப்பிடத்தக்க முன்னேற்றம் கண்ட நிறுவனங்கள் - டெக் மஹிந்திரா, Gnani.ai, சர்வம்

HT Tamil HT Tamil Sep 16, 2024 01:32 PM IST

எங்களை பின் தொடரலாம்

HT Tamil HT Tamil

Sep 16, 2024 01:32 PM IST

பெரிய மொழி மாதிரிகள் (LLMகள்) நடைபெறும் AI புரட்சியின் மையத்தில் உள்ளன. இருப்பினும், மேற்கிலிருந்து வரும் பெரும்பாலான பெரிய மொழி மாதிரிகள் இந்திய மொழிகளுக்கு வரையறுக்கப்பட்ட ஆதரவை வழங்குகின்றன.

AI நிறுவனங்கள் இப்போது பிராந்திய LLMகள் மற்றும் இந்திய மொழிகளில் கவனம் செலுத்துகின்றன. (REUTERS)

எங்களை பின் தொடரலாம்

நாம் அதிகாரப்பூர்வமாக செயற்கை நுண்ணறிவு அல்லது AI சகாப்தத்தில் இருக்கிறோம். AI நம் வாழ்வில் பெரிய அளவில் நுழைய உள்ளது மற்றும் Open AI இலிருந்து ChatGPT ஆனது AI பிரதான நீரோட்டத்திற்கு செல்வதற்கான பிரதான எடுத்துக்காட்டுகளில் ஒன்றாகும். பெரிய மொழி மாதிரிகள் (LLMகள்) நடைபெறும் AI புரட்சியின் மையத்தில் உள்ளன. இருப்பினும், மேற்கிலிருந்து வரும் பெரும்பாலான பெரிய மொழி மாதிரிகள் இந்திய மொழிகளுக்கு வரையறுக்கப்பட்ட ஆதரவை வழங்குகின்றன. ஆனால் இப்போது பிராந்திய எல்.எல்.எம் மற்றும் இந்திய மொழிகளில் கவனம் செலுத்தும் குறிப்பிடத்தக்க வளர்ச்சியுடன் இது மாறப்போகிறது.

இந்திய

அரசின் செயற்கை நுண்ணறிவு அடிப்படையிலான மொழி மொழிபெயர்ப்பு முயற்சியான பாஷினி பாஷினி, இந்தியா முழுவதும் மொழி தடைகளை உடைப்பதை நோக்கமாகக் கொண்டுள்ளது. இது 22 மொழிகள், 300 க்கும் மேற்பட்ட AI மாடல்களை ஆதரிக்கிறது மற்றும் 500K+ மொபைல் ஆப் பதிவிறக்கங்களைப் பெற்றுள்ளது. AI4Bharat, IIT மெட்ராஸில் உள்ள ஆராய்ச்சி ஆய்வகம், திறந்த மூல தரவுத்தொகுப்புகள், கருவிகள், மாதிரிகள் மற்றும் பயன்பாடுகளை உருவாக்குவதன் மூலம் இந்திய மொழி தொழில்நுட்பத்தை மேம்படுத்துவதற்காக அர்ப்பணிக்கப்பட்டுள்ளது. இந்த துறையில் அவர்களின் முன்னோடி பணி முன்னணி சர்வதேச மாநாடுகளில் அங்கீகரிக்கப்பட்டுள்ளது. அவர்களின் முக்கிய பங்களிப்புகளில் IndicCorp, BPCC, Shrutilipi, Kathbath, IndicBERT, IndicTrans, IndicXlit, IndicWav2Vec, IndicWav2Vec, Indic Whisper மற்றும் TTS போன்ற திட்டங்கள் அடங்கும்.

இதையும் படியுங்கள்: OpenAI இன் o1 'ஸ்ட்ராபெரி' AI மனிதர்களைப் போலவே சிந்திக்க முடியும் - ஆனால் அது ஏன் ஒரு பழத்தின் பெயரிடப்பட்டது?

விவேக் ராகவன் மற்றும் பிரதியுஷ் குமார் ஆகியோரால் நிறுவப்பட்ட மற்றும் லைட்ஸ்பீட், பீக் எக்ஸ்வி பார்ட்னர்ஸ் மற்றும் கோஸ்லா வென்ச்சர்ஸ் ஆகியோரால் ஆதரிக்கப்பட்ட ஜெனரேட்டிவ் AI இடத்தில் ஒரு தொடக்க நிறுவனமான சர்வம் AI, இந்திய மொழிகளில் கவனம் செலுத்தும் ஜெனரேட்டிவ் AI மாதிரிகளை உருவாக்கி வருகிறது. சர்வம் ஏஐ இந்தியாவில் ஜெனரேட்டிவ் ஏஐ பயன்பாடுகளின் துல்லியத்தை குறைந்த செலவில் மேம்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது. சமீபத்தில், சர்வம் AI 2 பில்லியன் அளவுரு மாதிரியை அறிமுகப்படுத்தியது, அதை அவர்கள் திறந்த மூலமாக்கி ஹக்கிங் ஃபேஸில் கிடைக்கச் செய்துள்ளனர். மெட்டாவின் Llama 3.1, Google இன் Gemma 2 மற்றும் GPT-4o ஆகியவற்றுடன் ஒப்பிடும்போது அதன் மாதிரி இந்திய மொழிகளுக்கு கணிசமாக மிகவும் திறமையானது என்று Sarvam AI கூறுகிறது.

டெக் மஹிந்திரா

டெக் மஹிந்திரா சமீபத்தில் புராஜெக்ட் இண்டஸை புதிதாக மிகப்பெரிய இந்திய எல்.எல்.எம் ஐ உருவாக்குவதை மையமாகக் கொண்டு அறிவித்தது. டெக் மஹிந்திராவின் அடுத்த தலைமுறை சேவைகளின் தலைவர் குணால் புரோஹித் கூறுகையில், "இந்தியா பாரம்பரியமாக ஒரு தேசமாக தொழில்நுட்பத்தின் நுகர்வோராக இருந்து வருகிறது; இருப்பினும், தொழில்நுட்பத்தின் உற்பத்தியாளராக மாறுவதற்கு நாங்கள் இப்போது செயலூக்கமான நடவடிக்கைகளை எடுத்து வருகிறோம். இந்த மாற்றம் நேர்மறையான வேகத்தை உருவாக்கியுள்ளது, மேலும் புராஜெக்ட் இண்டஸ் மற்றும் இண்டிக் எல்எல்எம் மூலம் நாங்கள் கணிசமான முன்னேற்றங்களை அடைந்துள்ளோம். ஆரம்பத்தில் இருந்தே, புதிதாக ஒரு அடித்தள மாதிரியை உருவாக்குவதே எங்கள் நோக்கம். ப்ராஜெக்ட் இண்டஸ் மூலம், ஒரு திறந்த மூல அடித்தள மாதிரியை உருவாக்குவதன் மூலம் எங்கள் ஆரம்ப மைல்கல்லை அடைந்தோம். இந்தியா முழுவதும் பேசப்படும் பல்வேறு பேச்சு வழக்குகளை வழங்குவதே எங்கள் நோக்கம். இந்தி மற்றும் அதன் 37 க்கும் மேற்பட்ட கிளைமொழிகளில் பயிற்சி பெற்ற 1.2 பில்லியன் அளவுரு மாதிரியான இண்டஸை நாங்கள் வெற்றிகரமாக அறிமுகப்படுத்தியுள்ளோம், பயனர்கள் தங்கள் சொந்த பேச்சுவழக்குகளில் கேள்விகளை எழுப்பவும், துல்லியமான பதில்களைப் பெறவும் அனுமதிக்கிறது. இந்த மாதிரி இந்த பேச்சுவழக்குகளில் பிராண்டுகள் மற்றும் தனிநபர்களிடையே தடையற்ற ஈடுபாட்டை உறுதி செய்கிறது ".

இதையும் படியுங்கள்: கூகிள் இப்போது உங்கள் குறிப்புகளை போட்காஸ்டாக மாற்ற உதவும், புதிய AI-ஆதரவு ஆடியோ ஓவர்வியூ

அம்சம் Gnani.ai

ஒரு சுவாரஸ்யமான அணுகுமுறையை எடுக்கும் மற்றொரு நிறுவனம் Gnani.ai ஆகும், இது தொழில்துறை குறிப்பிட்ட பயன்பாட்டு நிகழ்வுகளுக்கு SLMகள் அல்லது சிறிய மொழி மாதிரிகளை உருவாக்கி வருகிறது. நிறுவனம் AI இல் பிரதானமாக மாறுவதற்கு நீண்ட காலத்திற்கு முன்பே முதலீடு செய்து வருகிறது. இது பல கண்டுபிடிப்புகளுக்கு காப்புரிமை பெற்றுள்ளது மற்றும் சாம்சங் வென்ச்சர்ஸ் மற்றும் இன்ஃபோஎட்ஜ் வென்ச்சர்ஸ் ஆகியவற்றை முதலீட்டாளர்களாக கருதுகிறது, ஏனெனில் இது பல இந்திய மொழிகளில் நிபுணத்துவம் பெற்றுள்ளது. Gnani.ai நிறுவனத்தின் இணை நிறுவனரும் தலைமை நிர்வாக அதிகாரியுமான கணேஷ் கோபாலன், இந்தியாவில் ஆரம்பக் கல்வி, மகப்பேறு சுகாதாரம் மற்றும் பல அடிப்படை பிரச்சினைகளை செயற்கை நுண்ணறிவு தீர்க்க முடியும் என்று நம்புகிறார். AI இன் சக்தியைப் பயன்படுத்தும்போது நாம் மேற்பரப்பைக் கீறவில்லை என்று அவர் நம்புகிறார். அவர் மேலும் கூறுகிறார், இந்தியாவில் நீங்கள் கேட்கும் சத்தங்கள் உலகில் எங்கும் இருந்து மிகவும் வித்தியாசமானவை, அது ஆட்டோ ரிக்ஷா அல்லது ரயிலில் பேசுபவர்களாக இருந்தாலும் சரி.

பெங்களூரு

ஐஐஎஸ்சி, ஆர்ட்பார்க் மற்றும் கூகுள் ஆகியவற்றின் கூட்டு முயற்சியான ப்ராஜெக்ட் வாணி, இந்தியா முழுவதும் 80 மாவட்டங்களில் இருந்து சேகரிக்கப்பட்ட 59 மொழிகளில் 14,000 மணிநேரத்திற்கும் அதிகமான பேச்சு தரவை டெவலப்பர்களுக்கு வழங்குவதை நோக்கமாகக் கொண்டுள்ளது. மோர்னி என்ற புதிய திட்டத்தில் முதலீடு செய்வதன் மூலமும், 125 இந்திய மொழிகளை ஆதரிக்க AI மாதிரிகளை உருவாக்குவதன் மூலமும் கூகிள் இந்த முயற்சியை மேலும் எடுத்துச் செல்கிறது.

AI மாடல்களின் உள்ளூர் மேம்பாடு மற்றும் பயிற்சி சாத்தியமானது என்றாலும், NVIDIA GPUகளை இன்னும் நம்பியிருப்பது மற்றும் திறன் வாய்ந்த வன்பொருளின் பற்றாக்குறை உள்ளது. சமீபத்தில், தெலுங்கானா அரசு யோட்டா டேட்டா சர்வீசஸுடன் கூட்டு சேர்ந்து, 25,000 உயர் செயல்திறன் கொண்ட ஜி.பீ.யுக்களைக் கொண்ட இந்தியாவின் மிகப்பெரிய ஏஐ சூப்பர் கம்ப்யூட்டரை அறிமுகப்படுத்தியுள்ளது. AI கிளவுட் டேட்டா சென்டர் வளாகத்தில் உயர் செயல்திறன் கொண்ட கம்ப்யூட்டிங் வளங்களுக்கான அணுகலை வழங்கும் பிரத்யேக GPU கிளவுட் உள்கட்டமைப்பு இடம்பெறும், இது தோராயமாக 4,000 NVIDIA H100/H200 GPUகளால் இயக்கப்படுகிறது, எதிர்காலத்தில் 25,000 க்கும் மேற்பட்ட GPUகளை அளவிடும் திறன் கொண்டது. இந்த ஜி.பீ.யுக்கள் அதிவேக நெட்வொர்க்கிங் மூலம் ஒன்றோடொன்று இணைக்கப்படும். இந்த உள்கட்டமைப்பு ஸ்டார்ட்அப்கள், கல்வி நிறுவனங்கள், ஆராய்ச்சி ஆய்வகங்கள், வணிகங்கள் மற்றும் அரசு நிறுவனங்களுக்கு கிடைக்கும்.

இதையும் படியுங்கள்: தனிப்பயனாக்கப்பட்ட பயனர் தொடர்புகளை மேம்படுத்த பல குரல் விருப்பங்களுடன் மெட்டா AI ஐ அதிகரிக்க WhatsApp

குரல் போட்கள் இந்தியாவில் ஒரு முக்கிய AI பயன்பாடாக உருவெடுத்துள்ளன, இது பெரும்பாலும் ஃபின்டெக் துறையின் விரைவான வளர்ச்சியால் தூண்டப்படுகிறது. செயற்கை நுண்ணறிவு நாடு முழுவதும் பரவலாக உருவாக உள்ளது, பல செயல்படுத்தல்கள் தற்போதுள்ள செயல்முறைகளை மேம்படுத்த இணை விமானிகளாக செயல்படுகின்றன. இந்திய மொழி மாதிரிகளின் வளர்ச்சிக்கு ஆங்கிலத்தை விட கணிசமாக அதிக வளங்கள் தேவைப்படுகின்றன என்பது சுட்டிக்காட்டத்தக்கது. இந்த சவால்கள் இருந்தபோதிலும், இந்தியா பரவலான AI தத்தெடுப்புக்கான மிகப்பெரிய சந்தைகளில் ஒன்றாக மாற உள்ளது.

டாபிக்ஸ்

Artificial Intelligence

தேசிய மற்றும் சர்வதேச சமீபத்திய செய்திகளை எங்கள் இந்துஸ்தான் டைம்ஸ் தமிழின் செய்தி தளத்தின் தேசம் மற்றும் உலகம் பிரிவில் காணலாம்.