ઉત્સવ

પ્રાદેશિક ભાષામાં એઆઇ?

યેસ, સવાલ તમારા જવાબ અમારા…

ટૅક વ્યૂહ -વિરલ રાઠોડ

જ્યારથી અર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI) નો પ્રારંભ થયો છે ત્યારથી એક આખો માહોલ ગોકળગાયની જેમ બંધાઈ રહ્યો છે. એમાં હવે જુદી જુદી એપ્લિકેશન શરૂ થતા ગ્રાફિક્સ અને મલ્ટિમિડીયા પર એક વધુ અખતરો થવા જઈ રહ્યો છે. આમ પણ આપણા જુગાડું દિમાગી ઇન્ડિયન્સ કાયમ નવું કરવામાં માહિર છે. ભારતમાં, સ્થાનિક ભાષાઓમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સનો ઉપયોગ કરવા માટે મોટા પાયે પ્રયાસો કરવામાં આવી રહ્યા છે. આ કામમાં સામાન્ય લોકો મદદ કરી રહ્યા છે. જેમ પ્રાદેશિક ભાષાના શબ્દોનો આખો શબ્દકોશ બને એમ આખી ડિજિટલ આવૃત્તિ તૈયાર થઈ રહી છે એમ કેહવામા કંઈ ખોટું નથી. છેલ્લા કેટલાક અઠવાડિયાથી કર્ણાટકના એક ગામમાં ગ્રામજનો સ્થાનિક કન્નડ ભાષામાં વાક્યો રેકોર્ડ કરી રહ્યા છે. આ ભાષાને એક એપ દ્વારા રેકોર્ડ કરવામાં આવી રહી છે, જેથી ઝઇ માટે દેશનો પ્રથમ અઈં- આધારિત ચેટબોટ બનાવી શકાય. ઓડિયો બેઇઝ વસ્તુની આખો શ્રેણી વચ્ચે વધુ એક મોટું અને સારું કામ થઈ રહ્યું છે.

NLP એ આર્ટિફિશિયલ ઇન્ટેલિજન્સ ની શાખા છે. તે કોમ્પ્યુટરને વિવિધ ભાષાઓ સમજવા માટે તૈયાર કરે છે. દેશની મોટાભાગની ૧૨૧ ભાષા NLP હેઠળ આવતી ન હોવાથી દેશના કરોડો લોકો કોમ્પ્યુટરના લાભોથી વંચિત છે,પણ હવે એક ટેકનોજીને પ્રાદેશિક ભાષા થકી એવી રીતે ઊભી કરવામાં આવી રહી છે કે અંગ્રેજીની માથાજીકમાંથી સાક્ષાત મોક્ષ મળી જાય.

       માઈક્રોસોફ્ટ રિસર્ચ ઈન્ડિયા’ના મુખ્ય સંશોધક કાલિકા બાલી કહે છે, એઆઈ ટૂલ્સ દરેક વ્યક્તિ માટે ત્યારે જ ફાયદાકારક સાબિત થશે જો એ  અંગ્રેજી, ફ્રેન્ચ કે સ્પેનિશ બોલતા ન હોય તેવા લોકો માટે કામ કરે,પરંતુ ChatGPT જેવા મોટા AI ટૂલ માટે ડેટાનું કલેક્શન કરવામાં આવે તો એક દાયકો તો ખાલી ડેટાને પ્રોસેસ કરવા જાય એમ છે. એટલે એઆઇના પ્રોગ્રામને ધ્યાને રાખી વધુ એક લેયર બનાવવું જોઈએ જે આ કામમાં સિંહફાળો આપી શકે. કર્ણાટકના આ ગામના લોકોની જેમ આ પ્રકારનો ડેટા વિવિધ ભાષાઓના હજારો લોકો દ્વારા એકત્ર કરવામાં આવી રહ્યો છે. ટેક કંપની KARYA (KARYA) વિવિધ ભાષાઓમાં ડેટા એકત્રિત કરી રહી છે, જેનો ઉપયોગ કરીને Microsoft અને Google જેવી કંપનીઓને શિક્ષણ, આરોગ્ય અને અન્ય સેવાઓ માટે AI મોડલ બનાવવામાં મદદ કરે છે.

ભારત સરકાર ડિજિટલ માધ્યમો દ્વારા વધુને વધુ સેવાઓ ઉપલબ્ધ કરાવવા માંગે છે. તે આવા સ્થાનિક ડેટા સેટ પણ તૈયાર કરી રહી છે. તે ભાશિની નામની AI આધારિત અનુવાદ પ્રણાલી દ્વારા તૈયાર કરવામાં આવી રહી છે. તે સ્થાનિક ભાષાઓમાં AI સાધનો વિકસાવવા માટેની ઓપનસોર્સ સિસ્ટમ છે. જે આમાં પ્રોજેક્ટલક્ષી જ નહિ બીજા પણ કેટલાક ફાયદા કરવી જશે. વિશ્વમાં લગભગ સાત હજાર ભાષાઓ છે, જેમાંથી ૧૦૦ થી ઓછી ગકઙ હેઠળ ઉપલબ્ધ છે. આમાં અંગ્રેજી મોખરે છે. સમગ્ર વિશ્વમાં હલચલ મચાવનાર ChatGPT મુખ્યત્વે અંગ્રેજીમાં તૈયાર કરવામાં આવ્યું છે. ગૂગલનું બોર્ડ પણ અંગ્રેજી પૂરતું મર્યાદિત છે. એમેઝોનના એલેક્સા જે નવ ભાષાઓમાં પ્રતિસાદ આપે છે તેમાંથી માત્ર ત્રણ – અરબી, હિન્દી અને જાપાનીઝ – બિન-યુરોપિયન ભાષાઓ છે. હવે કોઈ એમ કહે કે, એલેક્સાને ગુજરાતી બોલાવો તો?? સૌથી પેહલાં તો એને ડખો એ થઈ જાય કે, આ ગોમ’ અને ’ગામ’માં જ એ ગોટે ચડે, કારણ કે શુદ્ધ ગુજરાતી બોલે તો પ્રજા એ સમજે કે, વેવલી ચાપી ચાપીને બોલે છે. અસ્સલ જે તે પ્રદેશની બોલી ફિટ કરવામાં આવે તો મજા લેનાર વધી પડે. બાકી એની ધબધબાટી અને ધાણાજીરું….

મુંબઈ સ્થિત ‘કોમ્પ્યુટેશન ફોર ઈન્ડિયન લેંગ્વેજ ટેક્નોલોજી લેબ’ના વડા પુષ્પક ભટ્ટાચાર્ય કહે છે, ભારત સરકાર ભારતીય ભાષાઓમાં મોટા ભાષાના મોડલને તાલીમ આપવા માટે મોટા પાયે પ્રયાસ કરી રહી છે. આ સાધનોનો ઉપયોગ શિક્ષણ, પર્યટન અને પર્યટન સહિતના ઘણા ક્ષેત્રોમાં થઈ રહ્યો છે. પરંતુ તેમાં ઘણા પડકારો પણ છે. ભારતીય ભાષાઓ મુખ્યત્વે બોલચાલના સ્વરૂપમાં ઉપલબ્ધ છે. તેના યોગ્ય ઇલેક્ટ્રોનિક રેકોર્ડ્સ ઉપલબ્ધ નથી. કોડ મિક્સિંગ પણ ખૂબ જ વધારે છે. ઓછા લોકો દ્વારા બોલાતી ભાષાઓમાં ડેટા એકત્ર કરવો એ પણ મોટો પડકાર છે. જેને વધારાના પ્રયત્નોની જરૂર છે.

ભારતની ૧.૪ અબજ વસતિમાંથી માત્ર ૧૧ ટકા લોકો અંગ્રેજી બોલે છે અને સમજે છે. તેથી, સ્થાનિક ભાષાઓમાં અઈં ટૂલ્સ ઉપલબ્ધ કરાવવાની જરૂરિયાત ઘણી મોટી છે. હવે સરકારો અને ખાનગી કંપનીઓ આ અંતરને ભરવાનો પ્રયાસ કરી રહી છે.

બાલી કહે છે કે ભારત જેવા દેશમાં ક્રાઉડસોર્સિંગ એ ભાષાકીય માહિતી એકત્ર કરવાની અસરકારક રીત છે. એ કહે છે, “ક્રાઉડસોર્સિંગ ભાષા, સંસ્કૃતિ અને સામાજિક-આર્થિક પાસાઓ જેવી નાની વસ્તુઓને પણ આવરી લે છે. પરંતુ સામાજિક-આર્થિક ભેદભાવ વિશે જાગૃતિની જરૂર છે. આ સંપૂર્ણ નીતિશાસ્ત્ર સાથે થવું જોઈએ. “લોકોને આ માટે કામ કરવા માટે તૈયાર કરવા. , કામ માટે તેમને ચૂકવણી જો એક પોલિસી હેઠળ કરવામાં આવે તો મોટું કામ થઈ શકે. પણ બીજો મુદ્દો એ પણ અહીંયા અસર કરે છે કે. આ તો આઇટી કંપનીઓની કામગીરી છે. જેમાં ડેટા ની સુરક્ષા મામલે ઘણા છીંડા સાવ અજાણ્યા નથી. વોઇસ નોટ સાથે પણ ડીપફેક થઈ જાય તો?? ઝુબાં કી તો કોઈ કિંમત હિ નહીં બચેગી….

એઆઇનું આખું મોડલ જો કોઈ દેશને ધ્યાને લઇને ડિઝાઇન કરવામાં આવે તો આવી ઘણી એલેક્સા’ એના વાસ્તવિક નોલેજ કરતાં પ્રાદેશિક પાવર ધરાવતી થઈ જાય. ગામ આખું જ્ઞાન એના મોઢેથી કરોડો કાનને પીરસાય તો જીવતે જીવ્ સરસ્વતી વંદના થઈ ગણાય. ખાસ કરીને એજ્યુકેશનમાં આ વસ્તુ આવે એટલે મૌલિક પોલિસી પર બાળકોની કલ્પનાની ક્ષિતિજ વિસ્તરે એ નક્કી છે. પણ ખાટલે મોટી ખોટ એ છે કે, આપણા ફ્લેવર્સમાં ઈંગ્લીશ ઘર કરી ગયું છે. એટલે જ અંગ્રેજીમાં વરસાદનો શબ્દ રેઇન એક જ યાદ છે. જ્યારે ગુજરાતીમાં શિયાળના પણ ઢગલો શબ્દો જડે.

આઉટ ઓફ ધ બોક્સ
ઇનપુટ અને આઉટપુટ જીવનમાં એક જ નિયમ પર કામ કરે છે. બેસ્ટ આપો તો સર્વ શ્રેષ્ઠ મળે અને બોગસ આપો તો બગાડી પણ મૂકે. ચોઇસ ઇસ યોર્સ….

Show More

Related Articles

Back to top button
આ ભારતીય ક્રિકેટરો સંપૂર્ણ શાકાહારી છે એક દિવસમાં કેટલી રોટલી ખાવી જોઈએ, શું કહે છે નિષ્ણાતો? 48 કલાક બાદ સૂર્યગ્રહણ, આ રાશિના જાતકોનો શરૂ થશે ગોલ્ડન પીરિયડ વિશ્વયુદ્ધ થાય તો કયા દેશ હશે સુરક્ષિત