વૈવિધ્ય-વિકાસ ને વિશાળતાનો ત્રિવેણી સંગમ એટલે ડેટા સાયન્સ
ટૅક વ્યૂહ -વિરલ રાઠોડ
દૈનિક ધોરણે લાખો-કરોડો લોકો યુટ્યુબનો ઉપયોગ કરે છે. કરોડો લોકો સર્ચ એન્જિનનો ઉપયોગ કરે છે. ટેક્નોલોજીની દુનિયામાં માર્કેટિંગથી લઈને મેડિકલ સુધી દરેક કેટેગરી માટે એક ખાસ પ્લેટફોર્મ છે, ભાષા છે, ટેકિનક છે અને ફીચર્સ છે. ડિજિટલ યુગમાં ડેટા શબ્દ ભલે એક હોય પણ તેના પ્રકાર અનેક છે. મલ્ટિમીડિયાથી લઈને મેથ્સની ટેકનિક સુધી, દુનિયામાં જેટલા વિષય છે એ દરેકનો એક ચોક્કસ ડેટા છે.
‘ડેટા પૂરો થઈ ગયો’ એવું કોઈ કહે એટલે પહેલો વિચાર ઈન્ટરનેટ ડેટા પૂરો એવો જ આવે. આ બહું સામાન્ય થઈ રહ્યું છે. મૂળ તો ‘ડેટા શબ્દ ડેટ્યુમ’ શબ્દ પરથી ઊતરી આવેલો શબ્દ છે, જે કોમ્પ્યુટર આવ્યું ત્યારથી પ્રચલિત બન્યો. બીજી તરફ, સાયન્સ શબ્દમાં પણ અનેક એવા વિષયોનો સમયાંતરે ઉમેરો થતો ગયો. ટેકનોલોજીની કંપનીઓ આવતી ગઈ એમ નવી નવી ટેક્નોલોજી તો આવી, પણ સાથે નવા વિજ્ઞાનીઓ પણ લાવી. સ્પીડ અને ઈન્ટરનેટના જમાનામાં હવે ડેટા સાયન્સના સાયન્ટિસ્ટની માગ વધી છે, જે માહિતીમાંથી પણ કંઈક નક્કર શોધી લાવે. ટૂંકમાં પથ્થરામાંથી હીરા શોધવા જેવું એ કામ છે.
ડેટા સાયન્સ એટલે શું?
ડેટા એટલે ‘આધાર -સામગ્રી ’ સીધા જ ડેટા સાયન્સ પર આવીએ. જ્યારે આપણે કોઈ એપ્લિકેશન, ઈ-કોમર્સ, વીડિયો સ્ટ્રિમિંગ એપ્સ કે યુટ્યુબ ખોલીએ છીએ ત્યારે આપણી સ્ક્રિન પર આપણા જ રસના કેટલાક વિષયોનો અન્નકૂટ કહી શકાય એવો થાળ તૈયાર હોય છે. વાર માત્ર ક્લિક કરીને જોવાની હોય છે. આ થાળ તૈયાર કરવા માટે જે તે કંપની કે એપ્લિકેશન જે વસ્તુ કે ટેકનિકનો ઉપયોગ કરે છે એ છે ડેટા સાયન્સ. આની પાછળ જેનું દિમાગ કામ કરે છે એ હોય છે ડેટા સાયન્ટિસ્ટ. ઈન્ટરનેટ પર કરોડો કમાતી કંપનીઓ એવું જ ઈચ્છે છે કે, આપણે સૌ એમની વેબ સાઈટ કે એપ્લિકેશન પર વધુ ને વધુ સમય પસાર કરીએ. અંતે કોઈ એક વસ્તુની પસંદગી કરીએ અને પછી એમને ખટાવીએ. (પૈસા આપીને વસ્તુ લઈએ) આ માટે આપણે સર્ચ કરેલા દરેક શબ્દો, લીંક, ફોટો અને વીડિયોનો એક રેકોર્ડ બને છે. એને પછી ચોક્કસ અલગોરીધમમાંથી પસાર થવાનું હોય છે. જે સંબંધિત વસ્તુઓ સતત પછી આપણે જ્યારે પણ સ્ક્રિન ખોલીએ તો સામે આવીને ઊભી રહે છે. આ સમગ્ર ટેકિનક પાછળ ડેટા સાયન્સ ઘણા ખરા અંશે જવાબદાર છે. યુટ્યુબ પર માત્ર એક લિંક જોઈએ પછી એ જ વિષયના સતત અને સખત વિડિયો આપણી સામે આવતા જ રહે એ પાછળ ડેટા સાયન્સ કામ કરતું હોય છે.
ડેટા સાયન્સમાં બહુવિધ વિષય
જે રીતે વિજ્ઞાન એક કરતાં વધારે વિષયનો બનેલો એક લોજિકલ વિષય છે, જેમાં જીવ વિજ્ઞાનથી લઈને ભૌતિકશાસ્ત્રના નિયમ આવી જાય. ડેટા સાયન્સમાં ગણિત, થોડું પ્રોગ્રામિંગ (પાયથન અને બી), વિશ્ર્લેષણ, પ્રક્રિયા અને પછી પરિણામનો સમાવેશ થાય છે.
ટેક કંપનીઓ મોટા પાયે રોકાણ કરતાં પહેલાં આ વિષયના નિષ્ણાતોને કરોડો રૂપિયાના (ભારતમાં લાખોના) પગાર સાથે રોકે છે. પછી રિયલ ટાઈમ એનાલિસિસ કરાવીને પોતાની કોઈ ચેટ નવી પ્રોડક્ટને લોંચ કરે છે. ચેટ ૠઝઙ, અઈં ની પાછળ પણ આના જ કેટલાક અલગોરીધમ જવાબદાર છે. એમેઝોન, ફેસબુક, ઈન્ટાગ્રામ, યુટ્યુબ, હોટ સ્ટાર, નેટફ્લિક્સ જેવી કંપનીઓ પાસે પોતાનું એક ડેટા સેન્ટર છે, જે ડેટા સાયન્સના અભિગમ અંતર્ગત જ કામ કરે છે. થોડું મશીન લર્નિંગનું પણ નોલેજ હોય તો આ ક્ષેત્રમાં નોકરીઓ મબલખ છે એટલે જે આઈટી ક્ષેત્રમાં રસ દાખવતા હોય એમણે આ વિષય વિચારવા જેવો નહીં, પણ અપનાવીને આગળ વધવા જેવો છે. પહેલી સેલેરી લાખોમાં હશે એની ગેરંટી.
બિગ ડેટા- બડા બજેટ
ટેક્નોલોજીની નાનામાં નાની કંપની પાસે પોતાનો કેટલોક ડેટા તો હોય છે જ. હવે માઈક્રોસોફ્ટ ભલે ગૂગલ જેટલી મોટી ન હોય પણ એની પાસે તો ડેટાનો આખો ક્રમશ: અને વ્યવસ્થિત આખો પોર્ટફોલિયો હશે. એ પણ ડિજિટલ. હવે ડેટા સાયન્સના જે નિષ્ણાત છે એનું કામ આવા ડેટાને વધુ ને વધુ રીતે ક્નેક્ટ કરીને, વિશ્ર્લેષણ કરીને એક નવી જ કોન્ટેટ સ્ટ્રેટજી તૈયાર કરવાનું પણ હોય છે. હવે થોડો બિગ ડેટાનો કોન્સેપ્ટ પણ સમજીએ. વીડિયો સ્ટ્રિમિંગ એપ્લિકેશન પર જે લોકો સબસ્ક્રાઈબ છે એમાં ઓટો રિન્યૂલ સિસ્ટમથી એ વાકેફ હશે. સબસ્ક્રિપ્શનનો સમય પૂરો થતા ઓટોમેટિક જ પૈસા ખાતામાંથી કટ થઈને ફરી એપ્લિકેશન પ્રીમિયમ બની જાય છે. આ પાછળ ટાઈમ લોજિક અને ટાઈમ ઈન્ટરવલ ટેકિનક તો કામ કરે છે, પણ ડેટા સાયન્સ એ કામ કરે છે કે, જે તે યુઝરને ગમતું કોન્ટેટ ક્યું છે. એ પ્રીમિયમ કે પેઈડ હોય તો એ પહેલા ઓફર કરીને કંપનીને પૈસા અપાવો. આ કામ અઈં નથી કરી શકતું એટલે જ અઈં ના ભેજા પાછળ માનવીય દિમાગ છે. એ પણ વેલ પ્રોગ્રામડ. આ પ્રોસેસ પાછળ ખર્ચાતી રકમ પણ લાખો-કરોડોમાં હોય છે એટલા માટે જ ટેક કંપનીઓ રિસર્ચ પાછળ કરોડો ખર્ચે છે.
હવે જમાનો ડેટાનો
આવનારા દિવસો ટેક્નોલોજીના ક્ષેત્રમાં ડેટાના રહેવાના છે. ઈન્ટરનેટ ડેટાથી લઈને કંપનીના કેટલાક મહત્ત્વના ડેટા સુધી માર્કેટ ડેટા પરથી બદલી રહી છે, જે કોન્ટેટ સૌથી વધુ વ્યવસ્થિત અને ડેટા પર ચોક્સાઈ વાળા હશે એની કિંમત વધારે. આ માટે જે નિષ્ણાતો તૈયાર કરશે તે પોતાનો ભાવ પણ કહી શકશે. હા, એક વાતની સ્પષ્ટતા એ કે, અઈં અને ચેટ ૠઝઙ ભલે રો ડેટાનો આખો ડુંગર ખડકી દે. હિમાયલ જેવડો ડેટા આપી દે,પણ એની યુનિકનેસ -વિશેષતા માટે માનવીય દિમાગની ઊપજ છે શ્રેષ્ઠ રહેશે. આ ક્ષેત્રે હજુ અઈં નથી આવી શક્યું.
આઉટ ઓફ ધ બોક્સ:
સૌથી અઘરું શું હોઈ શકે?
દરેક સ્થિતિમાં દરેકનું પોઝિટિવ જોવું અને વિચારવું એ.