Google, ડેટાને કેવી રીતે અનામી બનાવે છે

અનામીકરણ એ એક ડેટા સંસાધન તકનીક છે જે વ્યક્તિગતરૂપે ઓળખવા યોગ્ય માહિતીને દૂર કરે છે અથવા સંશોધિત કરે છે; તે અનામી ડેટામાં પરિણમે છે જે કોઈ એક વ્યક્તિની સાથે સાંકળી શકાતો નથી. તે ગોપનીયતા પ્રત્યેની Google ની પ્રતિબદ્ધતાનો એક મહત્વપૂર્ણ ઘટક પણ છે.

અનામી ડેટાનું વિશ્લેષણ કરીને, અમે સુરક્ષિત અને મૂલ્યવાન ઉત્પાદનો અને સુવિધાઓને બનાવીએ છીએ, જેમ કે વપરાશકર્તાની ઓળખને સુરક્ષિત કરીને પ્રવિષ્ટ કરેલ શોધ ક્વેરી પર સ્વતઃપૂર્ણતા અને સુરક્ષા જોખમો માટેની વધુ સારી શોધ, જેમ કે ફિશિંગ અને માલવેર સાઇટ. અમે અમારા વપરાશકર્તાઓની ગોપનીયતાને જોખમમાં મૂક્યાં વિના તેને અન્ય લોકો માટે ઉપયોગી બનાવીને, અનામી ડેટાને સુરક્ષિતપણે બાહ્યરૂપે શેર પણ કરી શકીએ છીએ.

તમારા ડેટાની સુરક્ષા માટે ઉપયોગમાં લઈએ છીએ તે બે તકનીક

ડેટાનું સામાન્યીકરણ

એવા અમુક ડેટા તત્વો છે જે અમુક વ્યક્તિઓ સાથે વધુ સહેલાઈથી જોડાયેલ હોય છે. તે વ્યક્તિઓની સુરક્ષા માટે, અમે સમાન હોય તેવા ડેટાના ભાગને દૂર કરવા અથવા તેના કેટલાક ભાગને બદલવા માટે સામાન્યીકરણનો ઉપયોગ કરીએ છીએ. ઉદાહરણ તરીકે, નંબરના સમાન અનુક્રમવાળા બધા જ ક્ષેત્ર કોડ અથવા ફોન નંબરના ભાગને બદલવા માટે અમે કદાચ સામાન્યીકરણનો ઉપયોગ કરીએ તેવું બને.

સામાન્યીકરણ અમને સમાન વ્યક્તિઓના જૂથમાં વ્યક્તિઓની ઓળખને છુપાવવા માટેની તકનીકનું વર્ણન કરવા માટે ઉપયોગમાં લેવાતાં ઉદ્યોગ-માનક શબ્દ એવા, k-anonymity ને હાંસલ કરવાની મંજૂરી આપે છે. k-nonymity માં, k એ એક નંબર છે જે જૂથના કદનું પ્રતિનિધિત્વ કરે છે. માની લો કે ડેટા સેટમાં કોઈ વ્યક્તિ માટે, ઓછામાં ઓછી k-1 વ્યક્તિઓ છે જે સમાન પ્રોપર્ટીઝ ધરાવે છે, તો પછી અમે તે ડેટા સેટ માટે k-anonymity હાંસલ કરી છે. ઉદાહરણ તરીકે, કોઈ એવા ડેટા સેટની કલ્પના કરો કે જ્યાં k, 50 ની બરાબર છે અને પ્રોપર્ટી પિન કોડ છે. જો અમે તે ડેટા સેટ અંતર્ગત કોઈ વ્યક્તિને શોધીએ, તો અમને હંમેશાં તે સમાન પિન કોડ ધરાવતાં 49 અન્ય લોકો મળશે જ. તેથી, અમે કોઈપણ એક વ્યક્તિને માત્ર તેમના પિન કોડથી ઓળખી શકીશું નહીં.

જો ડેટા સેટમાં બધી જ વ્યક્તિઓ સમાન સંવેદનશીલ એટ્રિબ્યુટ શેર કરે છે, તો આ વ્યક્તિઓ વિવાદાસ્પદ ડેટા સેટનો ભાગ છે એ જાણીને સંવેદનશીલ માહિતી જાહેર કરવામાં આવી શકે છે. આ જોખમને ઘટાડવા માટે, અમે સંવેદનશીલ મૂલ્યોમાં વિવિધતાના કેટલાક સ્તરનું વર્ણન કરવા માટે ઉપયોગમાં લેવાતાં ઉદ્યોગ-માનક શબ્દ એવા, l-diversity, નો ઉપયોગ કરી શકીએ છીએ. ઉદાહરણ તરીકે, એક એવા જૂથની કલ્પના કરો કે જેણે એક જ સમયે સમાન સંવેદનશીલ આરોગ્ય વિષય માટે શોધ કરી હોય (ઉ.દા. ફ્લૂના લક્ષણો). જો અમે આ ડેટા સેટને જોઈએ, તો અમે એ કહી શકીશું નહીં કે આ વિષય માટે કોણે શોધ કરેલી, જેનો શ્રેય k-anonymity ને જાય છે. જો કે, દરેક જણ કોઈ સંવેદનશીલ એટ્રિબ્યુટ (એટલે કે ક્વેરીનો વિષય) શેર કરતાં હોવાથી હજીએ ગોપનીયતાને લગતી સમસ્યા હોઈ શકે છે. L-diversity નો અર્થ છે કે અનામી ડેટામાં માત્ર ફ્લૂ શોધ શામેલ હશે નહીં. તેના બદલે, તેમાં વપરાશકર્તાની ગોપનીયતાને આગળ સુરક્ષિત કરવા માટે ફ્લૂની શોધ સાથે અન્ય શોધ પણ સામેલ હોઈ શકે છે.

ડેટામાં સ્પષ્ટપણે શામેલ ન હોય તેવી માહિતી ઉમેરવી

વિકલ ગોપનીયતા (જે એક ઉદ્યોગ-માનક શબ્દ પણ છે) તે ડેટામાં સ્પષ્ટપણે શામેલ ન હોય એવી ગણિતીય માહિતી ઉમેરવા માટેની તકનીકનું વર્ણન કરે છે. વિકલ ગોપનીયતા વડે, કોઈ એક વ્યક્તિ કોઈ ડેટા સેટનો ભાગ છે કે કેમ તે નક્કી કરવાનું મુશ્કેલ છે કેમકે આપેલ અલ્ગોરિધમનું આઉટપુટ આવશ્યકપણે તે જ દેખાશે, પછી ભલેને કોઈપણ એક વ્યક્તિની માહિતી શામેલ કરી હોય કે અવગણી કાઢેલ હોય. ઉદાહરણ તરીકે, કલ્પના કરો કે અમે કોઈ ભૌગોલિક પ્રદેશમાં ફ્લૂ માટેની શોધમાં એકંદર વલણને માપી રહ્યાં છીએ. વિકલ ગોપનીયતા હાંસલ કરવા માટે, અમે ડેટા સેટમાં સ્પષ્ટપણે શામેલ ન હોય એવી માહિતી ઉમેરીએ છીએ. આનો અર્થ એ છે કે અમે આપેલા પડોશમાં ફલૂને શોધતા લોકોની સંખ્યાને ઉમેરી અથવા ઘટાડી શકીએ છીએ, પરંતુ આમ કરવાથી વ્યાપક ભૌગોલિક પ્રદેશમાં વલણમાં અમારા માપનું પ્રમાણ પ્રભાવિત થશે નહીં. એ પણ નોંધવું મહત્વપૂર્ણ છે કે કોઈ ડેટા સેટમાં સ્પષ્ટપણે શામેલ ન હોય એવી માહિતી ઉમેરવાથી તે કદાચ ઓછો ઉપયોગી રહે તેવું બને.

અનામીકરણ તો બસ એક પ્રક્રિયા છે જેનો ઉપયોગ અમે વપરાશકર્તાની ગોપનીયતા પ્રત્યેની અમારી પ્રતિબદ્ધતાને જાળવી રાખવા માટે કરીએ છીએ. Google માં બધે જ સુરક્ષાના એકસમાન સ્તરની ખાતરી કરવા માટે અન્ય પ્રક્રિયાઓમાં વપરાશકર્તાની ડેટા ઍક્સેસ પર ચુસ્ત નિયંત્રણો, નિયંત્રણ માટેની નીતિઓ તથા ડેટા સેટમાં જોડાવાની મર્યાદા કે જે કદાચ વપરાશકર્તાઓને ઓળખી કાઢે તથા અનામીકરણ અને ડેટા સંચાલનની વ્યૂહરચનાઓની એકીકૃત સમીક્ષા સામેલ છે.

Google ઍપ્લિકેશનો
મુખ્ય મેનૂ