Google እንዴት ውሂብን ማንነት እንደማያሳውቅ እንደሚያደርግ
ማንነትን እንዳይታወቅ ማድረግ አንድን ግለሰብ ተለይቶ እንዲታወቅ የሚያስችልን መረጃ የሚያወግድ ወይም የሚያሻሽል የውሂብ ማስተናገድ ቴክኒክ ነው፤ ከማንም ግለሰብ ጋር የማይቆራኝ ማንነትን የማያሳውቅ እንዲሆን ተደርጎ የተዘጋጀ ውጤትን ያስገኛል። በተጨማሪ የGoogleን ለግላዊነት ያለውን ቁርጠኛ ተገዢነት ለማሳየት ዋንኛ ክፍለ አካል ነው።
ማንነትን እንዳያሳውቅ ተደርጎ የተዘጋጀን ውሂብ ትንታኔ በመስጠት እንደ የአንድን የገባ የፍለጋ መጠይቅ የራስሙላን እና የደህንነት ስጋቶችን የተሻለ ፈልጎ ማግኘት፣ እንደ አስጋሪ መልዕክቶች እና ማልዌር ጣቢያዎችን የመሳስሉ ሁሉንም የተጠቃሚ ማንነቶች እንደተጠበቁ ለደህንነት አስተማማኝ እና ጠቃሚ ምርቶችን ለመገንባት እንችላለን። በተጨማሪ ማንነትን እንዳያሳውቅ የተደረገን ውሂብ የእኛን ተጠቃሚዎች ግላዊነት ስጋት ላይ ሳንጥል ጠቃሚ እንዲሆን በማድረግ በከፍተኛ ደረጃ ልናጋራው እንችላለን።
የእርስዎን ውሂብ ለመጠቀም የምንጠቀምባቸው ሁለት ቴክኒኮች እነዚህ ናቸው
ውሂቡን ማጠቃለል
ከተወሰኑ ግለሰቦች ጋር በቀላሉ ይበልጥ ሊገናኙ የሚችሉ የተወሰኑ የውሂብ አባለ ነገራት አሉ። እነዚህን ግለሰቦች ለመጠበቅ ሲባል፣ የውሂቡን ክፍል ለማስወገድ ወይም የውሂቡን የተወሰኑ ክፍሎች በተለመዱ እሴቶች ለመተካት የውሂብ ማጠቃለልን እንጠቀማለን። ለምሳሌ፣ ውሂብ ማጠቃለልን ሁሉንም የአካባቢ ኮዶች ወይም የስልክ ቁጥሮች በተመሳሳይ ተከታታይ ቁጥሮች ለመተካት ልንጠቀምበት እንችላለን።
ውሂብን ማጠቃለል በተመሳሳይ የግለሰቦች ቡድን ውስጥ ያሉ ግለሰቦችን ማንነት ለመደበቅ ጥቅም ላይ የሚውለውን ቴክኒክ ለመግለጽ በኢንዱስትሪው ተቀባይነት ያለው ቃል የሆነውን k-anonymity ደረጃ ላይ እንድንድረስ ያስችለናል። በk-anonymity ውስጥ k የሚለው ፊደል የቡድኑን መጠን የሚያሳየው ቁጥር ነው። በውሂብ ቅንብሩ ውስጥ ላለ ለአንድ ማናቸውም ግለሰብ ተመሳሳይ ጠባዮች ያሉዋቸው ቢያንስ k-1 ግለሰቦች ካሉ ለዚያ የውሂብ ቅንብር k-anonymity አግኝተናል ማለት ነው። ለምሳሌ፣ k መጠኑ 50 የሆነባቸውን እና ጠባዩ የዚፕ ኮድ የሆነበትን የተወሰነ የውሂብ ቅንብር ያስቡ። በዚያ የውሂብ ቅንብር ውስጥ ያለን ማናቸውም ግለሰብ ብናይ፣ ተመሳሳይ ዚፕ ኮድ ያላቸውን 49 ሌሎች ግለሰቦችን ሁልጊዜ እናገኛለን። በመሆኑም ከዚፕ ኮዳቸው በመነሳት ማንንም ግለሰብ ለይተን ልናውቀው አንችልም።
በውሂብ ቅንብር ውስጥ ያሉ ሁሉም ግለሰቦች አደገኛ የሆነ ተመሳሳይ እሴትን የሚጋሩ ከሆነ አደገኛ መረጃው ግለሰቦቹ የዚህ በጥያቄ ውስጥ ያለው የውሂብ ቅንብር አባል እንደሆኑ በማወቅ ብቻ በቀላሉ መረጃው ገሃድ ሊወጣ ይችላል። ስጋቱን ለማስወገድ ሲባል በአደገኛ እሴቶች ውስጥ ያለውን ብዝሐነት የተለያየ ደረጃ ለመግለጽ በኢንዱስትሪው ተቀባይነት ያለውን ቃል ማለትም l-diversity ተግባራዊ ልናደርግ እንችል ይሆናል። ለምሳሌ፣ ተመሳሳይ ለሆነ አደጋን ሊያስከትል የሚችል የጤና ርዕሰ ጉዳይ (ለምሳሌ፦ የእንፍሉዌንዛ የበሽታ ምልክቶች) ሁሉም በአንድ ጊዜ የፈለጉ ሰዎች ያሉበትን ቡድን በምናብዎ ያስቡ። በዚህ የውሂብ ቅንብር ላይ ስንመለከት፣ ርዕሰ ጉዳዩን ማን እንደፈለገ ለይተን ለመናጋር አንችልም፣ ምስጋና ለk-anonymity ይግባውና። ሆኖም ግን ሁሉም ሰው አደጋ ሊያስከትል የሚችል መገለጫ ባህሪን ስለሚያጋራ አሁንም ድረስ የግላዊነት አሳሳቢ ችግር ሊሆን ይችላል (ለምሳሌ የመጠይቁ ርዕሰ ጉዳይ)። L-diversity ማለት ማንነት እንዳያሳውቅ የተደረገው ውሂብ ቅንብር የእንፍሉዌንዛ ፍለጋዎችን ብቻ በውስጡ የያዘ ነው ማለት አይደለም። እንዲያውም ከእንፍሉዌንዛ ፍለጋዎቹ ጎን ለጎን የተጠቃሚን ግላዊነት ለመጠበቅ ሌሎች ፍለጋዎችን ሊያካትት ይችላል።
በውሂብ ላይ ጫጫታን ማከል
Differential privacy (ይህም ተቀባይነት ያለው በኢንዱስትሪው ውስጥ ጥቅም ላይ የሚውል ቃል ነው) ሒሳብ ነክ ጫጫትን በውሂብ ላይ ለማከል ጥቅም ላይ የሚውልን ቴክኒክ ያብራራል። ከDifferential privacy ጋር፣ የአንድ የተሰጠ አልጎሪዝም በመሠረቱ የአንድ ግለሰብ መረጃ ቢታከልም ወይም ባይታከልም ተመሳሳይ ሆኖ እንደመታየቱ አንድ ግለሰብ የአንድ የውሂብ ቅንብር አካል መሆን አለመሆኑን በእርግጠኝነት ለመናገር አስቸጋሪ ነው። ለምሳሌ፣ በአንድ ሥነምድራዊ ክልል ውስጥ ዙሪያውን ያለውን የእንፍሉዌንዛ ፍለጋዎችን በተመለከተ ያለውን አጠቃላይ የፍለጋ አዝማሚያ በመለካት ላይ ነን እንበል። differential privacy ን ማግኘት እንድንችል በውሂብ ቅንብሩ ላይ ጫጫታ እናክልበታለን። ይህ ማለት በአንድ የተወሰነ ሰፈር ውስጥ ስለ እንፍሉዌንዛ የፈለጉ ሰዎችን ብዛት ልናክል ወይም ልንቀንስ እንችላለን ሆኖም ግን ይህን ማድረጉ እኛ በተሰጠው ሥነምድራዊ ክልል ድንበር ዙሪያ የሚኖረውን የእኛን ልኬት ተጽዕኖ አያስርፍበትም። በውሂብ ቅንብር ላይ ጫጫታ መጨመር ያነሰ ጠቃሚ እንዲሆን ሊያደርገው እንደሚችል ልብ ማለትም በተጨማሪ አስፈላጊ ነው።
ማንነትን አለማሳወቅ የእኛን የተጠቃሚ ግላዊነት ለማንበር ከምንጠቀምባቸው የሥራ ሂደቶች መካከል አንዱ ብቻ ነው። ሌሎች የሥራ ሂደቶች በተጠቃሚ ውሂብ መዳረሻ ላይ ጥብቅ ቁጥጥሮችን ማድረግ፣ ተጠቃሚዎችን ተለይተው እንዲታወቁ ሊያሰርጉ የሚችሉ የውሂብ ስብስቦችን ለመቆጣጠር እና ለመቀላቀል የሚረዱ መመሪያዎችን ተፈጻሚ ማድረግ፣ እና የማንነት አለማሳወቅ እና የውሂብ አስተዳደር ስትራቴጂዎችን በሁሉም Google ላይ ባሉ የጠበቃ ደረጃዎች ተፈጻሚ መሆኑን ለማረጋገጥ ማዕከላዊነት ያለው ግምገማን ማድረግ የመሳሰሉ ሂደቶችን ያካትታሉ።