Jinsi Google inavyoficha utambulisho wa data

Kuficha utambulisho wa data ni mbinu ya uchakataji inayoondoa au kubadilisha maelezo yanayoweza kumtambulisha mtu; mbinu hii husababisha kuzalisha data isiyokutambulisha, hivi kwamba haiwezi kuhusishwa na mtu yeyote. Mchakato huu pia ni kipengee muhimu cha azimio la faragha la Google.

Kwa kuchambua data ambayo utambulisho wake umefichwa, tunapata uwezo wa kutengeneza bidhaa na vipengele salama na vya ubora wa juu, kama vile kujaza kiotomatiki hoja ya utafutaji na kutambua hatari za usalama vizuri zaidi, kama vile programu hasidi na tovuti za kuhadaa ili kuiba maelezo ya binafsi, huku tukilinda utambulisho wa mtumiaji. Pia tunaweza kushiriki data kwa njia salama isiyokutambulisha na kuiwezesha kutumika na watu wengine bila kuhatarisha faragha ya watumiaji wetu.

Mbinu mbili tunazotumia kulinda data yako

Kutandaza data

Kuna vipengee fulani vya data vinavyoweza kuhusishwa kwa urahisi zaidi na watu mahususi. Ili kuwalinda watu hawa, tunaitandaza data ili kuondoa au kubadilisha sehemu ya data hii na kuweka thamani ya kawaida. Kwa mfano, tunaweza kutumia mbinu ya kutandaza data kubadilisha sehemu za misimbo yote ya maeneo au nambari za simu na kuweka mfululizo sawa wa nambari.

Kutandaza data hutuwezesha kufikia kiwango cha k cha kuficha utambulisho wa data (k-anonymity), ambacho ni kiwango cha tasnia hii kinachotumika kufafanua kuhusu mbinu ya kuficha utambulisho wa watu katika kikundi cha watu wenye sifa sawa. Katika kiwango cha k cha kuficha utambulisho wa data, k ni nambari inayosimamia ukubwa wa kikundi. Ikiwa kwa kila mtu aliye katika kifurushi cha data kuna angalau watu k-1 walio na sifa sawa, basi tumefikia kiwango cha k cha kuficha utambulisho wa data hii. Kwa mfano, tuseme kuna kifurushi cha data ambapo k ni sawa na 50 na kipengele husika ni msimbo wa eneo. Tukimtafuta mtu yeyote katika kifurushi hiki cha data, kila wakati tutawapata watu 49 walio na msimbo sawa wa eneo. Kwa hivyo hatutaweza kumtambua mtu yeyote kwa kuangalia msimbo wake wa eneo tu.

Ikiwa watu wote walio kwenye kifurushi cha data wana thamani sawa ya kipengee nyeti, maelezo nyeti yanaweza kufichuliwa kwa kujua kuwa watu hawa ni sehemu ya kifurushi cha data husika.Ili kuzuia hatari hii, tunaweza kutumia utofauti wa L, ambalo ni neno la kawaida la tasnia hii linalotumika kueleza kuhusu kiwango fulani cha utofauti katika thamani nyeti. Kwa mfano, tuseme kuna kikundi cha watu ambao wote walitafuta dalili nyeti za ugonjwa (k.m. dalili ya mafua) kwa wakati mmoja. Tukiangalia kifurushi hiki cha data, hatutaweza kujua mtu aliyetafuta mada hii, kwa sababu ya kiwango cha k cha kuficha utambulisho wa data. Hata hivyo, bado kuna uwezekano wa hatari ya kufichua faragha ya data kwa sababu kila mtu anashiriki sifa nyeti (yaani mada aliyotafuta). Utofauti wa L unamaanisha kuwa kifurushi cha data isiyomtambulisha mtu binafsi hakitakuwa na dalili za mafua pekee, lakini kitajumuisha matokeo mengine kando na ya utafutaji wa dalili za mafua ili kuhakikisha usalama zaidi wa faragha ya mtumiaji.

Kuongeza maelezo ya ziada kwenye data

Faragha ya utofauti (pia ni neno maalum linalotumika katika tasnia hii) ni mbinu ya kuongeza maelezo taka ya kihisabati katika data. Kwa kutumia utofauti wa faragha, ni vigumu kubaini kama mtu fulani ni sehemu ya kifurushi cha data kwa sababu pato la algorithi yoyote litafanana na jinginelo, iwe maelezo ya mtu mmoja yamejumuishwa au la. Kwa mfano, tuseme tunatafuta mtindo wa jumla wa utafutaji wa mada ya mafua katika eneo la kijiografia. Hii inamaanisha kuwa tunaweza kujumlisha au kutoa idadi ya watu wanaotafuta maelezo ya mafua katika jumuiya mahususi, lakini kufanya hivyo hakutaathiri vipimo vyetu vya mtindo wa utafutaji katika eneo kubwa zaidi la kijiografia. Pia ni muhimu kukumbuka kuwa kuongeza maelezo ya ziada kwenye kifurushi cha data kunaweza kupunguza umuhimu wake wa matumizi.

Kuficha utambulisho wa data ni mchakato mmoja tu tunaotumia kudumisha azimio letu la kulinda faragha ya watumiaji. Michakato mingine inajumuisha udhibiti mkali wa ufikiaji wa data ya watumiaji, sera za kulinda na kuzuia kuunganisha vifurushi vya data vinavyoweza kuwatambua watumiaji na ukaguzi wa data isiyomtambulisha mtumiaji unaofanyiwa katika sehemu moja na pia kufanya mikakati ya usimamizi wa data ili kuhakikisha kiwango imara cha usalama kwenye bidhaa zote za Google.