Как диференциалната поверителност работи

От години Apple има дълъг ангажимент към неприкосновеността на личния живот, който не се споделя от много от конкурентите му. Докато Google и Microsoft са щастливи да изсмучат персонализирани данни, които хакерите и правителството биха могли да експлоатират, Apple отказа да направи това. Като пример, Apple обяви на своята Worldwide Developers Conference, че всички приложения за iOS трябва да криптират уеб комуникациите до края на годината.

Но Apple се нуждае от данни, за да персонализира услугите си и да знае какви корекции желаят клиентите си, така че вчера Apple старши вицепрезидент на софтуерното инженерство Крейг Федерий обсъди концепция, наречена диференциална конфиденциалност, която ще бъде в софтуера iOS 10.

Според диференциала, неприкосновеността на личния живот на Apple ще "помогне за откриване на моделите на използване на голям брой потребители, без да се прави компромис с личната неприкосновеност на личността". Идеята е, че докато Apple може да вижда потребителски данни като цяло за подобряване на услугите си, данни за всеки един потребител. Това включва самата Apple, както и хакери и правителства.

Проблемите с личния живот

Как е възможно да се получат данни в съвкупност, но не на индивидуално ниво? За да разберем, че трябва да започнем с предизвикателствата, стоящи зад защитата на поверителността на потребителите.

Повечето компании полагат усилия да защитят личните ви данни и те често анонимират вашите данни и отказват да публикуват лична информация. Но хората могат да използват какви данни се разкриват, за да разберат вашите лични данни.

Това е сравнимо с намирането на истинска идентичност на потребител на интернет форум. Няма да имате истинското им име или телефонен номер, но можете да отбележите, че потребителският форум живее в Ню Йорк и отиде на среща в този ресторант. Като използвате такива факти, можете да ги стесните, докато не откриете истинската им самоличност. Както посочи Wired, изследователите успяха да направят нещо подобно през 2007 г., когато Netflix публикува списък с "анонимни" клиенти.

Това показва, че дори ако дадена компания се опитва да скрие личната си информация, хакерите могат да използват информацията, с която разполагат, за да събират лични данни. И ако компанията се опитва да скрие цялата информация, която имат, тогава те не могат да я използват в края си.

Но какво ще стане, ако цялата информация е затъмнена?

Идеята за диференциалната поверителност

Това е задачата на диференциала. Тя работи чрез алгоритмично затъмняване на данните с шум, така че хакерите никога не могат да разберат истински какво каза някой.

Много идеи за диференциация на личния живот са теоретични, разработени от технологични учени и криптолози. Но Синтия Двор, съизобретателят на разликата в поверителността според Engadget, дава пример за това как може да работи, като използва инспектор, който пита някой дали е изневерил на изпит:

Преди да отговорите, човекът трябва да обърне монета. Ако това е главата, отговорът трябва да бъде честен, но резултатът от монетата не бива да се споделя. Ако монетата излезе на опашка, човек трябва да обърне втората монета; ако това е главата, отговорът трябва да е "да". Ако втората е опашка, това е "не".

Тъй като монетата в дългосрочен план трябва да излезе на главата или опашката около петдесет процента от времето, геодезистът може грубо да отгатне колко много хора всъщност изневеряват на изпита над агрегата. Но ако една злонамерена агенция установи, че едно отделно лице отговори "да", той няма представа дали това е така, защото човекът е измамил на теста или защото е казал така, след като получи опашки и след това глави на флип на монетата си.

Действителните диференцирани алгоритми за поверителност са много по-сложни, но биха били подобни на примера за флип на монетите. Чрез създаването на математически "шум" за затъмняване на индивидуалните данни е невъзможно никой да знае някоя точка от данни, дори ако знае алгоритъма.

Потенциални опасения

Диференциалната поверителност може да означава, че Apple и други компании могат да получат данни, които им помагат, като същевременно защитават поверителността на своите клиенти. Но факт е, че голяма част от работата, свързана с диференциала на неприкосновеността на личния живот, е до голяма степен теоретична и не са провеждани малогабаритни тестове за това как тя може да работи.

Внедряването му в голям мащаб, както Apple планира да направи с iOS, без дребномащабни проучвания е рисковано.

Въпреки това диференциалната конфиденциалност не е толкова полезна в малък мащаб. Математическият шум ще затрудни по-строго данните в малък размер на извадката, като увеличи шансовете за напълно неточни данни. Помислете за примерния пример за монета. Ако наблюдателят е проучил само 10 души, възможно е осем души да са обърнали "опашките" и изследването му би било безполезно. Но ако е изследвал 10 000, е много по-малко вероятно 8 000 души да обърнат "опашките" и по този начин да може да се довери по-добре на данните си.

Диференциалната поверителност е трудна за разбиране концепция. Но ако Apple успее, може сериозно да промени начина, по който компаниите придобиват данни. Въпреки че ще има фирми, щастливи да вземат потребителски данни, фактът, че има начин да се съберат данни, без да се засяга личната неприкосновеност на личния живот, може да има огромни ефекти между компанията и клиента.