Cách hoạt động của Privacy Differential
Trong nhiều năm, Apple đã có một cam kết lâu dài đối với quyền riêng tư không được chia sẻ bởi nhiều đối thủ cạnh tranh của nó. Trong khi Google và Microsoft rất vui khi hút dữ liệu cá nhân mà tin tặc và chính phủ có thể khai thác, Apple đã từ chối làm như vậy. Ví dụ, Apple đã thông báo tại Hội nghị các nhà phát triển toàn cầu rằng tất cả các ứng dụng iOS phải mã hóa thông tin liên lạc web vào cuối năm.
Nhưng Apple cần dữ liệu để cá nhân hóa dịch vụ của mình và biết điều chỉnh khách hàng của họ, vì vậy vào thứ ba, phó chủ tịch cấp cao của kỹ sư phần mềm, ông Craig Federighi đã thảo luận một khái niệm gọi là sự riêng tư khác biệt .
Theo sự riêng tư khác biệt của Apple sẽ “giúp khám phá các mẫu sử dụng của một số lượng lớn người dùng mà không ảnh hưởng đến quyền riêng tư cá nhân.” Ý tưởng là trong khi Apple có thể xem dữ liệu người dùng trong tổng hợp để cải thiện dịch vụ của mình, sẽ không thể tìm được ai dữ liệu về bất kỳ người dùng nào. Điều này bao gồm chính Apple, cũng như tin tặc và chính phủ.
Các vấn đề về quyền riêng tư
Làm thế nào để có thể lấy dữ liệu trong tổng hợp chứ không phải ở cấp độ cá nhân? Để hiểu rằng chúng ta cần phải bắt đầu với những thách thức đằng sau việc bảo vệ quyền riêng tư của người dùng.
Hầu hết các công ty thực hiện một số nỗ lực để bảo vệ sự riêng tư của bạn, và họ thường sẽ ẩn danh dữ liệu của bạn và từ chối công bố thông tin cá nhân. Nhưng mọi người có thể sử dụng dữ liệu nào được tiết lộ để tìm ra dữ liệu cá nhân của bạn.
Nó có thể so sánh với việc tìm ra danh tính thực tế của người dùng trên diễn đàn Internet. Bạn sẽ không có tên thật hoặc số điện thoại của họ, nhưng bạn có thể lưu ý rằng người dùng diễn đàn sống ở New York và hẹn hò tại nhà hàng này. Bằng cách sử dụng các sự kiện như thế này bạn có thể thu hẹp nó xuống cho đến khi bạn có thể khám phá danh tính thực sự của họ. Và như Wired đã chỉ ra, các nhà nghiên cứu đã có thể làm một cái gì đó như thế này trong năm 2007 khi Netflix xuất bản một danh sách các khách hàng "vô danh".
Điều này cho thấy rằng ngay cả khi một công ty cố gắng ẩn thông tin cá nhân, tin tặc có thể sử dụng thông tin mà họ có để thu thập dữ liệu cá nhân. Và nếu công ty cố gắng giấu tất cả thông tin mà họ có, thì họ không thể sử dụng nó vào cuối của họ.
Nhưng nếu tất cả thông tin bị che khuất thì sao?
Ý tưởng đằng sau Differential Privacy
Đó là những gì khác biệt riêng tư đặt ra để làm. Nó hoạt động bằng thuật toán che khuất dữ liệu với tiếng ồn để tin tặc không bao giờ có thể thực sự tìm ra bất kỳ một người nào nói.
Rất nhiều ý tưởng đằng sau sự khác biệt về tính riêng tư là lý thuyết, được thực hiện bởi các nhà khoa học công nghệ và các nhà mật mã học. Nhưng Cynthia Dwork, nhà đồng phát minh về sự riêng tư khác biệt theo Engadget, đưa ra một ví dụ về cách nó có thể hoạt động, bằng cách sử dụng một người điều tra hỏi ai đó liệu họ có lừa dối trong một kỳ thi hay không:
Trước khi trả lời, người đó được yêu cầu lật một đồng xu. Nếu nó là người đứng đầu, phản ứng phải trung thực nhưng kết quả của đồng xu không nên được chia sẻ. Nếu đồng tiền đi lên đuôi, người đó cần phải lật một đồng xu thứ hai; nếu người đó là người đứng đầu, câu trả lời phải là “có”. Nếu câu thứ hai là đuôi, thì “không”.
Kể từ khi một đồng xu trong thời gian dài nên đi lên đầu hoặc đuôi khoảng năm mươi phần trăm thời gian, các điều tra viên gần như có thể đoán có bao nhiêu người thực sự đã gian lận về kỳ thi của họ trên tổng hợp. Nhưng nếu một cơ quan độc hại phát hiện ra rằng một cá nhân cụ thể đã trả lời "có", anh ta không biết liệu đó có phải là do cá nhân lừa dối bài kiểm tra hay vì anh ta nói vậy sau khi nhận đuôi và sau đó quay đầu lật xu.
Các thuật toán bảo mật khác biệt thực tế phức tạp hơn nhiều nhưng sẽ tương tự như ví dụ về lật xu. Bằng cách tạo ra "tiếng ồn" toán học để che khuất dữ liệu cá nhân, không ai có thể biết bất kỳ điểm dữ liệu nào ngay cả khi anh ta biết thuật toán.
Mối quan tâm tiềm năng
Sự riêng tư khác biệt có thể có nghĩa là Apple và các công ty khác có thể nhận được dữ liệu giúp họ trong khi bảo vệ sự riêng tư của khách hàng. Nhưng thực tế là phần lớn công việc xung quanh sự riêng tư vi phân đã phần lớn là lý thuyết, và không có thử nghiệm quy mô nhỏ về cách thức hoạt động của nó.
Triển khai nó trên quy mô lớn, như Apple có kế hoạch làm với iOS, mà không có thử nghiệm quy mô nhỏ là nguy hiểm.
Tuy nhiên, sự riêng tư vi phân không gần như hữu ích trên quy mô nhỏ. Tiếng ồn toán học sẽ làm lu mờ dữ liệu nhiều hơn trong một kích thước mẫu nhỏ, làm tăng cơ hội dữ liệu hoàn toàn không chính xác. Hãy suy nghĩ về ví dụ tiền xu trên. Nếu điều tra viên chỉ khảo sát 10 người, có thể là tám người có thể đã lật "đuôi", và cuộc khảo sát của ông sẽ vô giá trị. Nhưng nếu anh ta khảo sát 10.000, ít có khả năng là 8.000 người đã lật "đuôi", và do đó anh ta có thể tin tưởng dữ liệu của mình tốt hơn.
Sự riêng tư khác biệt là một khái niệm khó hiểu. Nhưng nếu Apple thành công, nó có thể thay đổi nghiêm trọng cách các công ty thu thập dữ liệu. Mặc dù sẽ có các công ty vui lòng lấy dữ liệu người dùng, thực tế là có cách thu thập dữ liệu mà không ảnh hưởng đến quyền riêng tư cá nhân có thể có tác động rất lớn giữa công ty và khách hàng.