Giải pháp giúp người dùng ngăn chặn Meta dùng dữ liệu cá nhân để đào tạo mô hình AI

Vào Th9 16, 2023 63

Nếu người dùng không muốn Meta sử dụng dữ liệu của họ để đào tạo các mô hình AI và muốn lấy lại quyền kiểm soát dữ liệu của mình, họ có thể yêu cầu Meta xóa dữ liệu của bên thứ ba bằng cách thực hiện theo các bước sau:

Đi tới biểu mẫu Facebook’s Generative AI data subject rights form (Quyền của chủ thể dữ liệu đối với AI tạo sinh trên Facebook). Bây giờ người dùng sẽ thấy ba tùy chọn và có thể yêu cầu Facebook cung cấp tất cả dữ liệu nó có về bạn hoặc bạn có thể xóa dữ liệu đó. Chọn tùy chọn thứ hai để xóa dữ liệu. Sau khi chọn, hãy điền vào quốc gia cư trú, tên và địa chỉ email.

Mặc dù biểu mẫu không đề cập đến vấn đề này nhưng nên sử dụng địa chỉ email dùng để tạo tài khoản Facebook của mình khi điền vào biểu mẫu. Khi hoàn tất, hãy nhấp vào gửi để gửi thông tin chi tiết đến Facebook. Meta chưa đề cập đến mốc thời gian thực hiện sau khi yêu cầu được gửi đi. Sau khi nhận được yêu cầu của, Meta sẽ xem xét và hành động phù hợp với chính sách về quyền riêng tư của quốc gia nơi người dùng cư trú.

Hiện tại, người dân tại EU có nhiều khả năng lấy được thông tin cá nhân, sửa đổi thông tin… so với những người dùng ở những nơi khác. Đó là bởi vì EU có luật về bảo vệ dữ liệu và quyền riêng tư nghiêm ngặt hơn nhiều so với bất kỳ nơi nào khác trên thế giới.

Meta cung cấp cho người dùng tùy chọn thay đổi hoặc xóa bất kỳ dữ liệu cá nhân nào của họ mà công ty sử dụng để đào tạo ngôn ngữ lớn và mô hình AI liên quan. Ảnh minh họa

Meta định nghĩa thông tin của bên thứ ba là dữ liệu “được cung cấp công khai trên Internet hoặc các nguồn được cấp phép”. Hãng cho biết loại thông tin này “có thể đại diện cho một số trong số hàng tỷ mẫu dữ liệu” được sử dụng để đào tạo AI bằng cách dùng những gì thu thập được cho tổng hợp, dự đoán và tạo ra nội dung mới.

Trong bài đăng trên blog mới đây, Meta cho biết họ lấy thông tin công khai này, bên cạnh việc dùng dữ liệu được cấp phép từ các đối tác. “Để dạy mô hình theo cách hiệu quả, chúng tôi cần một lượng dữ liệu lớn. Do đó, chúng tôi dùng kết hợp các nguồn khác nhau trong quá trình đào tạo. Những nguồn này gồm thông tin công khai trên mạng, thông tin được cấp phép, cũng như thông tin từ các sản phẩm và dịch vụ của Meta”, bài viết nêu. Xuyên suốt quá trình thu thập, Meta có thể lấy được cả thông tin cá nhân. Chẳng hạn một bài viết công khai có thể chứa thông tin tác giả. Công ty nói trong quá trình lấy dữ liệu, quyền riêng tư của người dùng được đảm bảo và có đội ngũ chuyên trách để làm điều này.

Meta hiện vận hành mô hình ngôn ngữ lớn LLaMA, được công bố đầu năm nay. Nó hoạt động dưới dạng mở, cho phép nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí. Phát ngôn viên Meta cho biết phiên bản LLaMA thế hệ mới, LLaMA 2, chưa sử dụng dữ liệu của người dùng trên các nền tảng như Facebook, Instagram của Meta để huấn luyện AI. “Tùy vào nơi sinh sống, mọi người có thể thực hiện quyền làm chủ dữ liệu, có thể phản đối chúng tôi khai thác một số dữ liệu nhất định để đào tạo AI”, phát ngôn viên Meta nói. “Họ có quyền biết thông tin của họ đang được chúng tôi sử dụng thế nào”.

Đến nay, hầu hết công ty công nghệ như Meta, Microsoft, Google hay OpenAI vẫn thu thập dữ liệu công khai trên Internet để phục vụ quá trình huấn luyện AI. Tuy nhiên, giới chuyên môn nhiều lần đặt câu hỏi về việc lượng lớn thông tin thu được đang sử dụng vào mục đích gì. Tuần trước, liên minh gồm các cơ quan bảo vệ dữ liệu từ Anh, Canada, Thụy Sĩ và một số quốc gia khác đưa ra tuyên bố chung rằng các công ty công nghệ lớn như Meta, Alphabet, ByteDance, X, Microsoft cần phải tuân theo luật bảo vệ dữ liệu và quyền riêng tư tùy theo những nơi đang hoạt động. Nhóm khuyến cáo người dùng cần có ý thức cao hơn trong việc kiểm soát và bảo vệ thông tin đưa lên Internet.

Khánh Mai (t/h)

Nguồn: Tạp chí điện tử chất lượng Việt Nam