Dữ liệu: 'Mỏ dầu' trên không gian số
Logo của 4 công ty công nghệ lớn của Mỹ là Amazon, Apple, Facebook và Google, những công ty từng bị phạt hoặc cáo buộc vì liên quan tới các vi phạm thông tin cá nhân của khách hàng - Ảnh: REUTERS
Dữ liệu người dùng là nguồn tài nguyên vô cùng quan trọng, nó giúp các công ty hiểu rõ những quan tâm và lợi ích khách hàng, giúp họ biết cách cải thiện sản phẩm, dịch vụ tốt nhất, từ đó đem lại doanh thu cao nhất.
Do đó, tiếp cận nguồn dữ liệu chất lượng về khách hàng đang ngày càng quan trọng với các doanh nghiệp trên khắp thế giới.
"Vùng xám" pháp lý
Các công ty hoặc tự khai thác giá trị thông tin từ nguồn dữ liệu của họ, hoặc mua lại từ những nguồn khác.
Xét từ góc độ kinh tế, mua lại sẽ tiết kiệm hơn nhiều so với tự bỏ tiền thu thập, do đó không ngạc nhiên khi đây chính là "mỏ dầu" đang được rất nhiều đơn vị môi giới dữ liệu bên thứ ba khai thác.
Cũng từ đó, có một "vùng xám" giữa tính hợp pháp và phi pháp của các bộ dữ liệu được mang ra rao bán.
Tại Trung Quốc, bán dữ liệu khách hàng đã trở thành một ngành kinh doanh lớn. Bất chấp việc từ năm 2017, Trung Quốc triển khai luật an ninh mạng, trong đó có điều khoản bảo vệ người dùng khỏi việc bị sử dụng và phát tán thông tin cá nhân khi chưa cho phép, tình trạng này vẫn lan tràn.
Trang Cpomagazine năm 2018 dẫn điều tra của Hãng tin Reuters cho biết những thông tin kiểu như hồ sơ ngân hàng, lịch sử trình duyệt web, đăng ký xe và sử dụng điện thoại di động được những bên môi giới dữ liệu cá nhân rao bán rất nhiều.
Các công ty bên thứ ba này đã mua lại dữ liệu từ những nhân viên bị mua chuộc tại các ngân hàng, các nhà cung cấp dịch vụ viễn thông, Internet, thậm chí còn có nguồn rò rỉ từ hệ thống tòa án. Chưa kể còn có những dữ liệu đến từ nguồn trộm cắp hay tấn công mạng (hack).
Cũng năm ngoái, theo báo Telegraph, Công ty Amazon đã điều tra các cáo buộc liên quan một số nhân viên của hãng đã bán dữ liệu khách hàng cho các công ty thứ ba tại Trung Quốc.
Các nhân viên bị tố đã bán các dữ liệu gồm thống kê doanh số bán hàng, thông tin liên lạc của những người đánh giá chất lượng sản phẩm cho các công ty bán hàng trên Amazon. Với dữ liệu này, các doanh nghiệp có thể liên hệ với những người viết review để yêu cầu họ thay đổi nội dung đánh giá.
Dĩ nhiên không phải tất cả các đơn vị môi giới dữ liệu đều khai thác nguồn phi pháp. Cũng có rất nhiều hãng cung cấp dịch vụ này hợp pháp, họ thu thập thông tin cá nhân (và bán dữ liệu khách hàng) được thu thập từ đủ loại nguồn công cộng.
Các văn bản công khai là một lựa chọn, song thông tin mọi người tự nguyện chia sẻ trên mạng xã hội và các trang hệ thống mạng doanh nghiệp thường là nguồn dữ liệu khách hàng phong phú hơn cả.
Con gà đẻ trứng vàng
Giáo sư Howard Yu, chuyên ngành chiến lược và đổi mới tại Học viện IMD - trường đào tạo kinh doanh quốc tế hàng đầu của Thụy Sĩ, cho rằng chính năng lực thu thập và phân tích dữ liệu chứ không phải đổi mới công nghệ là cái khiến "những gã khổng lồ công nghệ" trở thành... "khổng lồ".
Facebook, Google, Amazon, Alibaba, Uber và Airbnb, tất cả đều là những mô hình kinh doanh dựa trên một nền tảng công nghệ. Kho dữ liệu người dùng họ thu được từ quá trình cung cấp dịch vụ là rất lớn.
Theo trang Fast Company, không có gì bí mật về chuyện dữ liệu cá nhân của nhiều người đang bị mua đi bán lại giữa hàng trăm, hàng ngàn công ty. Nhưng một điều ít ai biết là những công ty đó là công ty nào, và chính xác thì họ đã làm gì.
Đầu năm nay, khi bang Vermont (Mỹ) ra luật mới, bắt các công ty bán dữ liệu bên thứ ba phải công khai các hoạt động của họ, người ta đã hiểu thêm được những ngóc ngách làm ăn của các công ty đó với "mỏ dữ liệu" người dùng.
Theo đó, từ việc mua dữ liệu, các công ty đó có thể "lắp ráp" được hàng ngàn thuộc tính khác nhau của hàng tỉ người.
Chẳng hạn, ngày nay nếu bạn dùng smartphone hay thẻ tín dụng, sẽ không khó khăn gì để một công ty như thế biết rõ bạn vừa ly hôn, bạn đang mang bầu hoặc đang cố gắng giảm cân.
Họ còn biết bạn là người hướng ngoại hay hướng nội, bạn uống thuốc gì, bạn sống ở đâu, thậm chí cả thói quen lướt và chạm màn hình điện thoại của bạn nữa.
Tất cả thông tin đó có thể được dùng để phác ra những hồ sơ cá nhân về bạn, sau đó dùng chúng để tiếp cận bạn bằng những quảng cáo bán hàng (chuyện này rất phổ biến), can thiệp lá phiếu bầu cử (như trong vụ Cambridge Analytica), theo dõi nghi phạm (như cách làm của Cơ quan thực thi hải quan và di trú Mỹ)...
Việc khai thác dữ liệu người dùng đang khuếch trương nhanh đến mức khó có thể theo dõi mức độ tăng trưởng của nó. Hiện có rất nhiều doanh nghiệp sử dụng dữ liệu và công nghệ phân tích dữ liệu để duy trì năng lực và lợi thế cạnh tranh.
Tạp chí The Economist mới đây chia sẻ bài viết phản ánh việc các hãng công nghệ đang cạnh tranh những hợp đồng trị giá lên tới cả tỉ USD liên quan tới phân tích dữ liệu và rõ ràng thị trường này đang ngày càng sôi động, béo bở thêm theo thời gian.
56.000 USD
Dữ liệu người dùng thường được rao bán thông qua hệ thống "web đen" (dark web), những mạng được mã hóa ngang hàng (peer-to-peer) mà giới tội phạm mạng rất ưa chuộng.
Chẳng hạn, vụ đánh cắp dữ liệu của 130 triệu khách hàng của Huazhu Hotels Group, tập đoàn khách sạn lớn thứ tư thế giới, xảy ra cuối tháng 8 năm ngoái.
Khối dữ liệu gồm thông tin chi tiết về thanh toán và thông tin liên lạc cá nhân của khách đã được bán với giá 8 bitcoin (khoảng 56.000 USD tại thời điểm đó).