Những bí mật khổng lồ trong thế giới phẳng

Vụ tiết lộ hồ sơ mật lớn nhất trong lịch sử thế giới được đặt tên là Panama Papers (Hồ sơ Panama) như một quả bom hạt nhân ảnh hưởng toàn cầu. Theo đó, có 12 cựu và đương kim lãnh đạo quốc gia và chính phủ, 140 chính trị gia của hơn 50 nước, 60 thành viên gia đình của các quan chức đã dùng những công ty vỏ bọc bên ngoài để trốn thuế, che giấu tài sản. Và cũng như số người liên quan, số lượng tài liệu lưu trữ nhiều đến mức không tưởng.

Phải thuê lập trình để xử lý dữ liệu

Hồ sơ Panama bao gồm 11,5 triệu tài liệu mật dưới dạng file số hóa có tổng dung lượng lên tới 2,6 terabyte (2.600 GB), chứa đựng thông tin về 214.488 công ty nước ngoài và 14.153 khách hàng nằm trong hồ sơ của Mossack Fonseca, hãng luật lớn thứ tư thế giới và là nhà cung cấp dịch vụ công ty có trụ sở chính ở Panama. Các hồ sơ này được lập trong một thời gian dài, từ thập niên 1970 tới cuối năm 2015.

Chính vì tính chất hồ sơ quá phức tạp mà tờ Süddeutsche Zeitung, nhật báo ở Munich có số bạn đọc đăng ký lớn nhất nước Đức, sau khi nhận được qua mạng toàn bộ Hồ sơ Panama trong năm 2015 đã tự lượng không đủ sức xử lý một mình. Và tờ báo Đức đã hợp tác với Tổ chức quốc tế Các nhà báo điều tra (ICIJ) có trụ sở ở Mỹ. Hiện nay kho hồ sơ này đang được thẩm định và phân tích bởi khoảng 400 nhà báo thuộc 107 cơ quan truyền thông ở 76 nước. Trong lịch sử báo chí thế giới, chưa bao giờ có vụ việc nào có đông nhà báo tham gia như vậy. Các báo tham gia đã phải thuê những nhà lập trình viết phần mềm giúp họ phân loại và xử lý dữ liệu. Thậm chí họ đã phải dùng máy quét ảnh với tính năng OCR để biến các tài liệu được chụp dưới dạng hình ảnh thành text.

Những bài báo đầu tiên “khui hầm bí mật” và 149 tài liệu trong Hồ sơ Panama đã được công bố trên báo chí ngày 3-4-2016. ICIJ còn tung quả bom nổ chậm khi hứa sẽ công bố danh sách đầy đủ vào đầu tháng 5-2016.

Vụ lộ Hồ sơ Panama được xem là vụ lộ thông tin dữ liệu lớn nhất hiện nay. Ảnh: INTERNET

Nhìn lại những vụ lộ thông tin lớn

Cuối tháng 11-2010, website WikiLeaks chuyên xuất bản thông tin từ những người dùng nặc danh (gọi chung là “những người thổi còi”) đã bắt đầu công bố trên mạng các bức điện tín mật do 274 cơ quan ngoại giao của Mỹ trên khắp thế giới gửi về Bộ Ngoại giao Mỹ để báo cáo những thông tin mật mà họ thu thập được các nhà ngoại giao, quan chức chính phủ, kể cả lãnh đạo quốc gia của nước mà mình hoạt động. Có 251.287 bức điện tín như thế, chứa hơn 260 triệu từ với tổng dung lượng lưu trữ 1,7 GB.

Vụ Offshore Leaks xảy ra tháng 4-2013 tiết lộ chi tiết 130.000 tài khoản ở nước ngoài của công dân 170 nước. Một số nhà quan sát đánh giá đây là vụ tiết lộ hồ sơ trốn thuế quốc tế lớn nhất xưa nay. Tổng dung lượng tài liệu của vụ này khoảng 260 GB.

Năm 2015 có vụ Swiss Leaks (hay SwissLeaks) khi Tổ chức ICIJ công bố kết quả điều tra của đạo quân hơn 130 nhà báo ở 49 nước thuộc tổ chức này, về vụ trốn thuế khổng lồ do Ngân hàng HSBC tiến hành cho hơn 100.000 khách hàng và 20.000 công ty hải ngoại thông qua chi nhánh của HSBC ở Thụy Sĩ. Đây là vụ tiết lộ hồ sơ mật lớn nhất trong lịch sử ngành ngân hàng Thụy Sĩ. Tổng số tiền ghi nhận tới hơn 180 tỉ euro. Tổng dung lượng hồ sơ 3,3 GB.

Rõ ràng là không gì có thể che giấu an toàn vĩnh viễn trong thời đại công nghệ này. Có vụ do tin tặc xâm nhập đánh cắp dữ liệu. Có vụ bởi những người bên trong do bất mãn hay vì lý do gì đó tung hê lên mạng. Về cả lý thuyết lẫn thực tế, không có công nghệ bảo mật nào là tuyệt đối (mã hóa được tạo bởi con người thì cũng do con người bẻ khóa). Cũng không có công ty nào dám bảo đảm an toàn thông tin 100%. Ngay như nhà Apple huyền thoại cũng không ít lần bị tin tặc đánh cắp những dữ liệu nhạy cảm của người dùng.

Kho dữ liệu lớn trong vụ Panama

Hồ sơ Panama quả thật là một quả bom công nghệ. Chưa bao giờ có một vụ tiết lộ tài liệu mật lại hoàn toàn dưới dạng số hóa và với dung lượng khổng lồ như vậy (phải cần tới 650 đĩa DVD ghi với mức trung bình 4 GB/đĩa). Hồ sơ gồm các email, hợp đồng, bản ghi chép và tài liệu được scan lại cũng đa dạng về định dạng: 4,8 triệu email; ba triệu file định dạng cơ sở dữ liệu; 2,2 triệu file tài liệu PDF; 1,2 triệu hình ảnh; 320.000 file text; và 2.242 file thuộc các định dạng khác.

Đọc thêm