Dân Việt

Các chuyên gia công nghệ bàn về “Dữ liệu lớn“

Ngọc Phạm 21/05/2015 06:00 GMT+7
Trong sự kiện “Ngày hội công nghệ FPT 2015”, ngoài chuyện khởi nghiệp thì các chuyên gia công nghệ đã thảo luận những thông tin xoay quanh vấn đề dữ liệu lớn.

Dữ liệu lớn (Big Data) đang là xu thế hiện hữu trong nhiều ngành nghề hiện nay, trong đó sử dụng công nghệ thông tin làm nền tảng. Dù muốn dù không, có thể người dùng internet sẽ bắt gặp cụm từ “dữ liệu lớn” ở đâu đó.

Thực tế, ông Betrand Bidaud, Phó Giám đốc điều hành khối nghiên cứu của Gartner cũng khẳng định, dữ liệu lớn là xu hướng hiện nay, bên cạnh xu hướng Internet of Things, điện toán đám mây, in 3D… Thậm chí, ông Bidaud còn đánh giá việc phân tích bảo mật dựa trên dữ liệu lớn như là “trái tim của nền tảng bảo mật công nghệ thế hệ mới”.

img

Ông Betrand Bidaud, Phó Giám đốc điều hành khối nghiên cứu của Gartner chia sẻ về những xu hướng công nghệ dựa trên nghiên cứu của công ty.

Theo ông Đặng Hoàng Vũ, Kỹ sư dữ liệu của FTI, dữ liệu lớn không phải mới mẻ trên thế giới nhưng chưa được khai khác mạnh tại Việt Nam. “Thậm chí có những doanh nghiệp hàng đầu về thương mại điện tử tại Việt Nam cũng đang đau đầu trong việc tận dụng dữ liệu lớn vào việc kinh doanh. Tất nhiên, nhiều doanh nghiệp đã đạt được thành công bước đầu, nhưng còn đó nhiều vấn đề cần giải quyết”, ông Vũ chia sẻ.

Ông Vũ lấy ví dụ về một vấn đề nan giải trong việc khai thác dữ liệu lớn, đó là phân tích hành vi người dùng khi có nhiều người dùng cùng sử dụng một thiết bị. Theo ông Vũ, nhóm nghiên cứu của ông vẫn đang trong quá trình nghiên cứu về vấn đề này.

Hiện có 3 giải pháp đã được đưa ra nhưng chưa hoàn toàn tối ưu. Cách thứ nhất là tận dụng các dịch vụ trực tuyến thường dùng để phân biệt chủ thể. Cách thứ hai, theo dõi hành vi và đánh giá người dùng dựa trên hành vi của họ. Cuối cùng, có thể không cần quan tâm họ là ai mà chỉ cần quan tâm họ đang làm gì.

Theo những số liệu thực tế mà ông Vũ cung cấp, Amazon đã tăng trưởng 29% doanh số sau khi khai thác dữ liệu lớn, giúp người dùng mua thêm các sản phẩm liên quan. Bên cạnh đó, YouTube với việc đưa ra gợi ý các video có thể người dùng quan tâm, cũng đã đạt được những thành công nhất định.

Tất nhiên, ông Vũ khẳng định: “Những gợi ý này không phải do con người chỉ định mà là do máy tính tự đưa ra dựa trên dữ liệu lớn và thuật toán xử lý. Cách thức này cũng giúp mang lại những thông tin phong phú, công bằng cho trang thương mại điện tử hơn so với danh mục sản phẩm mới…”.

Để làm được điều này, dữ liệu lớn phải cho biết được sở thích của người dùng. Từ đó, có thể đưa ra gợi ý cho một người mà hệ thống chưa có nhiều thông tin. Song việc khai thác dữ liệu lớn sẽ thành công ở mức cao hơn nếu cho biết được cả ý định của người dùng ở tương lai, đây cũng là điều mà các nhà khoa học làm việc trong lĩnh vực máy học đang hướng tới.

Kết luận, anh Vũ cho rằng, để đạt được thành công trong khai thác dữ liệu lớn, cần có 3 yếu tố quan trọng: Dữ liệu lớn, kỹ thuật và hiểu biết chuyên ngành đối với loại dữ liệu cần xử lý.

Còn ông Đinh Lê Đạt, Giám đốc điều hành ANTS thì bật mí thông tin: “Thực tế có những đại sứ quán đang dùng thông tin người dùng trên mạng xã hội để quyết định có nâng cấp hạng Visa cho công dân hay không”.

Cũng theo ông Đạt, nhờ việc khai thác dữ liệu lớn, các “gã khổng lồ” như Google, Facebook có thể bán dịch vụ quảng cáo theo mục tiêu. Mặc dù vậy, “chi phí quảng cáo trên Google và Facebook tăng ít nhất 70% sau mỗi năm”, ông Đạt chia sẻ khảo sát của công ty.