Lương Văn Phong, người đàn ông đứng sau DeepSeek, một 'gã mọt sách' với kiểu tóc kỳ lạ

PV (Theo Pravda) Thứ năm, ngày 30/01/2025 07:09 AM (GMT+7)
Liang Wenfeng (Lương Văn Phong), người sáng tạo ra mô hình AI DeepSeek của Trung Quốc, đã trở thành chủ đề bàn tán trực tuyến vì ngoại hình của mình.
Bình luận 0
Liang Wenfeng, người đàn ông đứng sau DeepSeek, một gã mọt sách với kiểu tóc kỳ lạ - Ảnh 1.

Liang Wenfeng đã quan tâm đến trí tuệ nhân tạo từ những năm còn là sinh viên. Ảnh CCTV

Lương Văn Phong bắt đầu làm việc cho dự án này vào năm 2021. Những người quen của ông đã coi thường công việc của anh trong dự án này vào thời điểm đó vì cho rằng đó là một sở thích kỳ lạ và sẽ chẳng mang lại kết quả gì. Văn Phong được đặt biệt danh là "kẻ mọt sách với kiểu tóc kinh khủng".

"Khi chúng tôi gặp anh ấy lần đầu, anh ấy chỉ là một gã thực sự buồn tẻ với mái tóc kinh khủng, và anh ấy kể với chúng tôi về việc xây dựng một cụm với 10.000 con chip để đào tạo các mô hình của anh ấy. Chúng tôi không coi việc đó là nghiêm túc", một trong những đối tác của doanh nhân nhớ lại. "Anh ấy không thể diễn đạt rõ ràng tầm nhìn của mình - anh ấy chỉ liên tục lặp lại, 'Tôi muốn xây dựng điều này, và nó sẽ là một bước ngoặt'".

Lương Văn Phong đã quan tâm đến trí tuệ nhân tạo từ những năm còn là sinh viên. Công ty đầu tiên Liang Wenfeng  thành lập là High-Flyer – một quỹ đầu cơ sử dụng AI để giao dịch thuật toán.

Vào cuối tháng 1, các báo cáo về việc ra mắt DeepSeek đã gây ra làn sóng bán tháo cổ phiếu công nghệ của Mỹ, khiến cổ phiếu Nvidia giảm 10%.

Liang Wenfeng (Lương Văn Phong) là ai?

Liang Wenfeng sinh năm 1985 tại Trương Giang, tỉnh Quảng Đông. Bố mẹ Liang Wenfeng là giáo viên tiểu học dạy tiếng Trung.

Trong những năm đi học, Liang đã phát triển sở thích về toán học, sau đó dẫn ông đến học tại một trường đại học địa phương, nơi ông lấy được cả bằng cử nhân và thạc sĩ về kỹ thuật thông tin và truyền thông. Chuyên ngành của ông là về thị giác máy tính.

Theo những người quen biết, khi còn là sinh viên, Lương Văn Phong là một người "kín đáo và không hòa đồng". Mặc dù vậy, vào năm 2008, giữa cuộc khủng hoảng tài chính toàn cầu, ông đã tập hợp một nhóm bạn cùng lớp để thu thập dữ liệu thị trường tài chính. Họ cùng nhau cố gắng áp dụng máy học vào giao dịch định lượng - một chiến lược dựa trên các mô hình toán học và thuật toán.

Liang Wenfeng luôn tin rằng "AI sẽ thay đổi thế giới", nhưng vào thời điểm đó, ông không có người cùng chí hướng nào có thể ủng hộ và chia sẻ ý tưởng của mình. Nhiều người thậm chí còn chế giễu ông, nói rằng ông "xem quá nhiều khoa học viễn tưởng".

Giao dịch thuật toán và mua GPU

Sau khi hoàn thành việc học, Lương Văn Phong đã thử nghiệm nhiều ứng dụng AI khác nhau trước khi tập trung vào tài chính. Năm 2015, ông đồng sáng lập quỹ đầu cơ High-Flyer, sử dụng trí tuệ nhân tạo để đưa ra quyết định đầu tư và dự đoán xu hướng thị trường.

Năm 2019, quỹ này đã thành lập High-Flyer AI để nghiên cứu giao dịch thuật toán do AI điều khiển và đầu tư 200 triệu nhân dân tệ (khoảng 2,6 tỷ rúp theo tỷ giá hối đoái của Ngân hàng Trung ương vào ngày 29/1/2024) vào việc phát triển mô hình Yinghuo. Công ty đã mua 1.100 GPU Nvidia cho mục đích này.

Đến năm 2021, High-Flyer đã đầu tư thêm 1 tỷ nhân dân tệ vào Yinghuo 2, mua 10.000 card đồ họa.

Vào thời điểm này, High-Flyer đang quản lý tài sản trị giá 100 tỷ nhân dân tệ. Công ty hoàn toàn dựa vào AI để giao dịch, hoạt động tương tự như Renaissance Technologies, chuyên về giao dịch định lượng bằng phương pháp toán học và thống kê.

Liang giải thích rằng việc mua GPU xuất phát từ sự tò mò hơn là bất kỳ logic kinh doanh bí mật nào – Liang Wenfeng muốn xem AI có thể tiến xa đến đâu. Liang Wenfeng lưu ý rằng trong khi ChatGPT của OpenAI đã cách mạng hóa ngành công nghiệp này đối với những người quan sát thông thường, những người đã tham gia vào AI đã nhận ra rằng, với việc phát hành GPT-3 vào năm 2020, trí tuệ nhân tạo sẽ đòi hỏi sức mạnh tính toán khổng lồ. Tuy nhiên, "hầu hết mọi người" vẫn không thể hiểu tại sao Lương Văn Phong lại chi nhiều tiền cho GPU như vậy.

Sự ra đời của DeepSeek

Sau khi tích lũy được khối tài sản đáng kể trong giao dịch thuật toán, Lương Văn Phong quyết định quay lại với tầm nhìn ban đầu của mình là nghiên cứu Trí tuệ nhân tạo tổng quát (AGI). Năm 2023, Lương Văn Phong tuyên bố thành lập DeepSeek – một công ty hoàn toàn tách biệt với giao dịch và độc lập với High-Flyer.

Khi tuyển dụng nhân viên, DeepSeek ưu tiên "niềm đam mê" và kỹ năng thực tế hơn là kinh nghiệm. Hầu hết lực lượng lao động của công ty bao gồm những người mới tốt nghiệp hoặc những chuyên gia đầu sự nghiệp.

Vào tháng 5/2024, công ty đã phát hành DeepSeek-V2, tiếp theo là DeepSeek-V3 vào tháng 11. Sau đó, vào tháng 1/2025, công ty đã giới thiệu DeepSeek-R1, một mô hình AI "có tư duy" giải quyết các nhiệm vụ toán học và lập trình tốt hơn hoặc ngang bằng với mô hình o1 của OpenAI.

Mời các bạn đồng hành cùng báo Dân Việt trên mạng xã hội Facebook để nhanh chóng cập nhật những tin tức mới và chính xác nhất.
Ý kiến của bạn
Tin cùng chuyên mục
Xem theo ngày Xem