Sự thật về sức mạnh của DeepSeek AI từ Trung Quốc

(Hình minh họa: Solen Feyissa/Unsplash)

Thị trường công nghệ toàn cầu vừa chứng kiến một sự kiện đáng chú ý: sự xuất hiện của DeepSeek AI, một ứng dụng trí tuệ nhân tạo (AI) mới đến từ Trung Quốc. Ứng dụng DeepSeek AI Assistant nhanh chóng đạt vị trí hàng đầu trên các bảng xếp hạng ứng dụng, vượt qua cả ChatGPT. Sự kiện này gây tranh luận về sức mạnh thực sự của DeepSeek AI và những tác động tiềm ẩn của nó đối với ngành công nghiệp AI toàn cầu.

DeepSeek AI, một chatbot được phát triển bởi công ty DeepSeek, có thể được truy cập thông qua ứng dụng di động hoặc trực tuyến. Được mô tả là một ứng dụng AI tương đương với các phiên bản cao cấp của ChatGPT và Gemini Advanced, DeepSeek AI thu hút sự chú ý đặc biệt vì khả năng cung cấp dịch vụ miễn phí cho người dùng. Theo nhiều đánh giá, DeepSeek AI không chỉ cung cấp một dịch vụ tương tự mà còn được đánh giá cao về khả năng “tư duy suy luận” (Self-Reasoning), một yếu tố then chốt trong việc đánh giá trí thông minh của AI.

“Tư duy suy luận” được định nghĩa là khả năng của AI trong việc tự suy nghĩ, lập luận, và giải quyết các vấn đề một cách độc lập, là một yếu tố đánh dấu bước tiến trong lĩnh vực AI. Các công ty như OpenAI, được biết đến với ChatGPT, đã đạt được những thành tựu đáng kể trong lĩnh vực này. Tuy nhiên, DeepSeek AI cho thấy khả năng tương đương, thậm chí còn được đánh giá cao hơn về tốc độ và hiệu quả của quá trình suy luận, gây ra những phản ứng khác nhau trong cộng đồng công nghệ và tài chính toàn cầu.

Sự xuất hiện của DeepSeek AI tạo ra một làn sóng hoài nghi và lo lắng trong giới đầu tư và công nghệ Mỹ. Thị trường chứng khoán phản ứng tiêu cực, với việc vốn hóa của các công ty công nghệ giảm tới $1,000 tỷ chỉ trong một ngày. Nguyên nhân chính của sự sụt giảm này đến từ những câu hỏi được đặt ra về hiệu quả đầu tư vào AI của các công ty công nghệ Mỹ trong thời gian vừa qua. Các nhà đầu tư đặt ra câu hỏi về tính hợp lý của những khoản chi phí khổng lồ mà các công ty công nghệ Mỹ đã đầu tư vào AI, khi DeepSeek AI tuyên bố chỉ mất một phần nhỏ chi phí để tạo ra một sản phẩm tương đương.

Cổ phiếu của Nvidia, nhà sản xuất chip AI hàng đầu, giảm sâu nhất tới 17% trong số các công ty công nghệ lớn, phản ánh sự lo ngại của các nhà đầu tư về tương lai của ngành chip AI. Điều này xuất phát từ việc DeepSeek AI tuyên bố rằng họ đã huấn luyện mô hình AI của mình chỉ với chi phí khoảng $5 triệu và sử dụng số lượng chip đồ họa (GPU) ít hơn đáng kể so với các mô hình tương đương, thậm chí sử dụng chip thế hệ cũ hơn là chip H800 thay vì chip H100 cao cấp của Nvidia. DeepSeek AI tiết lộ chỉ cần 1/100 số lượng chip so với những gì các công ty công nghệ khác đã sử dụng. Sự chênh lệch này khiến các nhà đầu tư lo ngại về một sự thay đổi trong nhu cầu chip AI cao cấp, ảnh hưởng trực tiếp đến doanh thu của Nvidia và các công ty cung cấp hạ tầng AI.

Đằng sau lời tuyên bố của AI DeepSeek

Trong khi đó, một số chuyên gia cho rằng DeepSeek AI đang “nói giảm nói tránh” về nguồn lực thực sự của họ, đặc biệt là về số lượng chip AI cao cấp mà công ty này sở hữu.

Alexandr Wang, CEO của Scale AI, công ty cung cấp dữ liệu huấn luyện AI, đưa ra nhận định đáng chú ý. Scale AI có một danh sách khách hàng đa dạng bao gồm các công ty công nghệ hàng đầu của Mỹ như OpenAI, Anthropic, Google, và các tập đoàn công nghệ lớn của Trung Quốc như Alibaba, Tencent, và High-Flyer, công ty mẹ của DeepSeek AI. Phát biểu của ông Wang có giá trị tham khảo vì công ty ông có mối liên kết mật thiết với cả các công ty AI hàng đầu của Mỹ và Trung Quốc. Ông Wang cho rằng DeepSeek AI thực chất có thể sở hữu đến 50,000 chip xử lý đồ họa (GPU) NVIDIA H100, một loại chip cao cấp được sử dụng trong các hệ thống AI tiên tiến nhất. “Dựa trên những thông tin mà chúng tôi có được, DeepSeek AI có thể có nhiều GPU H100 hơn họ đã công bố,” ông Wang phát biểu trong một cuộc phỏng vấn gần đây với đài CNBC. “Việc họ không công khai có thể liên quan đến các lệnh cấm vận của Mỹ và các nỗ lực của họ trong việc giữ bí mật về nguồn lực.”

Trong bối cảnh này, nhiều nhà quan sát cho rằng DeepSeek AI có thể đang sử dụng một chiến lược marketing “Vượt-Nghèo-Học-Giỏi” để thu hút sự chú ý của giới công nghệ và người dùng. Chiến lược này dựa trên việc tạo ra một hình ảnh khiêm tốn về nguồn lực để nhấn mạnh những thành công mà họ đạt được trong lĩnh vực AI.

Để hiểu rõ hơn về vấn đề, chúng ta cần phân biệt hai giai đoạn quan trọng trong quá trình phát triển AI: giai đoạn huấn luyện (training) và giai đoạn suy luận (inference).

-Giai đoạn huấn luyện là quá trình ‘dạy’ AI học hỏi thông qua việc xử lý lượng lớn dữ liệu, đòi hỏi sức mạnh tính toán rất cao. Về mặt kỹ thuật, việc huấn luyện này có thể thực hiện hiệu quả trên các nền tảng đám mây, sử dụng hàng trăm nghìn GPU từ xa trong thời gian vài tháng. Chi phí cho giai đoạn huấn luyện có thể dự đoán và kiểm soát được, do thường thanh toán một lần và không yêu cầu kết nối mạng liên tục.

Hiện nay, các công ty công nghệ Trung Quốc đã và đang thuê các dịch vụ điện toán đám mây (cloud computing) để phục vụ cho quá trình phát triển AI. Theo các báo cáo từ giới chuyên gia công nghệ, các công ty này đang thuê các GPU hiệu năng cao từ các trung tâm dữ liệu đặt tại nước ngoài, bao gồm cả khu vực Đông Nam Á.

Một số công ty Trung Quốc được cho là đang sử dụng dịch vụ của GreenNode, một công ty con của VNG (Việt Nam) có trung tâm dữ liệu đặt tại Thái Lan, cũng như tận dụng cơ sở hạ tầng từ các trung tâm dữ liệu do FPT (Việt Nam) sở hữu. Các trung tâm này cung cấp các GPU cao cấp cần thiết cho việc huấn luyện các mô hình AI phức tạp. Đây là cách các công ty AI Trung Quốc tìm cách tiếp cận nguồn lực tính toán tiên tiến bên ngoài lãnh thổ, vượt qua các hạn chế do lệnh cấm vận công nghệ gây ra.

Doanh số bán chip của Nvidia trong năm 2024, có tới 1/4 là dành cho các trung tâm dữ liệu đặt ở nước ngoài, cụ thể là tại Singapore, chủ yếu phục vụ nhu cầu của các công ty Trung Quốc. Trong khi các công ty Trung Quốc khẳng định họ không hề thiếu nguồn lực để phát triển AI.

-Giai đoạn suy luận (Inference) là lúc AI đi vào hoạt động thực tế, cung cấp dịch vụ cho người dùng. Giai đoạn này có những yêu cầu khắt khe về hạ tầng và chi phí, đòi hỏi hệ thống phải luôn sẵn sàng để đáp ứng yêu cầu của người dùng mọi lúc, mọi nơi. Số lượng GPU cần thiết cho suy luận phụ thuộc trực tiếp vào lượng người dùng và rất khó dự đoán; nếu người dùng tăng đột biến, chi phí thuê GPU cũng tăng theo. Giai đoạn này còn đòi hỏi kết nối mạng liên tục và tốc độ cao để đảm bảo trải nghiệm người dùng mượt mà; chỉ một chút chậm trễ cũng có thể gây ra sự khó chịu. Chi phí huấn luyện có thể dự đoán trước, và kiểm soát được nhờ tận dụng điện toán đám mây, trong khi vấn đề chi phí giai đoạn suy luận nổi lên như một yếu tố then chốt, khi DeepSeek hướng đến việc cung cấp dịch vụ miễn phí trên diện rộng.

Để giải quyết bài toán chi phí này, chiến lược trở thành mã nguồn mở trở thành một lựa chọn hợp lý. Việc chia sẻ công khai mã nguồn mô hình không chỉ giúp DeepSeek tận dụng sức mạnh cộng đồng để giảm tải chi phí vận hành, mà còn tương thích với xu hướng phát triển AI hiện tại, đặc biệt là sự trỗi dậy của các mô hình ngôn ngữ nhỏ (SLMs) và phong trào AI nguồn mở. Các SLMs, với ưu điểm tiết kiệm tài nguyên tính toán, có thể chạy hiệu quả trên các thiết bị có phần cứng ‘vừa phải’ như card đồ họa gaming RTX, Raspberry Pi, hoặc thậm chí là điện thoại thông minh với chip NPU (chip tùy chỉnh thực hiện tác vụ AI trên thiết bị).

Giáo sư Yann LeCun, người đứng đầu bộ phận AI của Facebook (FAIR), công khai xác nhận rằng DeepSeek AI thực tế đã sử dụng mô hình nguồn mở LLaMA của Meta để huấn luyện AI của mình. Với nguồn lực tài chính có hạn so với các tập đoàn công nghệ khổng lồ, việc kết hợp chiến lược chia sẻ công khai công nghệ với việc tập trung vào các mô hình nhỏ gọn có thể là một nước đi chiến lược giúp DeepSeek AI cạnh tranh hiệu quả hơn.

(Hình minh họa: Solen Feyissa/Unsplash)

Tương lai ngành AI toàn cầu

Nhiều người vẫn lạc quan về những cơ hội và lợi ích mà DeepSeek AI mang lại cho thị trường AI toàn cầu. Daniel Newman, giám đốc chiến lược của Futurum, cho rằng việc có những mô hình AI hiệu quả hơn như DeepSeek sẽ giúp cho người dùng tiếp cận AI một cách rộng rãi hơn. Ông đưa ra dẫn chứng về “Nghịch lý Jevons,” quy luật kinh tế cho thấy khi một công nghệ trở nên hiệu quả hơn, thì người ta có xu hướng sử dụng nó nhiều hơn, thay vì ít đi.

CEO của Microsoft, Satya Nadella, trước đó cũng đã đề cập đến “Nghịch lý Jevons” trong bối cảnh AI ngày càng phát triển trên mạng xã hội X, cho biết: “Nghịch lý Jevons lại một lần nữa xuất hiện! Khi AI ngày càng hiệu quả và dễ tiếp cận hơn, chúng ta sẽ thấy việc sử dụng nó tăng vọt, biến nó thành một thứ hàng hóa mà chúng ta không bao giờ cảm thấy đủ.”

Việc AI hiệu quả và tiết kiệm chi phí hơn, như DeepSeek AI đang thể hiện, sẽ không làm giảm sự phát triển của ngành, mà ngược lại, có thể thúc đẩy việc ứng dụng AI rộng rãi hơn nữa. Phản ứng của thị trường chứng khoán cũng cho thấy sự lạc quan về tiềm năng phát triển của các công ty ứng dụng AI. Trong khi một số cổ phiếu của các công ty công nghệ hạ tầng AI giảm, cổ phiếu của các công ty phần mềm ứng dụng AI như Salesforce, Hubspot và Workday lại tăng.

Nhà phân tích Stacy Rasgon của Bernstein nhận xét: “Mọi người vẫn đang chi tiền mạnh tay cho AI… Tôi không nghĩ chuyện này sẽ làm chậm lại đà tăng trưởng đó đâu.”  Các chuyên gia khác cũng chia sẻ sự lạc quan về tác động tích cực của DeepSeek AI đến năng suất toàn cầu và kinh tế vĩ mô. Chuyên gia chiến lược toàn cầu Seema Shah của Principal Asset Management cho rằng sự xuất hiện của DeepSeek AI không phải là dấu chấm hết cho sự thống trị của Mỹ trong lĩnh vực AI, mà có thể là một động lực thúc đẩy sự phát triển của các công nghệ mới và năng suất trên toàn thế giới. “Tôi không nghĩ chúng ta đang ở thời điểm có thể bắt đầu nói về khả năng thị trường rơi vào vùng điều chỉnh,” bà Shah phát biểu trên Yahoo Finance. “Môi trường kinh tế vẫn rất thuận lợi cho lợi nhuận ở hầu hết các lĩnh vực. Nếu DeepSeek thực sự đúng như những gì họ tuyên bố, thì đây rốt cuộc là một điều tích cực cho năng suất trên toàn thế giới, ở mọi lĩnh vực… Chắc chắn đây không phải là dấu chấm hết cho câu chuyện về sự vượt trội và năng suất của nước Mỹ.”

Một số chuyên gia còn cho rằng sự xuất hiện của các mô hình AI hiệu quả hơn như DeepSeek AI có thể thúc đẩy sự phát triển của các lĩnh vực AI mới, như “AI hữu hình,” có nghĩa là các hệ thống vật lý được vận hành bằng AI. Adam Jonas của Morgan Stanley cho rằng điều này là có lợi cho Tesla, khi nhận định “AI hữu hình” – hay các vật thể vật lý sử dụng AI để vận hành chức năng như hệ thống xe tự hành FDS và robot Optimus của Tesla – mới có thể là yếu tố quan trọng nhất trong cuộc đua AI.

Trong một bài viết gần đây trên TechCrunch, nhà phân tích Tim Bajarin viết: “Sự xuất hiện của DeepSeek AI là một lời nhắc nhở rằng cuộc đua trong lĩnh vực AI vẫn còn rất mở. Không có công ty nào, kể cả OpenAI, có thể tự mãn với vị thế hiện tại của mình. Sự cạnh tranh sẽ chỉ làm cho AI trở nên tốt hơn và rẻ hơn.”

Dù DeepSeek AI có thể gây ra những xáo trộn nhất định trong ngắn hạn, nhưng về lâu dài, điều này có thể mang lại những lợi ích to lớn cho cả ngành công nghiệp AI và người dùng trên toàn thế giới. Sự cạnh tranh khốc liệt sẽ thúc đẩy sự đổi mới và sáng tạo, và cuối cùng sẽ giúp cho công nghệ AI trở nên tốt hơn và rẻ hơn.

Share:

Ý kiến độc giả
Quảng Cáo

Có thể bạn chưa đọc

Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Quảng Cáo
Share trang này:
Facebook
Twitter
Telegram
WhatsApp
LinkedIn
Email
Kênh Saigon Nhỏ: