Trong bối cảnh trí tuệ nhân tạo vẫn phụ thuộc vào hạ tầng đám mây, việc một mô hình có thể hoạt động trực tiếp trên thiết bị cá nhân đang trở thành bước ngoặt lớn. Google vừa công bố Gemma 4, dòng AI gọn nhẹ nhưng hiệu năng cao, hướng đến khả năng triển khai trực tiếp trên laptop, điện thoại và các thiết bị nhúng.
Gemma 4 là thế hệ mới trong dòng mô hình AI “open weight” của Google, được phát triển dựa trên nền tảng công nghệ từ hệ sinh thái Gemini. Theo tài liệu kỹ thuật do Google công bố, mô hình này được thiết kế với mục tiêu tối ưu hiệu năng trên mỗi tham số, giúp duy trì khả năng xử lý cao trong khi giảm đáng kể yêu cầu phần cứng.
Một điểm đáng chú ý là Gemma 4 có nhiều cấu hình khác nhau, từ các phiên bản nhỏ dành cho thiết bị di động đến các bản lớn hơn phục vụ máy trạm. Cách tiếp cận này cho phép cùng một nền tảng AI có thể hoạt động trên nhiều môi trường, từ smartphone đến hệ thống chuyên dụng.
Khác với các mô hình như GPT-4 vốn phụ thuộc vào máy chủ mạnh, Gemma 4 có thể được tải về và chạy trực tiếp trên CPU hoặc GPU của thiết bị. Điều này giúp giảm rào cản triển khai, đặc biệt với cá nhân và doanh nghiệp nhỏ.
Bên cạnh đó, việc phát hành theo hướng mở cho phép cộng đồng phát triển dễ dàng tùy chỉnh, tích hợp và xây dựng ứng dụng riêng, từ chatbot, trợ lý lập trình đến các hệ thống xử lý dữ liệu nội bộ.
Khả năng hoạt động offline là điểm khác biệt quan trọng của Gemma 4. Thay vì gửi dữ liệu lên máy chủ để xử lý, toàn bộ quá trình có thể diễn ra trực tiếp trên thiết bị người dùng.
Điều này mang lại lợi ích lớn về quyền riêng tư. Các dữ liệu nhạy cảm như tài liệu công việc hay thông tin cá nhân không cần rời khỏi thiết bị, giúp giảm nguy cơ rò rỉ. Đây là yếu tố ngày càng được quan tâm khi AI được sử dụng rộng rãi trong đời sống và công việc.
Ngoài ra, AI offline giúp cải thiện đáng kể tốc độ phản hồi. Khi không phụ thuộc vào kết nối mạng, các tác vụ như soạn thảo văn bản, dịch thuật hoặc hỗ trợ lập trình có thể được xử lý gần như tức thì.
Một lợi ích khác là chi phí. Khi không phụ thuộc vào dịch vụ đám mây hay API, người dùng có thể giảm đáng kể chi phí vận hành AI trong dài hạn.
Gemma 4 là một ví dụ rõ nét cho xu hướng lớn của ngành công nghệ, khi nhiều tập đoàn như Apple, Qualcomm hay Google đang chuyển hướng sang AI on device: Apple đã tích hợp các tính năng AI trực tiếp trên thiết bị trong hệ sinh thái của mình, trong khi Qualcomm phát triển các dòng chip với bộ xử lý AI chuyên dụng.
Sự kết hợp giữa phần cứng ngày càng mạnh và mô hình AI tối ưu hóa đang giúp việc triển khai AI trở nên linh hoạt hơn, có thể hoạt động trực tiếp trên nhiều loại thiết bị khác nhau. Tuy vậy, cách tiếp cận này vẫn tồn tại những hạn chế, đặc biệt về giới hạn tài nguyên và khả năng cập nhật dữ liệu theo thời gian.
Dù còn thách thức, khoảng cách giữa AI đám mây và AI trên thiết bị đang dần được thu hẹp. Nhiều chuyên gia cho rằng trong tương lai gần, hai mô hình này sẽ cùng tồn tại và bổ trợ lẫn nhau.
Sự xuất hiện của Gemma 4 cho thấy một hướng đi rõ ràng của ngành AI, khi trọng tâm dần chuyển từ hạ tầng đám mây sang thiết bị cá nhân. Nếu xu hướng này tiếp tục phát triển, AI sẽ không chỉ nhanh hơn và riêng tư hơn mà còn hiện diện trực tiếp trên từng thiết bị, thay vì chỉ nằm trong các trung tâm dữ liệu như trước đây.
Tàu Orion đã đưa bốn phi hành gia Artemis II vào vùng ảnh hưởng lực hấp dẫn của Mặt Trăng ngày 6/4, sẵn sàng cho chuyến bay vòng qua phía xa Mặt Trăng. "Tất cả đều vô cùng hào hứng cho ngày mai. Nhóm vận hành chuyến bay và nhóm khoa học đều sẵn sàng bay ngang qua Mặt Trăng lần đầu tiên sau hơn 50 năm", Lori Glaze, phó quản lý phụ trách Chương trình Phát triển Hệ thống Thám hiểm của NASA, cho biết.
"Bốn chúng tôi đã ngắm nhìn Mặt Trăng suốt cả cuộc đời, và cách chúng tôi phản ứng với những gì thấy ngoài cửa sổ chẳng khác nào những đứa trẻ mãi không biết chán. Thật tuyệt vời", Reid Wiseman, chỉ huy nhiệm vụ Artemis II, nói với trung tâm điều khiển khi tàu Orion tới gần Mặt Trăng. Ông cùng đồng đội - phi công Victor Glover, chuyên gia nhiệm vụ Christina Koch và Jeremy Hansen - sẽ là những người đầu tiên quan sát cận cảnh Mặt Trăng kể từ nhiệm vụ Apollo 17 năm 1972.
NASA cho biết có 10 mục tiêu khoa học và 35 mục tiêu khác mà phi hành đoàn cần hướng tới. Phi hành đoàn sẽ làm việc theo ca hai người trong giai đoạn chính kéo dài 5 tiếng của chuyến bay vòng. Họ sử dụng ứng dụng Lập kế hoạch Mục tiêu Mặt Trăng trên máy tính bảng để ghi lại các quan sát bằng âm thanh, đồng thời chụp hàng nghìn bức ảnh về hố trũng, đồng bằng và núi trên thiên thể này.
Tên lửa Hệ thống Phóng Không gian (SLS) cùng tàu Orion rời bệ phóng tối 1/4 (5h35 ngày 2/4 giờ Hà Nội) đưa phi hành đoàn Artemis II bay lên không gian, thực hiện nhiệm vụ có người lái đầu tiên của NASA tới Mặt Trăng sau 54 năm. Phi hành đoàn được ví "đại diện cho thế giới", khi lần đầu có phụ nữ, người da màu và thành viên không phải người Mỹ bay tới Mặt Trăng.
Tuy nhiên, mọi thứ có thể sớm giải quyết sau khi Trung Quốc ban hành tiêu chuẩn quốc gia bắt buộc đầu tiên cho pin dự phòng, bắt đầu có hiệu lực từ ngày 1.4.2027.
Điểm đầu tiên trong quy định nhằm giải quyết nguyên nhân chính dẫn đến cháy nổ pin: tế bào pin bị hư hại bởi các sự cố như rơi, ép hoặc đâm thủng. Theo quy định, pin dự phòng sẽ phải trải qua bài kiểm tra đâm kim, mô phỏng chính xác tình huống xấu nhất có thể xảy ra. Nếu một tế bào pin bắt lửa hoặc phát nổ khi bị đâm thủng, nó sẽ bị loại ngay lập tức.
Bước kiểm tra này sẽ loại bỏ những tế bào pin kém chất lượng, vốn phổ biến trong thị trường pin dự phòng giá rẻ trong nhiều năm qua. Để vượt qua bài kiểm tra này, các nhà sản xuất cần sử dụng chất hóa học và cấu trúc pin an toàn hơn - những thứ không thể làm giả.
Tiêu chuẩn mới cũng nhắm vào hiện tượng phổ biến trên pin dự phòng giá rẻ: nhãn mác ghi 20.000 mAh, hiệu suất thực tế thấp hơn nhiều. Cụ thể, các công ty cần ghi rõ ràng và chính xác về cả công suất lẫn tuổi thọ sản phẩm. Việc thực thi các yêu cầu này sẽ loại bỏ một trong những hình thức lừa đảo phổ biến nhất trong ngành giúp người dùng nhận được sản phẩm đúng như quảng cáo.
Trước khi tiêu chuẩn được áp dụng chính thức, đã có 28 nhà sản xuất tế bào pin lớn, bao gồm ATL, BYD, Lishen và Huizhou Marathon, tham gia vào các bài kiểm tra sơ bộ. Năm công ty này đã cung cấp giải pháp chip và BMS (hệ thống quản lý pin điện tử) cũng đã vượt qua các bài kiểm tra ban đầu.
Sự tham gia tích cực của ngành công nghiệp trước khi tiêu chuẩn mới có hiệu lực bắt buộc cho thấy các nhà sản xuất đang nghiêm túc chuẩn bị thay vì chờ đợi hạn chót. Trong thực tế, đây được xem là khoảng thời gian chuẩn bị hợp lý cho các công ty nhằm tránh tình huống phải vội vàng giải quyết khi thời gian thực thi bắt đầu được áp dụng.
Kết quả là pin dự phòng tại Trung Quốc sẽ thực sự trở nên an toàn hơn và tác động không nhỏ với thị trường, đặc biệt khi đây là nguồn cung phần lớn pin dự phòng giá cả phải chăng cho toàn cầu.
Theo Android Authority, chủ các kênh YouTube cáo buộc Apple bí mật thu thập video từ nền tảng của họ để huấn luyện các mô hình AI mà không có sự cho phép, không trả tiền và không ghi công.
Vụ kiện liên quan đến các kênh như h3h3Productions, cùng các nhà sáng tạo nội dung về golf như Golfholics và MrShortGame Golf. Các nguyên đơn cho rằng Apple không chỉ đơn thuần liên kết đến nội dung mà còn vượt qua các biện pháp bảo vệ của YouTube để tải xuống và sử dụng video trực tiếp. Họ lập luận rằng hành động này vi phạm Đạo luật Bản quyền Thiên niên kỷ Kỹ thuật số (DMCA), vốn cấm hành vi vượt qua các hệ thống bảo vệ tài liệu có bản quyền.
Đơn kiện cũng chỉ ra rằng Apple đã thu được lợi nhuận đáng kể từ việc sử dụng nội dung của các nhà sáng tạo để xây dựng hệ thống AI của mình mà không bồi thường cho những người đã tạo ra các video đó. Vụ kiện nhấn mạnh đến bộ dữ liệu có tên Panda-70M, được các nhà nghiên cứu của Apple đề cập trong một bài báo năm 2025 về tạo video bằng AI. Panda-70M là một chỉ mục lớn gồm các video clip trên YouTube, được phân đoạn và sắp xếp theo URL, dấu thời gian và mã định danh.
Các nguyên đơn cho rằng việc truy cập các đoạn video này đồng nghĩa với hành vi vượt qua các biện pháp bảo vệ của YouTube, biến mỗi đoạn video thành một hành vi thu thập dữ liệu trái phép. Họ cũng khẳng định video của họ xuất hiện hàng trăm lần trong tập dữ liệu này.
Hiện tại, Apple chưa cung cấp thông tin chi tiết về cách họ xử lý dữ liệu, nhưng các tài liệu nghiên cứu của công ty xác nhận video từ YouTube đã được sử dụng trong quá trình huấn luyện AI. Vụ kiện đang yêu cầu bồi thường thiệt hại và có thể cả lệnh cấm đối với hành vi này.