A- A A+ | Tăng tương phản Giảm tương phản

Google ra mắt Genie 3: AI tạo thế giới ảo theo yêu cầu

Google DeepMind ra mắt Genie 3, AI có thể tạo thế giới ảo tương tác theo yêu cầu, mở ra tiềm năng mới cho game, robot và nghiên cứu trí tuệ nhân tạo.

Tóm tắt nhanh:

Genie 3 của Google DeepMind tạo thế giới ảo tương tác từ mô tả văn bản.

Hoạt động thời gian thực ở 24fps, 720p; duy trì nhất quán hình ảnh và vật lý vài phút.

Hỗ trợ thay đổi môi trường bằng lệnh văn bản.

Tiềm năng ứng dụng trong game, robot, huấn luyện AI và AGI.

Genie 3: Bước tiến lớn trong tạo thế giới ảo

DeepMind, phòng thí nghiệm AI của Google, vừa công bố Genie 3, hệ thống AI có khả năng tạo môi trường ảo tương tác thời gian thực chỉ từ một đoạn mô tả văn bản. Kết quả là người dùng có thể điều khiển và khám phá các khung cảnh ảo động, chạy ở tốc độ 24 khung hình/giây và độ phân giải 720p.

Hiện Genie 3 mới hoạt động trên màn hình phẳng, chưa hỗ trợ kính thực tế ảo (VR). Với VR, yêu cầu phần cứng khắt khe hơn nhiều, chẳng hạn Quest 3 có độ phân giải mỗi mắt 2.064 × 2.208 và tần số quét 90Hz.

Khả năng tương tác và trí nhớ ngắn hạn

Khác với mô phỏng tĩnh hoặc dựng sẵn, Genie 3 tạo từng khung hình ngay lập tức, giúp phản hồi người chơi nhanh hơn và môi trường thay đổi linh hoạt. Các thế giới ảo có thể duy trì tính nhất quán hình ảnh và vật lý trong vài phút, nhờ khả năng ghi nhớ ngắn hạn để phản ánh các hành động trước đó.

Người dùng có thể trải nghiệm nhiều bối cảnh khác nhau, từ thiên nhiên, lịch sử, đến các thế giới hư cấu hoặc hoạt hình. Genie 3 còn hỗ trợ “promptable world events”, cho phép thay đổi môi trường bằng lệnh văn bản, như đổi thời tiết hay thêm vật thể mới.

Google DeepMind vừa giới thiệu Genie 3, phiên bản mới nhất của mô hình AI tạo

Ứng dụng tiềm năng

Ngoài mục đích giải trí như tái hiện Osaka thế kỷ 19 hay cho xuất hiện mô tô nước giữa kênh đào Amsterdam, Google kỳ vọng Genie 3 sẽ trở thành công cụ hữu ích cho: Huấn luyện AI thể hiện (Embodied AI); Phát triển game; Nghiên cứu trí tuệ nhân tạo tổng quát (AGI); Ứng dụng trong robot

Google ra mắt Genie 3: AI tạo thế giới ảo theo yêu cầu

Hạn chế hiện tại

Google cho biết Genie 3 vẫn đang trong giai đoạn phát triển và gặp một số giới hạn:

Phạm vi hành động hạn chế cho các “tác nhân” AI trong môi trường.

Khó mô phỏng tương tác đa tác nhân chính xác.

Chưa đạt độ chính xác địa lý hoàn hảo khi tái tạo địa điểm thực.

Khó duy trì tương tác lâu dài quá vài phút.

Khả năng hiển thị văn bản trong môi trường còn hạn chế.

Bước gần hơn tới kỷ nguyên Holodeck

Dù còn nhiều điểm cần cải thiện, Genie 3 là bước tiến đáng kể so với các video AI không tương tác hiện nay. Công nghệ này mở ra viễn cảnh các thế giới ảo sống động, nơi người dùng vừa trải nghiệm, vừa tác động và thay đổi môi trường theo ý muốn.

 

Tổng số điểm của bài viết là: 0 trong 0 đánh giá
Click để đánh giá bài viết