Tại hội nghị công nghệ I/O 2026, Google đã trình làng phiên bản mới nhất của hệ sinh thái trí tuệ nhân tạo Gemini cùng với mô hình AI mô phỏng thế giới vật lý mang tên Omni. Sự kiện này đánh dấu bước ngoặt quan trọng trong cuộc đua phát triển AI khi Google tập trung tối ưu hóa tốc độ và chi phí cũng như mở rộng khả năng ứng dụng thực tiễn cho người dùng toàn cầu. Gemini không chỉ dừng lại ở một chatbot thông thường mà còn tích hợp nhiều tính năng thông minh vượt trội giúp cải thiện hiệu suất làm việc và trải nghiệm người dùng.
Gemini 3.5 Flash được giới thiệu như một bước tiến lớn về tốc độ xử lý và tiết kiệm chi phí so với các mô hình AI hiện đại khác. Phiên bản rút gọn này cung cấp hiệu quả cao với mức giá vận hành chỉ bằng một nửa hoặc thậm chí một phần ba so với các đối thủ cạnh tranh trong cùng phân khúc. CEO Sundar Pichai khẳng định Gemini 3.5 Flash có tốc độ “nhanh đến kinh ngạc” và sẽ trở thành mô hình mặc định phục vụ cho các dịch vụ AI của Google trên toàn cầu, bao gồm cả công cụ tìm kiếm hàng đầu thế giới.
Ngoài việc tăng tốc đáng kể, Gemini 3.5 Flash còn được cải thiện về mặt bảo mật, giảm nguy cơ tạo ra nội dung độc hại và hạn chế sai sót trong nhận diện câu lệnh của người dùng. Mô hình này tỏ ra vượt trội hơn phiên bản trước đó trên nhiều tiêu chí đánh giá như Terminal-Bench 2.1 hay MCP Atlas, đồng thời đạt tốc độ sinh token đầu ra nhanh gấp bốn lần so với nhiều mô hình mới khác. Điều này giúp rút ngắn đáng kể thời gian hoàn thành những tác vụ phức tạp từng mất hàng ngày hoặc tuần lễ, đặc biệt phù hợp cho lập trình viên, doanh nghiệp và nhà khoa học.
Theo ông Pichai, nếu các doanh nghiệp lớn chuyển 80% khối lượng công việc AI của họ sang sử dụng Gemini 3.5 Flash thì có thể tiết kiệm hơn một tỷ USD mỗi năm – số tiền này có thể tái đầu tư vào phát triển kinh doanh và đổi mới sáng tạo. Bên cạnh đó, phiên bản nâng cấp Pro đang được phát triển và dự kiến sớm ra mắt sẽ tiếp tục mở rộng khả năng của hệ sinh thái Gemini.

Gemini 3.5 Flash được tuyên bố cho hiệu quả cao với tốc độ đầu ra nhanh.
Ứng dụng Gemini cũng được làm mới với ngôn ngữ Neural Expressive đi kèm tác nhân AI cá nhân liên tục hoạt động mang tên Spark. Được xây dựng dựa trên nền tảng của mô hình Gemini 3.5, Spark có khả năng kết nối trực tiếp với các dịch vụ văn phòng như email hay tài liệu nhằm tự động phân tích, tổng hợp thông tin hoặc cảnh báo người dùng về những khoản chi tiêu bất thường hay nhiệm vụ quan trọng cần xử lý.
Một điểm đặc biệt của Spark là khả năng chạy ngầm trên thiết bị ngay cả khi màn hình khóa hoặc thiết bị tạm thời không hoạt động. Các thao tác tự động như tổng hợp nội dung cuộc họp lên tài liệu hay lọc thông tin quan trọng từ email đều diễn ra mượt mà qua giao diện Android Halo dự kiến ra mắt cuối năm nay trên nền tảng Android. Trong tương lai gần, Spark cũng sẽ tích hợp vào trình duyệt web để hỗ trợ người dùng khai thác tối đa hiệu suất làm việc trực tuyến.

Những tính năng mới sắp có mặt trên ứng dụng Gemini.
Để đảm bảo quyền riêng tư tối đa cho người dùng, tính năng Spark có thể được bật hoặc tắt tùy ý cùng khả năng chọn lọc ứng dụng kết nối riêng biệt theo nhu cầu cá nhân. Chế độ thử nghiệm ban đầu sẽ dành cho thuê bao cao cấp tại thị trường Mỹ bắt đầu từ cuối tháng 5 năm nay.
Một tính năng hữu ích khác mang tên Daily Brief giúp cung cấp bản tóm tắt cá nhân hóa mỗi buổi sáng dựa trên dữ liệu email và lịch làm việc của người dùng. Người dùng có thể yêu cầu ưu tiên loại thông tin quan trọng cũng như hướng dẫn bước xử lý tiếp theo để AI vận hành hiệu quả hơn. Hiện tính năng này hỗ trợ các thuê bao AI cao cấp tại Mỹ.
Trên nền tảng macOS, ứng dụng cũng được cập nhật thêm khả năng tích hợp Spark nhằm tự động hóa quy trình làm việc cùng hệ thống nhận diện giọng nói Rambler giúp loại bỏ những từ thừa khi chuyển đổi giọng nói thành văn bản mượt mà hơn.

Tính năng tóm tắt Daily Brief trong ứng dụng Gemini.
Đáng chú ý nhất tại I/O năm nay là sự xuất hiện của mô hình AI mô phỏng thế giới vật lý mang tên Omni – bước tiến vượt bậc so với các công nghệ trước đây chỉ áp dụng trong robot hay game điện tử. Với Omni, người dùng có thể tạo ra video chất lượng cao kết hợp giữa hình ảnh, âm thanh và văn bản dựa trên kiến thức sâu rộng về vật lý thực tế như lực hấp dẫn hay động lực học chất lỏng.
Mô hình còn có khả năng dự đoán diễn biến tiếp theo trong bối cảnh video cũng như dễ dàng chỉnh sửa qua ngôn ngữ tự nhiên bằng cách thêm nhân vật hoặc thay đổi cảnh vật mà vẫn duy trì tính nhất quán xuyên suốt video. Ngoài ra, Omni còn hỗ trợ tạo avatar số với ngoại hình và giọng nói giống thật kèm watermark SynthID nhằm minh bạch nguồn gốc nội dung do AI sản xuất.

Một video tạo bởi Gemini Omni.
Dự kiến phiên bản đầu tiên mang tên Omni Flash sẽ nhanh chóng được tích hợp vào ứng dụng trí tuệ nhân tạo chủ đạo cũng như nền tảng chia sẻ video ngắn phổ biến để đem lại trải nghiệm sáng tạo nội dung mới mẻ cho cộng đồng người dùng rộng lớn.

Google nhấn mạnh khả năng mô phỏng chính xác thế giới vật lý của Gemini Omni.
Trước những khoản đầu tư lớn vào nghiên cứu và phát triển AI đang gia tăng không ngừng tại Silicon Valley cũng như kỳ vọng từ phía thị trường chứng khoán về lợi nhuận bền vững từ công nghệ mới mẻ này đã thúc đẩy các tập đoàn công nghệ đẩy mạnh đổi mới sáng tạo liên tục. Những công cụ tác nhân AI thông minh như Spark hay Daily Brief chính là minh chứng cho chiến lược ứng dụng thực tiễn hóa trí tuệ nhân tạo nhằm giữ vững vị thế dẫn đầu trong lĩnh vực này.
Cùng lúc đó các hãng công nghệ khác cũng không đứng ngoài cuộc chơi khi vừa giới thiệu những giải pháp AI đầy hứa hẹn như Mythos – mô hình có khả năng phát hiện hàng nghìn điểm yếu bảo mật chưa từng biết trong hạ tầng phần mềm toàn cầu khiến cuộc cạnh tranh ngày càng khốc liệt và hấp dẫn hơn bao giờ hết.