Bạn đã bao giờ tưởng tượng ra một cuộc video call mà ở đầu dây bên kia, không phải là một người bạn, mà là một trợ lý AI? Không phải kiểu robot giọng đều đều, vô cảm đâu nhé. Mà là một “người” có thể nhìn, hiểu, và trò chuyện với bạn một cách tự nhiên đến kinh ngạc, thậm chí còn biết “chỉ trỏ” vào những thứ bạn đang tìm kiếm.
Viễn cảnh ấy không còn xa nữa đâu. Google vừa tung ra một “cú hit” chấn động làng công nghệ: một bản nâng cấp toàn diện cho Gemini Live, biến trợ lý ảo này trở thành một người đồng hành trực quan và sống động hơn bao giờ hết. Đây không chỉ là một bản cập nhật phần mềm thông thường, mà là một bước nhảy vọt, mở ra một kỷ nguyên giao tiếp hoàn toàn mới giữa người và máy.
Khi AI biết “chỉ trỏ” – Cây đũa thần trong túi bạn
Hãy quên đi việc mô tả vật thể một cách khó khăn cho AI. Với tính năng đột phá nhất trong lần nâng cấp này, bạn chỉ cần hướng camera điện thoại về phía một vật thể và hỏi. Gemini sẽ không chỉ nhận diện, mà còn khoanh vùng và làm nổi bật vật đó ngay trên màn hình của bạn!
Thử tưởng tượng bạn đang loay hoay tìm một chiếc tua vít cụ thể giữa một hộp đồ nghề lộn xộn. Thay vì phải bới tung mọi thứ lên, bạn chỉ cần đưa điện thoại lên và hỏi: “Gemini, cái tua vít đầu dẹt ở đâu?”. Ngay lập tức, một vòng tròn sáng sẽ xuất hiện quanh đúng vật bạn cần. Thật kỳ diệu, phải không?
Đây chính là tương lai của tương tác thông minh, nơi AI không chỉ nghe, mà còn “nhìn” và “chỉ” cho chúng ta. Tin vui cho các fan của Google là tính năng đỉnh cao này sẽ ra mắt đầu tiên trên các thiết bị Pixel 10 vào ngày 28 tháng 8 tới, trước khi được phổ biến rộng rãi sang các thiết bị Android khác và cả iOS.
Một giọng nói “chạm” đến cảm xúc
Và cuối cùng, linh hồn của một cuộc trò chuyện chính là giọng nói. Google đã cải tiến mạnh mẽ mô hình âm thanh, giúp giọng nói của Gemini trở nên tự nhiên, có nhịp điệu và ngữ điệu linh hoạt như người thật. Gemini giờ đây có thể thay đổi tông giọng để phù hợp với ngữ cảnh cuộc trò chuyện, tạo cảm giác thân thiện và dễ chịu hơn rất nhiều. Đó không còn là giọng nói của một cỗ máy, mà là của một người bạn đồng hành thực sự.
Tóm lại
Bản nâng cấp của Gemini Live không chỉ là một bước tiến về công nghệ, nó còn định hình lại cách chúng ta tương tác với thế giới số. Từ một trợ lý giọng nói, Gemini đang chuyển mình thành một đối tác có tri giác, có khả năng nhìn, hiểu và giao tiếp một cách đáng kinh ngạc.
Chúng ta đang đứng ở ngưỡng cửa của một tương lai nơi ranh giới giữa người và máy ngày càng trở nên mong manh. Bạn nghĩ sao về tương lai này? Liệu chúng ta đã sẵn sàng cho những người bạn AI “thật” như thế này chưa? Hãy chia sẻ suy nghĩ của bạn ở phần bình luận nhé!