Thanh Thúy
Well-known member
Một AI mới tên Yolov8 hứa hẹn tạo ra bước đột phá trong lĩnh vực xử lý video với khả năng nhận diện và xóa bỏ vật thể không mong muốn trong video theo thời gian thực.
"Yolov8 hoạt động dựa trên việc chia nhỏ khung hình video thành một mạng lưới các ô. AI sẽ dự đoán, phân loại và xóa bỏ những vật thể không mong muốn xuất hiện trong mỗi ô này," Serhii Postupaiev, thành viên nhóm nghiên cứu tại Đại học Công nghệ Kaunas (Litva), cho biết.
Cái tên Yolov8, viết tắt của "You Only Look Once" (Bạn chỉ nhìn một lần), xuất phát từ ý tưởng xử lý triệt để các cảnh quay vô tình lọt người quay phim hoặc vật thể không phù hợp. Công nghệ này được kỳ vọng sẽ mang lại lợi ích lớn cho các sự kiện phát sóng trực tiếp.
Để huấn luyện AI, nhóm nghiên cứu đã sử dụng bộ dữ liệu khổng lồ, lên tới hàng nghìn gigabyte, bao gồm video quay từ nhiều thiết bị khác nhau, với kích thước và định dạng đa dạng trong nhiều điều kiện khác nhau. Công cụ được sử dụng là Video Inpainting, một công nghệ học sâu hoạt động tương tự Spot Healing Brush (công cụ xóa vật thể trên ảnh) của phần mềm Photoshop.
"Nhờ AI, các chương trình phát sóng trực tiếp sẽ trở nên chuyên nghiệp và mượt mà hơn, không bị gián đoạn bởi những sự cố ngoài ý muốn. Kỹ thuật viên có thể dễ dàng loại bỏ những chi tiết thừa trong cảnh quay," Postupaiev cho biết. "Công nghệ này cũng giúp quá trình biên tập video trở nên đơn giản hơn."
Ứng dụng đầu tiên của Yolov8 sẽ là trong lĩnh vực bóng đá, tập trung vào việc loại bỏ các chi tiết gây sao nhãng trong quá trình tường thuật trực tiếp. Nhóm nghiên cứu cũng có kế hoạch mở rộng ứng dụng của công nghệ này sang nhiều lĩnh vực khác trong tương lai. Tuy nhiên, họ chưa công bố kế hoạch thương mại hóa cụ thể.
Mặc dù đã có những phần mềm tương tự được phát triển trước đó, Yolov8 được xem là mô hình AI hoàn thiện đầu tiên có khả năng xử lý video trực tiếp.
"Yolov8 hoạt động dựa trên việc chia nhỏ khung hình video thành một mạng lưới các ô. AI sẽ dự đoán, phân loại và xóa bỏ những vật thể không mong muốn xuất hiện trong mỗi ô này," Serhii Postupaiev, thành viên nhóm nghiên cứu tại Đại học Công nghệ Kaunas (Litva), cho biết.
Cái tên Yolov8, viết tắt của "You Only Look Once" (Bạn chỉ nhìn một lần), xuất phát từ ý tưởng xử lý triệt để các cảnh quay vô tình lọt người quay phim hoặc vật thể không phù hợp. Công nghệ này được kỳ vọng sẽ mang lại lợi ích lớn cho các sự kiện phát sóng trực tiếp.
Để huấn luyện AI, nhóm nghiên cứu đã sử dụng bộ dữ liệu khổng lồ, lên tới hàng nghìn gigabyte, bao gồm video quay từ nhiều thiết bị khác nhau, với kích thước và định dạng đa dạng trong nhiều điều kiện khác nhau. Công cụ được sử dụng là Video Inpainting, một công nghệ học sâu hoạt động tương tự Spot Healing Brush (công cụ xóa vật thể trên ảnh) của phần mềm Photoshop.
"Nhờ AI, các chương trình phát sóng trực tiếp sẽ trở nên chuyên nghiệp và mượt mà hơn, không bị gián đoạn bởi những sự cố ngoài ý muốn. Kỹ thuật viên có thể dễ dàng loại bỏ những chi tiết thừa trong cảnh quay," Postupaiev cho biết. "Công nghệ này cũng giúp quá trình biên tập video trở nên đơn giản hơn."
Ứng dụng đầu tiên của Yolov8 sẽ là trong lĩnh vực bóng đá, tập trung vào việc loại bỏ các chi tiết gây sao nhãng trong quá trình tường thuật trực tiếp. Nhóm nghiên cứu cũng có kế hoạch mở rộng ứng dụng của công nghệ này sang nhiều lĩnh vực khác trong tương lai. Tuy nhiên, họ chưa công bố kế hoạch thương mại hóa cụ thể.
Mặc dù đã có những phần mềm tương tự được phát triển trước đó, Yolov8 được xem là mô hình AI hoàn thiện đầu tiên có khả năng xử lý video trực tiếp.