Công cụ nâng cấp AI mới của Stable Diffusion có thể tăng gấp bốn lần độ phân giải của hình ảnh

Like Comment

Stability.AI, công ty đứng sau Stable Diffusion, đã công bố một công cụ nâng cấp dựa trên trí tuệ nhân tạo mới có khả năng tăng gấp bốn lần độ phân giải của hình ảnh.

Công cụ nâng cấp trí tuệ nhân tạo (AI) đang được phát hành dưới dạng API và Độ ổn định. AI tuyên bố nó có thể tăng kích thước của bất kỳ hình ảnh nào lên gấp bốn lần độ phân giải ban đầu mà không ảnh hưởng đến độ sắc nét.

“API Nâng cấp hình ảnh là phần bổ sung mới nhất cho bộ API chỉnh sửa và tạo hình ảnh hiện có của Stability.AI, như các API chuyển văn bản thành hình ảnh, hình ảnh thành hình ảnh và inpainting phổ biến. Công ty cho biết tính năng nâng cấp thêm vào các công cụ phổ biến đó bằng cách mở rộng hình ảnh nhỏ thành hình ảnh lớn hơn trong khi vẫn duy trì — hoặc thậm chí cải thiện — mức độ chi tiết của chúng.

Xem thêm: Picsart ra mắt máy chủ Discord, thêm bot tạo ảnh AI

“Kể từ khi hình ảnh kỹ thuật số xuất hiện, gần như không thể mở rộng hình ảnh nhỏ thành hình ảnh lớn hơn mà không làm giảm chất lượng của hình ảnh. Giờ đây, người dùng có thể chuyển một hình ảnh nhỏ vào API và nhận lại một hình ảnh với mức độ chi tiết cao hơn gấp đôi.”

Khái niệm này tương tự như các công cụ nâng cấp khác như Adobe Super Resolution hoặc Topaz Gigapixel và có hai cách hoạt động, cả hai đều là nguồn mở.

Cái đầu tiên được thiết kế cho tốc độ và được gọi là Real-ESRGAN. Stability.ai cho biết nó có thể tăng gấp đôi độ phân giải của hình ảnh 512×512 pixel điển hình trong nửa giây. Cái thứ hai chậm hơn đáng kể, nhưng mạnh hơn. Nó sử dụng mô hình nâng cấp Khuếch tán Ổn định x4 và có thể tăng gấp bốn lần độ phân giải của hình ảnh trong khoảng từ 20 đến 40 giây. Công ty nói rằng nó cung cấp kết quả chi tiết hơn và “kết cấu phong phú hơn” để đổi lấy thời gian tính toán lâu hơn đáng kể.

“Cả hai mô hình đều có thể được sử dụng để nâng cấp bất kỳ hình ảnh nào, cho dù chúng được tạo bằng API ổn định hay không. Một lợi thế chính của Trình nâng cấp 4x Khuếch tán Ổn định tiềm ẩn là quy trình khuếch tán nâng cao giúp tăng mức độ chi tiết cảm nhận được trong khi nâng cấp hình ảnh đầu vào,” Stability.AI cho biết.

“Việc giới thiệu các mô hình này phù hợp với tầm nhìn của chúng tôi là liên tục làm phong phú thêm API Nâng cấp hình ảnh bằng các mô hình tiên tiến nhất khi chúng có sẵn.”

Stability.AI đã xuất bản tài liệu đầy đủ về các API nâng cấp trên trang web của mình ngoài việc chia sẻ Real-ESRGAN trên Github và nâng cấp x4 trên Hugging Face. Công ty không lưu ý cụ thể cách thức hoặc liệu API của họ có hoạt động với ảnh thực tế hay không.

Những người đã sử dụng Ổn định cho Photoshop hoặc Ổn định cho Blender sẽ thấy các tính năng nâng cấp mới được thêm vào các phiên bản mới nhất của những tính năng đó ngay lập tức.



You might like

About the Author: Chu Thuy

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *