1. Chọn cách truy cập Stable Diffusion Stable Diffusion có thể được sử dụng qua nhiều cách tùy thuộc vào kỹ năng và thiết bị của bạn: Các...
1. Chọn cách truy cập Stable Diffusion
Stable Diffusion có thể được sử dụng qua nhiều cách tùy thuộc vào kỹ năng và thiết bị của bạn:
- Cách 1: Qua DreamStudio (dễ nhất)
- Truy cập dreamstudio.ai, đăng ký và sử dụng trực tiếp (xem hướng dẫn DreamStudio trước đó).
- Phù hợp cho người mới, không cần cài đặt.
- Cách 2: Cài đặt cục bộ trên máy tính
- Yêu cầu: Máy tính có GPU (khuyến nghị NVIDIA 4GB VRAM trở lên), Python, và Git.
- Phù hợp cho người dùng nâng cao muốn tùy chỉnh.
- Cách 3: Qua giao diện WebUI (AUTOMATIC1111)
- Dùng giao diện phổ biến nhất để chạy Stable Diffusion trên máy cục bộ hoặc đám mây.
- Lưu ý: Nếu bạn muốn dùng miễn phí và không cài đặt, DreamStudio là lựa chọn tốt nhất. Hướng dẫn dưới đây sẽ tập trung vào cài đặt cục bộ với WebUI và sử dụng cơ bản.
2. Cài đặt Stable Diffusion cục bộ
- Yêu cầu phần cứng:
- Windows, macOS, hoặc Linux.
- GPU NVIDIA (4GB VRAM tối thiểu, 8GB+ khuyến nghị) hoặc CPU mạnh (chạy chậm hơn).
- RAM: Tối thiểu 8GB, khuyến nghị 16GB+.
- Bước 1: Cài đặt môi trường
- Tải Python 3.10 từ python.org.
- Cài Git từ git-scm.com.
- Bước 2: Tải Stable Diffusion
- Mở terminal/command prompt, chạy lệnh:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.gitcd stable-diffusion-webui
- Mở terminal/command prompt, chạy lệnh:
- Bước 3: Tải mô hình
- Đăng ký tại huggingface.co để tải file mô hình Stable Diffusion (ví dụ: SD 1.5 hoặc SDXL).
- Đặt file .ckpt hoặc .safetensors (tải từ Hugging Face) vào thư mục models/Stable-diffusion.
- Bước 4: Cài đặt phụ thuộc
- Chạy lệnh:
pip install -r requirements.txt
- Chạy lệnh:
- Bước 5: Khởi động WebUI
- Chạy file webui-user.bat (Windows) hoặc lệnh:
python webui.py
- Truy cập giao diện tại http://127.0.0.1:7860 trên trình duyệt.
- Chạy file webui-user.bat (Windows) hoặc lệnh:
3. Tạo hình ảnh từ văn bản (Text to Image)
- Bước 1: Mở giao diện WebUI, vào tab "txt2img".
- Bước 2: Nhập prompt:
- Ví dụ: "Một con mèo trắng ngồi trên mái nhà, ánh trăng sáng, phong cách anime".
- Bước 3: Tùy chỉnh cài đặt:
- Sampling Steps: 20-50 (càng cao càng chi tiết, nhưng chậm hơn).
- CFG Scale: 7-12 (độ bám sát prompt).
- Resolution: 512x512 (mặc định), có thể tăng lên 768x768 hoặc hơn (tùy GPU).
- Negative Prompt: Nhập thứ không muốn (ví dụ: "blurry, low quality").
- Bước 4: Nhấn "Generate":
- Sau 5-60 giây (tùy phần cứng), bạn nhận được 1 hoặc nhiều hình ảnh (tùy số lượng cài đặt).
4. Chỉnh sửa và tùy chỉnh hình ảnh
- Image to Image (img2img):
- Chuyển sang tab "img2img".
- Tải lên hình ảnh khởi đầu, nhập prompt mới (ví dụ: "Biến con mèo thành phi hành gia").
- Điều chỉnh Denoising Strength (0-1): Giá trị thấp giữ nguyên nhiều chi tiết gốc.
- Inpainting:
- Chuyển sang tab "Inpainting".
- Tải hình ảnh, dùng công cụ vẽ để chọn vùng cần chỉnh sửa, nhập prompt (ví dụ: "Thêm một ngôi sao").
- Outpainting:
- Mở rộng hình ảnh bằng cách thêm khung ngoài (cần extension bổ sung như "SD WebUI Outpainting").
- Upscaling:
- Dùng tab "Extras" để tăng độ phân giải (ví dụ: từ 512x512 lên 1024x1024).
5. Xuất và chia sẻ hình ảnh
- Bước 1: Nhấp "Save" trong WebUI để tải hình ảnh dưới dạng PNG.
- Bước 2: Chất lượng:
- Tùy thuộc cài đặt ban đầu (512x512, 768x768, hoặc cao hơn với upscaling).
- Bước 3: Chia sẻ:
- Lưu vào máy hoặc đăng lên mạng xã hội.
- Lưu ý: Hình ảnh không có watermark khi chạy cục bộ.
Mẹo sử dụng Stable Diffusion hiệu quả
- Prompt chi tiết: Ví dụ, "Một con hổ trong rừng mưa, ánh sáng ban chiều, phong cách tranh sơn dầu, chi tiết cao".
- Tối ưu phần cứng: Nếu GPU yếu, giảm kích thước hình hoặc dùng CPU (chậm hơn).
- Thử nghiệm mô hình: Tải các mô hình khác từ civitai.com (như DreamShaper, Anything V5) để đa dạng phong cách.
- Kết hợp công cụ: Dùng hình từ Stable Diffusion với Runway hoặc Luma AI để tạo video.
- Cộng đồng: Tham gia Discord của Stability AI hoặc subreddit r/StableDiffusion để học hỏi prompt và mẹo.
Ưu và nhược điểm của Stable Diffusion
- Ưu điểm:
- Miễn phí khi chạy cục bộ, mã nguồn mở, tùy chỉnh không giới hạn.
- Hỗ trợ nhiều mô hình (SD 1.5, SDXL, cộng đồng đóng góp).
- Tính năng chỉnh sửa mạnh mẽ (img2img, inpainting, outpainting).
- Nhược điểm:
- Yêu cầu kỹ thuật để cài đặt và chạy cục bộ.
- Không tạo video trực tiếp.
- Cần phần cứng mạnh để đạt hiệu suất tối ưu.
Kết luận
Stable Diffusion là một công cụ AI mạnh mẽ và linh hoạt để tạo hình ảnh, đặc biệt phù hợp cho người dùng muốn kiểm soát tối đa quá trình sáng tạo. Dù cần một chút nỗ lực để cài đặt, kết quả mà nó mang lại là không giới hạn khi bạn làm chủ được.