Qwen 팀은 다중 이미지 편집과 단일 이미지 일관성에 중점을 둔 Qwen-Image-Edit의 월별 리디자인 버전인 Qwen-Image-Edit-2509를 출시했습니다. 다중 이미지 모드를 사용하면 "인물 + 제품" 또는 "인물 + 장면"과 같이 최대 1~3개의 참조 이미지를 드래그하여 모델 합성 과정에서 피사체와 소재의 일관성을 유지하고, 정렬 오류와 "스티칭" 느낌을 최소화할 수 있습니다. 단일 이미지 편집 시 얼굴은 포즈와 스타일 전반에 걸쳐 정체성을 유지하고, 제품은 광고와 포스터의 주요 특징을 유지합니다. 텍스트 편집 기능을 사용하면 콘텐츠, 글꼴, 색상 및 질감을 동시에 수정할 수 있어 긴 텍스트의 레이아웃과 텍스트 및 이미지 통합을 지원합니다.
이 버전은 ControlNet 조건부 입력(깊이, 모서리, 키포인트 등)을 기본적으로 지원하여 포즈 교체 및 구조 정렬을 용이하게 합니다. QwenChat 이미지 편집 포털, Hugging Face 모델 및 데모, GitHub 사용 설명서, ModelScope 이미지 등 공식 온라인 경험과 오픈소스 리소스를 이용할 수 있습니다. GGUF 양자화 및 ComfyUI 적용에 대한 커뮤니티 토론도 시작되었습니다. 구체적인 기능 및 모범 사례는 공식 문서 및 저장소를 참조하세요.
자주 묻는 질문
질문: 이전 버전과 비교했을 때 핵심적으로 개선된 점은 무엇인가요?
A: 여러 이미지 편집 기능이 추가되었습니다. 단일 이미지에서 문자와 제품 간의 일관성이 크게 향상되었습니다. 텍스트 편집을 통해 글꼴/색상/소재 등을 정밀하게 제어할 수 있습니다.
질문: 여러 이미지를 편집할 때 권장되는 입력량은 얼마입니까?
A: 현재 1~3장의 사진이 가장 적합하며, "사람 + 사람/사람 + 상품/사람 + 시나리오"와 같은 조합이 지원됩니다.
질문: ControlNet은 내장되어 있나요?
A: 네, 자세와 구조 제어를 위한 깊이, 모서리, 주요 지점과 같은 조건부 입력을 기본적으로 지원합니다.
질문: 모델을 체험하고 구매할 수 있는 곳은 어디인가요?
답변: QwenChat의 이미지 편집 포털을 사용할 수 있습니다. GitHub/Hugging Face/ModelScope에서는 가중치, 예제 및 온라인 데모를 제공합니다.
질문: 이건 오픈소스인가요?
A: 모델 가중치와 샘플 코드가 제공됩니다. 커뮤니티는 이미 정량화 및 워크플로우 조정을 구현했습니다. 구체적인 권한 및 사용 방법은 플랫폼 페이지를 참조하세요.