PhotoMaker:创造出一个新的、个性化的人物图像
能根据描述生成符合描述的人物照片。
也能把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。
还能改变照片人物的性别、年龄和生成多种风格的其他照片。
快速逼真,效果自然。
主要功能:
1、根据文字描述制作照片:你可以告诉它你想要的人物样子,它就能生成符合描述的人物照片。
2、混合多个人的特征:它可以把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。
3、改变年龄或性别:比如,你可以把一张男士的照片转换成女士的样子,或者让照片中的人看起来年轻或年老。
4、添加艺术风格:它还能给照片加上不同的艺术效果,比如油画风格或卡通风格。
5、现实化艺术作品/旧照片中的人物:将艺术品或旧照片中的人物带入现代。
用一个例子来解释PhotoMaker的工作原理:
假设你有三张照片:
一张你的照片。
一张你最喜欢的电影明星的照片。
一张穿着历史服装的人的照片。
现在,你想要创造一张新的照片,这张照片的人物是你,但是有着电影明星的某些特征(比如发型或表情),并且穿着历史服装。你可以将这三张照片上传到PhotoMaker。
PhotoMaker会这样工作:
它首先分析这三张照片,识别出每张照片中人物的特征,比如面部特征、发型、服装风格等。
然后,它将这些特征结合起来,创建一个新的图像。这个图像基本上是你的脸,但可能有着电影明星的发型和表情,同时穿着那张历史服装照片中的服装。
最终的结果是一张全新的照片,这张照片展示了一个独特的人物形象:看起来像你,但具有其他照片中人物的特征和风格。这就是PhotoMaker的核心功能——结合多个不同照片的特征,创造出一个全新、个性化的图像。
主要特点:
PhotoMaker使用的核心技术是“堆叠ID嵌入”。这意味着它可以将多个身份证明(ID)图像的信息合并成一个统一的数据结构。这种方法不仅能捕捉到单个ID的细微特征,还能整合多个不同ID的特征,创造出新的、个性化的图像。
1、结合多张照片的特征:PhotoMaker可以取多张照片,这些照片可以是同一个人的,也可以是不同人的。它分析这些照片中的特征,然后将它们结合起来,创造出一个新的、个性化的人物图像。
2、灵活的文本控制:与其他方法相比,PhotoMaker提供了更灵活的文本控制能力。用户可以通过文本提示来指导图像的生成,这使得创造出的图像不仅逼真,而且能更好地符合用户的具体要求。
3、高效率和快速生成:相比于需要大量微调的方法(如DreamBooth),PhotoMaker在保持身份信息的同时,提供了更快的生成速度。它能在短时间内(例如10秒)生成定制的人类照片,这对于需要快速生成结果的应用场景非常有利。
4、高身份保真度:PhotoMaker在生成图像时能更好地保持人物的身份特征。这对于需要精确保留人物特征的场景(如个性化肖像或身份识别)尤其重要。
项目及演示:https://photo-maker.github.io
论文:https://huggingface.co/papers/2312.04461
GitHub:https://github.com/TencentARC/PhotoMaker
在线体验:
https://huggingface.co/spaces/TencentARC/PhotoMaker
https://huggingface.co/spaces/TencentARC/PhotoMaker-Style
视频:https://youtu.be/WbsFSvATbEU