东风 明敏 发自 凹非寺
量子位 | 公共号 QbitAI
AI工具秒做电商图 ,元购一张惟独一块钱 ,人图老本直降99%!布景本
随意上传一张照片,随意服饰巩固,换国改头换脸 :
走南闯北即可配入种种布景,具降光影也能做作泛起 :
小哥哥也有哦 ,电商还能自动补全扩展,模特恣意修正图片巨细:
哪怕不真人图 ,元购惟独人台照,人图也可揭示上身下场:
致使可能跨次元,布景本把2次元纸片人的随意服饰酿成3D着实气焰 。
这下场 ,换国乍一看很难分说出是AI天生的啊。
如斯一来 ,商家岂不是无需妨碍大批线下拍摄,省去换景离奇使外出拍图的步骤,在电脑前即可做出丰硕商品图?
啥情景,电商模特这碗饭也要端不住了?
1分钟做一张AI模特图
如上提到的AI工具,名叫小K电商图。
如今能提供4种电商图生乐成用 :
种种下场惟独3步即可搞定,界面颇为深入易懂,操作流程约莫在1分钟摆布 。
好比选一张迪丽热巴的照片 ,想替换人脸以及神色 ,而且把布景交流成T台 ,同时调解图片尺寸。
需要先上传图像 ,零星会自动对于图像妨碍分割,选中想要保存的地域 。
(假如服饰被头发遮住可能同时保存头发))
而后再设定想修正的元素,搜罗模特人脸气焰 、面部神色、布景等。
同时可能勾选一些特殊处置,填补服饰。
在这里,咱们设定将原图人像换成一位欧美模特 、露齿笑、布景为T台,并扩展了原图尺寸 。
可能看到生乐成果中,很好保存了服饰以及发型,可是其余元素都妨碍了响应调解。
而且对于发丝、光影都重新做了处置。布景也是AI重新残缺天生的 ,差距于传统PS抠图 。
一次天生会给出4张图,利便筛选 。
天生图片布景的细节也可能处置患上很好 ,好比雪景布景下 ,人物鞋子上都市被加之雪花 。
在小K电商图里,提供的AI模特规范比力多,差距地域、差距年纪都有拆穿困绕。
假如对于现有模特不知足 ,还可逍遥定制专属模特,定制化方式有两种 :
除了AI模特 、真人,二次元人物也可定制。
可交流的AI布景也很丰硕。
据介绍,自界说布景功能、物品图天生也即将推出。
以是,小K电商图是若何实现这些下场的呢 ?
散漫自研姿态算法
小K电商图的底层技术可能重大散漫为两部份 :天生+操作 。
天在行腕来自开源的Stable Diffusion 。
操作方面则引入了小K自研的一系列算法 ,其中以姿态算法最为突出。
要知道 ,AI画画很长一段光阴都无奈画大盗手,在可控性上展现也比力差,这是由于散漫模子自己的特色使然。
后续随着ControlNet泛起,经由给预磨炼散漫模子削减一个格外的输入 ,可能操作Stable Diffusion天生的细节。
这里可能是种种规范的输入,搜罗草图 、边缘图像、语义分割图像、人体关键点特色、霍夫变更检测直线、深度图、人体骨骼等。
由此 ,Stable Diffusion加之人体姿态估量算法(Openpose)可能很好操作人物措施天生。
小K电商图的技术逻辑也是如斯,不外他们接管了功能愈加晃动的自研算法 。
基于这套算法 ,小K的另一款视频动捕产物——小K直播姬已经实现为了经由艰深RGB摄像头 、无需任何传感器 ,即可实现3D动捕。
而且在手指细节的处置上展现很好 。
因此,对于不四肢的人台图,小K电商图可能做到直接识别。自动填补头部 、画手能耐提升也患上益于该算法。
在处置了姿态可控后 ,还需要处置面部可控。在这方面小K电商图引入了LoRA 。
LoRA原本是微软钻研团队早在2021年提出的一项狂语言模子微调的技术 ,可能大猛后退微调磨炼速率 。
去年底,韩国迷信技术院KAIST一位钻研员@cloneofsimo与HuggingFace相助,将此措施扩展到Stable Diffusion上。
不光实现为了单块11GB显存的RTX2080Ti实现模子残缺微调,同时原始模子权重解冻,新磨炼进去的权重可能保存为3MB巨细的单个文件宣告。
这项技术被AI绘画喜爱者用来让模子牢靠天生一个物体,最盛行的便是牢靠一总体物抽象。
在CivitAI社区里,每一个微调好的权重就叫做一个Lora,就至关于一总体物模版,所有人都可能利便下载运用。
最后在布景方面,为了知足电商场景下的需要 ,小K也做了更强的操作。
好比一些情景下