这篇文章将通过一个真实的故事,展示AI如何在关键时刻帮助作者解决了一个看似简单却棘手的问题——修图。
在聊AI之前,先聊聊别的。
我还记得,高中毕业后去深圳打暑假工,领了现金工资后,自己没有银行卡,担心拿着钱坐车回家弄丢了,于是去银行柜台,将工资汇款到家里的存折。
大学毕业后,来北京工作,刚开始给家里汇款的时候,也去过银行柜台,填写纸质的汇款单。
那时,如果想在非银行上班时间紧急汇款,基本行不通的。
后来移动支付、手机网上银行开始盛行,就再也没去过线下汇款,所有的转账都是通过手机完成。
当时没想到,将来有一天,对我来讲,去银行柜台汇款会成为历史。
这其实是一件很小的事情。背后反映的是科技在进步,时代在发展。有些看起来不起眼的改变,可能对我们工作、生活带来极大的便利。
最近,我就用AI,帮我解了燃眉之急。虽然这并不是一件大事,但背后反映的是,AI已经开始影响我们工作、生活的方方面面。
一、AI修图解了我燃眉之急事情是这样的。
前段时间,因为工作需要,公司让我提供一张职业照,提交后同事没说照片有问题。
但在距离截止时间,只有不到半天时找到我,说“照片不符合规定,需要提供正面照。”
上面是我提供的图片,原照片是半身形象照,不属于证件照,仔细看的话,能看出来身体有点倾斜,不是标准正面照。
当时,我存在侥幸心理,以为这张照片能“糊弄过去”。
于是我说,照片几天前就发给你了,当时没说有问题,我以为你们审核通过了。
结果对方说,他们收集照片时,不做审核。照片要求已发给大家,需要大家按照要求提供照片。
因为当时临近中午,当时我首先想到的是,先不吃饭了,马上去公司附近的照相馆拍照。
但是转念一想,去照相馆拍照,来回折腾,加上照片的处理时间,估计得2个小时,既费钱,又浪费时间。
突然想到,现在AI也能生成、调整图片,是不是可以用AI处理一下。
于是,打开自己常用的“即梦AI”这款工具,输入上面那张被驳回的照片,输入如下的提示词:
将这张照片,按证件照的标准,调整为100%正面看镜头,长宽为1:1,像素1500*1500的个人白底照片,格式为.jpg,且包含完整面部、颈部、肩膀(约为胸口及以上位置),选择合适的光源,避免照片有阴影(需要露出完整的上半身)。
短短几秒钟,“即梦AI”就生成了满足要求的照片,也就是右侧下面那张照片。这张照片提交后审核通过了。
下面三张图片中,左侧和右侧上方是原照片,右侧下方是AI调整后的照片。
右下角这张新照片,有三个调整的地方:
一是从原来有点侧身,变成了正面照,这一点至关重要。原来的照片审核没通过,说照片不是正面照。AI调整后的照片,再次提交审核通过了。
二是背景色,从原来的灰色,变成了白色,让照片符合白底的要求。
三是脸部的颜色做了调整,原来面部颜色有点偏黄,调整后更白了。
当我得知,经AI调整后的照片,审核通过后,我内心有点小庆幸。
当时第一反应是,一个全新的时代即将来临,并且开始真真切切,实实在在地影响我们的工作、生活的方方面面。
毫不夸张地说,未来照相馆的生意会受到很大的影响。
比如我们随便拍一张照片,就可以让AI进行调整、美化,除了可以更换角度、背景和颜色,还能更换服装等,只要你能想到的要求,AI大概率能实现。
想象一下,你随手自拍了一张照片,尽管你穿的是T恤,但能让AI给你换成衬衣+西装,或者其他任何你喜欢的衣服。
也就是说,你想修图,只需要输入指令就可以。
以前照相馆修图,都是按张收费的,一张都要几十、上百,甚至更贵,而且也费时,未来这些工作AI基本能取代,并且做得更好,效率更高。
毫不夸张地说,不管你是否承认,AI时代已经真正到来,并且已经开始影响我们工作、生活的方方面面。
二、AI修图背后的逻辑接下来,我们来说一下,AI修图背后实现的逻辑与原理。
首先,对于传统的图片处理软件,比如Photoshop,它是规则驱动,就像一把精密的手术刀,你需要告诉它:“选中某个区域,颜色改成白色”,它能按要求做,但不理解内容。
而AI图像模型是数据驱动的,它通过学习海量图像和对应的文本描述等,构建了一个视觉概念模型。它并不是在拼图,而是在理解你需求后,绘制出一张全新的图片。
对于AI的修图,核心动作是重画。它会在原图的基础上,运用其从海量数据中学到的知识,根据你的指令,重新绘制并按要求进行修改。
这个过程分为三步:
1、理解现状:AI会先看一眼你的原图,理解里面有什么,包括有什么人、树、房子等。
比如上面这张照片,AI会理解,这是一张人脸,但照片有点侧身,看到一只耳朵和半边脸显示不全。
2、加入噪声:AI会故意将原图片弄花,加入噪点,就像在画上撒一层薄薄的白沙。这一步是为了给AI留下创作空间。
3、按指令修改:AI开始清理这些噪点,但在清理的每一步,它都会参考你的文字指令和原图的结构。它的最终目标,是生成一张既符合你指令、又与原图有一定关联的新图片。
比如上面这张图片的修改,AI会调用从数亿张正面人脸照片中学到的知识,识别出“一个正常的正面人脸,应该有两只对称的眼睛、两边对称的脸、两只对称的耳朵、一个鼻子、一张嘴。”然后AI按指令要求调整为正面照。
三、AI修图的局限尽管AI处理图片的技术,总体效果不错,但仍有局限。
比如在处理人物图片时,人的手部姿势、面部表情多变,文字样本相对较少且组合复杂,导致模型对这些细节概念学习不充分、不到位,容易出错。
对于一些复杂的空间管理,或者物理常识,模型可能无法准确理解。
AI在对图片进行处理时,虽然能够理解需求,但要实现像素级的精确控制仍然非常困难,如果对图片处理要求非常高,就需要慎重。
四、结语AI 修图不是在原图上涂改,而是先看懂内容,再按要求重新生成符合逻辑的图片。
AI是否能生成符合你要求的图片,全看你给的指令够不够具体,以及原图有没有清晰的参考信息。
如果你修图时,非常清楚地知道,自己要修改哪里、保留哪里、调整什么细节,AI通常就能高质量地完成任务。
本文由人人都是产品经理作者【刘刚】,微信公众号:【产品经理之路】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
方舟配资-新股配资网-股民配资平台-在线配资公司提示:文章来自网络,不代表本站观点。