女同 视频
GPT4o 的多模态生图前天上线之后。
经过两天的发酵,含金量还在不停进步。
在我的群里,照旧能看到越来越多的,参加到推行坐褥情势的例子。
比如 @银海的奏凯作念商品图的翻译和合成,这是原来的算法,很难作念的狂放,可是目下,有手就行。
超越复杂的电商历程,一张原始图,换产品换脸换衣裳。
比如 @歸藏的奏凯把 UI 图放样机内部的例子,如果作念过 UI 或者产品瞎想的一又友笃建都知谈,以前咱们在作念作念展示,或者作念文牍的时候,时时作念样机作念的挺祸害的。
比如给他头像,画的两套颜料包,是不错奏凯上架到微信颜料商店的那种。
来自瞎想大佬 @付遥,用 GPT-4o 来奏凯作念之前超越流行的 3D 品牌海报。
比如我一个很心爱的小红书 AI 博主 @Rico 有三猫,用 GPT-4o 给她作念小红书封面。
也用 GPT-4o 奏凯作念商品图翻译出海。
群友 @默月佥在用 GPT-4o 出蜜蜂的剖解科普图。
一个很专科的公众号 AI 博主 @阿真 lrene,不仅用 GPT-4o 生成复杂的漫画,还能抠图,一键直出透明通谈的 PNG 图。
干死多样抠图软件的不是更给力的抠图软件,而是大模子。。。
还有一又友 @不著名网友虎子哥,用 GPT-4o 给他我方家的屋子装修。。。
还有一些我确乎不知谈源泉的可是被传播的蛮广的例子(如有作家,迎接筹商区认领)。
给几个居品作念一个展示图,这个场景在电商限制无敌。
之前我写可灵的 AI 模特的时候,许多东谈主问,能不可让模特带首饰?目下,不错了。
还用它,奏凯 P 图,排斥东谈主物。
老像片一键开垦 + 上色。
以致,还不错师法字体作念自体瞎想。
在 GPT-4o 的冲击下,N 多的瞎想师和创业者,都有点 emo 了。
比如就有大佬在 X 上赞赏谈:
一又友圈里还看到了一张图,是 glif 的雇主,在 X 上发的。
操心 ComfyUI,操心一切的 AI 图像职责流。
OpenAI 的一次更新,又屠杀了一堆公司。
又一次长远的施展了那句《三体》中的经典台词:女同 视频
我淹没你,与你无关。
GPT-4o 的冲击虽然是有,可是,他的上限在哪?能作念到什么地步?确实能透澈替代 ComfyUI 的 AI 图像职责流吗?
我念念弄明晰这个谜底。
领先我以为我照旧要跟群众超越毛糙的用一两句话阐述一下 ComfyUI,让群众知谈这玩意是个啥,咱们才好不息往下聊。
ComfyUI 是一个超越专科的职责流器具,不局限于 AI 绘制,AI 视频啥的也都不错往内部接。他的界面大略是这么的,很像电路板。
这个便是在 Liblib 上搭的 ComfyUI 职责流。
它是以节点神情,把各个器具、各个模子给串起来,造成一整套的职责流,比如一张图进去,经过多样节点和插件,输出一个都备作风不同的 AI 视频,这都是 OK 的。
坦率的讲,我不是 ComfyUI 的众人的,作念过的职责流也未几,我以为在这个限制,我并莫得那么强的发言权,是以。
我去讨教了一下我的 1 个好一又友,AI 绘制大神 @真金不怕火丹师忠忠。
我念念听听,他的看法。
领先是,GPT-4o 对电商瞎想的冲击到底有多大?
我跟忠忠聊了很久。
临了赢得的论断,跟我我方在瞎想行业里感受到的水温差未几。
关于庸碌水平的电商瞎想师,笃定是有打击的,他们原有的手段水平也就只可产出跟 gpt4o 差未几的图,相对来说敬爱不大了。
上游的运营专员不错我方操作器具来坐褥同样质地的图。跟被冲击的插画师类似,可能会变为赞理修补 gpt4o 产出的图的 bug,还有叠加原图部分细节上去加强细节复原(类似于高下频开垦历程)。
坐褥老本缩短后,需求量会变大,原来用不起多样丽都布景图包装的商家,目下也用的起了。
乱伦图片从狂放上极简操作就能生图的器具有好意思图瞎想室等一堆器具,GPT4o 仅仅在某些狂放方面更进一步费力,关于专科级的推行贸易坐褥的影响可能莫得那么大。
而从视觉瞎想角度,对现存的通盘开源生态,反而是利好作用。
忠忠举了我方瞎想的公司 IP 的例子。
目下,不错一句话把 IP 的 3D 模子,直出到品牌海报上,不需要走以前的 3D 建模 + 渲染了,大大精真金不怕火了时候。
同期,更敬爱的极少是,GPT-4o 不错凭据一张 IP 草图,来生成这个 IP 的各角度视图。
而这些图,会进一步鞭策 flux 等开源模子的微调版块的狂放。
你可能会问,都有 GPT-4o 了,为什么还要去微调 flux,在 ComfyUI 搭职责流用呢?这不是脱裤子放屁冠上加冠呢?
其实有两个原因。
数据隐秘性和精确性。
数据隐秘很好阐述,便是 GPT-4o 是一个闭源的模子,背面最多最多也便是绽放一个 API,让群众接到 ComfyUI 内部去用,可是,就 OpenAI 这个尿性,咱们给已往的东西,大略率就成他后续的考试素材了。
举个例子,《流浪地球 3》2027 年上映,如果目下好意思术组把中枢见解图或者设定图奏凯灌给 GPT-4o 作念一些处理,到时候,《流浪地球 3》电影还没上映,设定图你不错奏凯在 GPT-5o 内部让它画出来,这特么就炸了。。。
是以,数据隐秘性至关要害,在真实的坐褥环境里,超越是一些大厂里,必须只可用腹地的 ComfyUI 搭,真实的输出,必须是腹地环境,用开源的模子。
是以,这个时候,咱们就不错用一些不敏锐的信息,扔给 GPT-4o,来接济生成数据集,反过来微调我方的 flux 模子,这个点,确实很有效。
精确性其实也很毛糙,咱们回过甚来看忠忠用 GPT-4o 输出的我方家 IP 的海报。
先不说其他的细节了,这几处,你是能发现一些显着的 BUG 的。
这其实在坐褥环境里,这种 BUG 是品牌方以为不可能禁受的,就念念你给一个手机产品作念告白,你把东谈主手机弄变形了,你跟东谈主说不行 AI 出得便是这么的,你看对面会不会把你挂在电电扇上转着打。
而这个时候,用 Flux 特别微调的 Lora,是不错竣工的惩办这种精确性和一致性的问题的。
这其实便是庸碌瞎想场景和专科瞎想场景的区别。
GPT-4o 虽然不错替代大部分的庸碌职责流,会让 ComfyUI 里一多数的职责流失去价值,可是这就不代表,ComfyUI 失去价值了。
很毛糙的极少是,在专科的瞎想职责里,纯对话式的毛糙界面欢欣不了复杂专科的需求的。
就像你问一个专科瞎想师,为什么瞎想是用 PS 作念瞎想,而毋庸好意思图秀秀来作念瞎想,对方只会把你当白痴。
在真实的专科的 AI 瞎想职责里,可控性,许多时候超越的要害。
需要精确的章程重绘区域,需要精确的转机作风狂放,出图尺寸比例等,是以在专科坐褥中需要精确转机的细节,不可指望 OpenAI 全作念奏遵守。
还有前后处理历程,比如说前置的编著,抠图,语义识别,后置的比如对图片的放大,贴回原图细节(高下频开垦),再接入其他职责流不息处理等。
自动化一键完成的效率要比多轮对话高许多。
包括在一些精确度条目高的产品和场景上,GPT-4o 目下还够不上专科级的水准。
看个例子。
比如咱们要把问界 M9 这款车,换到另一个场景里。车这种产品,跟笔、规矩、香水等等条目的致密度,都备不同样。
这是 GPT-4o 出的图。
而如果咱们用大佬的给力职责流呢?
生成出来的狂放在举座比例和质感上,是更好的。
对比应该超越直不雅了。
这里我要给我方叠个甲,我并不是在这里饱读励,GPT-4o 不行,ComfyUI 的狂放不错吊打 GPT-4o。
如果是这么的话,我也不会连更两篇,来给群众看一看,GPT-4o,有多酷,有多强。
我念念说的是,GPT-4o,跟当年的 SD、Midjorney、Runway、可灵等等 AI 器具是同样的。
会无辞别替代通盘这个行业内部的低级实行职位。
屠杀通盘也曾在工程层面临大模子进行的一些优化。
然后,极少极少侵蚀更表层的建筑。
它更像是一层层澎湃高潮的潮流,将通盘 AI 图像限制原有的界限打得瓜剖豆分。
都说作念 AI 产品,要看到大模子的界限,在界限以外的安全地带作念。
可是目下,你根蒂不知谈界限在何方。
那些看似高耸的时候壁垒与职责历程,如果仅仅基于毛糙拼装或者低级实行的逻辑,正在被 GPT-4o 以近乎暴力的神情消解。
绝大多数机械式的制作职责,一朝被强大的多模态相识与生成替代,就会像那些轰然倒塌的围墙同样,被历史的风尘松驰隐敝。
有莫得一种第一次工业革新时候,机器代替手工干事的即视感?
历史老是在不停的类似。
可一如上文所言,这毫不代表 ComfyUI 之流就会被都备淘汰。
在工业级、专科级的深度职责流里,东谈主们对数据安全、瞎想精度、可控度的需求不可能假造隐藏。
那种图像与视频的屡次处理、分层输出、版块管制、剧本化批量运行、自动化节点相连,惟有是大型企业或中枢团队,都会很介意。
GPT-4o 会在 C 端和中小 B 端商场里摧枯折腐,取代了巨额低端或者类似性职责。
而 ComfyUI、Flux、ControlNet 等开源生态则在更专科的限制不息进化,欺诈它们致密、可控、可离线部署的特质,为高端客户或奥妙样子提供服务。
这威望就像云霄办公与腹地办公的干系同样,前者无尽浅显,后者安全可控。
也如同家用轿车与顶级跑车的分手,各自策画用户并不突破。
GPT-4o 也一定会不停进化,去扩大我方的界限蚕食更多的场景。
开源生态也会有多样不错复刻狂放的模子、产品出来,从而进行特有化。
没什么能够闭塞波涛上前。
要么成为波涛的奴隶者,要么成为波涛的推手。
这二者,都笃定比作念一块千里在海底的礁石,要精彩得多。
你说是吗。
起头:微信公众号:数字生命卡兹克女同 视频