自从AI火了之后,抖音、哔哩哔哩等平台也出现了很多优秀的博主在输出AIGC的相关内容。
这次青椒云也有幸联系到哔哩哔哩平台「百万播放级别博主」:轩轩老师(ID:靠谱的轩轩)分享他对AIGC的发展趋势解读和行业的看法。
轩轩老师个人简介:
本名:孟德轩
哔哩哔哩ID:靠谱的轩轩
上海德普道信息技术有限公司CEO
阿里巴巴Design认证AIGC培训讲师
十方AI绘画项目负责人
AI领域连续创业者,AI绘画领域教育先驱
AI技术公益普及先行者
深度学习领域专家,哲学硕士
为人民邮电出版社、机械工业出版社等撰写AI系列书籍,在国际云计算平台担任顾问,与国企以及大厂都有合作经历
B站AI绘画领域头部博主
线上课程百万播放量,让数十万人受益
Q1、青椒云:很感谢轩轩老师可以来青椒云分享,想问下老师是什么样的契机让你的团队这次专注于AI领域?
轩轩老师:今天很荣幸来到瑞云科技,和我们AIGC领域志同道合的朋友做一个交流。
说起我怎么进入AIGC领域,我感觉是一个非常曲折的过程。一开始我个人更喜欢的是历史和哲学,然后创业更多是追逐科技方向。
因为从过往的历史上来看,每一次科技的爆发和进步其实都带动了我们社会的进步,也让很多人在这个过程中收获了成就。
比如在原来蒸汽机时代,那些去追随工业革命的人,都获得了成就,这是因为整个过程是一种降维打击,后面再进入电气时代、互联网时代,每一个年代我们见证了非常多的成功案例。
所以当每一个生产力浪潮的出现,都会造就很多的市场机会,所以我就一直在思考,我们的下一步浪潮在哪里?
图片来源于网络
直到AI的出现,让我们看到这样的一个趋势,觉得这个是适合我们团队的。
以前市场总是会有新的趋势出现,但是并不是所有的趋势都适合我们,因为追随趋势是一个庞大的事情,每一个趋势你都深入进去,反而会导致浪费这次机会。
我们判断合适不合适主要就两个点:第一个他的成本要低。第二个他又要不可复制。
轩轩老师B站主页
比如说轩轩老师做的个人IP,很多企业就发现这样的人特别难找,第一你要懂技术,第二要懂商业模式,第三你还能完整表达。
经过我们自己的综合讨论,我们团队决定要进入AI领域。
Q2、你是如何看待stable diffusion这类AI绘图的价值的?AI能否胜任人类的一些工作?
轩轩老师:人类发展历史,也是生产力发展的历史。
AI是一个充满生命力的东西。换句话说,他就像是我们的电,就像是我们的互联网一样。它一经出现,就再也不会消失了。
而且我们可以把时间拉长到十年20年看,我会觉得10年20年之后,无论如何, AI都会比现在发展要好的多得多。
大家想想看,AI是一个比较特殊的东西。就从未有一个技术这么像人,或者能完成以前人类觉得我们很独特的东西,比如说:思考。
Open AI(图片来源网络)
就先别管ChatGPT、AI绘画这些工具,他是否真的在思考。至少他已经很像在思考,他已经可以取代一些人脑的功能。
你们就拿ChatGPT来说,像归纳总结,有的时候我们以为归纳总结只有人类擅长做,但是现在计算机也能做。
又比如说讲故事。我们原来说讲故事是人独特的一个能力,那现在讲故事甚至想象力AI也不差,有时候你就感觉AI写东西很有想象力;像AI绘画总给人出乎意料的结果。
既然它这么像人,或者说他能够去完成人脑的一些事情,意味着在任何一个领域AI都可以应用,无非就是早晚而已。
AI大数据诊断(图片来源网络)
就是我们现在通用AI,更像是文员或者说画师,但是未来可以有各行各业专门的AI。比如说医学的,去诊断癌症的那个片子一点都不比普通的医生差,包括医生的看病率,搞法律也是。
人有的时候需要人文关怀的东西,可能AI慢一点或者更加像是水,它会一层一层的往上淹,直到所有人都浸没其中。
我相信一个生产力发展,必然会给人类带来一个前所未有的时代。
Q3、青椒云:老师你认为目前的AI,还有那些地方需要提高吗?
轩轩老师:光是靠AI绘图这一个工具是不够的。
比如说工业设计中我们设计手表,设计手表这个东西,它不能光是好看,他还得符合这个手表的逻辑。
比如手表表盘怎么设计,里面的机械是什么样的结构,对不对,他不了解机械结构,所以他生成出来的图,只是你看起来好看,实际上,他是没办法作为工业设计使用的。
它需要其他专业领域知识的设计领域,AIGC光是靠stable diffusion是不够的,以后可能要用专用的AI对这个领域进行优化,才会好很多。
当然,我们用AI最强调的是包括我们这些创意,如果要做AI领域,你就要去做AI能够做并且擅长的事。
它不擅长的事,你就用传统的方法就好,什么时候他发展了,你再用它不就行了,这是我们的一个看法。
Q4、青椒云:老师你在使用AI的时候,您具体使用了哪些技术实现。哪些模型是现在你目前比较推荐的?
轩轩老师:我们就说AI绘画领域好用的工具不多,我个人推荐的其实用两个,一个是midjourney、stable diffusion。
两大AI绘画工具(图片来源网络)
如果没有时间去学,建议基本都用midjourney。虽然他对画面的控制能力上弱一些,但是它的模型的能力很强,生成出来的图片效果很好,很多时候也能符合我们一般平面设计师的需要。
第二个stable diffusion。他的下限虽然比较高,就是不会的人,就真的用不明白,但他上限也是同样的非常的高。我们可以对stable diffusion进行很多定制,让他去约束生成的图片。
目前来说。我们在实际商业应用中用的最多的一个工具就是stable diffusion,至于大模型方面。因为他们那个模型很多。
在我看来就是术业有专攻,不同的模型做不同的事情,在不同的领域里它的作用是不一样的,所以说stable diffusion,有成千上百微调过的大模型可以去选择,我们要根据自己行业,或者我们落地应用的需要,去选择就可以。
Q5、青椒云:新人上手stable diffusion需要掌握什么技术吗?然后它的门槛是什么呢?
轩轩老师:我觉得AIGC技术作为新一代生产的工具,它很强。但是它的门槛其实相比于传统的很多工具来说是低的。
有人说AI难学,但是你回过头想想看,笔墨纸砚难学吗?那真的要成为大师,那也得也是苦面寒暑。然后, PS你要学,培训周期几年也是有的。
AIGC在我看来新手要学的第一个就是电脑的基础操作。我们在教学的过程中就发现一个问题,有的时候不是SD学不会,他连电脑都不会用,这个就非常的痛苦,我们还得教他怎么去使用电脑。电脑基础的系统知识,还是要了解的,不然它出了点毛病都不知道怎么回事,对AI也无法理解。
stable diffusion界面(图片来源网络)
第二是英语,其实我们现在很多时候,去生成图片,不管是 Midjourney还是stable diffusion,我们的主流的AI绘画工具很多是用英语来进行训练的,因为它里面构成的很多功能模型都是用英语作为语料训练的。
第三个我觉得比较重要的就是工具的使用方法。就是这个工具它里面你会看到里面有很多参数,每个参数呢,它都对画面的结果会有一些影响,你要清楚这个参数对画面结果影响是什么,可以帮助你更好的去生成想要的图片。
第四个当然毫无缘是美术相关的知识了。这个别人都帮不了你,这个图片究竟能不能用,好不好用好不好看,客户喜不喜欢。只有你自己做的这个行业知道。
第五个就是你在AI想要落地的一些知识,比如你做电商的。你如果不懂电商,你是没办法去用的,你可能做出一张很漂亮的图,但你不知道这个图能不能用在电商里。
如果你是做建筑设计的或者室内设计的,你生成一张图很好看,但你不知道这个东西能不能给客户看,这都是你需要那个领域的专业知识,这个也是别人帮不了你的,我觉得这几个知识是比较基础的。
civitai模型网站页面
我之前差点就犯了一个错误,我之前有段时间一直在研究深度学习。想自己从头要搞一个模型出来,后来发现走歪了。
我们搞AI的最终目的是为了更好的去服务社会,更好的去让我们团队有所收获。
这个东西其实更考验你对商业模式的认识,你怎么去一步一步的把你这个项目搭起来?你从哪去获得你想要的资源?怎么能更好的为这个社会做一些事情。我觉得这些维度的思考比你会技术更重要。
会技术我们可以去组建专门的技术团队来做,你只需要懂技术的整体逻辑和整体框架就行了,具体的操作层面,我们可以组成团队来做,因为个人来做是不可能的;AI它涉及的领域太多了。
在我个人看来,程序员是技术与实际应用相结合,我觉得更加的重要。而且一个人的钻研技术升级再快,你也没有世界上AI发展的速度快。
Q6、青椒云:老师,您如何选择训练或者找到适合自己的模型呢?
怎么选择和训练模型,它是有一套专门的技术。
我们原来讲训练的课程都是用一整个ppt来讲,今天我就简单说说,所谓的训练就是让AI去学习那些,我们想要它生成的特定类型的图片。
就比如说:我们现在有一个项目是帮某时尚界公司去做一个大模型,这个大模型要求他生成的图片符合他们公司的宣传调性。
AI绘画的作品(图片来源网络)
我们就通过把公司过去的几千张图片,让模型进行学习,最后我们生成的图片,甲方很满意。
甲方说:“这就是我们想要的感觉啊。”其实就像是设计师,他可能本来画画就很好,但是他不会某种风格。你把某种风格的话交给他,让他学个几千张,他画出来的效果,就和你想要的大致差不多,这就是AI训练的过程。
至于怎么选择适合自己的模型?其实就像找到一个员工一样,你就先让有试用期。人试用期三个月,AI试用期三小时。
你先拿他去测各方面的数据,测出来你去看它的美观程度,它出错的概率,它的整体画面质量。然后看它能不能正确的理解事物?全部都ok,然后我们再长期的进行项目中应用就好了。