腾众软件科技有限公司腾众软件科技有限公司

每走一步就会深深的撞一下,抱着走一下就撞一下

每走一步就会深深的撞一下,抱着走一下就撞一下 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软(ruǎn)公司创始(shǐ)人比尔·盖茨已多次公开谈论(lùn)人(rén)工智能话题。在最近的一次采访(fǎng)中,他再次表示:“AI可能会(huì)让(ràng)科(kē)技(jì)行(xíng)业迎来一次剧烈(liè)的洗牌(pái)”。

这(zhè)个结(jié)论是他在(zài)当地时间2月20日(rì)接受《In Good Company》节目专访(fǎng)时提(tí)出(chū)的。

他预期,AI的发展可能会威胁到谷歌的市占(zhàn)率(lǜ),因为微(wēi)软(ruǎn)在AI方面的行(xíng)动相当(dāng)迅(xùn)速。而(ér)最终科技巨(jù)头(tóu)将把AI整合成用户的(de)“全能助手”,包揽一切应用,与(yǔ)人们进行沟通并提供建议(yì),可以取代(dài)亚马逊、Siri或Outlook等应(yīng)用。

大佬(lǎo)口中全能助手(shǒu)的到(dào)来可能(néng)尚(shàng)需时日,但由ControlNet引发的又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话题热点包(bāo)围中杀(shā)出重围。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能量

01

ControlNet颠覆AI绘(huì)画新玩法

AIGC向(xiàng)可控靠近

以AI绘画为代表的AIGC上一次爆火(huǒ)的时(shí)候,还(hái)是2022年8月,在美国(guó)科罗拉多(duō)州举办的新兴数(shù)字艺(yì)术家竞赛中,一幅名为《太空歌(gē)剧院》的作品获奖。

随(suí)后各(gè)大厂商的AI绘画(huà)软件被(bèi)广大网友熟知并体验(yàn),Stable Diffusion便是(shì)其中代表。

ChatGPT之(zhī)后又一应(yīng)用(yòng)杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科(kē)技行业(yè)?_黑料正能量

用(yòng)户们可以在应用中(zhōng)输入(rù)一组(zǔ)关键词或者一张照片,就能获得一幅AI创作(zuò)的画作。

作画的关键就是(shì)所输入的文本。同一(yī)组关键词也(yě)可以创作(zuò)出(chū)很多(duō)张风(fēng)格不一样的画作,这让创作的过(guò)程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这种不确定(dìng)的惊(jīng)喜,他们会将生成(chéng)的美图当做头像。而另一部(bù)分喜欢翻看AI绘(huì)画(huà)的“翻(fān)车”作品。在社交媒(méi)体上,许(xǔ)多用(yòng)户分享AI“翻(fān)车现场”,例(lì)如,一(yī)位网友的小狗照片被AI画成了“肌肉男(nán)”,还有网友的个人照(zhào)片被AI识别成(chéng)了建筑。

而如今随着ControlNet的出(chū)现与加持,以往AI绘(huì)画的填写关键词游戏(xì)可能要被颠(diān)覆了(le)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正能(néng)量

ControlNet是一位正在斯坦福读博的中(zhōng)国(guó)人张(zhāng)吕敏创作的一种基于控制点的图像变形算(suàn)法,主要(yào)用于数字图像处(chù)理、计算机视觉和计算机图形(xíng)学等(děng)领(lǐng)域(yù)。

其(qí)SD插件一经发布(bù),在短短的两(liǎng)天内便(biàn)成为了AI绘(huì)画领(lǐng)域(yù)最新的热(rè)点。

在此(cǐ)之前,大家用了很多(duō)方法想(xiǎng)让AI生(shēng)成的结果尽(jǐn)可能的符(fú)合要求,但是都(dōu)不尽如(rú)人(rén)意,它的出现代表着AI生成(chéng)开始进入真正的可控时期。每走一步就会深深的撞一下,抱着走一下就撞一下ong>

因(yīn)为ControlNet可以(yǐ)直接提取画面的构图,人物的姿势和画面的深度信息等。有了它的帮助,就(jiù)不用频繁的用提示(shì)词来碰运气,抽盲盒(hé)式的创作了。

通俗的说ControlNet相当于(yú)给AI绘(huì)画加了“魔法”,不少(shǎo)博主的作品已经获得(dé)了大量的浏览量,“viggo”就是其中之一,他用朋友的照片直接带她(tā)们(men)走(zǒu)进动漫世(shì)界。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技行业?_黑料正能量

viggo先用StableDiffusion图(tú)片转(zhuǎn)文字。

再用Text2Prompt插(chā)件拓展找(zhǎo)到对(duì)应(yīng)的关键(jiàn)词(cí);最后用(yòng)ControlNet插件绑定骨骼开始换关键词(cí)试效果。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入(rù)可(kě)控(kòng)期,将洗牌科技行业?_黑料正能(néng)量(liàng)

通过图片就可以看(kàn)出来,效果十(shí)分惊艳。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进入可控期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑料正(zhèng)能量

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进(jìn)入(rù)可控期(qī),将洗牌科技行业(yè)?_黑(hēi)料正能量

更厉害的是(shì),除了真实的照片,草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实(shí)现线稿转全彩图。大神张吕敏其本尊也亲自回应。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或(huò)进入可(kě)控期,将洗牌科技行业(yè)?_黑料(liào)正能(néng)量(liàng)

不得(dé)不(bù)说当(dāng)下AIGC已经变(biàn)得越来(lái)越强(qiáng)大(dà),甚至(zhì)输(shū)出的(de)作(zuò)品都已经能(néng)以假(jiǎ)乱(luàn)真了。

02

难辨(biàn)虚(xū)实,AIGC技术力爆发

警(jǐng)惕(tì)安全(quán)问题

近日,“苏州(zhōu)金鸡湖有游(yóu)艇(tǐng)party”的消息火遍网(wǎng)络,而(ér)经过警方辟谣这所谓的(de)“party”可能(néng)是全国第一起AI绘图诈骗(piàn)。

由于(yú)这个活(huó)动里面给出的美女照片都是AI制(zhì)作(zuò)的真(zhēn)人(rén)照片绘(huì)图,因为太逼真,被(bèi)大家当成真(zhēn)事传(chuán)播了

ChatGPT之后又一(yī)应用(yòng)杀疯了(le),AIGC或(huò)进(jìn)入可(kě)控期,将(jiāng)洗牌(pái)科技(jì)行业(yè)?_黑料正能量

不过仔细观察可以发(fā)现,活动发(fā)起(qǐ)者提供的照片中有个很大的漏(lòu)洞可以发现并非真人,而是(shì)AI绘(huì)图,那(nà)便是图片中女性(xìng)的手指(zhǐ)部分有的存在异常。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量

有(yǒu)行业人事(shì)表示(shì):“现在(zài)因为手指部分(fēn)的绘画算法比较复(fù)杂,AI还不太(tài)会画人的手,但最新看到的图片(piàn)已经有(yǒu)越(yuè)来(lái)越完美的(de)AI模型出现,以后可(kě)能就完全没有漏洞了(le)。

类似的AI作图诈骗在国(guó)外也已有发生。据英国广播公(gōng)司(sī)报道,土耳其地震期(qī)间,有Tiktok用(yòng)户使用AI合成了(le)儿童受(shòu)灾的假照(zhào)片(piàn)发(fā)布(bù)到网络,以此诱骗(piàn)善(shàn)良的人打赏“捐(juān)助”从而实施诈骗。

目前随(suí)着技(jì)术(shù)发展(zhǎn),AIGC已(yǐ)经(jīng)能做出真人照片般的绘图效果,如果这(zhè)样的图片被用来诈骗,将非常可怕。

此外AIGC还引发了很多担忧(yōu),一方面(miàn),批判者认为AI在(zài)“学(xué)习”了大量前(qián)人(rén)的作品(pǐn)之后(hòu),其创作没有任何情绪(xù)和灵魂,难以和人(rén)类的艺(yì)术创(chuàng)作相(xiāng)提并(bìng)论。

另一方面(miàn),AIGC背(bèi)后的版权(quán)、目前都(dōu)并没有得到(dào)有(yǒu)效(xiào)的解(jiě)决,还有AIGC会不会代替人类“至高无(wú)上”的创意(yì)。

马斯克也强(qiáng)调,人工智(zhì)能的安全问题需要得到重视,太晚就(jiù)来(lái)不(bù)及了。

03

AIGC下一站除了视频,还有远(yuǎn)方(fāng)

技术都(dōu)是有两(liǎng)面性的,潜在的危害并不能掩盖其(qí)光辉的贡(gòng)献。现在看来,人工智能(néng)技术将是第四次(cì)工业(yè)革命的(de)核心驱动力(lì)量(liàng),将(jiāng)创(chuàng)造新的增(zēng)长奇迹。

过去(qù)一年,人(rén)工(gōng)智能在技术(shù)和商业(yè)层面都有了巨大进展,AI绘画就是人工智能(néng)技(jì)术发生方向性(xìng)改变的(de)一个代(dài)表。其下一站或(huò)许就是视(shì)频(pín)。

此前,Meta和谷歌(gē)先后发布了几条引爆科技圈的短视频。这些视频引发(fā)关注并非内容做得多优秀,反(fǎn)而都非(fēi)常简单,比(bǐ)如(rú)一匹正在喝(hē)水的马,一只画画(huà)的(de)玩具熊(xióng),或(huò)者一段骑摩托车(chē)的第一视角(jiǎo)录像,随(suí)便(biàn)一个有(yǒu)手(shǒu)机的人都可以随手录下(xià)一(yī)段。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入(rù)可控期(qī),将洗牌科技行业(yè)?_黑(hēi)料(liào)正能(néng)量

但这些短视频(pín)的创作方式非常简单,创(chuàng)作者仅仅需(xū)要向AI输入一段话,甚至只是说(shuō)一下要求,AI就可以根据(jù)需要生成一段视频。

谷歌发(fā)布(bù)的(de)两个AI生成视频(pín)分(fēn)别来自于Imagen Video和Phenaki,前者主要突出(chū)的(de)是高清,与Meta的Make-A-Video没(méi)有太多的差(chà)别。

在Make-A-Video公布了(le)AI生成的视频后,AI圈就已经玩了一(yī)波梗,一个(gè)能够做(zuò)出更(gèng)高清视频的(de)AI还(hái)不(bù)足以在(zài)短(duǎn)时(shí)间内戳中兴奋点。

Phenaki更(gèng)加令(lìng)人震惊的地(dì)方在(zài)于(yú),它可以制(zhì)作出超过(guò)2分钟的(de)连(lián)贯的也有确切(qiè)内容(róng)的视频,这才(cái)是真正让人(rén)们(men)感到惊(jīng)喜的地方。因为(wèi)无论AI生成的视频多么高清,也只(zhǐ)能是为内容(róng)生产者提供一个灵感,一个素材(cái),一个(gè)过场动画。

不过能够制作出有具体(tǐ)剧(jù)情内容的视频(pín)就意(yì)味着(zhe),一(yī)些视(shì)频创作(zuò)由AI代替人工完成已经初步有了可能。

当下AI的发展速度(dù)已经(jīng)超(chāo)过大(dà)部分(fēn)人的想(xiǎng)象。内(nèi)容产业的本质是供(gōng)给创造需求,AIGC作为全新的内容生产方(fāng)式,可以为内(nèi)容产业带来更(gèng)新的内(nèi)容风格、更快的(de)生产速度,更(gèng)低的(de)生产成本,这无疑会(huì)驱(qū)动内(nèi)容产业的大爆发。

除了AI绘(huì)图、视频,AIGC技术还能应(yīng)用(yòng)于音(yīn)乐、代码、机器(qì)人动作等多种(zhǒng)内容形式的生成。不(bù)难发(fā)现该(gāi)项技术不仅在游戏等行业能得到有效应用,对(duì)于下一代互联网各种元素的构建(jiàn)亦(yì)有关键意义。

从商业(yè)化的角(jiǎo)度来看(kàn),文化(huà)娱乐、教育、传媒(méi)等诸多领域,本身就对基(jī)于AI的可视化内(nèi)容有强烈需求(qiú)。

因(yīn)此,AI绘画(huà)及视频或不是结果,而只是AI进(jìn)程(chéng)中的(de)一块(kuài)重要拼图,有望(wàng)在技术更(gèng)新的(de)加持(chí)下实现更(gèng)大的(de)应用(yòng)价值。

AI从理解内容,走(zǒu)向了可以生成内(nèi)容,甚至能(néng)够创造出独立价值和独立视角(jiǎo)的内容。AIGC的再(zài)次出(chū)圈,更代(dài)表着未来(lái)的先进生产力(lì)即将(jiāng)到来(lái)。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑(hēi)料(liào)正能量

04

紧抓大模型(xíng)与算力,牢固AIGC底(dǐ)座

从技术的发展也(yě)可以(yǐ)看出,在语言大(dà)模型(xíng)、图像大模型之后,多模态大模型已经(jīng)成为了新的趋势。

大模型被誉为当前人工智能发展的(de)智能(néng)底(dǐ)座,是全球(qiú)竞争最激烈的研(yán)究方向之一,包(bāo)括谷歌、亚马逊、百度、阿里、腾讯等众多头部(bù)企业都(dōu)在(zài)竞相发力。

不过(guò)训(xùn)练大模(mó)型的确(què)价格不(bù)菲,以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报(bào)告估算(suàn),GPT-3训(xùn)练(liàn)一(yī)次(cì)的(de)成本(běn)约为140万美(měi)元(yuán)。而对于(yú)一些更大(dà)的LLM(大型语言模型),训练成本则(zé)介于200万(wàn)美(měi)元至(zhì)1200万美元高价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立访客平均数1300万计算,其对(duì)应芯片需(xū)求为(wèi)3万多片英伟(wěi)达(dá)A100 GPU,初始投入成本(běn)约(yuē)为8亿美元,每日仅(jǐn)电(diàn)费就在5万美元(yuán)左右(yòu)。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或进入(rù)可控期(qī),将(jiāng)洗牌科技行(xíng)业?_黑料正能量

此外不论是(shì)ChatGPT还(hái)是(shì)AIGC,都离不开庞大算力(lì)支持。在关注(zhù)各类大模(mó)型的发展同时,更(gèng)应该关注(zhù)算(suàn)力网(wǎng)络的(de)建设。

算(suàn)力网络正驱动AI产(chǎn)业发展进入史诗级加速进程,让(ràng)AIGC及通用AI这(zhè)一(yī)人工(gōng)智(zhì)能(néng)发(fā)展的终极目(mù)标离得更(gèng)近。

因为算力可(kě)以(yǐ)对突破性技术创(chuàng)新提供(gōng)大力(lì)的支持(chí)。这方面,多模态大模型是典型。作为面向未来强人工(gōng)智能、通(tōng)用人工智(zhì)能的重要技术(shù)创新,多模态大(dà)模型已经在(zài)人工智能领(lǐng)域(yù)提出了很多(duō)年,业界也有不少技术突破,但(dàn)是,多模态大模型进一步往下走,算力需(xū)求呈几何式上升,一般的算力基础设施很快(kuài)将(jiāng)难以胜任。

从图像、文字、语音单独一项的训练,到双模态(tài)、三模(mó)态(tài)的跃迁,让人工智能可以(yǐ)灵(líng)活应对不同模态(tài)的转化(huà)、像人(rén)与世界交(jiāo)互(hù)一样自然,这(zhè)方面,由算力网络(luò)来驱动将有明显优势(shì)。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌(pái)科(kē)技行业?_黑(hēi)料正能(néng)量

此外,还(hái)有很多需要(yào)爆发式(shì)增长的算力来支撑的技(jì)术创新,将在(zài)人工智能算力网络支撑下快速推进(jìn)。

AIGC已经(jīng)露(lù)出曙(shǔ)光,期待在(zài)大模(mó)型和大算(suàn)力的支持(chí)下AIGC能持续颠覆内容生(shēng)产的(de)方式(shì),将创造的边际成本降低,让万众受益(yì)。

未经允许不得转载:腾众软件科技有限公司 每走一步就会深深的撞一下,抱着走一下就撞一下

评论

5+2=