每走一步就会深深的撞一下，抱着走一下就撞一下-腾众软件科技有限公司

每走一步就会深深的撞一下，抱着走一下就撞一下 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火爆以来，微软(ruǎn)公司创始(shǐ)人比尔·盖茨已多次公开谈论(lùn)人(rén)工智能话题。在最近的一次采访(fǎng)中，他再次表示：“AI可能会(huì)让(ràng)科(kē)技(jì)行(xíng)业迎来一次剧烈(liè)的洗牌(pái)”。

这(zhè)个结(jié)论是他在(zài)当地时间2月20日(rì)接受《In Good Company》节目专访(fǎng)时提(tí)出(chū)的。

他预期，AI的发展可能会威胁到谷歌的市占(zhàn)率(lǜ)，因为微(wēi)软(ruǎn)在AI方面的行(xíng)动相当(dāng)迅(xùn)速。而(ér)最终科技巨(jù)头(tóu)将把AI整合成用户的(de)“全能助手”，包揽一切应用，与(yǔ)人们进行沟通并提供建议(yì)，可以取代(dài)亚马逊、Siri或Outlook等应(yīng)用。

大佬(lǎo)口中全能助手(shǒu)的到(dào)来可能(néng)尚(shàng)需时日，但由ControlNet引发的又一次AI绘画浪潮，让AIGC在(zài)ChatGPT的话题热点包(bāo)围中杀(shā)出重围。

ChatGPT之后(hòu)又一应用杀疯(fēng)了，AIGC或进入可控期，将洗牌(pái)科技行业？_黑料正能量

ControlNet颠覆AI绘(huì)画新玩法

AIGC向(xiàng)可控靠近

以AI绘画为代表的AIGC上一次爆火(huǒ)的时(shí)候，还(hái)是2022年8月，在美国(guó)科罗拉多(duō)州举办的新兴数(shù)字艺(yì)术家竞赛中，一幅名为《太空歌(gē)剧院》的作品获奖。

随(suí)后各(gè)大厂商的AI绘画(huà)软件被(bèi)广大网友熟知并体验(yàn)，Stable Diffusion便是(shì)其中代表。

用(yòng)户们可以在应用中(zhōng)输入(rù)一组(zǔ)关键词或者一张照片，就能获得一幅AI创作(zuò)的画作。

作画的关键就是(shì)所输入的文本。同一(yī)组关键词也(yě)可以创作(zuò)出(chū)很多(duō)张风(fēng)格不一样的画作，这让创作的过(guò)程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这种不确定(dìng)的惊(jīng)喜，他们会将生成(chéng)的美图当做头像。而另一部(bù)分喜欢翻看AI绘(huì)画(huà)的“翻(fān)车”作品。在社交媒(méi)体上，许(xǔ)多用(yòng)户分享AI“翻(fān)车现场”，例(lì)如，一(yī)位网友的小狗照片被AI画成了“肌肉男(nán)”，还有网友的个人照(zhào)片被AI识别成(chéng)了建筑。

而如今随着ControlNet的出(chū)现与加持，以往AI绘(huì)画的填写关键词游戏(xì)可能要被颠(diān)覆了(le)。

ControlNet是一位正在斯坦福读博的中(zhōng)国(guó)人张(zhāng)吕敏创作的一种基于控制点的图像变形算(suàn)法，主要(yào)用于数字图像处(chù)理、计算机视觉和计算机图形(xíng)学等(děng)领(lǐng)域(yù)。

其(qí)SD插件一经发布(bù)，在短短的两(liǎng)天内便(biàn)成为了AI绘(huì)画领(lǐng)域(yù)最新的热(rè)点。

在此(cǐ)之前，大家用了很多(duō)方法想(xiǎng)让AI生(shēng)成的结果尽(jǐn)可能的符(fú)合要求，但是都(dōu)不尽如(rú)人(rén)意，它的出现代表着AI生成(chéng)开始进入真正的可控时期。每走一步就会深深的撞一下，抱着走一下就撞一下ong>

因(yīn)为ControlNet可以(yǐ)直接提取画面的构图，人物的姿势和画面的深度信息等。有了它的帮助，就(jiù)不用频繁的用提示(shì)词来碰运气，抽盲盒(hé)式的创作了。

通俗的说ControlNet相当于(yú)给AI绘(huì)画加了“魔法”，不少(shǎo)博主的作品已经获得(dé)了大量的浏览量，“viggo”就是其中之一，他用朋友的照片直接带她(tā)们(men)走(zǒu)进动漫世(shì)界。

viggo先用StableDiffusion图(tú)片转(zhuǎn)文字。

再用Text2Prompt插(chā)件拓展找(zhǎo)到对(duì)应(yīng)的关键(jiàn)词(cí)；最后用(yòng)ControlNet插件绑定骨骼开始换关键词(cí)试效果。

通过图片就可以看(kàn)出来，效果十(shí)分惊艳。

更厉害的是(shì)，除了真实的照片，草图也可以加上“魔法”，知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实(shí)现线稿转全彩图。大神张吕敏其本尊也亲自回应。

不得(dé)不(bù)说当(dāng)下AIGC已经变(biàn)得越来(lái)越强(qiáng)大(dà)，甚至(zhì)输(shū)出的(de)作(zuò)品都已经能(néng)以假(jiǎ)乱(luàn)真了。

02

难辨(biàn)虚(xū)实，AIGC技术力爆发

警(jǐng)惕(tì)安全(quán)问题

近日，“苏州(zhōu)金鸡湖有游(yóu)艇(tǐng)party”的消息火遍网(wǎng)络，而(ér)经过警方辟谣这所谓的(de)“party”可能(néng)是全国第一起AI绘图诈骗(piàn)。

由于(yú)这个活(huó)动里面给出的美女照片都是AI制(zhì)作(zuò)的真(zhēn)人(rén)照片绘(huì)图，因为太逼真，被(bèi)大家当成真(zhēn)事传(chuán)播了。

不过仔细观察可以发(fā)现，活动发(fā)起(qǐ)者提供的照片中有个很大的漏(lòu)洞可以发现并非真人，而是(shì)AI绘(huì)图，那(nà)便是图片中女性(xìng)的手指(zhǐ)部分有的存在异常。

有(yǒu)行业人事(shì)表示(shì)：“现在(zài)因为手指部分(fēn)的绘画算法比较复(fù)杂，AI还不太(tài)会画人的手，但最新看到的图片(piàn)已经有(yǒu)越(yuè)来(lái)越完美的(de)AI模型出现，以后可(kě)能就完全没有漏洞了(le)。”

类似的AI作图诈骗在国(guó)外也已有发生。据英国广播公(gōng)司(sī)报道，土耳其地震期(qī)间，有Tiktok用(yòng)户使用AI合成了(le)儿童受(shòu)灾的假照(zhào)片(piàn)发(fā)布(bù)到网络，以此诱骗(piàn)善(shàn)良的人打赏“捐(juān)助”从而实施诈骗。

目前随(suí)着技(jì)术(shù)发展(zhǎn)，AIGC已(yǐ)经(jīng)能做出真人照片般的绘图效果，如果这(zhè)样的图片被用来诈骗，将非常可怕。

此外AIGC还引发了很多担忧(yōu)，一方面(miàn)，批判者认为AI在(zài)“学(xué)习”了大量前(qián)人(rén)的作品(pǐn)之后(hòu)，其创作没有任何情绪(xù)和灵魂，难以和人(rén)类的艺(yì)术创(chuàng)作相(xiāng)提并(bìng)论。

另一方面(miàn)，AIGC背(bèi)后的版权(quán)、目前都(dōu)并没有得到(dào)有(yǒu)效(xiào)的解(jiě)决，还有AIGC会不会代替人类“至高无(wú)上”的创意(yì)。

马斯克也强(qiáng)调，人工智(zhì)能的安全问题需要得到重视，太晚就(jiù)来(lái)不(bù)及了。

03

AIGC下一站除了视频，还有远(yuǎn)方(fāng)

技术都(dōu)是有两(liǎng)面性的，潜在的危害并不能掩盖其(qí)光辉的贡(gòng)献。现在看来，人工智能(néng)技术将是第四次(cì)工业(yè)革命的(de)核心驱动力(lì)量(liàng)，将(jiāng)创(chuàng)造新的增(zēng)长奇迹。

过去(qù)一年，人(rén)工(gōng)智能在技术(shù)和商业(yè)层面都有了巨大进展，AI绘画就是人工智能(néng)技(jì)术发生方向性(xìng)改变的(de)一个代(dài)表。其下一站或(huò)许就是视(shì)频(pín)。

此前，Meta和谷歌(gē)先后发布了几条引爆科技圈的短视频。这些视频引发(fā)关注并非内容做得多优秀，反(fǎn)而都非(fēi)常简单，比(bǐ)如(rú)一匹正在喝(hē)水的马，一只画画(huà)的(de)玩具熊(xióng)，或(huò)者一段骑摩托车(chē)的第一视角(jiǎo)录像，随(suí)便(biàn)一个有(yǒu)手(shǒu)机的人都可以随手录下(xià)一(yī)段。

但这些短视频(pín)的创作方式非常简单，创(chuàng)作者仅仅需(xū)要向AI输入一段话，甚至只是说(shuō)一下要求，AI就可以根据(jù)需要生成一段视频。

谷歌发(fā)布(bù)的(de)两个AI生成视频(pín)分(fēn)别来自于Imagen Video和Phenaki，前者主要突出(chū)的(de)是高清，与Meta的Make-A-Video没(méi)有太多的差(chà)别。

在Make-A-Video公布了(le)AI生成的视频后，AI圈就已经玩了一(yī)波梗，一个(gè)能够做(zuò)出更(gèng)高清视频的(de)AI还(hái)不(bù)足以在(zài)短(duǎn)时(shí)间内戳中兴奋点。

Phenaki更(gèng)加令(lìng)人震惊的地(dì)方在(zài)于(yú)，它可以制(zhì)作出超过(guò)2分钟的(de)连(lián)贯的也有确切(qiè)内容(róng)的视频，这才(cái)是真正让人(rén)们(men)感到惊(jīng)喜的地方。因为(wèi)无论AI生成的视频多么高清，也只(zhǐ)能是为内容(róng)生产者提供一个灵感，一个素材(cái)，一个(gè)过场动画。

不过能够制作出有具体(tǐ)剧(jù)情内容的视频(pín)就意(yì)味着(zhe)，一(yī)些视(shì)频创作(zuò)由AI代替人工完成已经初步有了可能。

当下AI的发展速度(dù)已经(jīng)超(chāo)过大(dà)部分(fēn)人的想(xiǎng)象。内(nèi)容产业的本质是供(gōng)给创造需求，AIGC作为全新的内容生产方(fāng)式，可以为内(nèi)容产业带来更(gèng)新的内(nèi)容风格、更快的(de)生产速度，更(gèng)低的(de)生产成本，这无疑会(huì)驱(qū)动内(nèi)容产业的大爆发。

除了AI绘(huì)图、视频，AIGC技术还能应(yīng)用(yòng)于音(yīn)乐、代码、机器(qì)人动作等多种(zhǒng)内容形式的生成。不(bù)难发(fā)现该(gāi)项技术不仅在游戏等行业能得到有效应用，对(duì)于下一代互联网各种元素的构建(jiàn)亦(yì)有关键意义。

从商业(yè)化的角(jiǎo)度来看(kàn)，文化(huà)娱乐、教育、传媒(méi)等诸多领域，本身就对基(jī)于AI的可视化内(nèi)容有强烈需求(qiú)。

因(yīn)此，AI绘画(huà)及视频或不是结果，而只是AI进(jìn)程(chéng)中的(de)一块(kuài)重要拼图，有望(wàng)在技术更(gèng)新的(de)加持(chí)下实现更(gèng)大的(de)应用(yòng)价值。

AI从理解内容，走(zǒu)向了可以生成内(nèi)容，甚至能(néng)够创造出独立价值和独立视角(jiǎo)的内容。AIGC的再(zài)次出(chū)圈，更代(dài)表着未来(lái)的先进生产力(lì)即将(jiāng)到来(lái)。

04

紧抓大模型(xíng)与算力，牢固AIGC底(dǐ)座

从技术的发展也(yě)可以(yǐ)看出，在语言大(dà)模型(xíng)、图像大模型之后，多模态大模型已经(jīng)成为了新的趋势。

大模型被誉为当前人工智能发展的(de)智能(néng)底(dǐ)座，是全球(qiú)竞争最激烈的研(yán)究方向之一，包(bāo)括谷歌、亚马逊、百度、阿里、腾讯等众多头部(bù)企业都(dōu)在(zài)竞相发力。

不过(guò)训(xùn)练大模(mó)型的确(què)价格不(bù)菲，以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报(bào)告估算(suàn)，GPT-3训(xùn)练(liàn)一(yī)次(cì)的(de)成本(běn)约为140万美(měi)元(yuán)。而对于(yú)一些更大(dà)的LLM(大型语言模型)，训练成本则(zé)介于200万(wàn)美(měi)元至(zhì)1200万美元高价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立访客平均数1300万计算，其对(duì)应芯片需(xū)求为(wèi)3万多片英伟(wěi)达(dá)A100 GPU，初始投入成本(běn)约(yuē)为8亿美元，每日仅(jǐn)电(diàn)费就在5万美元(yuán)左右(yòu)。

此外不论是(shì)ChatGPT还(hái)是(shì)AIGC，都离不开庞大算力(lì)支持。在关注(zhù)各类大模(mó)型的发展同时，更(gèng)应该关注(zhù)算(suàn)力网(wǎng)络的(de)建设。

算(suàn)力网络正驱动AI产(chǎn)业发展进入史诗级加速进程，让(ràng)AIGC及通用AI这(zhè)一(yī)人工(gōng)智(zhì)能(néng)发(fā)展的终极目(mù)标离得更(gèng)近。

因为算力可(kě)以(yǐ)对突破性技术创(chuàng)新提供(gōng)大力(lì)的支持(chí)。这方面，多模态大模型是典型。作为面向未来强人工(gōng)智能、通(tōng)用人工智(zhì)能的重要技术(shù)创新，多模态大(dà)模型已经在(zài)人工智能领(lǐng)域(yù)提出了很多(duō)年，业界也有不少技术突破，但(dàn)是，多模态大模型进一步往下走，算力需(xū)求呈几何式上升，一般的算力基础设施很快(kuài)将(jiāng)难以胜任。

从图像、文字、语音单独一项的训练，到双模态(tài)、三模(mó)态(tài)的跃迁，让人工智能可以(yǐ)灵(líng)活应对不同模态(tài)的转化(huà)、像人(rén)与世界交(jiāo)互(hù)一样自然，这(zhè)方面，由算力网络(luò)来驱动将有明显优势(shì)。

此外，还(hái)有很多需要(yào)爆发式(shì)增长的算力来支撑的技(jì)术创新，将在(zài)人工智能算力网络支撑下快速推进(jìn)。

AIGC已经(jīng)露(lù)出曙(shǔ)光，期待在(zài)大模(mó)型和大算(suàn)力的支持(chí)下AIGC能持续颠覆内容生(shēng)产的(de)方式(shì)，将创造的边际成本降低，让万众受益(yì)。

未经允许不得转载：腾众软件科技有限公司每走一步就会深深的撞一下，抱着走一下就撞一下