腾众软件科技有限公司腾众软件科技有限公司

家贫无从致书以观出自哪里,家贫无从致书以观每假借于藏书之家翻译

家贫无从致书以观出自哪里,家贫无从致书以观每假借于藏书之家翻译 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊(liáo)天机器人ChatGPT火爆以来,微软公司创始(shǐ)人比尔·盖茨已(yǐ)多次公(gōng)开谈论人工智能话(huà)题(tí)。在最近的一次采(cǎi)访(fǎng)中,他再次表示:“AI可能会让(ràng)科技行业迎(yíng)来一次(cì)剧烈的(de)洗牌”。

这个结论是他在当地时(shí)间(jiān)2月20日接受《In Good Company》节目(mù)专访时(shí)提出的。

他预期,AI的发展可能会威胁到谷歌(gē)的市占率,因为微软在AI方面的行动相当迅速。而最终科(kē)技巨头(tóu)将把(bǎ)AI整合成用(yòng)户(hù)的“全能助手(shǒu)”,包揽一(yī)切应用,与人们进行沟通(tōng)并提供(gōng)建议,可(kě)以取(qǔ)代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到来可能尚需时日(rì),但由ControlNet引发(fā)的又一次AI绘(huì)画(huà)浪潮,让AIGC在(zài)ChatGPT的话题热(rè)点包围中杀出重围。

ChatGPT之后又一应用杀(shā)疯(fēng)了(le),AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量

01

ControlNet颠覆AI绘(huì)画新玩(wán)法

AIGC向可控(kòng)靠近

以(yǐ)AI绘(huì)画为代表的AIGC上一(yī)次爆火的时候,还是2022年8月,在美(měi)国科罗拉多州举(jǔ)办的新兴数字艺术家竞赛中,一幅名为《太空歌剧院》的作品获奖(jiǎng)。

随后各(gè)大厂商(shāng)的AI绘(huì)画(huà)软件被广大网(wǎng)友熟知并体验,Stable Diffusion便(biàn)是其(qí)中(zhōng)代表。

ChatGPT之后(hòu)又一应用(yòng)杀(shā)疯了,AIGC或进(jìn)入(rù)可控期,将(jiāng)洗牌(pái)科技行业?_黑(hēi)料正(zhèng)能量

用户(hù)们可以在应用中输入一组关(guān)键词或者一张照片(piàn),就能获(huò)得一(yī)幅AI创作的画作(zuò)。

作画的关键就(jiù)是所输(shū)入的文本。同一(yī)组关键词也可(kě)以创(chuàng)作出很多张风(fēng)格(gé)不一样的画作,这让创作的过程就像(xiàng)开(kāi)盲盒。

很多用户(hù)很喜欢这种(zhǒng)不确(què)定的(de)惊喜,他们会将(jiāng)生成(chéng)的美图当(dāng)做头像。而另(lìng)一部(bù)分喜欢翻看AI绘画的“翻车”作(zuò)品。在社交媒体上,许多用户(hù)分(fēn)享AI“翻车现场”,例(lì)如,一位网友的(de)小狗(gǒu)照片被AI画成了“肌肉(ròu)男”,还(hái)有网友的(de)个人(rén)照片被(bèi)AI识别成了建(jiàn)筑。

而如(rú)今随着ControlNet的出现(xiàn)与加持,以(yǐ)往(wǎng)AI绘(huì)画(huà)的填写关键词游戏可(kě)能要被(bèi)颠覆了。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业(yè)?_黑料正能(néng)量

ControlNet是一(yī)位正在(zài)斯坦(tǎn)福(fú)读博的(de)中国人张吕敏创(chuàng)作(zuò)的一种基(jī)于控制(zhì)点的图像变形算(suàn)法(fǎ),主要(yào)用于数字图像处理、计算(suàn)机视觉和计(jì)算机图形学等领域(yù)。

其SD插件一经发布,在短(duǎn)短的两天内便成(chéng)为了(le)AI绘(huì)画(huà)领域最(zuì)新的(de)热点。

在(zài)此之前,大家(jiā)用了很多方法(fǎ)想让AI生成的(de)结果(guǒ)尽可能的符合要求(qiú),但(dàn)是都(dōu)不(bù)尽如(rú)人(rén)意(yì),它的出现代表(biǎo)着AI生成开始进(jìn)入真正的可控(kòng)时(shí)期。

因为(wèi)ControlNet可以直接提(tí)取画(huà)面的构图,人物的(de)姿势和画面的深度信息等(děng)。有了(le)它的帮助,就不用频繁的用提(tí)示词(cí)来碰运气(qì),抽盲盒式的(de)创作了。

通俗的说ControlNet相当于给(gěi)AI绘画加了“魔法”,不(bù)少博主的(de)作品已经获得了(le)大量的浏览量,“viggo”就是(shì)其中之一,他(tā)用(yòng)朋友的(de)照片直接带她(tā)们(men)走进动漫(màn)世界。

ChatGPT之后(hòu)又一应用(yòng)杀疯了(le),AIGC或进(jìn)入可(kě)控期,将洗牌科技行业(yè)?_黑(hēi)料正能量

viggo先用StableDiffusion图片转文字。

再(zài)用(yòng)Text2Prompt插(chā)件拓(tuò)展找到对应的关键(jiàn)词;最后用ControlNet插(chā)件绑定骨骼开始换关(guān)键词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科(kē)技行业?_黑料正能量(liàng)

通过(guò)图片就可以看(kàn)出(chū)来,效果十分惊(jīng)艳(yàn)。

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌(pái)科(kē)技(jì)行业?_黑料正能量

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科技行业(yè)?_黑(hēi)料正能(néng)量

更厉(lì)害的是(shì),除了真实的照片(piàn),草(cǎo)图也(yě)可以(yǐ)加上“魔法”,知乎(hū)大(dà)牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线稿转全彩图。大神张吕敏其本尊也亲自回应。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业(yè)?_黑料正能(néng)量

不得不说当下AIGC已(yǐ)经变(biàn)得越来(lái)越强大,甚(shèn)至输(shū)出的作品都已经能(néng)以假乱(luàn)真了。

02

难辨虚实,AIGC技术力爆发

警惕(tì)安全问题

近日,“苏州金(jīn)鸡湖有游艇party”的消息火遍网络(luò),而(ér)经过警方辟谣这所谓(wèi)的“party”可能是全国第(dì)一(yī)起AI绘图诈(zhà)骗(piàn)。

由于这个活动里面给出的(de)美女照(zhào)片都是AI制作的真人照(zhào)片绘图,因(yīn)为(wèi)太逼真,被大家(jiā)当成真事传播了(le)

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌(pái)科技行业(yè)?_黑(hēi)料正能(néng)量(liàng)

不过(guò)仔细观察可(kě)以发(fā)现(xiàn),活动发起者(zhě)提供(gōng)的(de)照片中有个很大的漏洞可以发现(xiàn)并非真人,而是AI绘(huì)图,那便是图(tú)片中女性的手(shǒu)指部分有的存在异常。

ChatGPT之后(hòu)又(yòu)一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能(néng)量

有(yǒu)行(xíng)业人事(shì)表示:“现在因为(wèi)手指(zhǐ)部分的(de)绘画算法比较复杂,AI还不太会画(huà)人的手,但最新看到的图片已经有(yǒu)越来越完美的(de)AI模型(xíng)出现,以后可(kě)能就(jiù)完全没有漏洞了(le)。

类似的(de)AI作图诈骗在(zài)国外也已有发生。据英国(guó)广播公司报道,土耳其地(dì)震期间,有Tiktok用户使用AI合成了儿童受灾的假照片发布到网(wǎng)络(luò),以此诱骗善良的(de)人打赏“捐(juān)助”从(cóng)而(ér)实(shí)施诈骗。

目前(qián)随着(zhe)技(jì)术发展(zhǎn),AIGC已经能做出真人(rén)照片般的绘图效果(guǒ),如果这(zhè)样的图片被用(yòng)来(lái)诈骗,将非常(cháng)可怕。

此外AIGC还引发了很多担忧,一(yī)方面,批(pī)判者认为AI在“学习”了大(dà)量前(qián)人的(de)作品之后(hòu),其创作没有任何(hé)情绪和灵魂(hún),难(nán)以和人类(lèi)的艺术创作相提并(bìng)论。

另一方面,AIGC背后的版权、目前都并没有得到有效的解决,还有AIGC会不会代替人类“至高(gāo)无上”的(de)创(chuàng)意。

马斯(sī)克也强调,人工智(zhì)能(néng)的安全问题家贫无从致书以观出自哪里,家贫无从致书以观每假借于藏书之家翻译需要得到重视,太晚就(jiù)来不及(jí)了(le)。

03

AIGC下一站除(chú)了视频,还有远方

技术都是有(yǒu)两面性的,潜在的危害并不能掩盖其光辉的贡献。现在(zài)看来,人(rén)工(gōng)智能技(jì)术将(jiāng)是第四次工业革命的核(hé)心驱动(dòng)力量,将创造(zào)新(xīn)的增长奇迹。

过(guò)去一年,人工(gōng)智能在(zài)技术和商(shāng)业层(céng)面都有了巨大进展(zhǎn),AI绘画就是人工智(zhì)能技术发生方向性改变的一(yī)个代(dài)表。其下一站或许就是视(shì)频。

此前,Meta和(hé)谷(gǔ)歌先(xiān)后发(fā)布(bù)了(le)几条(tiáo)引爆科技圈的短视频。这(zhè)些视频引发关注并非内容做(zuò)得多优秀,反(fǎn)而(ér)都(dōu)非常简单,比如一匹正在喝水的马,一只画画(huà)的玩具熊,或者(zhě)一段(duàn)骑摩托车的(de)第一(yī)视角录(lù)像,随便一个(gè)有手(shǒu)机的人都(dōu)可以随手(shǒu)录下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

但这些短视频的创作方式(shì)非(fēi)常简单,创作者仅仅需要向AI输入(rù)一段话,甚至(zhì)只(zhǐ)是说一下要(yào)求(qiú),AI就(jiù)可以根据(jù)需要生成一段视频。

谷(gǔ)歌发(fā)布的两个AI生成视频分别来(lái)自于Imagen Video和Phenaki,前者(zhě)主要突出的是高清,与(yǔ)Meta的Make-A-Video没(méi)有太多的差别。

在(zài)Make-A-Video公布了AI生成(chéng)的视频后,AI圈就已经玩了一波梗,一(yī)个能够做出更高清(qīng)视频的(de)AI还不足以在短时间内戳中兴(xīng)奋点(diǎn)。

Phenaki更加令人震(zhèn)惊(jīng)的(de)地(dì)方在于,它(tā)可(kě)以制作出超过(guò)2分(fēn)钟的连贯的(de)也有确切内容的视频,这才是(shì)真正(zhèng)让人(rén)们(men)感到惊喜的地方。因(yīn)为无论(lùn)AI生成的(de)视频多么高清,也只能是为内容生产者提供(gōng)一个灵(líng)感,一个素(sù)材,一(yī)个过场动画。

不过能够制作出有具(jù)体剧情内(nèi)容(róng)的视频就意味着,一些视频创作(zuò)由(yóu)AI代替人工完成已(yǐ)经初步有了可能。

当下AI的发展速度(dù)已经超过大部(bù)分人(rén)的想象。内容(róng)产业的本质是供给创造需求,AIGC作为全新(xīn)的(de)内(nèi)容(róng)生产方式,可以为内(nèi)容产业(yè)带(dài)来更新的(de)内(nèi)容(róng)风格、更快的生产速(sù)度(dù),更低的生产成本,这无(wú)疑会驱动内容产业的大(dà)爆发。

除了AI绘(huì)图、视频,AIGC技(jì)术还能(néng)应用于音乐、代码(mǎ)、机器人动作等多(duō)种内容形式(shì)的生成。不难发现该项技术不仅在游戏等行业能得到(dào)有(yǒu)效应用,对(duì)于下一代互联网各(gè)种元素的构(gòu)建亦有关键意(yì)义。

从(cóng)商业(yè)化的角度来看,文(wén)化娱乐、教育、传媒等诸多领域,本(běn)身就对基于(yú)AI的可(kě)视化(huà)内容有(yǒu)强烈(liè)需求。

因此,AI绘画及视家贫无从致书以观出自哪里,家贫无从致书以观每假借于藏书之家翻译频或不是(shì)结果,而只是AI进程中的一块重(zhòng)要拼(pīn)图,有(yǒu)望(wàng)在(zài)技术更新的加持下实(shí)现更大的应用(yòng)价值。

AI从理解内容,走向了可以生成内容,甚(shèn)至能够创造(zào)出独立价值和独立(lì)视(shì)角的内容。AIGC的再次(cì)出圈,更代表着未来的先(xiān)进生产力即将到来(lái)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能量

04

紧抓大模型与算力,牢(láo)固AIGC底(dǐ)座

从技术的发展(zhǎn)也可以看出,在语言(yán)大模型、图(tú)像大(dà)模型(xíng)之后,多模态大模型(xíng)已经成为了新(xīn)的(de)趋势。

大(dà)模(mó)型被誉(yù)为当前人工智(zhì)能发展的智能底座,是全球竞(jìng)争(zhēng)最激烈的研究方向(xiàng)之一,包括谷歌(gē)、亚马逊、百度、阿里、腾讯等众多头部企业都在竞相发力。

不过(guò)训练大模(mó)型(xíng)的确价格不菲,以国盛(shèng)证券发布的《ChatGPT需要多少算力》报告(gào)估算,GPT-3训练一次的成(chéng)本约为140万美元。而对(duì)于一些更大(dà)的LLM(大型语言模(mó)型),训练成本(běn)则介于200万美元至1200万美元(yuán)高价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立(lì)访客平均数1300万计算(suàn),其对应芯片需求为3万多片英伟达A100 GPU,初(chū)始投入成本约为8亿(yì)美元(yuán),每日仅电(diàn)费就在5万美元左右。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌(pái)科技行业?_黑料正能量

此(cǐ)外(wài)不论是(shì)ChatGPT还是(shì)AIGC,都离不开庞大(dà)算力支(zhī)持(chí)。在关注各类(lèi)大模型(xíng)的发展同时(shí),更应该关注算力网络(luò)的建(jiàn)设。

算力网(wǎng)络正驱动AI产业发展进入史诗级(jí)加(jiā)速进程,让AIGC及通用AI这一(yī)人工智能发(fā)展(zhǎn)的终极目(mù)标离(lí)得更近。

因(yīn)为算(suàn)力可以对突(tū)破(pò)性技术创新(xīn)提(tí)供大(dà)力的支持。这方(fāng)面,多模态大模型是典(diǎn)型。作(zuò)为(wèi)面(miàn)向未来强人(rén)工智能、通用(yòng)人工智能(néng)的重要技术创新(xīn),多模态大模型已经在(zài)人工智能领域(yù)提出了很多年(nián),业(yè)界也有不(bù)少技术突破,但是,多模(mó)态大模型进一步往下走,算(suàn)力需求呈(chéng)几何(hé)式上升,一般的算力基(jī)础(chǔ)设施很快将难以胜任。

从(cóng)图像、文字(zì)、语音单独一项的训练,到双模态、三模态的跃迁,让人工智能可以灵活应对不同(tóng)模(mó)态的转化、像人与世(shì)界交互一样(yàng)自然,这(zhè)方面,由算力网络来驱动将有(yǒu)明显优势。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入(rù)可控(kòng)期,将洗牌(pái)科(kē)技行业?_黑料正(zhèng)能量

此(cǐ)外(wài),还有很多需(xū)要爆发式增长(zhǎng)的算力来支(zhī)撑(chēng)的技术(shù)创新,将在人工(gōng)智能算(suàn)力(lì)网络支撑下快速(sù)推进(jìn)。

AIGC已(yǐ)经露(lù)出曙光,期待在大模型和大算力的支持下AIGC能持续(xù)颠覆内容生产的方(fāng)式,将创造的边际成本降低(dī),让万众受益。

未经允许不得转载:腾众软件科技有限公司 家贫无从致书以观出自哪里,家贫无从致书以观每假借于藏书之家翻译

评论

5+2=