家贫无从致书以观出自哪里，家贫无从致书以观每假借于藏书之家翻译-腾众软件科技有限公司

家贫无从致书以观出自哪里，家贫无从致书以观每假借于藏书之家翻译 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊(liáo)天机器人ChatGPT火爆以来，微软公司创始(shǐ)人比尔·盖茨已(yǐ)多次公(gōng)开谈论人工智能话(huà)题(tí)。在最近的一次采(cǎi)访(fǎng)中，他再次表示：“AI可能会让(ràng)科技行业迎(yíng)来一次(cì)剧烈的(de)洗牌”。

这个结论是他在当地时(shí)间(jiān)2月20日接受《In Good Company》节目(mù)专访时(shí)提出的。

他预期，AI的发展可能会威胁到谷歌(gē)的市占率，因为微软在AI方面的行动相当迅速。而最终科(kē)技巨头(tóu)将把(bǎ)AI整合成用(yòng)户(hù)的“全能助手(shǒu)”，包揽一(yī)切应用，与人们进行沟通(tōng)并提供(gōng)建议，可(kě)以取(qǔ)代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到来可能尚需时日(rì)，但由ControlNet引发(fā)的又一次AI绘(huì)画(huà)浪潮，让AIGC在(zài)ChatGPT的话题热(rè)点包围中杀出重围。

ChatGPT之后又一应用杀(shā)疯(fēng)了(le)，AIGC或进入可控(kòng)期，将洗牌科技行业？_黑料正(zhèng)能量

ControlNet颠覆AI绘(huì)画新玩(wán)法

AIGC向可控(kòng)靠近

以(yǐ)AI绘(huì)画为代表的AIGC上一(yī)次爆火的时候，还是2022年8月，在美(měi)国科罗拉多州举(jǔ)办的新兴数字艺术家竞赛中，一幅名为《太空歌剧院》的作品获奖(jiǎng)。

随后各(gè)大厂商(shāng)的AI绘(huì)画(huà)软件被广大网(wǎng)友熟知并体验，Stable Diffusion便(biàn)是其(qí)中(zhōng)代表。

用户(hù)们可以在应用中输入一组关(guān)键词或者一张照片(piàn)，就能获(huò)得一(yī)幅AI创作的画作(zuò)。

作画的关键就(jiù)是所输(shū)入的文本。同一(yī)组关键词也可(kě)以创(chuàng)作出很多张风(fēng)格(gé)不一样的画作，这让创作的过程就像(xiàng)开(kāi)盲盒。

很多用户(hù)很喜欢这种(zhǒng)不确(què)定的(de)惊喜，他们会将(jiāng)生成(chéng)的美图当(dāng)做头像。而另(lìng)一部(bù)分喜欢翻看AI绘画的“翻车”作(zuò)品。在社交媒体上，许多用户(hù)分(fēn)享AI“翻车现场”，例(lì)如，一位网友的(de)小狗(gǒu)照片被AI画成了“肌肉(ròu)男”，还(hái)有网友的(de)个人(rén)照片被(bèi)AI识别成了建(jiàn)筑。

而如(rú)今随着ControlNet的出现(xiàn)与加持，以(yǐ)往(wǎng)AI绘(huì)画(huà)的填写关键词游戏可(kě)能要被(bèi)颠覆了。

ControlNet是一(yī)位正在(zài)斯坦(tǎn)福(fú)读博的(de)中国人张吕敏创(chuàng)作(zuò)的一种基(jī)于控制(zhì)点的图像变形算(suàn)法(fǎ)，主要(yào)用于数字图像处理、计算(suàn)机视觉和计(jì)算机图形学等领域(yù)。

其SD插件一经发布，在短(duǎn)短的两天内便成(chéng)为了(le)AI绘(huì)画(huà)领域最(zuì)新的(de)热点。

在(zài)此之前，大家(jiā)用了很多方法(fǎ)想让AI生成的(de)结果(guǒ)尽可能的符合要求(qiú)，但(dàn)是都(dōu)不(bù)尽如(rú)人(rén)意(yì)，它的出现代表(biǎo)着AI生成开始进(jìn)入真正的可控(kòng)时(shí)期。

因为(wèi)ControlNet可以直接提(tí)取画(huà)面的构图，人物的(de)姿势和画面的深度信息等(děng)。有了(le)它的帮助，就不用频繁的用提(tí)示词(cí)来碰运气(qì)，抽盲盒式的(de)创作了。

通俗的说ControlNet相当于给(gěi)AI绘画加了“魔法”，不(bù)少博主的(de)作品已经获得了(le)大量的浏览量，“viggo”就是(shì)其中之一，他(tā)用(yòng)朋友的(de)照片直接带她(tā)们(men)走进动漫(màn)世界。

viggo先用StableDiffusion图片转文字。

再(zài)用(yòng)Text2Prompt插(chā)件拓(tuò)展找到对应的关键(jiàn)词；最后用ControlNet插(chā)件绑定骨骼开始换关(guān)键词试效果。

通过(guò)图片就可以看(kàn)出(chū)来，效果十分惊(jīng)艳(yàn)。

更厉(lì)害的是(shì)，除了真实的照片(piàn)，草(cǎo)图也(yě)可以(yǐ)加上“魔法”，知乎(hū)大(dà)牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实现线稿转全彩图。大神张吕敏其本尊也亲自回应。

不得不说当下AIGC已(yǐ)经变(biàn)得越来(lái)越强大，甚(shèn)至输(shū)出的作品都已经能(néng)以假乱(luàn)真了。

难辨虚实，AIGC技术力爆发

警惕(tì)安全问题

近日，“苏州金(jīn)鸡湖有游艇party”的消息火遍网络(luò)，而(ér)经过警方辟谣这所谓(wèi)的“party”可能是全国第(dì)一(yī)起AI绘图诈(zhà)骗(piàn)。

由于这个活动里面给出的(de)美女照(zhào)片都是AI制作的真人照(zhào)片绘图，因(yīn)为(wèi)太逼真，被大家(jiā)当成真事传播了(le)。

不过(guò)仔细观察可(kě)以发(fā)现(xiàn)，活动发起者(zhě)提供(gōng)的(de)照片中有个很大的漏洞可以发现(xiàn)并非真人，而是AI绘(huì)图，那便是图(tú)片中女性的手(shǒu)指部分有的存在异常。

ChatGPT之后(hòu)又(yòu)一应用杀疯了，AIGC或进入可控期(qī)，将洗牌科技(jì)行业？_黑料正能(néng)量

有(yǒu)行(xíng)业人事(shì)表示：“现在因为(wèi)手指(zhǐ)部分的(de)绘画算法比较复杂，AI还不太会画(huà)人的手，但最新看到的图片已经有(yǒu)越来越完美的(de)AI模型(xíng)出现，以后可(kě)能就(jiù)完全没有漏洞了(le)。”

类似的(de)AI作图诈骗在(zài)国外也已有发生。据英国(guó)广播公司报道，土耳其地(dì)震期间，有Tiktok用户使用AI合成了儿童受灾的假照片发布到网(wǎng)络(luò)，以此诱骗善良的(de)人打赏“捐(juān)助”从(cóng)而(ér)实(shí)施诈骗。

目前(qián)随着(zhe)技(jì)术发展(zhǎn)，AIGC已经能做出真人(rén)照片般的绘图效果(guǒ)，如果这(zhè)样的图片被用(yòng)来(lái)诈骗，将非常(cháng)可怕。

此外AIGC还引发了很多担忧，一(yī)方面，批(pī)判者认为AI在“学习”了大(dà)量前(qián)人的(de)作品之后(hòu)，其创作没有任何(hé)情绪和灵魂(hún)，难(nán)以和人类(lèi)的艺术创作相提并(bìng)论。

另一方面，AIGC背后的版权、目前都并没有得到有效的解决，还有AIGC会不会代替人类“至高(gāo)无上”的(de)创(chuàng)意。

马斯(sī)克也强调，人工智(zhì)能(néng)的安全问题家贫无从致书以观出自哪里，家贫无从致书以观每假借于藏书之家翻译需要得到重视，太晚就(jiù)来不及(jí)了(le)。

AIGC下一站除(chú)了视频，还有远方

技术都是有(yǒu)两面性的，潜在的危害并不能掩盖其光辉的贡献。现在(zài)看来，人(rén)工(gōng)智能技(jì)术将(jiāng)是第四次工业革命的核(hé)心驱动(dòng)力量，将创造(zào)新(xīn)的增长奇迹。

过(guò)去一年，人工(gōng)智能在(zài)技术和商(shāng)业层(céng)面都有了巨大进展(zhǎn)，AI绘画就是人工智(zhì)能技术发生方向性改变的一(yī)个代(dài)表。其下一站或许就是视(shì)频。

此前，Meta和(hé)谷(gǔ)歌先(xiān)后发(fā)布(bù)了(le)几条(tiáo)引爆科技圈的短视频。这(zhè)些视频引发关注并非内容做(zuò)得多优秀，反(fǎn)而(ér)都(dōu)非常简单，比如一匹正在喝水的马，一只画画(huà)的玩具熊，或者(zhě)一段(duàn)骑摩托车的(de)第一(yī)视角录(lù)像，随便一个(gè)有手(shǒu)机的人都(dōu)可以随手(shǒu)录下一段。

但这些短视频的创作方式(shì)非(fēi)常简单，创作者仅仅需要向AI输入(rù)一段话，甚至(zhì)只(zhǐ)是说一下要(yào)求(qiú)，AI就(jiù)可以根据(jù)需要生成一段视频。

谷(gǔ)歌发(fā)布的两个AI生成视频分别来(lái)自于Imagen Video和Phenaki，前者(zhě)主要突出的是高清，与(yǔ)Meta的Make-A-Video没(méi)有太多的差别。

在(zài)Make-A-Video公布了AI生成(chéng)的视频后，AI圈就已经玩了一波梗，一(yī)个能够做出更高清(qīng)视频的(de)AI还不足以在短时间内戳中兴(xīng)奋点(diǎn)。

Phenaki更加令人震(zhèn)惊(jīng)的(de)地(dì)方在于，它(tā)可(kě)以制作出超过(guò)2分(fēn)钟的连贯的(de)也有确切内容的视频，这才是(shì)真正(zhèng)让人(rén)们(men)感到惊喜的地方。因(yīn)为无论(lùn)AI生成的(de)视频多么高清，也只能是为内容生产者提供(gōng)一个灵(líng)感，一个素(sù)材，一(yī)个过场动画。

不过能够制作出有具(jù)体剧情内(nèi)容(róng)的视频就意味着，一些视频创作(zuò)由(yóu)AI代替人工完成已(yǐ)经初步有了可能。

当下AI的发展速度(dù)已经超过大部(bù)分人(rén)的想象。内容(róng)产业的本质是供给创造需求，AIGC作为全新(xīn)的(de)内(nèi)容(róng)生产方式，可以为内(nèi)容产业(yè)带(dài)来更新的(de)内(nèi)容(róng)风格、更快的生产速(sù)度(dù)，更低的生产成本，这无(wú)疑会驱动内容产业的大(dà)爆发。

除了AI绘(huì)图、视频，AIGC技(jì)术还能(néng)应用于音乐、代码(mǎ)、机器人动作等多(duō)种内容形式(shì)的生成。不难发现该项技术不仅在游戏等行业能得到(dào)有(yǒu)效应用，对(duì)于下一代互联网各(gè)种元素的构(gòu)建亦有关键意(yì)义。

从(cóng)商业(yè)化的角度来看，文(wén)化娱乐、教育、传媒等诸多领域，本(běn)身就对基于(yú)AI的可(kě)视化(huà)内容有(yǒu)强烈(liè)需求。

因此，AI绘画及视家贫无从致书以观出自哪里，家贫无从致书以观每假借于藏书之家翻译频或不是(shì)结果，而只是AI进程中的一块重(zhòng)要拼(pīn)图，有(yǒu)望(wàng)在(zài)技术更新的加持下实(shí)现更大的应用(yòng)价值。

AI从理解内容，走向了可以生成内容，甚(shèn)至能够创造(zào)出独立价值和独立(lì)视(shì)角的内容。AIGC的再次(cì)出圈，更代表着未来的先(xiān)进生产力即将到来(lái)。

紧抓大模型与算力，牢(láo)固AIGC底(dǐ)座

从技术的发展(zhǎn)也可以看出，在语言(yán)大模型、图(tú)像大(dà)模型(xíng)之后，多模态大模型(xíng)已经成为了新(xīn)的(de)趋势。

大(dà)模(mó)型被誉(yù)为当前人工智(zhì)能发展的智能底座，是全球竞(jìng)争(zhēng)最激烈的研究方向(xiàng)之一，包括谷歌(gē)、亚马逊、百度、阿里、腾讯等众多头部企业都在竞相发力。

不过(guò)训练大模(mó)型(xíng)的确价格不菲，以国盛(shèng)证券发布的《ChatGPT需要多少算力》报告(gào)估算，GPT-3训练一次的成(chéng)本约为140万美元。而对(duì)于一些更大(dà)的LLM(大型语言模(mó)型)，训练成本(běn)则介于200万美元至1200万美元(yuán)高价之间。

以(yǐ)ChatGPT在(zài)2023年1月的独立(lì)访客平均数1300万计算(suàn)，其对应芯片需求为3万多片英伟达A100 GPU，初(chū)始投入成本约为8亿(yì)美元(yuán)，每日仅电(diàn)费就在5万美元左右。

此(cǐ)外(wài)不论是(shì)ChatGPT还是(shì)AIGC，都离不开庞大(dà)算力支(zhī)持(chí)。在关注各类(lèi)大模型(xíng)的发展同时(shí)，更应该关注算力网络(luò)的建(jiàn)设。

算力网(wǎng)络正驱动AI产业发展进入史诗级(jí)加(jiā)速进程，让AIGC及通用AI这一(yī)人工智能发(fā)展(zhǎn)的终极目(mù)标离(lí)得更近。

因(yīn)为算(suàn)力可以对突(tū)破(pò)性技术创新(xīn)提(tí)供大(dà)力的支持。这方(fāng)面，多模态大模型是典(diǎn)型。作(zuò)为(wèi)面(miàn)向未来强人(rén)工智能、通用(yòng)人工智能(néng)的重要技术创新(xīn)，多模态大模型已经在(zài)人工智能领域(yù)提出了很多年(nián)，业(yè)界也有不(bù)少技术突破，但是，多模(mó)态大模型进一步往下走，算(suàn)力需求呈(chéng)几何(hé)式上升，一般的算力基(jī)础(chǔ)设施很快将难以胜任。

从(cóng)图像、文字(zì)、语音单独一项的训练，到双模态、三模态的跃迁，让人工智能可以灵活应对不同(tóng)模(mó)态的转化、像人与世(shì)界交互一样(yàng)自然，这(zhè)方面，由算力网络来驱动将有(yǒu)明显优势。