AI绘画的“小秘密”都在这一篇文章里******
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
智媒元宇宙:打造智能传播新生态 服务人类文明新形态******
从概念元宇宙到智媒元宇宙,从现代传播体系到智能全媒体传播体系,从智能全媒体传播新生态到人类文明新形态,我国传媒领域及其内外部环境正在发生着深刻的历史性变革和时代性演进。
一、智媒元宇宙概念:构建开放共享、智能融合的数字虚拟新世界
我们认为,智媒元宇宙是我国传媒领域在元宇宙传播场景下所构建的一个开放共享、智能融合的数字虚拟新世界,旨在推进智媒元宇宙传播新生态与现实传播世界数字孪生与和谐共生,创造出巨大的数字资产、数字新物种和数字财富,为我国网络空间建设、数字文明建设和人类文明新形态探索贡献中国智慧、中国力量和中国方案。
从传播历史演进的维度来看,元宇宙是一个创新型、融合型、虚拟型的传播生态体系。在元宇宙传播场景、传播空间、传播结构中,所有的主体都是智能全媒体传播主体。从媒介的维度来看,媒介组织将在元宇宙传播场景、传播空间、传播结构中扮演极为重要的角色。也就是说,智媒元宇宙是元宇宙传播体系、传播生态中的重要组成部分,是元宇宙虚拟场景的专业内容提供者,是元宇宙空间治理的重要引导者、参与者和贡献者。智媒元宇宙并不脱离元宇宙的传播场景而独立存在,智媒元宇宙和传播主体、传播内容、传播关系、传播场景共同构成了元宇宙的传播空间和传播生态。
二、智媒元宇宙愿景:打造世界一流智媒元宇宙传播新生态
智媒元宇宙需要从技术维度获得充分赋能。具体而言,可以从云端化、垂直化、场景化、智能化等四个方面形成元宇宙传播新赋能,打造世界一流智媒元宇宙传播新生态,共建中国特色开放共享智能融合数字虚拟新世界。
从网络空间维度看,云端化是智媒元宇宙发展所应具备的虚拟化网络能力。云端化可以看作是网络能力、计算能力、服务能力的虚拟化。这为智媒元宇宙传播空间的构建奠定了网络基础或信息基础设施基础。
从行业发展维度看,垂直化是智媒元宇宙发展所应具备的产业化建构能力。每一个垂直的行业,都有关于元宇宙传播空间、传播场景、传播形态的具体需求。由此可见不管是元宇宙,还是智媒元宇宙,都应聚焦各行业元宇宙需求和趋势,为元宇宙的垂直化服务提供精准和直接的支持。
从传播感知维度看,场景化是智媒元宇宙发展所应具备的网络空间建构能力。如何搭建智媒元宇宙的传播空间、传播场景,为所有元宇宙传播者提供具有虚拟现实特点的个性化服务,这是智媒元宇宙所要解决的重要问题。智媒元宇宙不是为了媒介组织自身的自娱自乐,而是为了提供多维场景化的传播服务。这是智媒元宇宙的核心要义。
从传播服务维度看,智能化是智媒元宇宙发展所应具备的智能传播关键能力。智能化传播环境,智慧化传播服务,这是智媒元宇宙所形成智能化传播能力的主要内容。智能化的环境和智慧化传播服务相结合,构成了智慧传播的全媒体传播体系。这是智媒元宇宙发展的重要方向。
三、智媒元宇宙特征:涌现多元主体,创建多维场景
智媒元宇宙具有虚拟性、场景性、互动性、融合性、生态性、安全性等主要特征。
智媒元宇宙是一个虚拟化的传播世界。虚拟不是单一的虚拟,而是多重叠加、多元叠加的虚拟场景。虚拟成为最大的传播现实。传播的现实场景和虚拟场景的融合无处不在,无时不在。
智媒元宇宙是一个场景化的传播世界。各种生活场景、工作场景都将成为智媒元宇宙的传播新常态。在智媒元宇宙传播生态之下,智能全媒体传播主体将进一步跨越时空的限制,并获得更大程度的传播自由和传播空间。
智媒元宇宙是一个互动化的传播世界。智媒元宇宙的互动不是简单化的互动,而是包含服务性内容互动,是包括产业链、供应链、价值链、生态链等价值在内的互动。互动产生价值,协同激发成效,共存推进共生,共赢推进共荣。
智媒元宇宙是一个融合化的传播世界。从媒体融合到全媒体传播体系,我国媒体发展进入新阶段。智媒元宇宙的融合涵盖了现实和虚拟的深度融合,涵盖了生活方式和工作方式的深度融合,涵盖了传播和服务的深度融合。
智媒元宇宙是一个生态化的传播世界。随着新一代数字信息技术和网络的不断发展,人类传播世界的生态化特征越来越明显。智媒元宇宙的生态化主要体现在传播主体、传播关系、传播内容、传播结构、传播场景等方面。
智媒元宇宙是一个安全化的传播世界。智媒元宇宙的去中心化和安全性发展并不矛盾。去中心化为智媒元宇宙的全方位创新创造了有利条件,安全性则为智媒元宇宙发展提供了行稳致远的基本保证。越是在高度开放、深度融合的环境下,越要关注智媒元宇宙传播生态的网络安全、系统安全、平台安全、内容安全、关系安全、场景安全等内容。将智媒元宇宙发展和安全性要求辩证地统一在智媒元宇宙稳健有序发展的大目标下,智媒元宇宙才能创造更加丰富多彩的传播生态和传播未来。
四、智媒元宇宙机制:构建和谐共生的智能全媒体传播体系
从全程媒体、全息媒体、全员媒体、全效媒体的发展脉络上认识和把握元宇宙,倡导元宇宙生态的“共创、共商、共建、共享”等价值理念,通过智媒元宇宙传播新生态形成创新传播机制,建构传媒现实传播体系和虚拟传播体系和谐共生的智能全媒体传播体系,涵盖全媒体传播体系架构下的全产业链、全传播要素和全生态领域。
智能元宇宙背后,所隐藏的是两大机制:一是智媒元宇宙呈现层的新型传播生态。二是智媒元宇宙产业层的产业链、创新链、价值链、生态链。只有智媒元宇宙产业层的繁荣发展,才能带动或推动智媒元宇宙的繁荣发展。与此同时,智媒元宇宙呈现层的繁荣发展也将吸引、凝聚更多的传播资源,为智媒元宇宙发展创造良好内外部环境。
五、智媒元宇宙展望:推进现实虚拟场景深度融合,为人类文明新形态发展提供支持
元宇宙方兴未艾。智媒元宇宙蓄势待发。随着元宇宙网络、技术、服务的不断完善,智媒元宇宙传播生态体系将获得长足发展。在此背景之下,智媒元宇宙也将不断开拓新型虚拟传播空间和传播领域。
展望未来,智媒元宇宙所建构的是一个开放共享、智能融合的数字虚拟新世界。智媒元宇宙是我国智能全媒体传播体系的重要体现,是我国新时代传播体系的前沿领域,是我国传播生态的新型形态。智媒元宇宙大大拓展了全媒体传播的虚拟空间,大力推进了虚拟场景和现实场景的深刻融合,为人类文明新形态的发展提供了新的支撑、新的空间和新的领域。
智媒元宇宙建设大事记
2021年11月21日,元宇宙与智能全媒体发展研讨活动在京举行。
研讨活动由中国广播电视社会组织联合会智能全媒体委员会(下称智媒委)主办,国家广电总局宣传司原巡视员、智媒委会长杨杰,智媒委高级顾问、人民邮电报社原总编辑武锁宁,智媒委高级顾问、中国联通集团原高级副总裁姜正新,工信部电子工业出版社总编辑兼华信研究院院长刘九如,智媒委高级顾问、中国移动集团设计院原副院长刘涛,中国世贸组织研究会数贸会主任杨勇,中央广播电视总台央广网副总编高阳,国家广电总局《广电时评》杂志主编牛春颖,中国宋庆龄基金会《环球慈善》杂志执行主编马瑞聪等20余位广播电视和网络视听媒体、信息通信与互联网行业、大学等研究机构的知名专家学者参加研讨。会议由智媒委副会长兼秘书长李永刚、智媒委副会长付玉辉主持。
与会专家合影
2022年5月22日,智媒委联合中国网生活频道、上方股份发起“中广数字艺术”平台共建工作。
同日,新华社报道:“中共中央办公厅、国务院办公厅近日印发《关于推进实施国家文化数字化战略的意见》明确,夯实文化数字化基础设施,依托现有有线电视网络设施、广电5G网络和互联互通平台,形成国家文化专网。”“鼓励多元主体依托国家文化专网,共同搭建文化数据服务平台。”智媒委联合中国网生活频道(中网数智)、上方股份,在元宇宙研究和智库建设、数字藏品研究和平台建设等领域开展全面合作,共建“中广数字艺术”、中广IP资源孵化器等平台,共同促进元宇宙技术与全媒体融合创新发展,引导智能全媒体领域在元宇宙时代的新产品、新业态、新模式、新物种的创新成长。“中广数字艺术”平台将积极服务和支撑广电传媒转化优势资源,开展文化数字化工作,开拓文化产业市场,推进数字藏品开发和研究工作同时,为全国广电传媒提供数字藏品IP汇聚等公共服务。“中广数字艺术”平台还将联合广电和文化领域有关机构,发起数字藏品平台合法合规运营倡议,促进各数字藏品平台制定科学规范的业务流程与技术规范。
2022年5月30日,智媒元宇宙研究社群创立。开始智媒元宇宙共识探讨,启动基础设施建设,同时研究赋能细分行业。
2022年6月3日,茶元宇宙研究社群创立,是智媒元宇宙赋能的第一个细分行业元宇宙社群,共识形态基本呈现。“茶元宇宙研究群”愿景:研究探索元宇宙技术赋能茶文化、茶产业和茶科技发展;促进社群成员共创共享茶元宇宙新世界,创造出巨大的茶元宇宙数字新物种和数字财富。
2022年6月7日,全民国防教育元宇宙研究社群和直播电商元宇宙研究社群同时创立。
2022年6月10日,音乐戏曲元宇宙研究社群创立。
2022年6月19日,白酒元宇宙研究社群创立。“白酒元宇宙共识”(讨论版):白酒元宇宙,爱酒懂酒人的虚拟新世界。白酒元宇宙愿景:研究探索元宇宙技术赋能白酒文化、白酒品牌、白酒科技和白酒产业发展创新路径;促进本群成员共创共享白酒元宇宙数字新物种和数字财富,推动白酒元宇宙虚拟新世界和白酒消费现实场景互动共生。
2022年6月21日,智媒元宇宙基础设施建设思维导图初稿完成。
2022年7月7日,智媒元宇宙战略愿景发布。
2022年11月,智媒委启动智媒元宇宙产业联盟建设。
(作者系中国广播电视社会组织联合会智能全媒体委员会副会长、智媒与元宇宙发展研究部主任、中国联通集团新媒体中心原主任付玉辉,中国广播电视社会组织联合会智能全媒体委员会副会长兼秘书长、新华网亿连数据资产研究院原院长李永刚)
(文图:赵筱尘 巫邓炎)