2020年11月20日(rì),2020中国5G+工(gōng)业互联网大会在武汉开幕。习近平总书(shū)记(jì)向(xiàng)大会发来贺信,“希望湖(hú)北省和武汉市以(yǐ)此次大会召开为契机,弘扬(yáng)伟大抗疫精神(shén),大力推动数字经济发展,为推动经济高质(zhì)量(liàng)发展、服务构建新发(fā)展格局作出贡献”。
8月底,我国首批8家(jiā)AI大模型产(chǎn)品获批名(míng)单出(chū)炉,由东湖高新区和中国科学(xué)院自动(dòng)化研(yán)究所共(gòng)建武汉人工智(zhì)能研究院打(dǎ)造的“紫东太初”大(dà)模型位(wèi)列(liè)其(qí)中(zhōng),这(zhè)也是全球首(shǒu)个图文音(yīn)三模态大模型(xíng),曾于去年9月荣获2022世界(jiè)人工(gōng)智能大会(huì)最(zuì)高奖项(xiàng)——SAIL大奖(jiǎng)。
“这也意味着人工智(zhì)能大(dà)模型开(kāi)始真正进入大众(zhòng)的视野,赋能千行百业。”近日,武汉人(rén)工智能研究院(以下简称“武智院”)院(yuàn)长王金(jīn)桥在接受长江日报《在(zài)场》栏目专访时表示(shì),贯彻落实习近平总书记重(chóng)要指示精神,将(jiāng)坚持以原始创新和核心技术(shù)研(yán)发为主导,以产业落(luò)地为目标,促进人工智能“走(zǒu)深向实”重塑(sù)千行百业。
“梦想光(guāng)谷”AI绘画创作比赛优秀(xiù)获奖(jiǎng)作品吸引了市(shì)民(mín)驻足。参赛者(zhě)依托“江城(chéng)洛神”AI创作平台,将简短的文本描述通(tōng)过Al创作出心目中的光谷。而“江城洛神”正是基于“紫东太初(chū)”大模(mó)型打造(zào)的人工智能内容创作平台(tái)。记者周超 摄
01
图文(wén)音三模态大(dà)模型
升级为多模态
王金桥介绍,大模型取名“紫东(dōng)太(tài)初”,一是寓(yù)意紫气东来、混沌初开,代表人工智能(néng)从专用迈向了通用,从感知智能迈向(xiàng)了认知智能;二(èr)是“紫东”与中国科学院自动化研究所的(de)谐音(yīn)相通,代(dài)表着(zhe)自动(dòng)化所自身的意(yì)义和使命。
3个月(yuè)前,中国科(kē)学院自(zì)动化研究所(suǒ)联合武智院发布“紫东太初”2.0全模态大(dà)模(mó)型,该大模型是在千亿参数三模(mó)态大模型“紫东(dōng)太初”1.0基础上的升级,在此前语音、图像(xiàng)和文本三模态的(de)基础上,加入了视频(pín)、信号、3D点云等模态数据(jù),突破了认(rèn)知增强的多模态关联等关键(jiàn)技术(shù),具备(bèi)全模(mó)态理解能(néng)力、生成能力和关联能力。这(zhè)意味(wèi)着(zhe)在(zài)实际应用场景(jǐng)中,它将能够为行业创造更大价值(zhí)。
今年以来(lái),国(guó)内(nèi)人工智能大模型如雨后春笋般(bān)涌现。据不完全统计(jì),截至今年5月,国内(nèi)已扎堆发(fā)布10亿级参数规模(mó)以上基(jī)础大模(mó)型79个(gè),“百模大(dà)战”打响。其中,绝大多(duō)数都是语言类大模(mó)型。
“我们是国内最(zuì)早开始大模型研(yán)究的团队之一。”王(wáng)金(jīn)桥介绍,得益于中(zhōng)国科学院自动化研究(jiū)所在多(duō)模态数据领(lǐng)域的多年积累,团队一开始就(jiù)选择了多模态(tài)大模(mó)型这条更(gèng)艰难(nán)的路,实现语音(yīn)、图像(xiàng)和文本等多种模态交(jiāo)叉协同与(yǔ)有(yǒu)机融合(hé),打造更(gèng)加拟人的人工智(zhì)能。“在这条研发路径上,我们走(zǒu)在了世界前(qián)列。”他说。
在武智院的操作平台上,王金桥(qiáo)给出了一张奔跑的小狗的照片,“紫东太初”立刻识别并描绘出照(zhào)片(piàn)中的景象:一只黑白相间的狗在铁轨上(shàng)奔跑着,身后是绿色的树林。当他提出“以光谷为主题做首(shǒu)诗(shī)”时,“紫(zǐ)东太初”迅速地完成了一首七(qī)言绝句。
长江日(rì)报记者注意到,“紫东太(tài)初(chū)”被形(xíng)象地设计成一个身穿汉服的小女孩(hái),取(qǔ)名“小初”。
王金桥解释说,身穿汉(hàn)服(fú)代(dài)表着“紫东太(tài)初”从(cóng)算(suàn)法到硬件、算力全栈国产化,全链(liàn)条(tiáo)“中国造(zào)”;而小女孩则意味着(zhe)国内的通用(yòng)人工智能还处于刚刚起步的阶(jiē)段(duàn),“和10多(duō)岁的孩子的能力差(chà)不(bú)多(duō)”。
上(shàng)月举行(háng)的东(dōng)湖算力(lì)与大数据(jù)创新大会上(shàng),基(jī)于“紫东太初”全(quán)模(mó)态大模(mó)型搭建的“紫东太初”大(dà)模(mó)型(xíng)开放服务平台2.0正(zhèng)式发(fā)布。
该平台瞄准当前人(rén)工智能大规模应用(yòng)难题(tí),将全力推动人工(gōng)智(zhì)能在各行业的(de)广泛应(yīng)用,实现人工智能大模型高效落地、提(tí)升行业效率。
“在智能世界‘混沌初开(kāi)’之际,希望‘紫东太初’的开放(fàng)体验能够为用户打开一扇探索AI未来的大(dà)门。”王金桥介绍,该平台已于近日对外开(kāi)放体验,用户可通过(guò)各种方式与AI进行交互(hù),享受到更为(wéi)便捷、高效的AI服务。
02
已在多个领域
形成规模化应用落地
光谷资本大(dà)厦内,中(zhōng)国光谷(gǔ)人工智(zhì)能AI艺(yì)术(shù)展正在展出。在(zài)现场体验(yàn)区,参观者只需要输入几个关键词或简单的文本描述(shù),就能通过(guò)“江城洛(luò)神”人工(gōng)智(zhì)能(néng)内容(róng)创作平台生成一幅幅独一无二的(de)绘画作(zuò)品,实(shí)现“妙语(yǔ)生画(huà)”。“人(rén)工智能作为一种技术,和艺术有了越来越(yuè)多的融合。”王金(jīn)桥(qiáo)说。
“江城洛神”正是基于“紫东太初”大模型(xíng)打(dǎ)造的人(rén)工智能内容创(chuàng)作平台,通过多模态技术实(shí)现图像编辑与生成,辅助(zhù)内容生产,用(yòng)户无需任何专业技能,只需轻轻一点,便可轻(qīng)松创造出属于自己的(de)艺术作品,可广泛运用于设(shè)计、影(yǐng)视、游戏等(děng)多个领域。
以室内装(zhuāng)修设计领(lǐng)域为例,只需提(tí)供一张户型图,“江城洛神”就可自动生成多种装修设计(jì)样(yàng)式,提示词越多、越精细,生成质量(liàng)就越(yuè)高,还能根(gēn)据不同提(tí)示自动对(duì)结果进(jìn)行编辑。
两(liǎng)周前,武汉市2023年数(shù)字(zì)经(jīng)济应用场景“揭榜挂帅”揭榜(bǎng)项目名单公布(bù),“紫东太初”大模(mó)型入选。
“‘紫东太(tài)初’大(dà)模型正赋(fù)能千行百业,推动数字经济全面发(fā)展(zhǎn)。”王金桥介绍,“紫东太初”人工智能开放服务(wù)平(píng)台目前已成功应用于汽车制(zhì)造质检、媒(méi)体信(xìn)息服务、文化旅游、手语(yǔ)教育(yù)、纺织(zhī)生产质检、医(yī)疗(liáo)器械等10余个领域,形成规模化应用落(luò)地。
在智慧医疗领域,武智院联手(shǒu)九州通打造基于“紫东太初(chū)”大模(mó)型的医疗器械智能管理平(píng)台,自动识别管(guǎn)理2000多种医疗器械(xiè),能效(xiào)提升30倍,精度实现99.9%,并将迅速推广到更多医院;
在法律咨询领域,“紫东太初”大模型仅需(xū)0.5秒就可完成案件的分析、拆解、定责(zé),将法律案件研判的效率提升100倍左右;
在文(wén)化娱乐领域,“紫东太初”大模型变身“人工智能导(dǎo)师”,从科技角度对(duì)歌曲(qǔ)的审美和传播做出全新推荐,为歌唱比赛(sài)参(cān)赛歌手们提出个性化建议……
据介绍(shào),截至目(mù)前,武智院已与湖北三(sān)环集团、湖(hú)北港口集团(tuán)、九州通集团、光谷人才集团、武汉光庭等10余家单位在(zài)智(zhì)能制造(zào)、智能网联(lián)汽(qì)车、智慧医(yī)疗、虚拟数字人等领域(yù)开(kāi)展(zhǎn)实质性(xìng)合作,并与东风集团、湖(hú)北电信、湖北广电、长江(jiāng)通(tōng)信、爱帝集团、集度汽(qì)车等40余家(jiā)企业达成合作意(yì)向,助力数字经济与实体经济深度融合。
“人工智能(néng)未来的10年将是AIGC(Artificial Intelligence Generated Content,即生成式人工智(zhì)能)的10年(nián),如果说这(zhè)个赛道有一万米,那么现(xiàn)在(zài)才刚刚跑了100米。”王金桥(qiáo)表示,未来,武(wǔ)智院还(hái)将围绕更多产业打(dǎ)造场景(jǐng)化模(mó)型(xíng)和垂直类模型,推(tuī)动“紫东(dōng)太初”大模型(xíng)在更(gèng)多领域落地(dì)应(yīng)用,“并借此(cǐ)不(bú)断(duàn)提升大模(mó)型正确知识的学习能力和(hé)生成能力,使(shǐ)‘紫东太初(chū)’自身也不断地升级进化(huà)”。