(網(wǎng)經(jīng)社訊)
目錄
01. 概覽
02. 文本
03. 圖像
04. 視頻
05. 音頻
06. 數(shù)字人
07. 游戲
08. 綜合
09. 模型&算法
10. 報(bào)告申明
概覽
2022年12月發(fā)布的大型語(yǔ)言生成模型ChatGPT,以其強(qiáng)大的信息整合和語(yǔ)言創(chuàng)作能力驚艷了世界,能夠勝任對(duì)話聊天、小說(shuō)和劇本構(gòu)思等多個(gè)場(chǎng)景。在北密歇根大學(xué)的一門(mén)課程論文評(píng)分時(shí),用ChatGPT撰寫(xiě)的論文得到了最高等級(jí)的A+評(píng)分,并被教授評(píng)為“全班最好的論文”。
在我們上個(gè)月發(fā)布的《行業(yè)洞察 | 萬(wàn)字長(zhǎng)文解讀AIGC如何革命性提效內(nèi)容營(yíng)銷》中已經(jīng)對(duì)AIGC對(duì)內(nèi)容營(yíng)銷的影響有了基本的介紹,本篇主要針對(duì)中國(guó)市場(chǎng)對(duì)國(guó)內(nèi)正在做AIGC的相關(guān)企業(yè)展開(kāi)介紹。
目前AIGC主要運(yùn)用在文字、圖像、視頻、音頻、游戲以及虛擬人等方面。簡(jiǎn)單的說(shuō),用戶只需要輸入一段對(duì)文章的描述或要求,類似于大學(xué)課堂上教授布置論文時(shí)的要求,系統(tǒng)就能根據(jù)指令進(jìn)行創(chuàng)作;輸入對(duì)藝術(shù)繪畫(huà)作品的文字描述,比如“星空下的大海,遠(yuǎn)處的波浪像籠罩著一層層白霧慢慢向海邊靠近”,系統(tǒng)就能自動(dòng)生成一張繪畫(huà)作品。
△賣出300萬(wàn)的全球第一幅AI畫(huà)作(由GAN創(chuàng)作自2018年)
所謂AIGC,英文全稱是AI Generated Content,指的是利用人工智能來(lái)生產(chǎn)內(nèi)容,其中AI是人工智能的簡(jiǎn)稱,GC則是創(chuàng)作內(nèi)容。
同傳統(tǒng)意義上的AI相比,AIGC變聰明了。畢竟創(chuàng)造力是人類非常特別的能力,但當(dāng)人們發(fā)現(xiàn)AIGC有創(chuàng)造力的時(shí)候非常震驚,未來(lái)AIGC將是人工智能發(fā)展的新方向。在AIGC 相關(guān)技術(shù)爆發(fā)的同時(shí),其商業(yè)化速度同樣驚人,文字生成公司Copy.ai 僅用兩年時(shí)間 ARR 就突破 了千萬(wàn)美金,這非常像移動(dòng)互聯(lián)網(wǎng)早期,全新的商業(yè)模式在不斷涌現(xiàn)并快速被市場(chǎng)驗(yàn)證后,能夠更快的迭代,尋求突破。
△圖表來(lái)源:量子位,《AIGC/AI生成內(nèi)容產(chǎn)業(yè)展望報(bào)告》
AI絕不是真的在一夜間變得無(wú)所不能,算法、模型、框架的迭代凝結(jié)著無(wú)數(shù)從業(yè)者的心血,無(wú)論是科技大廠,還是初創(chuàng)企業(yè),始終要在最前沿的科技領(lǐng)域保持前瞻的視野和敏銳的判斷,才有可能把握住市場(chǎng)機(jī)遇,而背后日復(fù)一日的數(shù)據(jù)積累,更是產(chǎn)品能夠在差異化的需求中勝出的基礎(chǔ)。
眾多從業(yè)者也紛紛表示:AIGC將會(huì)是AI的下一波浪潮,第一代AI更多應(yīng)用在分析、識(shí)別領(lǐng)域,而AIGC實(shí)現(xiàn)了重大突破,它讓AI有創(chuàng)造內(nèi)容的能力,是全新的革命。
△圖表來(lái)源:量子位,《AIGC/AI生成內(nèi)容產(chǎn)業(yè)展望報(bào)告》
越早擁抱變化,才能越早享受到技術(shù)變革所帶來(lái)的紅利。AIGC幫助各行各業(yè)的內(nèi)容創(chuàng)作者們打破自身能力的局限性,更好將自己的想法、創(chuàng)意變成現(xiàn)實(shí)。
文本
目前AIGC的發(fā)展,可以以較人工更高效的技術(shù)路徑,實(shí)現(xiàn)個(gè)性化文本、圖像的生成需求,對(duì)規(guī)模化內(nèi)容的生產(chǎn)有較大沖擊,特別是對(duì)初級(jí)、通用形內(nèi)容生產(chǎn)者,具有取代性。現(xiàn)在圖像、文本人工智能內(nèi)容生成技術(shù),基本可以實(shí)現(xiàn)快速生成高質(zhì)量的營(yíng)銷內(nèi)容。
聆心智能
聆心智能是一家超擬人底層大模型研發(fā)商,致力于打造“超擬人底層大模型”,核心技術(shù)是具有可控、可配置、擬人特點(diǎn)的LLM,通過(guò)簡(jiǎn)單設(shè)置即可構(gòu)造一個(gè)有知識(shí)、有個(gè)性、有風(fēng)格的類人智能體。聆心智能的愿景是創(chuàng)造AGI(通用人工智能)時(shí)代的類人智能體,使得AI Companion進(jìn)入人類生活的所有角落,科技向善為人類謀福祉始終是聆心智能的目標(biāo)。
聆心智能孵化自清華大學(xué)計(jì)算機(jī)系,創(chuàng)始人黃民烈教授是自然語(yǔ)言生成領(lǐng)域知名教授。團(tuán)隊(duì)核心成員均來(lái)自于清華大學(xué)、卡內(nèi)基梅隆大學(xué)、谷歌等國(guó)內(nèi)外頂尖高校及公司,具有豐富的商業(yè)化經(jīng)驗(yàn),一直以來(lái),在大模型和對(duì)話系統(tǒng)的開(kāi)發(fā)與應(yīng)用領(lǐng)域中處于行業(yè)領(lǐng)先位置。
作為AI心理賽道中自然語(yǔ)言處理(NLP,Natural Language Processing)基因領(lǐng)先的創(chuàng)業(yè)團(tuán)隊(duì)之一,聆心智能已開(kāi)發(fā)了心理咨詢及朋輩支持服務(wù)線上平臺(tái)聆心悠然,可為不同需求層次的用戶提供服務(wù)。
瀾舟科技
瀾舟科技是一家認(rèn)知智能公司,針對(duì)商業(yè)場(chǎng)景數(shù)字化轉(zhuǎn)型、以自然語(yǔ)言處理為基礎(chǔ)提供商業(yè)洞見(jiàn)類產(chǎn)品,主要產(chǎn)品包括基于預(yù)訓(xùn)練模型的功能引擎(包括搜索、生成、翻譯、對(duì)話等)和針對(duì)垂直行業(yè)場(chǎng)景的 SaaS 產(chǎn)品。
公司創(chuàng)始人周明是世界頂級(jí)的 AI 科學(xué)家,自然語(yǔ)言處理領(lǐng)域的代表性人物。
【熊貓小說(shuō)家】小程序是瀾舟科技首個(gè) AIGC 方向的 C 端用戶產(chǎn)品,通過(guò)技術(shù)領(lǐng)先的語(yǔ)言生成模型,快速將用戶的日常生活變成小說(shuō)情節(jié)。
△圖片來(lái)源:瀾舟科技官網(wǎng)
倚瀾科技
倚瀾科技成立于2021年6月,致力于沉浸式數(shù)字內(nèi)容和實(shí)時(shí)3D引擎兩大核心業(yè)務(wù),為超寫(xiě)實(shí)虛擬化身CG內(nèi)容創(chuàng)作、實(shí)時(shí)交互等場(chǎng)景提供技術(shù)解決方案和平臺(tái)化技術(shù)服務(wù),通過(guò)科技創(chuàng)新,改變數(shù)字內(nèi)容生產(chǎn)方式。
22年11月,倚瀾科技在線上發(fā)布會(huì)上公布了Meta Conference、Meta Streaming兩套元宇宙場(chǎng)景解決方案,分別對(duì)應(yīng)兩套產(chǎn)品MetaC系統(tǒng)與MetaS系統(tǒng)。
Meta Conference 是一款提供給線下會(huì)議、論壇使用的擴(kuò)展現(xiàn)實(shí)會(huì)議工具。該系統(tǒng)首創(chuàng)XR空間互動(dòng)模式,讓每一位演講者在論壇現(xiàn)場(chǎng)就能輕松創(chuàng)觸摸科技前沿,結(jié)合實(shí)際場(chǎng)景與虛擬場(chǎng)景創(chuàng)造元宇宙會(huì)議空間,打通由虛向?qū)?、由?shí)向虛的雙向通道,實(shí)現(xiàn)科技魅力和互動(dòng)體驗(yàn)的飛躍。
而Meta Streaming 是直播行業(yè)提供的一款智能便捷的擴(kuò)展現(xiàn)實(shí)直播工具。該系統(tǒng)首創(chuàng)輕量高精AR模式,讓每一位創(chuàng)作者和品牌主都能夠以極低的成本和極簡(jiǎn)的方式,實(shí)現(xiàn)真實(shí)和虛擬的人、物品、空間進(jìn)行虛實(shí)結(jié)合來(lái)增強(qiáng)直播互動(dòng),為主播和直播用戶創(chuàng)造沉浸式的直播體驗(yàn)。
彩云小夢(mèng)
彩云小夢(mèng)是一款A(yù)I寫(xiě)書(shū)軟件。你可以通過(guò)給出一些基本的世界設(shè)定,讓你的彩云AI圍繞故事主題去進(jìn)行聯(lián)想創(chuàng)作。彩云小夢(mèng)由彩云科技出品,因?yàn)橛辛瞬试铺鞖夂筒试菩∽g這兩款成功產(chǎn)品的開(kāi)發(fā)運(yùn)營(yíng)經(jīng)驗(yàn),彩云小夢(mèng)自身研發(fā)素質(zhì)過(guò)硬,曾風(fēng)靡B站創(chuàng)作圈。
彩云小夢(mèng)創(chuàng)始人兼 CEO 袁行遠(yuǎn)在訪談中說(shuō)道:「就像游戲讓我們體驗(yàn)各種光怪陸離的世界,看電影是對(duì)生命的延長(zhǎng)。人只能活一輩子,這是很遺憾的,但電影、小說(shuō)都是讓我們體驗(yàn)不一樣的人生。而現(xiàn)在有 AI 技術(shù),可以讓你更沉浸式的體驗(yàn),不僅可以閱讀基督山伯爵,也可以扮演基督山伯爵,而且是自由的扮演。它也是對(duì)生命的延長(zhǎng),以前所未有的一種形式?!?/span>
△在b站火爆一時(shí)的AI續(xù)寫(xiě)
必優(yōu)科技
智能寫(xiě)作SDK服務(wù)平臺(tái),致力于為企業(yè)提供場(chǎng)景化內(nèi)容創(chuàng)作解決方案和通用內(nèi)容創(chuàng)作SDK服務(wù),打造一站式內(nèi)容創(chuàng)作應(yīng)用。必優(yōu)科技已在智能簡(jiǎn)歷方面,搭建了AI在線輔寫(xiě)簡(jiǎn)歷平臺(tái)——YOO簡(jiǎn)歷。
選擇簡(jiǎn)歷作為智能寫(xiě)作的應(yīng)用場(chǎng)景,原因在于簡(jiǎn)歷常被視為低頻場(chǎng)景,但事實(shí)上市場(chǎng)空間很廣。而目前市場(chǎng)上,大多智能簡(jiǎn)歷以提供模板為主,難以起到內(nèi)容優(yōu)化的作用,因此用戶較為容易認(rèn)可內(nèi)容優(yōu)化的商業(yè)價(jià)值。
基于以上問(wèn)題,必優(yōu)科技首先通過(guò)大量AI訓(xùn)練,明確企業(yè)關(guān)注的核心內(nèi)容與板塊,以此來(lái)引導(dǎo)用戶完成簡(jiǎn)歷內(nèi)容。其次,通過(guò)分析投遞崗位,提煉出關(guān)鍵信息。最后,是將內(nèi)容潤(rùn)色,通過(guò)將口語(yǔ)化等內(nèi)容轉(zhuǎn)為職業(yè)化表達(dá),優(yōu)化用戶的內(nèi)容價(jià)值。
YOO簡(jiǎn)歷能夠?qū)崿F(xiàn)AI輔寫(xiě),關(guān)鍵在于底層的韋尼克框架(Wernicke)。韋尼克框架是由必優(yōu)科技自主研發(fā)的智能寫(xiě)作引擎,基于其自研的深度學(xué)習(xí)模型WCCG(Wernicke Control Content Generate)架構(gòu)生成。
KAWO 科握
社交媒體管理服務(wù)商「KAWO 科握」,成立于2017年,是一家為品牌或市場(chǎng)營(yíng)銷機(jī)構(gòu)提供一站式社交媒體管理的平臺(tái),也是國(guó)內(nèi)首家提供標(biāo)準(zhǔn)化SaaS服務(wù)的社交媒體協(xié)同管理平臺(tái)。
「KAWO」為品牌提供了統(tǒng)一的協(xié)作平臺(tái),使得內(nèi)外部不同參與者都可以擁有單一登錄信息的安全平臺(tái),管理不同的社交媒體賬號(hào),從而進(jìn)行創(chuàng)建、排期、批準(zhǔn)、發(fā)布內(nèi)容等,提升效率的同時(shí)降低人為失誤和人力依賴。數(shù)據(jù)顯示,該平臺(tái)每周平均為品牌運(yùn)營(yíng)人員節(jié)省了3-4個(gè)小時(shí)的工作時(shí)間。
KAWO 科握具有深度數(shù)據(jù)復(fù)盤(pán)、競(jìng)品監(jiān)測(cè)與分析、內(nèi)容規(guī)劃與排期、編輯與排版、實(shí)時(shí)反饋與審批、定時(shí)發(fā)布等功能,幫助客戶團(tuán)隊(duì)的內(nèi)外部成員均可在平臺(tái)上全流程協(xié)作管理多個(gè)社媒賬號(hào)。
香儂科技
AI+金融的初創(chuàng)公司,智能投研,即在金融市場(chǎng)數(shù)據(jù)的基礎(chǔ)支持上,通過(guò)深度學(xué)習(xí)、自然語(yǔ)言處理等人工智能方法,對(duì)于數(shù)據(jù)、事件、結(jié)論等信息進(jìn)行自動(dòng)化處理和分析,為金融機(jī)構(gòu)的專業(yè)從業(yè)人員(分析師、基金經(jīng)理、投資人等)提供投研幫助,提高其工作效率和分析能力。預(yù)計(jì)到2020年,智能投研所屬的人工智能分析產(chǎn)業(yè)的市場(chǎng)規(guī)模達(dá)到700億美元左右。
利用自然語(yǔ)言處理(NLP)和圖像處理(CV)算法,從海量分散的非結(jié)構(gòu)化數(shù)據(jù)中自動(dòng)提取結(jié)構(gòu)化信息,通過(guò)獨(dú)立開(kāi)發(fā)的智能AI金融信息平臺(tái),描繪包括中小企業(yè),上市公司,地區(qū)、產(chǎn)業(yè)、全球等多維度金融實(shí)體畫(huà)像,服務(wù)政府、銀行、基金券商、評(píng)級(jí)機(jī)構(gòu)、保險(xiǎn)和大型企業(yè),為金融資產(chǎn)管理、風(fēng)控評(píng)級(jí)、行業(yè)研究、投資決策等各類金融業(yè)務(wù)賦能。
秘塔科技METASOTA
上海秘塔網(wǎng)絡(luò)科技有限公司成立于2018年4月,是人工智能領(lǐng)域的一家新銳科技公司,致力于將重復(fù)腦力勞動(dòng)AI化,以AI為杠桿撬動(dòng)專業(yè)場(chǎng)景的百倍生產(chǎn)力提升。
目前,秘塔科技已經(jīng)擁有數(shù)百萬(wàn)用戶,成立北京和成都兩大研發(fā)中心,在AIGC、文檔輔助創(chuàng)作、智能合同等方向上開(kāi)展研發(fā)與產(chǎn)品落地。
中文在線
中文在線全資子公司鴻達(dá)以太已經(jīng)在錄制部分有聲書(shū)過(guò)程中運(yùn)用AIGC技術(shù),通過(guò)捕捉聲紋,AI做情感標(biāo)識(shí),產(chǎn)出高質(zhì)量仿真語(yǔ)音,快速完成文本到語(yǔ)音的轉(zhuǎn)化過(guò)程,極大加速了網(wǎng)絡(luò)文學(xué)到音頻內(nèi)容的生產(chǎn)能力,擴(kuò)充了內(nèi)容傳播的渠道。
其“AI主播”可實(shí)現(xiàn)低成本、高效優(yōu)質(zhì)的內(nèi)容生產(chǎn),實(shí)現(xiàn)了單播、雙播、多人播制作方式,支持制作玄幻、懸疑、武俠、歷史、言情等不同類型的作品,實(shí)現(xiàn)旁白、角色音的區(qū)分,演繹更豐富、貼合劇情。該功能已向公司旗下17K文學(xué)平臺(tái)全部作者開(kāi)放。
黑狐科技
黑狐創(chuàng)客隸屬于廣州黑狐科技有限公司,是國(guó)內(nèi)以AI技術(shù)應(yīng)用的平臺(tái),自注冊(cè)成立歷時(shí)至今一直以“誠(chéng)信為本、用戶至上”的服務(wù)理念為經(jīng)營(yíng)之本。平臺(tái)一直致力于AI生態(tài)圈,產(chǎn)品有:狐寫(xiě)作、黑狐文字提取神器。
漢儀股份
公司主營(yíng)業(yè)務(wù)包括字體設(shè)計(jì)、字庫(kù)軟件開(kāi)發(fā)和授權(quán)、提供字庫(kù)類技術(shù)服務(wù) 和視覺(jué)設(shè)計(jì)服務(wù),以及以 IP 賦能方式開(kāi)展的 IP 產(chǎn)品化業(yè)務(wù)。
2022下半年,深度學(xué)習(xí)模型Diffusion擴(kuò)散化模型創(chuàng)新推進(jìn)AIGC技術(shù)突破,公司AI造字等內(nèi)容領(lǐng)域爆發(fā)。
智搜科技
智搜是中國(guó)領(lǐng)先的AI+資訊的技術(shù)服務(wù)商,自主研發(fā)了Giiso資訊機(jī)器人引擎,以及系列衍生的寫(xiě)作機(jī)器人、機(jī)器人商店、天機(jī)智訊、Giiso編輯機(jī)器人等智能產(chǎn)品,可廣泛應(yīng)用于新聞媒體服務(wù)和情報(bào)采集追蹤等領(lǐng)域。作為國(guó)內(nèi)首家AI+資訊的技術(shù)服務(wù)商,智搜正試圖圈住“資訊”這塊蛋糕,為人們提供更智能的資訊服務(wù)。
智搜以卓越的科研能力獲得國(guó)家級(jí)高新技術(shù)企業(yè)認(rèn)證,并先后獲得了金沙江聯(lián)合資本、力合集團(tuán)、民銀國(guó)際等多家著名投資機(jī)構(gòu)的參股投資。發(fā)展至今,智搜已有近百名員工,其中研發(fā)人員占五成以上。
同伴客數(shù)據(jù)
同伴客數(shù)據(jù)是領(lǐng)先的數(shù)據(jù)要素市場(chǎng)集成構(gòu)建商,致力于讓所有數(shù)據(jù)資產(chǎn)都能產(chǎn)生最大價(jià)值。同伴客數(shù)據(jù)成立于2017年,是一家致力于通過(guò)數(shù)字科技為人類釋放無(wú)限潛能的科技公司。其核心產(chǎn)品是TBanic數(shù)字員工基礎(chǔ)平臺(tái),集成了基于“DARD”技術(shù)(數(shù)據(jù)-Data、人工智能-AI、機(jī)器流程自動(dòng)化-RPA、數(shù)字人-Digital Human)的數(shù)字員工開(kāi)發(fā)套件,客戶可以根據(jù)不同的業(yè)務(wù)場(chǎng)景,構(gòu)造出具備對(duì)應(yīng)工作技能的數(shù)字員工。同伴客的產(chǎn)品和解決方案覆蓋數(shù)字藍(lán)領(lǐng)、數(shù)字白領(lǐng)和數(shù)字金領(lǐng)三個(gè)層級(jí),主要包含AIGC數(shù)字員工、數(shù)據(jù)洞察數(shù)字員工、RPA數(shù)字員工、金融交易數(shù)字員工、人工增強(qiáng)數(shù)字員工,目前已服務(wù)于全球超過(guò)200家客戶。
Friday
△FRIDAY官網(wǎng)
文本生成工具「Friday AI」:用戶輸入一個(gè)標(biāo)題,就能生成一篇文章。
Friday智能寫(xiě)作是一款在線AI內(nèi)容創(chuàng)作工具,做為提高寫(xiě)作者內(nèi)容生產(chǎn)效率的助手,能夠幫助你更快、更好地創(chuàng)作內(nèi)容。Friday AI開(kāi)始搭建易用的專注于人工智能文本生成的服務(wù)。作為一家中美合資公司,我們?yōu)椴煌膶?xiě)作場(chǎng)景開(kāi)發(fā)和提供各種原創(chuàng)文本,包括產(chǎn)品描述、營(yíng)銷信息、各類主題文章和廣告文案等。
拓爾思
成立于1993年,公司已落地了一批服務(wù)型虛擬人項(xiàng)目,其中有面向農(nóng)產(chǎn)品電商主播提供直播腳本智能創(chuàng)作、帶貨虛擬人全鏈租用等知識(shí)賦能服務(wù)。
拓爾思開(kāi)展“大數(shù)據(jù)看世界杯”的虛擬數(shù)字人系列服務(wù)。在 2022 年北京冬奧會(huì)上,二十多位數(shù)字人代替真人為賽事提供服務(wù)支持。其中數(shù)字播報(bào)員小思通過(guò)對(duì)資訊內(nèi)容的自動(dòng)分析、智能創(chuàng)作和虛擬播報(bào)幫助觀眾了解冬奧盛況,讓觀眾能快速把握冬奧會(huì)海量資訊中的亮點(diǎn)信息。小思冬奧播報(bào)由拓爾思 SaaS 平臺(tái)開(kāi)發(fā)而成,集成自然語(yǔ)言處理、大數(shù)據(jù)、人工智能等技術(shù)。
圖像
去年由Stability發(fā)布的Stable Diffusion模型,就讓人工智能生成圖片的速率和質(zhì)量進(jìn)行了大幅提升。全AI創(chuàng)作的繪圖作品幾乎達(dá)到專業(yè)水準(zhǔn),讓一眾畫(huà)師感到職業(yè)危機(jī)。
TIAMAT
生成式AI平臺(tái),成立于2021年?!拜斎胍痪湓?,Tiamat系統(tǒng)就會(huì)從0開(kāi)始生成一整張圖片?!盩iamat系統(tǒng)是該團(tuán)隊(duì)自主研發(fā)的一款A(yù)I藝術(shù)創(chuàng)作工具。該系統(tǒng)采用了當(dāng)前最先進(jìn)的算法技術(shù)和強(qiáng)大的多模態(tài)技術(shù),結(jié)合人類靈感創(chuàng)造力與科技的碰撞,拓展了算法藝術(shù)與AI創(chuàng)造力在商業(yè)環(huán)境中的應(yīng)用邊界,致力于探索前沿AIGC領(lǐng)域的更多可能性。
Tiamat生成式AI模型是基于擴(kuò)散模型(Diffusion Models)和審美模型實(shí)現(xiàn)的,研發(fā)團(tuán)隊(duì)還在擴(kuò)散模型采樣、數(shù)據(jù)集構(gòu)建上開(kāi)展了許多工作,進(jìn)一步增加了圖像生成質(zhì)量。作為一款國(guó)產(chǎn)優(yōu)化自研系統(tǒng),Tiamat系統(tǒng)支持中文和各種復(fù)雜的描述風(fēng)格,界面簡(jiǎn)潔,在手機(jī)上就可以使用。
Tiamat研發(fā)團(tuán)隊(duì)創(chuàng)新性地使用梯度引導(dǎo)和條件生成結(jié)合的技術(shù),對(duì)系統(tǒng)進(jìn)行優(yōu)化,使得Tiamat系統(tǒng)能夠在圖片生成符合文本輸入的同時(shí),讓最終結(jié)果的色彩細(xì)節(jié)、構(gòu)圖更加完善。
ZMO.AI
ZMO開(kāi)發(fā)了新一代AIGC引擎,基于?研優(yōu)化的Implicit style diffusion技術(shù),為?戶提供從AI輔助內(nèi)容創(chuàng)作到AI完全?成的技術(shù)引擎與創(chuàng)作平臺(tái)。
2022年年底,ZMO的中文平臺(tái)“YUAN初”、以及同名小程序全新上線,用戶可以便捷體驗(yàn)AI圖像生成。
△YUAN初生成的圖像
ZMO開(kāi)發(fā)了新一代AIGC引擎,基于?研優(yōu)化的Implicit style diffusion技術(shù),為?戶提供從AI輔助內(nèi)容創(chuàng)作到AI完全?成的技術(shù)引擎與創(chuàng)作平臺(tái)。
ZYRO
圍繞電商場(chǎng)景,通過(guò)AIGC生成網(wǎng)站搭建過(guò)程中所需的各類素材,具體業(yè)務(wù)包括針對(duì)性生成公司介紹、企業(yè)價(jià)值、Slogan、自動(dòng)提升圖片清晰度、自動(dòng)生成logo等。
國(guó)內(nèi)類似的公司包括聆心智能?;诙嗄B(tài)對(duì)話生成系統(tǒng),該公司專注于針對(duì)精神心理的AI驅(qū)動(dòng)的高質(zhì)量數(shù)字療法,讓AI圍繞認(rèn)知、情緒和行為三個(gè)維度對(duì)用戶進(jìn)行評(píng)估和干預(yù),生成千人千面的情緒治療方案,目前已與北醫(yī)六院、湘雅二院、中日友好醫(yī)院、清華大學(xué)玉泉醫(yī)院等達(dá)成合作。
目前,Zyro帶來(lái)了完全不同的網(wǎng)站設(shè)計(jì)工具:AI寫(xiě)作器(AI Writer)和AI熱圖(AI Heatmap)。
Mai小麥
Mai小麥作為AI量化社交電商領(lǐng)域的獨(dú)角獸,將AI與電商行業(yè)深度融合,打造了獨(dú)特的商業(yè)模式。此外,Mai的核心技術(shù)已經(jīng)得到美國(guó)和日本的專利認(rèn)證,Mai通過(guò)自主研發(fā)的視覺(jué)識(shí)別產(chǎn)品,模擬人眼觀看視頻時(shí)的過(guò)程,自動(dòng)識(shí)別畫(huà)面中出現(xiàn)的商品并匹配各大電商平臺(tái)的同款推薦給用戶。
當(dāng)前,市面上的視頻廣告技術(shù)本質(zhì)上都是圖片識(shí)別,而Mai小麥可以模擬人眼對(duì)畫(huà)面中的商品進(jìn)行追蹤,做到高速準(zhǔn)確的多物體識(shí)別。這是Mai小麥在技術(shù)領(lǐng)域的核心競(jìng)爭(zhēng)力,并且在行業(yè)中處于領(lǐng)先地位。目前Mai已經(jīng)與微博、愛(ài)奇藝等頭部?jī)?nèi)容平臺(tái)以及唯品會(huì)、天貓、京東、亞馬遜等國(guó)內(nèi)外知名電商平臺(tái)展開(kāi)合作,并且正在積極拓展合作平臺(tái)和應(yīng)用場(chǎng)景,讓更多用戶可以感受到AI技術(shù)帶來(lái)的“所見(jiàn)即所買(mǎi)”的便捷。
Nolibox(圖宇宙)
Nolibox成立于2020年,是一家基于場(chǎng)景需求和用戶喜好的智能設(shè)計(jì)引擎及平臺(tái)服務(wù)商,致力于讓每個(gè)人都能享受好設(shè)計(jì)。Nolibox將美學(xué)原理、設(shè)計(jì)模型及人工智能技術(shù)進(jìn)行深度融合,完成知識(shí)表示與設(shè)計(jì)生成,支持多場(chǎng)景之間的設(shè)計(jì)分發(fā)與延展創(chuàng)造。
△Nolibox - 畫(huà)宇宙
這一設(shè)計(jì)平臺(tái)旨在提供兼收并蓄的多元設(shè)計(jì),讓人們能夠以實(shí)惠價(jià)格獲取別具一格的優(yōu)質(zhì)設(shè)計(jì)作品。在此理念驅(qū)動(dòng)下,“計(jì)算美學(xué)”(Nolibox)致力于運(yùn)用人工智能等尖端技術(shù),打破當(dāng)下壟斷的設(shè)計(jì)壁壘。
視覺(jué)中國(guó)
視覺(jué)中國(guó)是國(guó)內(nèi)最大的視覺(jué)內(nèi)容互聯(lián)網(wǎng)版權(quán)交易平臺(tái),百度文心一格是AI作畫(huà)這一新興領(lǐng)域兼顧創(chuàng)新與實(shí)用的代表性平臺(tái)。雙方在AIGC賦能內(nèi)容創(chuàng)作上的積極探索,展現(xiàn)了AIGC的多元商業(yè)價(jià)值。視覺(jué)中國(guó)與百度正式簽署戰(zhàn)略合作協(xié)議,視覺(jué)中國(guó)與百度旗下的AI作畫(huà)平臺(tái)文心一格將在創(chuàng)作者賦能和版權(quán)保護(hù)等方面展開(kāi)多項(xiàng)合作,共探AIGC內(nèi)容產(chǎn)業(yè)發(fā)展方向。
藍(lán)色光標(biāo)
藍(lán)色光標(biāo)AI技術(shù)主要應(yīng)用于“智能創(chuàng)意設(shè)計(jì)”“短視頻智能化制作”“智能策略方案制作”三個(gè)方面。2021年12月,藍(lán)色光標(biāo)銷博特全新上線AI易稿模塊,輔助營(yíng)銷人員輕松寫(xiě)作,用戶只需輸入公司、產(chǎn)品、行業(yè)、標(biāo)題四項(xiàng)關(guān)鍵內(nèi)容即可一鍵生成新聞草稿;此外,還能輕松創(chuàng)作虛擬人配音的可“聆聽(tīng)”音頻版新聞稿件。
2022年2月,藍(lán)色光標(biāo)旗下智能營(yíng)銷助手銷博特平臺(tái)發(fā)布“小元宵”計(jì)劃,旨在將平臺(tái)現(xiàn)有的分析、寫(xiě)作、文案、隨筆以及創(chuàng)意等六大產(chǎn)品能力封裝成API技術(shù)接口,為虛擬數(shù)字人賦能營(yíng)銷創(chuàng)作能力。
萬(wàn)興科技
萬(wàn)興科技深耕數(shù)字創(chuàng)意軟件領(lǐng)域,推出萬(wàn)興喵影、萬(wàn)興優(yōu)轉(zhuǎn)、萬(wàn)興錄演等視頻創(chuàng)意軟件,Wondershare Filmstock、萬(wàn)興喵庫(kù)視頻創(chuàng)意素材平臺(tái),萬(wàn)興愛(ài)畫(huà)、萬(wàn)興播爆等AIGC應(yīng)用;此外面向全球市場(chǎng)還推出萬(wàn)興圖示、萬(wàn)興腦圖MindMaster、墨刀等繪圖創(chuàng)意軟件,萬(wàn)興PDF、Wondershare PDFelement等文檔創(chuàng)意軟件,萬(wàn)興恢復(fù)專家、萬(wàn)興數(shù)據(jù)管家、萬(wàn)興易修等實(shí)用工具軟件。
公司正以前瞻的視野推進(jìn)全球化布局,在深圳設(shè)立研發(fā)總部,并在長(zhǎng)沙、北京、杭州、鄭州、西安、溫哥華、東京等地設(shè)立運(yùn)營(yíng)中心,業(yè)務(wù)范圍遍及全球200多個(gè)國(guó)家和地區(qū),全球累計(jì)用戶逾15億。
西湖心辰
西湖心辰今年8月上線的AI繪畫(huà)平臺(tái)盜夢(mèng)師,今年9月,AI繪畫(huà)的作品《太空歌劇院》獲得了第一名。
「盜夢(mèng)師」所在的AIGC廠商「西湖心辰」成立于2021年,依托于新型研究型學(xué)術(shù)機(jī)構(gòu)西湖大學(xué),專注于人工智能自然語(yǔ)言處理領(lǐng)域的科研成果轉(zhuǎn)化及產(chǎn)品應(yīng)用等,2021年年底完成了近千萬(wàn)美元的天使輪融資。Diffusion方法出現(xiàn)之后,AI Art的生成速度被大幅提高,也讓他們終于看到了在這一賽道推出產(chǎn)品的可行性。
Fancy Technology
Fancy Technology成立于2020年4月,核心團(tuán)隊(duì)主要來(lái)自阿里系,深諳平臺(tái)運(yùn)營(yíng)規(guī)則及電商玩法。FancyTech是在用AIGC做內(nèi)容生成,通過(guò)AI能力學(xué)習(xí)平臺(tái)里海量的跨平臺(tái)內(nèi)容,得到我們自己的模型,在結(jié)合商家的素材去為他們生成更多內(nèi)容。
在天使輪之后,F(xiàn)ancyTech基于其之前做數(shù)據(jù)智能服務(wù)商所沉淀的海量數(shù)據(jù),建立數(shù)據(jù)分析模型,最終打造出面向品牌的智能服務(wù)平臺(tái)Content Hub,其核心是通過(guò)“跨平臺(tái)熱門(mén)內(nèi)容的智能使用和內(nèi)容的智能生成”,從而提升品牌力商品的轉(zhuǎn)化率以及用戶的留存度。
美圖秀秀
美圖公司旗下應(yīng)用程序Meitu也順勢(shì)推出AI繪畫(huà)功能,在海外收獲了一大批新用戶。特別是在日本地區(qū)的蘋(píng)果App免費(fèi)下載排行榜上,Meitu軟件在上周多次蟬聯(lián)第一,一度創(chuàng)造了單日最高將近破百萬(wàn)新增用戶的巨幅增長(zhǎng)。
美圖選擇的AI繪畫(huà)賽道,是AIGC的重要分支,利用該技術(shù),用戶只需或拍攝上傳一張照片,幾秒鐘后就能得到一張意象極為相似的藝術(shù)圖畫(huà)。美圖秀秀AI繪畫(huà)功能廣受海外用戶喜愛(ài),在日本、巴西、烏克蘭多日蟬聯(lián)Apple Store總榜第一名;在美國(guó)、加拿大、澳大利亞、新西蘭、白俄羅斯、智利、哈薩克等地區(qū)沖至總榜前三名,訂閱用戶數(shù)在多個(gè)國(guó)家都有上漲。
詩(shī)云科技
詩(shī)云科技成立于2020年12月,總部在深圳,愿景是用AI生成內(nèi)容,讓用戶以更低成本完成內(nèi)容創(chuàng)作。其主要產(chǎn)品是內(nèi)容生成引擎Surreal Engine,核心技術(shù)是深度學(xué)習(xí)和圖形學(xué),如自然語(yǔ)言理解、3D建模、神經(jīng)輻射場(chǎng)、生成對(duì)抗網(wǎng)絡(luò)、神經(jīng)渲染等。
在Surreal Engine里,他們把內(nèi)容生成分解成三個(gè)步驟:Understanding(理解)、Framing(視框化)、Rendering(渲染)。這是一個(gè)多模態(tài)的生成器,可以在文字、語(yǔ)音、圖片、視頻、3D 內(nèi)容、虛擬內(nèi)容之間互相切換。這些底層能力會(huì)堆疊起來(lái)組成內(nèi)容生成和內(nèi)容編輯的能力。
視頻
相較文本、圖像、音頻而言,人工智能生成視頻的算法模型還處于未成熟階段。
視連通
北京視連通科技有限公司在人工智能/CV識(shí)別、視頻內(nèi)容智能生產(chǎn)和營(yíng)銷增值方面深入探索,以自有AI技術(shù)加持大屏增加營(yíng)銷增長(zhǎng)。他從當(dāng)下傳統(tǒng)長(zhǎng)視頻運(yùn)營(yíng)的痛點(diǎn)切入,直指面向內(nèi)容的營(yíng)銷是助力傳統(tǒng)長(zhǎng)視頻運(yùn)營(yíng)商營(yíng)銷增長(zhǎng)的重中之重。
特看科技
特看科技成立于2022年6月,創(chuàng)始人兼CEO吳春松(花名樂(lè)乘)是前阿里資深產(chǎn)品專家,曾擔(dān)任阿里巴巴智能設(shè)計(jì)實(shí)驗(yàn)室負(fù)責(zé)人,打造了AI設(shè)計(jì)平臺(tái)“魯班”;后負(fù)責(zé)淘寶內(nèi)容工具業(yè)務(wù),孵化了淘寶商家短視頻工具親拍App。聯(lián)合創(chuàng)始人兼CTO陳炳輝是前阿里資深技術(shù)專家,曾擔(dān)任UC瀏覽器內(nèi)核技術(shù)負(fù)責(zé)人,淘寶內(nèi)容中臺(tái)視頻生產(chǎn)播放技術(shù)負(fù)責(zé)人。
△圖片來(lái)源:特看科技
特看核心團(tuán)隊(duì)在生成式AI、B端視頻直播工具領(lǐng)域有著多年的技術(shù)及產(chǎn)品落地經(jīng)驗(yàn),同時(shí)也在電商行業(yè)擁有豐富的認(rèn)知。團(tuán)隊(duì)致力于打造服務(wù)全球電商商家的內(nèi)容工具SaaS,目前已推出海外電商數(shù)據(jù)分析&視頻智能生成工具Tabcut.com,數(shù)字人直播工具“主播寶”。
像素偏移
像素偏移致力于拓展視覺(jué)藝術(shù)的技術(shù)邊界,改變?nèi)藗儎?chuàng)作、審美和休閑方式。 我們結(jié)合數(shù)字角色渲染和混合現(xiàn)實(shí)等技術(shù)應(yīng)用,展開(kāi)在 IP 角色數(shù)字化、創(chuàng)意營(yíng)銷視頻生產(chǎn)等領(lǐng)域的產(chǎn)品方案落地。
騰訊智影
騰訊智影是騰訊影業(yè)戰(zhàn)略型科技創(chuàng)新團(tuán)隊(duì),依靠騰訊體系的能力和資源,聯(lián)動(dòng)云技術(shù),運(yùn)用5G和AI作為技術(shù)載體,基于騰訊科技為影視行業(yè)提供智慧化全流程解決方案,推出可提高影片拍攝,后期制作,宣傳發(fā)行的系列工具:智慧制片,審片平臺(tái),智慧后期。
影譜科技
作為國(guó)內(nèi)人工智能視覺(jué)技術(shù)企業(yè),影譜科技開(kāi)創(chuàng)了AI視覺(jué)生成技術(shù)的全景商業(yè)模式,影譜科技在產(chǎn)品、業(yè)務(wù)、研發(fā)等方面取得的一系列突破,代表著社會(huì)對(duì)AI技術(shù)商業(yè)落地能力的期望。
2020年9月,影譜科技發(fā)布“AI視頻鑒偽鑒定平臺(tái)”,從數(shù)字治理入手輔助AI視頻生態(tài)的安全性;2020年10月,發(fā)布“智能影像生成引擎MAGC 2.0”,被學(xué)界、商界、媒體界認(rèn)定成為數(shù)字經(jīng)濟(jì)的生成要素;2020年11月,推出國(guó)內(nèi)首款融合AI+5G的3D數(shù)字孿生引擎MADT,創(chuàng)建適應(yīng)數(shù)字經(jīng)濟(jì)時(shí)代的新型可視化業(yè)務(wù)鏈環(huán)境。除此之外,基于MADT引擎,影譜科技還推出了業(yè)內(nèi)首款3D數(shù)字文創(chuàng)解決方案。同月,公司首次對(duì)外展示和演示新的3D成像系統(tǒng),并針對(duì)新零售業(yè)務(wù)場(chǎng)景提出行業(yè)解決方案。
GilaCloud
GilaCloud旗下的GliaStudio是人工智能視頻自動(dòng)生產(chǎn)制作平臺(tái),通過(guò)其人工智能技術(shù)會(huì)自動(dòng)將內(nèi)容轉(zhuǎn)換成視頻,并且提供客制化選項(xiàng)。GliaStudio在大數(shù)據(jù)分析以及機(jī)器學(xué)習(xí)等領(lǐng)域提供多種應(yīng)用服務(wù)以及解決方案,致力于讓用戶都能享受人工智能以及大數(shù)據(jù)所帶來(lái)的便利。
Creative Fitting
商業(yè)內(nèi)容創(chuàng)作服務(wù)企業(yè)「井英科技」發(fā)布CreativeFitting短視頻一站式生產(chǎn)平臺(tái),以“AI+人工”協(xié)同創(chuàng)作,幫助品牌提高生產(chǎn)效率,為品牌出海賦能。伴隨TikTok商業(yè)化的崛起,整體廣告主對(duì)廣告短視頻的創(chuàng)作需求將大幅度提升。而國(guó)內(nèi)出海廣告主在做國(guó)外廣告短視頻時(shí),通常面臨腳本創(chuàng)作難、多語(yǔ)言挑戰(zhàn)、真人化本土化、真人素材昂貴、外籍演員溝通難等痛點(diǎn)。這都將是CreativeFitting的機(jī)會(huì)。
數(shù)字王國(guó)
2022年初,南京江蘇衛(wèi)視跨年演唱會(huì),有一位“特殊”嘉賓現(xiàn)身:使用最先進(jìn)技術(shù)合成的虛擬人鄧麗君現(xiàn)身舞臺(tái),與知名歌手周深同臺(tái)演繹《大魚(yú)》、《小城故事》和《漫步人生路》,虛擬鄧麗君的背后是知名虛擬現(xiàn)實(shí)(VR)體驗(yàn)服務(wù)供應(yīng)商之一,數(shù)字王國(guó)。本次其使用的技術(shù)是融合機(jī)器學(xué)習(xí)的高階渲染系統(tǒng)“Mystique Live”,該項(xiàng)技術(shù)也曾經(jīng)運(yùn)用在《復(fù)仇者聯(lián)盟》系列中的“滅霸”身上。
筷子科技
企業(yè)級(jí)創(chuàng)意智能生產(chǎn)及協(xié)作增長(zhǎng)平臺(tái)。經(jīng)過(guò)多年的技術(shù)沉淀,筷子科技基于自研的圖片、音頻和視頻內(nèi)容的結(jié)構(gòu)化分析技術(shù)引擎FusionX,通過(guò)AI自動(dòng)解構(gòu)圖像及視頻創(chuàng)意元素,賦能內(nèi)容人機(jī)協(xié)作生產(chǎn)效率,深度分析創(chuàng)意與商業(yè)轉(zhuǎn)化效果的關(guān)系,并通過(guò)商業(yè)創(chuàng)意線上化團(tuán)隊(duì)協(xié)作平臺(tái)產(chǎn)品,大幅提升內(nèi)容商家客戶團(tuán)隊(duì)效率和業(yè)務(wù)增長(zhǎng)。
△筷子科技核心產(chǎn)品能力
“加筷”智能創(chuàng)意生產(chǎn)及協(xié)作平臺(tái),該平臺(tái)為筷子科技于2020年底推出的全新企業(yè)級(jí)智能創(chuàng)意SaaS產(chǎn)品平臺(tái),賦能國(guó)內(nèi)數(shù)百萬(wàn)內(nèi)容商家及跨境商家的智能內(nèi)容生產(chǎn)及協(xié)作平臺(tái),鏈接內(nèi)容團(tuán)隊(duì)編導(dǎo)、拍攝、剪輯、投放、管理等五大協(xié)同角色,數(shù)十倍提升內(nèi)容(特別是短視頻)生產(chǎn)效率,打通國(guó)內(nèi)外公域及私域主流平臺(tái),并通過(guò)智能推薦算法和數(shù)據(jù)分析提升內(nèi)容轉(zhuǎn)化。
快手云剪
目前,字節(jié)跳動(dòng)旗下的剪映,快手云剪都能提供AI生成視頻,快手云剪提供了智能封面、自動(dòng)配音、自動(dòng)字幕、畫(huà)質(zhì)增強(qiáng)、視頻去抖、自動(dòng)橫屏轉(zhuǎn)豎屏等系列智能工具,以技術(shù)賦能內(nèi)容創(chuàng)作者。
在視頻的智能化處理模塊,目前已經(jīng)上線了4個(gè)智能工具:智能封面、橫屏轉(zhuǎn)豎屏、視頻去抖和智能去痕。通過(guò)AI技術(shù)識(shí)別橫屏視頻,再自動(dòng)生成豎屏內(nèi)容,直接降低了橫屏豎屏之間的轉(zhuǎn)換門(mén)檻。
帝視科技
專注于人工智能與計(jì)算機(jī)視覺(jué)技術(shù)研究與產(chǎn)品開(kāi)發(fā),提供智能制造及數(shù)智影像領(lǐng)域技術(shù)服務(wù)和行業(yè)解決方案。帝視科技與產(chǎn)業(yè)鏈上下游高校、院所、企業(yè)構(gòu)建了關(guān)系廣泛、技術(shù)力量強(qiáng)大、產(chǎn)業(yè)鏈完整的產(chǎn)學(xué)研合作體,圍繞數(shù)智影像、智能制造等領(lǐng)域開(kāi)展系統(tǒng)研究與攻關(guān),形成多種專業(yè)化的解決方案。目前,經(jīng)過(guò)自主開(kāi)發(fā)且可落地應(yīng)用的核心AI算法已有100+,AI模型超1000+,產(chǎn)品能力覆蓋數(shù)智影像、智能制造產(chǎn)業(yè)鏈上下游企業(yè),加速實(shí)體產(chǎn)業(yè)往數(shù)字化、智能化、系統(tǒng)化方向更新迭代。
音頻
思必馳
思必馳旗下DUI平臺(tái)上線“單人千音”功能。“單人千音”通過(guò)深度神經(jīng)網(wǎng)絡(luò)對(duì)發(fā)音人音色進(jìn)行建模,實(shí)現(xiàn)單個(gè)音色就能生成同時(shí)覆蓋多種語(yǔ)言、多種風(fēng)格的語(yǔ)音合成聲音,極大豐富了合成語(yǔ)音的表現(xiàn)力。與大家分享這一新功能。
靈動(dòng)音科技
于2018年成立,其產(chǎn)品包括針對(duì)視頻生成配樂(lè)的配樂(lè)貓、支持非音樂(lè)專業(yè)人員創(chuàng)作的口袋音樂(lè)、可AI生成歌詞的LYRICA、AI作曲軟件LAZYCOMPOSER。目前已與國(guó)內(nèi)多家音樂(lè)平臺(tái)廠商達(dá)成合作。其音樂(lè)標(biāo)注團(tuán)隊(duì)已形成了全球最精確的話語(yǔ)歌曲音樂(lè)信息庫(kù)。
標(biāo)貝科技
標(biāo)貝科技是一家專注于智能語(yǔ)音交互和AI數(shù)據(jù)服務(wù)的人工智能公司,擁有業(yè)內(nèi)先進(jìn)的AI語(yǔ)音交互技術(shù)及高精度數(shù)據(jù)采標(biāo)處理技術(shù),創(chuàng)新打造多場(chǎng)景應(yīng)用的語(yǔ)音交互方案,以及聲音定制,聲音復(fù)刻、情感合成、聲音轉(zhuǎn)換等在內(nèi)的語(yǔ)音技術(shù)產(chǎn)品;AI數(shù)據(jù)業(yè)務(wù)涵蓋語(yǔ)音合成、語(yǔ)音識(shí)別、圖像視覺(jué)、nlp等采標(biāo)服務(wù)和數(shù)據(jù)可視化平臺(tái)-數(shù)據(jù)工場(chǎng)。
為了賦予合成聲音更豐富的情感表現(xiàn)力,滿足用戶在更多應(yīng)用場(chǎng)景的多樣化需求,標(biāo)貝科技在音色和場(chǎng)景豐富度上持續(xù)發(fā)力,上線了超過(guò)34種音色,包括童聲、成人男女聲,深度覆蓋有聲閱讀、智能客服、語(yǔ)音播報(bào)等多個(gè)業(yè)務(wù)場(chǎng)景,完成對(duì)發(fā)音庫(kù)的大量增容。
科大訊飛
科大訊飛是成立于1999年的AI巨頭,不僅基于AI虛擬人交互平臺(tái)在打造中國(guó)AIGC的中心,而且正在穩(wěn)步推進(jìn)國(guó)產(chǎn)化核心技術(shù)創(chuàng)新。
早在2019年科大訊飛已開(kāi)始研究超大模型關(guān)鍵技術(shù),聯(lián)合國(guó)內(nèi)高校打造的開(kāi)源預(yù)訓(xùn)練模型已成為業(yè)界頭部中文預(yù)訓(xùn)練模型,助力行業(yè)智能化創(chuàng)新。
訊飛超腦2030計(jì)劃為牽引來(lái)推動(dòng)源頭技術(shù)的系統(tǒng)性創(chuàng)新,科大訊飛在復(fù)雜場(chǎng)景的多模感知、多維表達(dá)、認(rèn)知智能和AI運(yùn)動(dòng)智能算法領(lǐng)域都有長(zhǎng)足的進(jìn)步。多模感知實(shí)現(xiàn)語(yǔ)音與視覺(jué)、眼神、面部表情、肢體語(yǔ)言、環(huán)境的融合感知,多模態(tài)增強(qiáng)語(yǔ)音技術(shù)將主說(shuō)話人的干凈人聲從嘈雜場(chǎng)景中分離出來(lái),識(shí)別效果相較單模態(tài)提升約49.5%,在業(yè)界率先跨過(guò)實(shí)用門(mén)檻。在多語(yǔ)種語(yǔ)音識(shí)別、語(yǔ)音合成、圖文識(shí)別、機(jī)器翻譯領(lǐng)域,科大訊飛主要語(yǔ)種核心效果保持國(guó)際領(lǐng)先水平。
網(wǎng)易天音
△圖片來(lái)源:網(wǎng)易天音官網(wǎng)
網(wǎng)易試水AI音樂(lè)創(chuàng)作領(lǐng)域,推出全球首個(gè)一站式音樂(lè)創(chuàng)作平臺(tái)天音??梢詾榱餍幸魳?lè)專業(yè)伴奏編曲工作,提供快速模版化。但是使用該平臺(tái)需要一定的樂(lè)理基礎(chǔ),可根據(jù)和弦譜,進(jìn)行編曲微調(diào)的自定義編輯,支持導(dǎo)出成品伴奏音頻。
數(shù)字人3D
AIGC和虛擬數(shù)字人結(jié)合會(huì)成為一種趨勢(shì),聰明且人性化的對(duì)話體驗(yàn),不再只是文字呈現(xiàn),而是以生動(dòng)形象的數(shù)字人形式輸出,這或?qū)⒊蔀锳IGC數(shù)字人的另一個(gè)里程碑。
倒映有聲
AI音頻科技創(chuàng)新企業(yè)「倒映有聲」,一家以AI技術(shù)為核心的國(guó)家高新技術(shù)企業(yè)和無(wú)人驅(qū)動(dòng)數(shù)字分身技術(shù)解決方案供應(yīng)商,通過(guò)自研神經(jīng)渲染引擎、數(shù)字孿生技術(shù)、以及獨(dú)創(chuàng)的TTSA技術(shù),從語(yǔ)義到聲音圖片,再到連續(xù)幀視頻畫(huà)面,實(shí)現(xiàn)多姿態(tài)的數(shù)字分身生成,并實(shí)現(xiàn)基于文本實(shí)時(shí)生成高質(zhì)量語(yǔ)音(音頻)和動(dòng)畫(huà)(視頻),最終實(shí)現(xiàn)無(wú)人驅(qū)動(dòng)數(shù)字分身的行業(yè)技術(shù)突破,致力于成為全球領(lǐng)先的AI數(shù)字人神經(jīng)渲染引擎。
倒映有聲旗下?lián)碛腥诿襟wAI數(shù)字人技術(shù)解決方案、“一視同人”數(shù)字分身內(nèi)容創(chuàng)作平臺(tái)和有聲書(shū)制作交易平臺(tái)等,落地場(chǎng)景可覆蓋媒體播報(bào)、有聲讀物制作、互動(dòng)游戲、虛擬直播、娛樂(lè)等應(yīng)用場(chǎng)景,滿足企業(yè)用戶降本增效的需求,促進(jìn)企業(yè)業(yè)務(wù)形態(tài)創(chuàng)新和增長(zhǎng),構(gòu)建以無(wú)人驅(qū)動(dòng)數(shù)字分身為載體的虛擬世界新生態(tài)。
目前,公司產(chǎn)品、技術(shù)、服務(wù)以及整套解決方案,已被中央廣播電視總臺(tái)音頻客戶端云聽(tīng)、河南電視臺(tái)、物靈科技、中文在線、當(dāng)紅齊天等頭部企業(yè)所采用。
魔琺科技
成立于2018年初,創(chuàng)始人柴金祥已在三維虛擬人的智能建模和綁定、AI表演動(dòng)畫(huà)、AI動(dòng)畫(huà)生成、交互領(lǐng)域潛心研究了19年,并以第一作者身份代表MSRA發(fā)表了中國(guó)大陸學(xué)者第1篇SIGGRAPH(圖形學(xué)世界最頂級(jí)期刊)論文,先后在SIGGRAPH/TOG發(fā)表了20篇關(guān)于三維虛擬人核心技術(shù)論文。
目前已構(gòu)建AI虛擬人能力平臺(tái),實(shí)現(xiàn)一站式造人、育人、用人的構(gòu)建AI虛擬人的能力平臺(tái),賦能各行各業(yè)創(chuàng)建多模態(tài)交互的AI虛擬人,從而應(yīng)用在不同的業(yè)務(wù)場(chǎng)景。
星凡科技
坐落于成都,依托自主研發(fā)的元宇宙引擎,采用行業(yè)內(nèi)領(lǐng)先的大數(shù)據(jù)、區(qū)塊鏈、AIGC等技術(shù),致力于打造Web3.0時(shí)代的元宇宙基礎(chǔ)數(shù)字設(shè)施,賦能商業(yè)元宇宙和城市元宇宙,助力政府、企業(yè)數(shù)字化轉(zhuǎn)型升級(jí),服務(wù)國(guó)家戰(zhàn)略,推動(dòng)人類重構(gòu)未來(lái)智能新世界。
2022年11月,星凡科技完成近千萬(wàn)人民幣天使輪融資,由鑫瑞恩資本和個(gè)人投資者聯(lián)合投資。本輪融資資金主要用于元宇宙引擎以及AIGC相關(guān)技術(shù)的研發(fā)、市場(chǎng)拓展等。
游戲
△HoloLens工業(yè)使用宣傳畫(huà)面
AIGC已經(jīng)或者將要滲透到游戲產(chǎn)業(yè)鏈各個(gè)環(huán)節(jié):美術(shù)—AI畫(huà)圖、AI實(shí)景運(yùn)算、AI地圖;玩法/策劃—AI劇情、智能NPC及語(yǔ)音、AI關(guān)卡設(shè)計(jì)/道具設(shè)計(jì);發(fā)行—AI投放系統(tǒng)、AI驅(qū)動(dòng)CG制作等等。AIGC對(duì)游戲的改造也有望推動(dòng)全新的玩法/品類甚至游戲形態(tài)的誕生。
超參數(shù)科技
超參數(shù)科技是一家專注于游戲AI探索的初創(chuàng)公司,主攻機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、大系統(tǒng)工程等領(lǐng)域,旨在為游戲公司提供AI解決方案。成立于2019年初,目前已獲得晨興資本、高榕資本數(shù)千萬(wàn)美元A輪融資。
創(chuàng)始人劉永升,原騰訊AI Lab總經(jīng)理、T4技術(shù)專家,圍棋AI“絕藝”、王者榮耀AI“絕悟”團(tuán)隊(duì)負(fù)責(zé)人。團(tuán)隊(duì)成員包括來(lái)自騰訊AI Lab和IEG游戲的多位人工智能科學(xué)家、技術(shù)骨干,以及海內(nèi)外頂尖院校的精英伙伴。團(tuán)隊(duì)曾主導(dǎo)了圍棋AI“絕藝”、王者榮耀AI“絕悟”的研發(fā)工作。
超參數(shù)科技的方向主要是探索通過(guò)AI技術(shù),變革游戲生產(chǎn)方式和內(nèi)容玩法形式。而經(jīng)過(guò)三年發(fā)展,劉永升意識(shí)到,游戲AI能夠輻射的領(lǐng)域非常廣闊,在游戲AI概念下衍生出的業(yè)務(wù)和應(yīng)用場(chǎng)景非常豐富,“即便游戲本身也太大了,每個(gè)人對(duì)游戲AI的理解也不同,我們現(xiàn)在是做減法,把AI Bot做到極致,這是公司非常重要的新戰(zhàn)略?!?/span>
超參數(shù)為AI Bot的發(fā)展規(guī)劃了一條從L1至L4的技術(shù)路徑,希望從簡(jiǎn)單擬人化的AI Bot出發(fā),最終構(gòu)建一個(gè)“10億人與100億AI bot共存”的虛擬空間生態(tài)。
靈圖創(chuàng)新
旗下產(chǎn)品「言出法隨」——無(wú)門(mén)檻的影視游戲創(chuàng)作發(fā)布平臺(tái)。靈圖致力于搭建下一代影視游戲創(chuàng)作發(fā)布平臺(tái)。利用先進(jìn)的多模態(tài)AI,實(shí)現(xiàn)一句話到多種數(shù)字媒體內(nèi)容(圖像、視頻、VR/AR、3D場(chǎng)景)的一鍵式生成。將創(chuàng)作能力和權(quán)利下放到每一個(gè)人,真正實(shí)現(xiàn)內(nèi)容原生,建起人類走向元宇宙時(shí)代的橋梁。公司具有奧斯卡級(jí)的超大型CG數(shù)據(jù)集,研發(fā)了世界領(lǐng)先的多模態(tài)AI。目前該AI已能夠?qū)崿F(xiàn)從文字到多種數(shù)字媒體內(nèi)容的生成。
rct AI
rct AI 成立于2018年,運(yùn)用人工智能為游戲行業(yè)提供完整的解決方案。 在不同類型和題材的游戲場(chǎng)景中,rct AI為游戲開(kāi)發(fā)者打造的一系列解決方案,覆蓋了游戲的全生命周期,包含智能內(nèi)容生成、智能測(cè)試、智能數(shù)據(jù)運(yùn)營(yíng)、智能投放等類型。
rct AI也在打造不同技術(shù)解決方案,以布局虛擬人“大腦”,即讓虛擬人能夠智能地行動(dòng)和決策。在布局過(guò)程中,選擇以工具的方式切入,借助游戲的全數(shù)字化場(chǎng)景迭代AGI技術(shù)。rct AI目前主要面向游戲行業(yè)提供基于AI的解決方案,包括智能NPC、自動(dòng)化QA、對(duì)話系統(tǒng)和AI陪玩,在這個(gè)過(guò)程中不斷實(shí)現(xiàn)技術(shù)的積累與迭代。
綜合
相芯科技
2016年成立,相芯科技致力于元宇宙基礎(chǔ)設(shè)施建設(shè),并率先布局深耕虛擬人技術(shù)應(yīng)用,是國(guó)內(nèi)最早一批的元宇宙規(guī)?;瘡S商之一。
相芯科技憑借尖端技術(shù)研發(fā)能力、豐富的產(chǎn)品開(kāi)發(fā)經(jīng)驗(yàn),為各行業(yè)領(lǐng)域提供標(biāo)準(zhǔn)化、低門(mén)檻、多類型的虛擬人解決方案,廣受海內(nèi)外客戶青睞。立足國(guó)內(nèi),相芯科技已服務(wù)小米、榮威、中國(guó)移動(dòng)等各行業(yè)頭部企業(yè);放眼全球,與美國(guó)Fika Media Company、韓國(guó)CKG Solutions、新加坡Buzz AR等企業(yè)均深入合作。
微軟小冰
成立于2020年,獨(dú)角獸企業(yè),是全球領(lǐng)先的人工智能科技公司,旗下小冰框架是全球承載交互量最大的完備人工智能框架之一,在開(kāi)放域?qū)υ?、多模態(tài)交互、超級(jí)自然語(yǔ)音、神經(jīng)網(wǎng)絡(luò)渲染及內(nèi)容生成領(lǐng)域居于全球領(lǐng)先。
微軟小冰人產(chǎn)品有虛擬人、音頻生成、視覺(jué)創(chuàng)造、文本創(chuàng)造、虛擬社交等。微軟小冰的客戶已覆蓋金融、智能車機(jī)、零售、體育、紡織、地產(chǎn)、文旅等十多個(gè)垂直領(lǐng)域,并提出了以「人力」的邏輯去進(jìn)行商業(yè)報(bào)價(jià)的虛擬人商業(yè)模式。
追一科技
深圳追一科技有限公司是領(lǐng)先的人工智能公司和AI數(shù)字員工提供商,公司主攻深度學(xué)習(xí)和自然語(yǔ)言處理,提供智能語(yǔ)義,語(yǔ)音和視覺(jué)的AI全棧服務(wù)。AI數(shù)字員工智能平臺(tái)能與業(yè)務(wù)場(chǎng)景深度融合,提供不同類型的AI數(shù)字員工,滿足企業(yè)和政府用戶服務(wù)、營(yíng)銷、運(yùn)營(yíng)、 辦公等多種場(chǎng)景的智能化升級(jí)需求,幫助客戶降本提效,改善用戶體驗(yàn),驅(qū)動(dòng)創(chuàng)新和增長(zhǎng)。
核心團(tuán)隊(duì)中,國(guó)內(nèi)頂尖技術(shù)專家占比81%以上,絕大部分成員為碩士和博士學(xué)歷,涵蓋了NLP算法、語(yǔ)義算法、語(yǔ)音算法、多模態(tài)算法、自動(dòng)機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等全棧AI技術(shù)領(lǐng)域。團(tuán)隊(duì)成員已提交333項(xiàng)專利,其中獲得專利授權(quán)109項(xiàng),在AI領(lǐng)域主流刊物發(fā)表數(shù)十篇學(xué)術(shù)論文,其中3篇論文發(fā)表在頂級(jí)學(xué)術(shù)會(huì)議ASRU、NLPCC、EMNLP上。
昆侖萬(wàn)維
昆侖萬(wàn)維成立于2008年,在AIGC領(lǐng)域已經(jīng)投入了近兩年的時(shí)間,成立MusicX L ab,目前已經(jīng)正式銷售AI作曲。
△昆侖天工算法與模型
22年第四季度推出的“昆侖天工”,旗下模型包括天工巧繪SkyPaint、天工樂(lè)府SkyMusic、天工妙筆SkyText、天工智碼SkyCode,覆蓋圖像、音樂(lè)、文本、編程等多模態(tài)內(nèi)容生成能力,標(biāo)志著昆侖萬(wàn)維成為目前國(guó)內(nèi)AIGC領(lǐng)域布局最為全面的公司之一,也是國(guó)內(nèi)第一個(gè)全身心投入到AIGC開(kāi)源社區(qū)的公司。
目前AI圖像、AI文本、AI編程的模型已經(jīng)在GitHub上開(kāi)源。
AI圖像方面,天工巧繪SkyPaint采用全球第一款多語(yǔ)言Stable Diffusion分支模型,兼容Stable Diffusion;使用1.5億中英雙語(yǔ)語(yǔ)料,支持中英雙語(yǔ)輸入實(shí)現(xiàn)文字生成圖像,是國(guó)內(nèi)為數(shù)不多的支持中英雙語(yǔ)的文圖生成模型。
模型&算法
搜狗
央視最早在 2018 年就和搜狗推出過(guò) AI 主持人,并在21年5月推出手語(yǔ)AI合成主播,搜狗在翻譯和虛擬數(shù)字人(搜狗分身)交互領(lǐng)域的積累和交叉融合。在搜狗以語(yǔ)言為核心的AI技術(shù)布局中,從中文、多方言和外國(guó)語(yǔ)種的語(yǔ)音識(shí)別轉(zhuǎn)寫(xiě)、AI同傳翻譯,再到個(gè)性化的語(yǔ)音合成和變聲……在人們生活中語(yǔ)言應(yīng)用的方方面面,都不乏搜狗的身影。
如今,搜狗作為國(guó)產(chǎn)AI+語(yǔ)音領(lǐng)域顛覆傳統(tǒng)語(yǔ)音行業(yè)領(lǐng)先者之一,其AI語(yǔ)音技術(shù)具有高識(shí)別率、高準(zhǔn)確率、低時(shí)延和多模態(tài)融合等優(yōu)勢(shì),已廣泛應(yīng)用到教育、商務(wù)、旅游等多個(gè)應(yīng)用場(chǎng)景,并已深入你我身邊的千家萬(wàn)戶中。
百度
2022年發(fā)布了AI助理,覆蓋了各種AIGC應(yīng)用,包括AI自動(dòng)生成文字、圖片以及圖片轉(zhuǎn)換成視頻,旨在為現(xiàn)有的500多萬(wàn)百家號(hào)創(chuàng)作者帶來(lái)一套AI生產(chǎn)內(nèi)容工具,幫助他們更快更好地產(chǎn)出視頻內(nèi)容,從而增加百度百家號(hào)等產(chǎn)品的用戶粘性。
百度增強(qiáng)現(xiàn)實(shí)技術(shù)部成立于2017年,依托百度大腦核心能力,打造業(yè)內(nèi)領(lǐng)先的AR 智能交互平臺(tái)DuMix AR。通過(guò)視覺(jué)定位、人機(jī)交互、3D識(shí)別跟蹤等技術(shù)能力的前瞻布局,構(gòu)建虛實(shí)互聯(lián)的基礎(chǔ)設(shè)施,變革人機(jī)交互的創(chuàng)新體驗(yàn)。百度知識(shí)圖譜面向海量數(shù)據(jù),綜合運(yùn)用語(yǔ)義理解、知識(shí)挖掘、知識(shí)整合與補(bǔ)全等技術(shù),構(gòu)建出多元異構(gòu)的超大規(guī)模知識(shí)圖譜,進(jìn)而基于知識(shí)圖譜進(jìn)行理解、推理和計(jì)算。
文心一言(英文名:ERNIE Bot)是百度基于文心大模型技術(shù)推出的生成式對(duì)話產(chǎn)品:
△AI自動(dòng)生成節(jié)日海報(bào)(來(lái)自文心作畫(huà)大模型ERNIE-ViLG)
目前,百度知識(shí)圖譜已經(jīng)擁有業(yè)界最大規(guī)模知識(shí)圖譜,并廣泛應(yīng)用于公司各產(chǎn)品線。同時(shí),百度知識(shí)圖譜深耕行業(yè)圖譜,打造面向B端場(chǎng)景的知識(shí)圖譜平臺(tái)、產(chǎn)品及解決方案,業(yè)內(nèi)首發(fā)行業(yè)知識(shí)中臺(tái),助力各行各業(yè)的智能化升級(jí)。
騰訊
2023年2月初,騰訊旗下的騰訊研究院發(fā)布《AIGC發(fā)展趨勢(shì)報(bào)告2023》。報(bào)告中指出,AIGC的商業(yè)化應(yīng)用將快速成熟,市場(chǎng)規(guī)模會(huì)迅速壯大。當(dāng)前AIGC已經(jīng)率先在傳媒、電商、影視、娛樂(lè)等數(shù)字化程度高、內(nèi)容需求豐富的行業(yè)取得重大發(fā)展,市場(chǎng)潛力逐漸顯現(xiàn)。以及,在廣告領(lǐng)域,騰訊混元AI大模型能夠支持廣告智能制作,即利用AIGC將廣告文案自動(dòng)生成為廣告視頻,大大降低了廣告視頻制作成本。巨大的應(yīng)用前景將帶來(lái)市場(chǎng)規(guī)模的快速增長(zhǎng)。
騰訊擁有“微信”這一國(guó)民級(jí)移動(dòng)應(yīng)用程序,包括在公眾號(hào)、視頻號(hào)、看一看等功能中都有AI算法加持。目前,騰訊在AI技術(shù)領(lǐng)域的業(yè)務(wù),主要包括騰訊AI實(shí)驗(yàn)室、騰訊優(yōu)圖等。
騰訊AI Lab基于多模態(tài)學(xué)習(xí)及生成能力在游戲領(lǐng)域進(jìn)行了全流程的布局。如開(kāi)發(fā)的“絕悟”平臺(tái)通過(guò)強(qiáng)化學(xué)習(xí)的方法來(lái)模仿真實(shí)玩家,包括發(fā)育、運(yùn)營(yíng)、協(xié)作等指標(biāo)類別,以及每分鐘手速等具體參數(shù),讓AI更接近正式服玩家真實(shí)表現(xiàn)。騰訊AI Lab還與王者榮耀聯(lián)合推出了AI開(kāi)放研究平臺(tái)“開(kāi)悟”,試圖讓AI通過(guò)強(qiáng)化學(xué)習(xí)的方法來(lái)模仿真實(shí)玩家,最終達(dá)到職業(yè)電競(jìng)水平。除此之外,騰訊還打造了寫(xiě)稿機(jī)器人“夢(mèng)幻寫(xiě)手”。
微軟亞洲研究院
微軟亞洲研究院(MSRA)是微軟在美國(guó)本土以外規(guī)模最大研究機(jī)構(gòu),自 1998 年建院以來(lái)已經(jīng)發(fā)展成為世界一流的計(jì)算機(jī)基礎(chǔ)及應(yīng)用研究機(jī)構(gòu),推動(dòng)整個(gè)計(jì)算機(jī)學(xué)科前沿技術(shù)發(fā)展并將最新研究成果快速產(chǎn)品化。微軟亞洲研究院著眼于下一代革命性技術(shù)的研究,目前共有約 250 名研究和開(kāi)發(fā)人員以及 300 多名訪問(wèn)學(xué)者和實(shí)習(xí)生。
微軟亞洲研究院自然語(yǔ)言計(jì)算組專注于自然語(yǔ)言處理領(lǐng)域的理論、算法和應(yīng)用研究。目前主要的研究興趣包括:自然語(yǔ)言理解與生成,機(jī)器翻譯,智能問(wèn)答,語(yǔ)音處理,代碼智能,文檔智能,多模態(tài)理解與生成,以及大規(guī)模預(yù)訓(xùn)練模型等。
阿里巴巴
淘系搜索算法團(tuán)隊(duì)擁有全世界最大的商品搜索系統(tǒng),每天為上億用戶提供數(shù)十億次搜索服務(wù)。我們致力于研究最前沿的機(jī)器智能技術(shù),探索世界上最完整的最有價(jià)值的電商大數(shù)據(jù),引領(lǐng)深度學(xué)習(xí)時(shí)代搜索算法技術(shù)的變革。
阿里巴巴達(dá)摩院語(yǔ)言技術(shù)實(shí)驗(yàn)室NLP團(tuán)隊(duì)研發(fā)的技術(shù)在圖文問(wèn)答和中文理解榜單多個(gè)任務(wù)上首次超越人類,建設(shè)NLP平臺(tái)和產(chǎn)品在阿里巴巴集團(tuán)內(nèi)支持?jǐn)?shù)百個(gè)場(chǎng)景日均數(shù)萬(wàn)億級(jí)調(diào)用,對(duì)外賦能多個(gè)行業(yè)合作伙伴,也是AI開(kāi)源魔搭社區(qū)NLP模型的主要提供者。其中黃非博士加入達(dá)摩院之前,他曾在卡耐基梅隆大學(xué)攻讀博士,之后在IBM Watson和Facebook從事并領(lǐng)導(dǎo)NLP研究等工作。他在人工智能頂級(jí)會(huì)議和期刊發(fā)表文章60+篇,中美專利20項(xiàng),曾擔(dān)任ACL,AACL等學(xué)術(shù)會(huì)議領(lǐng)域主席等。
阿里巴巴旗下的AI在線設(shè)計(jì)平臺(tái)Lubanner,幫助營(yíng)銷人員生產(chǎn)Banner。
英偉達(dá)
在視覺(jué)生成研究領(lǐng)域始終位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GANverse3D、Instant NeRF等。2022年12月,NVIDIA發(fā)布了NVIDIA AI Enterprise 軟件套件的新版本,為全球企業(yè)多個(gè)行業(yè)和特定領(lǐng)域的各項(xiàng)工作負(fù)載提供支持。NVIDIA AI Enterprise 3.0提供用于呼叫中心的智能虛擬助手、音頻轉(zhuǎn)錄和網(wǎng)絡(luò)安全數(shù)字指紋的AI工作流。對(duì)于應(yīng)用AI來(lái)完善客戶服務(wù)的企業(yè)而言,這些都是最常使用的應(yīng)用。NVIDIA AI Enterprise 3.0預(yù)計(jì)將于本月晚些時(shí)候上線。除上述功能外,還擴(kuò)大了對(duì)NVIDIA NGC軟件目錄中50多個(gè)NVIDIA AI軟件框架和預(yù)訓(xùn)練模型的支持,將大幅推動(dòng)并簡(jiǎn)化全球范圍內(nèi)眾多機(jī)構(gòu)的AI部署工作。
商湯科技
商湯擁有領(lǐng)先的人工智能基礎(chǔ)設(shè)施SenseCore大裝置,不僅具有領(lǐng)先的人工智能算力,還可以提供十億級(jí)參數(shù)級(jí)別的參數(shù)大模型,并在此基礎(chǔ)上打造了SenMARS火星混合現(xiàn)實(shí)平臺(tái)。SenMARS火星混合現(xiàn)實(shí)平臺(tái)可以提供包括數(shù)字人、數(shù)字空間、數(shù)字物體在內(nèi)的生成能力。
基于原創(chuàng)的OpenXRLab擴(kuò)展現(xiàn)實(shí)平臺(tái)的領(lǐng)先算法,結(jié)合大量真人動(dòng)作數(shù)據(jù),商湯打造了一套基于深度學(xué)習(xí)的動(dòng)作捕捉及生成解決方案。
基于商湯原創(chuàng)的虛擬IP解決方案及多種領(lǐng)先的AI技術(shù),可以實(shí)現(xiàn)高效率、低成本的AIGC內(nèi)容創(chuàng)作,助力銀行實(shí)現(xiàn)前端業(yè)務(wù)的用戶積累和營(yíng)銷轉(zhuǎn)化。
字節(jié)跳動(dòng)
抖音有很多 NLP 的落地場(chǎng)景,多模態(tài),語(yǔ)義理解,詞法分析,意圖分析,多語(yǔ)言,廣告等等,絕對(duì)有你的用武之地;而工程方面的也有非常多有挑戰(zhàn)的工作等著你,支持?jǐn)?shù)萬(wàn)億視頻的快速檢索框架,超大規(guī)模分布式系統(tǒng),高性能深度學(xué)習(xí)框架和平臺(tái)構(gòu)建等等,方向眾多。
2023年2月7日,谷歌通過(guò)Twitter發(fā)布了一個(gè)在線短視頻廣告,推廣其旗下、基于大型語(yǔ)言模型LaMDA的聊天機(jī)器人Bard。谷歌已經(jīng)向AI初創(chuàng)企業(yè)Anthropic投資約3億美元,獲得Anthropic約10%的股份,后者將用投資從谷歌的云計(jì)算部門(mén)購(gòu)買(mǎi)大量計(jì)算資源。
谷歌所研發(fā)的LaMDA,是一種基于網(wǎng)絡(luò)上數(shù)十億詞匯進(jìn)行訓(xùn)練的大型語(yǔ)言模型。它不僅受益于谷歌更強(qiáng)大的計(jì)算能力和研發(fā)團(tuán)隊(duì),并且谷歌還有能力通過(guò)數(shù)百萬(wàn)用戶的反饋來(lái)對(duì)LaMDA模型及聊天機(jī)器人Bard進(jìn)行微調(diào)。按照Pichai的說(shuō)法,Bard可以利用谷歌龐大的信息庫(kù),為用戶提供準(zhǔn)確且高質(zhì)量的答案,對(duì)微軟及ChatGPT構(gòu)成有力威脅。
Meta AI(Facebook)
2022年5月,MetaAI官宣發(fā)布了基于1750億參數(shù)的超大模型OPT-175B,還對(duì)所有社區(qū)免費(fèi)開(kāi)放。
2022年12月22日,該模型的更新版本OPT-IML(Open Pre-trained Transformer)正式上線,Meta稱其「對(duì)2000個(gè)語(yǔ)言任務(wù)進(jìn)行了微調(diào),包含1750 億個(gè)參數(shù)」,還將為非商業(yè)研究用途免費(fèi)開(kāi)放。
MetaAI在2022年5月宣布了一項(xiàng)長(zhǎng)期研究計(jì)劃,與神經(jīng)影像中心NeuroSpin (CEA)和INRIA合作,以更好地了解人類的大腦如何處理語(yǔ)言。該項(xiàng)目的主要工作是比較AI語(yǔ)言模型和大腦如何響應(yīng)相同的口語(yǔ)或書(shū)面句子,進(jìn)而將得出的見(jiàn)解和結(jié)論用于指導(dǎo)AI模型的開(kāi)發(fā),使得新模型能夠像人類一樣高效地處理語(yǔ)音和文本。
Open.AI
OpenAI是全球最著名的人工智能研究機(jī)構(gòu),發(fā)布了許多著名的人工智能技術(shù)和成果,如大語(yǔ)言模型GPT系列、文本生成圖片預(yù)訓(xùn)練模型DALL·E系列、語(yǔ)音識(shí)別模型Whisper系列等。由于這些模型在各自領(lǐng)域都有相當(dāng)驚艷的表現(xiàn),引起了全世界廣泛的關(guān)注。
2022年11月30日,OpenAI帶來(lái)了一種全新的 AI 聊天機(jī)器人——ChatGPT,它在很多問(wèn)題上近乎完美的表現(xiàn)使得它僅僅5天就有了100萬(wàn)用戶。它可以幫助我們寫(xiě)代碼、寫(xiě)博客、解釋技術(shù),可以多輪對(duì)話,寫(xiě)短劇等等。
Stability.AI
以AI繪畫(huà)走紅全球的新晉獨(dú)角獸公司Stability AI,去年推出了開(kāi)源AI模型Stable Diffusion。借助這一模型,任何人只需要提供一段文字描述,就有機(jī)會(huì)創(chuàng)作出任意風(fēng)格的繪畫(huà)作品。Stable Diffusion自2022年8月推出以來(lái),已經(jīng)被全球超過(guò)20萬(wàn)開(kāi)發(fā)者下載和授權(quán)。Stability AI的消費(fèi)級(jí)產(chǎn)品DreamStudio注冊(cè)用戶來(lái)自全球50多個(gè)國(guó)家,已經(jīng)超過(guò)100萬(wàn),他們共同創(chuàng)建了超過(guò)1.7億張圖像。
Midjourney
Midjourney-Ai 一款搭載在Discord上的人工智能繪畫(huà)聊天機(jī)器人,一分鐘繪圖,效果出眾,至今仍然是AI繪圖領(lǐng)域里的佼佼者。對(duì)于普通人來(lái)說(shuō),使用Midjourney的門(mén)檻非常低,你只需從Midjourney官網(wǎng)點(diǎn)擊進(jìn)入它們的Discord服務(wù)器,任意選擇一個(gè)新手頻道(#newbies),然后在聊天框里輸入或者調(diào)用“ / imagine”選項(xiàng),輸入一句描繪你想要實(shí)現(xiàn)畫(huà)面的文字即可。
MiniMax名之夢(mèng)
MiniMax名之夢(mèng),致力于成為通用人工智能時(shí)代基礎(chǔ)設(shè)施建設(shè)者和內(nèi)容應(yīng)用創(chuàng)造者,靠譜的產(chǎn)品和技術(shù)規(guī)劃,充裕資金(全球頂級(jí)投資機(jī)構(gòu)),信奉產(chǎn)品和技術(shù)驅(qū)動(dòng)的商業(yè)模式變革,“不走捷徑”得用“智能創(chuàng)造極致體驗(yàn)”。核心成員均來(lái)自于中美頂級(jí)科技/互聯(lián)網(wǎng)企業(yè)和海內(nèi)外知名院校。團(tuán)隊(duì)擁有豐富的計(jì)算資源和數(shù)據(jù)壁壘,促使前沿技術(shù)與產(chǎn)品的結(jié)合。
深言科技
以自研的中文超大規(guī)模預(yù)訓(xùn)練模型為核心構(gòu)建工業(yè)級(jí)中文信息處理引擎,并研發(fā)最優(yōu)秀的產(chǎn)品,引領(lǐng)中國(guó)的語(yǔ)言信息處理智能化革命。由于天然的語(yǔ)言差異和屏障,國(guó)外的英文大模型無(wú)法用于中文語(yǔ)言信息處理場(chǎng)景。而中文大模型的研發(fā)遠(yuǎn)未成熟,實(shí)際性能相較英文大模型仍有不小差距。這既是挑戰(zhàn),更是機(jī)遇——中文語(yǔ)言信息智能處理這一極為廣闊的市場(chǎng)仍然一片藍(lán)海。依靠這些模型強(qiáng)大的語(yǔ)言能力,文章自動(dòng)寫(xiě)作、摘要自動(dòng)生成、人機(jī)交互對(duì)話等一系列應(yīng)用迅速鋪開(kāi),并已產(chǎn)生巨大商業(yè)價(jià)值。
FlagOpen飛智(智源研究院)
北京智源人工智能研究院(簡(jiǎn)稱:智源研究院 Beijing Academy of Artificial Intelligence,BAAI)是人工智能領(lǐng)域的新型研發(fā)機(jī)構(gòu),目前正在研發(fā)的有“悟道”人工智能大模型項(xiàng)目、“天演”人工智能生命模擬工程、“九鼎”智算平臺(tái)、AI技術(shù)賦能生命科學(xué)研究等。
GPT-3、OPT系列、悟道等預(yù)訓(xùn)練模型在NLP領(lǐng)域取得了非常矚目的效果,但是不同代碼倉(cāng)庫(kù)有著不同實(shí)現(xiàn)風(fēng)格,并且在預(yù)訓(xùn)練大模型過(guò)程中使用的技術(shù)也各不相同,造成了技術(shù)鴻溝。為了快速加載、訓(xùn)練、推理不同大模型,使用最新最快的模型并行技術(shù)以及提高用戶訓(xùn)練和使用模型的便捷性,智源人工智能研究院推出了FlagAI(飛智)基礎(chǔ)模型開(kāi)源項(xiàng)目,為一鍵調(diào)大模型等功能提供支持。
FlagAI飛智是一個(gè)快速、易于使用和可擴(kuò)展的AI基礎(chǔ)模型工具包。 支持一鍵調(diào)用多種主流基礎(chǔ)模型,同時(shí)適配了中英文多種下游任務(wù)。
報(bào)告申明
10.1 團(tuán)隊(duì)介紹
非凡產(chǎn)研是非凡資本旗下專業(yè)的新商業(yè)創(chuàng)新及發(fā)展研究中心。非凡產(chǎn)研專注于商業(yè)場(chǎng)景下國(guó)內(nèi)及出海企業(yè)服務(wù)生態(tài)領(lǐng)域的研究,涉及方向包括:新?tīng)I(yíng)銷、新零售、新體驗(yàn)等,來(lái)幫助品牌和商家在全球化和數(shù)字化的時(shí)代獲得先機(jī)和提升競(jìng)爭(zhēng)力,同時(shí),非凡產(chǎn)研致力于將數(shù)據(jù)技術(shù)、人工智能和自動(dòng)化等新技術(shù)與不同領(lǐng)域傳統(tǒng)產(chǎn)業(yè)相結(jié)合,包括:消費(fèi)零售、本地生活、醫(yī)療健康等,助力企業(yè)插上數(shù)智化的翅膀。團(tuán)隊(duì)成員來(lái)自知名研究咨詢公司、私募基金和科技媒體等,是一支具有深入洞察、專業(yè)知識(shí)和豐富資源的分析師團(tuán)隊(duì)。
10.2 免責(zé)聲明
本報(bào)告由非凡產(chǎn)研發(fā)布,本報(bào)告版權(quán)歸非凡產(chǎn)研所有。任何中文轉(zhuǎn)載或引用,需注明報(bào)告來(lái)源,國(guó)外機(jī)構(gòu)如需轉(zhuǎn)載引用,請(qǐng)?zhí)崆奥?lián)系授權(quán)。
本報(bào)告為非凡產(chǎn)研作為第三方機(jī)構(gòu)的獨(dú)立原創(chuàng)分析,報(bào)告內(nèi)容不代表任何企業(yè)的立場(chǎng),且均不構(gòu)成對(duì)任何人的投資建議。因此投資者務(wù)必注意,因據(jù)此做出的任何投資決策與非凡產(chǎn)研及其員工或者關(guān)聯(lián)機(jī)構(gòu)無(wú)關(guān)。
在法律許可的情況下,非凡產(chǎn)研及其關(guān)聯(lián)機(jī)構(gòu)可能持有報(bào)告中提到的公司的股權(quán),或?yàn)槠涮峁┗驙?zhēng)取提供籌資或財(cái)務(wù)顧問(wèn)等相關(guān)服務(wù),其員工可能擔(dān)任報(bào)告中所提及公司的董事。