- 政策解讀
- 經(jīng)濟發(fā)展
- 社會發(fā)展
- 減貧救災(zāi)
- 法治中國
- 天下人物
- 發(fā)展報告
- 項目中心
|
2.虛擬現(xiàn)實與數(shù)字媒體技術(shù)
2.1媒體大數(shù)據(jù)內(nèi)容理解與智能服務(wù)
通過對媒體大數(shù)據(jù)進行深度分析和關(guān)聯(lián)挖掘,建立符合媒體內(nèi)容理解的計算模型,實現(xiàn)異構(gòu)媒體(圖像、視頻、音頻和文本)的結(jié)構(gòu)化描述和語義協(xié)同,突破媒體內(nèi)容理解的關(guān)鍵技術(shù),顯著提升媒體大數(shù)據(jù)的使用價值,為基于語義的媒體搜索、監(jiān)管與服務(wù)等相關(guān)產(chǎn)業(yè)的發(fā)展提供技術(shù)支撐并建立典型應(yīng)用示范。下設(shè)5個研究方向。
2.1.1媒體大數(shù)據(jù)的深度分析與結(jié)構(gòu)化描述(國撥經(jīng)費限600萬元,實施年限3年)
在超過10TB的數(shù)據(jù)集上建立多層次多角度的語義描述模型,研究媒體大數(shù)據(jù)的概念表示、事件提取、多角度語義表述、結(jié)構(gòu)組織、內(nèi)容分析的多層次結(jié)構(gòu)化描述方法,形成超過300個媒體內(nèi)容深度分析的概念模型,為媒體大數(shù)據(jù)的內(nèi)容理解奠定基礎(chǔ)。
2.1.2異構(gòu)媒體數(shù)據(jù)的關(guān)聯(lián)與挖掘(國撥經(jīng)費限500萬元,實施年限3年)
研究異構(gòu)媒體關(guān)聯(lián)分析與表達、基于上下文的多模態(tài)特征融合、異構(gòu)媒體相似性計算等問題,建立異構(gòu)媒體的語義關(guān)聯(lián)和統(tǒng)一表示,實現(xiàn)跨媒體的內(nèi)容挖掘和異構(gòu)媒體的統(tǒng)一管理。在超過10TB的數(shù)據(jù)集上視頻、圖像、音頻和文本之間的關(guān)聯(lián)速度小于2秒。
2.1.3面向社交網(wǎng)絡(luò)的搜索方法與群體行為分析(國撥經(jīng)費限600萬元,實施年限3年)
在社交網(wǎng)絡(luò)數(shù)據(jù)信息融合的基礎(chǔ)上,提出新型搜索模式與群體推薦方法,研究社交網(wǎng)絡(luò)中個體角色、信息傳播規(guī)律、群體行為演化的分析與預(yù)測技術(shù),實現(xiàn)社交網(wǎng)絡(luò)信息的高效獲取和態(tài)勢感知。在真實社交網(wǎng)絡(luò)環(huán)境下,千萬級用戶動態(tài)社交數(shù)據(jù)的增量分析比靜態(tài)分析速度提高15%,基于用戶偏好的預(yù)測及信息推薦方法的準確率比現(xiàn)有方法提高10%。
2.1.4媒體大數(shù)據(jù)內(nèi)容聚合與呈現(xiàn)(國撥經(jīng)費限500萬元,實施年限3年)
在分析用戶的屬性、興趣偏好、行為特征等信息的基礎(chǔ)上,通過領(lǐng)域知識構(gòu)建和社會需求發(fā)現(xiàn),建立用戶的興趣模型;在媒體內(nèi)容聚類、關(guān)聯(lián)和挖掘基礎(chǔ)上,提供符合用戶特定需求的多層次多維度的媒體信息聚合與呈現(xiàn)。聚合信息來源覆蓋新聞、論壇、博客、微博、社交網(wǎng)站等網(wǎng)絡(luò)媒體,熱點事件信息提取的準確率超過85%。
2.1.5基于網(wǎng)絡(luò)媒體內(nèi)容的智能服務(wù)平臺(國撥經(jīng)費限800萬元,企業(yè)牽頭申報,實施年限3年)
搜集、整合與管理超過10億網(wǎng)絡(luò)媒體用戶的數(shù)據(jù),通過分類與挖掘建立超過30個多維度、分層次的需求模型;研發(fā)滿足千萬級用戶并發(fā)訪問的網(wǎng)絡(luò)異構(gòu)媒體大數(shù)據(jù)存儲、管理與分析系統(tǒng),構(gòu)建高可靠的基于媒體內(nèi)容的智能服務(wù)平臺,實現(xiàn)關(guān)鍵技術(shù)驗證和基于語義的媒體智能服務(wù)示范。
2.2面向移動終端的多模態(tài)自然交互技術(shù)
研究提升移動終端視覺、聽覺感觀性能的手段,探討增強現(xiàn)實、情感語音、手勢等創(chuàng)新性人機交互技術(shù),實現(xiàn)系統(tǒng)集成,達到提高下一代智能移動終端易用性和便捷性的目的。下設(shè)5個研究方向。
2.2.1基于LCOS的眼鏡型透視融合顯示系統(tǒng)(國撥經(jīng)費限1300萬元,企業(yè)牽頭申報,實施年限3年)
完成大規(guī)模SDRAM器件與數(shù)字邏輯器件共融的集成電路設(shè)計和準亞微米厚度液晶盒制造工藝研究,提供微型高分辨率(1920×1080)時間混色LCOS芯片;研究波導(dǎo)器件設(shè)計和加工方法,研制眼鏡型透視式增強顯示系統(tǒng),波導(dǎo)器件厚度≤3mm,顯示視場角≥35度,在該視場角范圍內(nèi)實現(xiàn)虛實融合顯示。
2.2.2基于移動終端的戶外實時視覺定位技術(shù)(國撥經(jīng)費限600萬元,企業(yè)參與申報,實施年限3年)
研究高效的視覺特征提取及編碼技術(shù)、海量場景的快速識別技術(shù)、資源受限環(huán)境下的高精度實時跟蹤定位技術(shù)。制定視覺定位相關(guān)技術(shù)標準,重點研究視覺特征的數(shù)據(jù)規(guī)范。單幅圖像的視覺特征描述小于2K字節(jié),視覺定位準確率大于80%。研制符合標準規(guī)范的低功耗硬件。建立基于移動終端的大范圍戶內(nèi)外視覺定位服務(wù)平臺,實現(xiàn)在旅游、文化等領(lǐng)域的示范應(yīng)用。
2.2.3基于視覺的非接觸式自然人機交互技術(shù)(國撥經(jīng)費限500萬元,企業(yè)參與申報,實施年限3年)
研制可用于移動終端的新型光學(xué)傳感器設(shè)備,研究低功耗控制電路及新型多模傳感緊湊(或單封裝)型構(gòu)件,在移動終端上實現(xiàn)新型多模態(tài)的非接觸式自然人機交互。實現(xiàn)對用戶手指運動的跟蹤,完成虛擬鍵盤操作等功能,刷新速度30幀/秒,跟蹤覆蓋區(qū)域60度,跟蹤范圍50cm。
2.2.4多方言的高表現(xiàn)力情感語音交互系統(tǒng)(國撥經(jīng)費限500萬元,企業(yè)參與申報,實施年限3年)
研發(fā)帶有多種方言口音的普通話低運算復(fù)雜度語音交互嵌入式引擎和基于云計算的語音交互服務(wù)平臺,研制面向移動終端多種交互方式融合的情感語音交互系統(tǒng)。方言普通話連續(xù)語音識別正確率達到95%;對話、疑問、感嘆語氣自然度的主觀意見平均分(MOS)超過4.0;愉悅、悲傷等情感識別準確率超過80%;日常生活問答的準確率超過80%。
2.2.5移動終端三維聲場技術(shù)(國撥經(jīng)費限600萬元,企業(yè)參與申報,實施年限3年)
研究3D音頻高效感知壓縮技術(shù),提升3D音頻空間信息壓縮率25%以上;研究個性化HRTF庫多級選擇方法,減少前后混淆效應(yīng)30%以上;研究實時聲場增強技術(shù),在資源受限的移動終端上實現(xiàn)3D音頻的實時生成,用耳機實現(xiàn)3D聲場的再現(xiàn);研制簡單易用的3D音頻編輯創(chuàng)作工具和播控服務(wù)器,支持2000人以上的并發(fā)3D音頻請求。
2.3全景互動關(guān)鍵技術(shù)與示范系統(tǒng)
針對安全生產(chǎn)、仿真訓(xùn)練、文化科技等領(lǐng)域的應(yīng)用需求,突破球面全景建模、復(fù)雜場景動態(tài)演化、實時角色植入與虛實合成、人群實時劇情交互等全景互動關(guān)鍵技術(shù),構(gòu)建具有高真實感的全景互動系統(tǒng)支撐平臺并實現(xiàn)應(yīng)用示范。下設(shè)3個研究方向:
2.3.1球面全景建模技術(shù)(國撥經(jīng)費限500萬元,實施年限3年)
針對球面全景應(yīng)用要求,研究機載、車載和手持便攜等設(shè)備獲取的多源數(shù)據(jù)處理與建模技術(shù),自然現(xiàn)象與動植物快速精細建模與表現(xiàn)技術(shù),融合圖形圖像的表觀模型建模及交互表現(xiàn)方式,研制3D全景建模工具,全景模型精度達厘米級,場景范圍不小于100公里。
2.3.2大規(guī)模復(fù)雜場景動態(tài)演化模擬技術(shù)與系統(tǒng)(國撥經(jīng)費限1000萬元,實施年限3年)
重點研究基于數(shù)學(xué)物理特性的大規(guī)模復(fù)雜場景的高可信建模技術(shù);探索研究交互過程中復(fù)雜場景的演化規(guī)律,研發(fā)具有高度物理真實的動態(tài)發(fā)展過程、發(fā)展狀態(tài)模擬技術(shù)與平臺,其中演化模擬的典型復(fù)雜場景不少于4個,幀率不低于25幀/秒;提出有效的誤差度量方法和準則,構(gòu)建模型可信性評估與驗證平臺。
2.3.3大型全景互動系統(tǒng)及其應(yīng)用示范(國撥經(jīng)費限800萬元,企業(yè)牽頭申報,實施年限3年)
突破多視角高清內(nèi)容的高速自動生成技術(shù)、實時角色植入與虛實合成技術(shù)、用戶人群實時交互技術(shù),研制多線索數(shù)字腳本編輯與內(nèi)容制作平臺。集成本項目研究成果,面向安全生產(chǎn)、仿真訓(xùn)練、文化科技等領(lǐng)域需求,研發(fā)大型全景互動系統(tǒng)并應(yīng)用示范,系統(tǒng)總體性能和主要技術(shù)指標達到2015年底國際先進水平。