本文相關基金

      更多

      相關資訊

      嘉實動態

      AI新進展帶來哪些投資機會?

      字體大小:

      之所以認為是神話,是因為科技程度還達不到。

      ——高銘《天才在左瘋子在右》

      用一段文字描述就可以形成一段“真實”的視頻,曾經想象中的場景如今已經實現!

      春節假期尚未結束,OpenAI發布的新一代文字生成視頻模型——Sora就已經引發熱潮,通過文字生成1分鐘的高質量視頻,極其真實、個性化的視頻表現,且符合現實世界物理規律的圖像,令人驚艷,這也直接帶動了資本市場的表現。

      Sora模型有何特點,龍年AI投資有哪些趨勢?本期《風向》將為您一一梳理。

      文本轉視頻,時長達1分鐘

      一個視頻勝千言,從OpenAI放出的視頻來看,通過一長串的提示詞,諸如“幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近”,AI就生成了極其真實的動態畫面場景。

      資料來源:OpenAI官網

      提示詞:幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋著積雪的樹木和雄偉的雪山,午后的陽光下有縷縷云彩,太陽高高地掛在空中距離產生溫暖的光芒,低相機視角令人驚嘆地捕捉到大型毛茸茸的哺乳動物,具有美麗的攝影和景深。

      如果不是猛犸象已經滅絕,或者視頻標注了AI生成,我相信包括筆者在內的很多人會認為是實拍鏡頭。

      不僅僅是動物,人物和場景表現也極其真實。

      資料來源:OpenAI官網

      提示詞:一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。

      根據OpenAI官網的介紹,Sora能夠生成具有多個角色、特定類型的運動以及主體和背景的準確細節的復雜場景,該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。

      其次,該模型能夠更加準確的理解人類給出的提示詞,借助GPT的能力,Sora將用戶的簡短提示轉換成更詳細的提示,使其能夠準確地解釋提示詞,并生成質量更高的圖像。

      如同電影中常見的多機位拍攝,Sora模型還可以在單個生成的視頻中創建多個鏡頭,準確地保留角色和視覺風格。而且生成的視頻也可以重新編輯,比如讓植被更加茂密等等,如果嫌視頻的時間過短,也可以讓AI向前或向后拓展視頻。

      Sora的技術報告顯示,OpenAI并不是把Sora單純當作一個視頻模型來看待,而是將視頻生成模型作為“世界模擬器”,不僅可以在不同設備的原生寬高比直接創建內容,還能展示出對真實世界的模擬能力,如3D一致性、長期一致性和對象持久性等。

      依托于大語言模型,讓機器模仿人

      根據公開資料,在文生視頻領域,比較成熟的模型思路有循環網絡(RNN)、生成對抗網絡(GAN)和擴散模型(Diffusionmodels)。

      結合OpenAI官網下的文獻參考,Sora為使用Transformer架構的擴散模型。它從看起來像靜態噪聲的視頻開始生成視頻,然后通過多個步驟消除噪聲來逐漸對其進行轉換。

      如果用通俗但不太嚴謹的話來解釋,之前的GAN模型更多的是對其他圖片“形”的模仿,而擴散模型更多的是對“神”的模仿,比如圖像內涵,圖像與圖像的關系等等。

      隨著訓練計算的增加,樣本質量顯著提高

      圖片來源:Sora技術報告

      在其技術報告中,Sora可以將圖片和視頻轉化為補丁,從而可以用更廣泛的數據訓練。OpenAI將圖片和視頻數據轉化為統一的表示方式——補丁(patches)來進行訓練,補丁類似于大語言模型中的tokens,并且可以高度擴展。通過統一數據的表示方式,Sora可以用更廣泛的數據訓練,使生成的視頻更加真實。

      目前Sora模型還在進行安全測試,僅向有限的創作者開放。據彭博社預計,GPT-4經過6個月的測試后正式開放,參考GPT-4,預計Sora或將于8月向公眾開放。

      政策端大力鼓勵,國內AIGC商業化已全面鋪開

      去年8月底,國內首批大模型產品通過《生成式人工智能服務管理暫行辦法》(下稱《辦法》)備案,可正式上線面向公眾服務。

      去年下半年,一批國內大模型陸續向社會開放,C端商業化逐步鋪開。此前,這些大模型廠商已開始布局B端部分場景,與多家企業簽訂合約。當前國產AIGC在BC兩端同時發力,商業化全面鋪開,已腳踏實地開啟賺錢之路。上述備案完成與《辦法》正式實施日相隔僅半個月,體現監管層對這一新興產業的鼓勵態度。

      去年9月初,工信部和財政部聯合印發《電子信息制造業2023-2024年穩增長行動方案》再次強調了對人工智能和大模型發展的重視,表示要推動先進計算產業發展和行業應用。

      目前,國內AIGC的產業架構分為基礎層、中間層和應用層。


      整個AI生成內容鏈條第一層是基礎層,也是由大語言模型為基礎搭建的AIGC技術基礎設施層。

      第二層為中間層,及垂直化、場景化、個性化的模型和應用工具。預訓練的大語言大模型是基礎設施,在此基礎上可以快速抽取生成場景化、定制化、個性化的小模型,實現在不同領域的應用部署。

      第三層為應用層,面向C端的文字、圖片、視頻生成等內容的生成服務。側重于用戶的使用體驗和需求,使得用戶可以用消費級的顯卡算力挖掘豐富的內容,包括ChatGPT、Sora等等。

      根據中國電子學數據,2021年中國人工智能核心產業市場規模為1300億元,同比增長38.9%。根據《新一代人工智能發展規劃》,到2025年,我國人工智能核心產業規模將超過4000億元,帶動相關產業規模超過5萬億元。

      投資方向怎么選?

      中信證券研報認為,從投資角度來看,Sora背后的涌現能力為自動駕駛、設計等需要現實世界建模的行業提供了明確方向。Gemini在短期內的部分商業場景表現可能會更為出色,尤其是需要結合圖片與文字的多模態應用場景。除去應用端的投資機會,硬件端的需求也必然會隨著多模態的技術進步而不斷提高。

      從AI投資的角度看,嘉實基金大科技研究總監王貴重認為,隨著OpenAI和GPT4的面世,意味著AI從弱人工智能向強人工智能的邁進。目前,AI行業正處在在一個爆發的起點,未來隨著大模型成本的不斷下降,AI賦能各行各業將會成為一種可能。所有跟信息技術相關的領域都會迎來一定程度的重塑,但仍有大量的長尾的應用沒有得到顯著的滿足。

      目前科技投資的整體架構分為底層的基礎設施、芯片層、服務器層,云層,再到上面的大模型、專用模型,最后到各個行業的應用,未來需要在整體的研究圖譜中密切跟蹤各個行業的發展進度。

      最看好的環節依然是AI應用。第一,曾經被互聯網改變的行業會再一次被AI改變。首先是內容,無論是一維媒介文字,二維媒介圖片,三維媒介視頻,四維媒介游戲,還是社交、搜索、短視頻、電商,我們用的互聯網應用都會集成AI功能。第二,軟件會從功能軟件到智能軟件,軟件的能力會進一步提升,幫我們做更多的事情,交互也會更加友好。無論是辦公、OA、CRM、ERP,甚至一些專業的畫圖、EDA等工具。

      *風險提示:以上觀點不構成具體投資建議。基金投資需謹慎。投資人應當認真閱讀《基金合同》、《招募說明書》、《產品資料概要》等基金法律文件,了解基金的風險收益特征及其特有風險,并根據自身的投資目的、投資期限、投資經驗、資產狀況等判斷基金是否和投資人的風險承受能力相適應。基金管理人不保證基金一定盈利,也不保證最低收益或本金不受損失。基金過往業績及其凈值高低并不預示其未來業績表現,基金管理人管理的其他基金的業績并不構成本基金業績表現的保證。


      AI新進展帶來哪些投資機會?

      2024-02-27 來源:嘉實基金

      之所以認為是神話,是因為科技程度還達不到。

      ——高銘《天才在左瘋子在右》

      用一段文字描述就可以形成一段“真實”的視頻,曾經想象中的場景如今已經實現!

      春節假期尚未結束,OpenAI發布的新一代文字生成視頻模型——Sora就已經引發熱潮,通過文字生成1分鐘的高質量視頻,極其真實、個性化的視頻表現,且符合現實世界物理規律的圖像,令人驚艷,這也直接帶動了資本市場的表現。

      Sora模型有何特點,龍年AI投資有哪些趨勢?本期《風向》將為您一一梳理。

      文本轉視頻,時長達1分鐘

      一個視頻勝千言,從OpenAI放出的視頻來看,通過一長串的提示詞,諸如“幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近”,AI就生成了極其真實的動態畫面場景。

      資料來源:OpenAI官網

      提示詞:幾只巨大的毛茸茸的猛犸象踏著白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋著積雪的樹木和雄偉的雪山,午后的陽光下有縷縷云彩,太陽高高地掛在空中距離產生溫暖的光芒,低相機視角令人驚嘆地捕捉到大型毛茸茸的哺乳動物,具有美麗的攝影和景深。

      如果不是猛犸象已經滅絕,或者視頻標注了AI生成,我相信包括筆者在內的很多人會認為是實拍鏡頭。

      不僅僅是動物,人物和場景表現也極其真實。

      資料來源:OpenAI官網

      提示詞:一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿著黑色皮夾克、紅色長裙和黑色靴子,拎著黑色錢包。她戴著太陽鏡,涂著紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。

      根據OpenAI官網的介紹,Sora能夠生成具有多個角色、特定類型的運動以及主體和背景的準確細節的復雜場景,該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。

      其次,該模型能夠更加準確的理解人類給出的提示詞,借助GPT的能力,Sora將用戶的簡短提示轉換成更詳細的提示,使其能夠準確地解釋提示詞,并生成質量更高的圖像。

      如同電影中常見的多機位拍攝,Sora模型還可以在單個生成的視頻中創建多個鏡頭,準確地保留角色和視覺風格。而且生成的視頻也可以重新編輯,比如讓植被更加茂密等等,如果嫌視頻的時間過短,也可以讓AI向前或向后拓展視頻。

      Sora的技術報告顯示,OpenAI并不是把Sora單純當作一個視頻模型來看待,而是將視頻生成模型作為“世界模擬器”,不僅可以在不同設備的原生寬高比直接創建內容,還能展示出對真實世界的模擬能力,如3D一致性、長期一致性和對象持久性等。

      依托于大語言模型,讓機器模仿人

      根據公開資料,在文生視頻領域,比較成熟的模型思路有循環網絡(RNN)、生成對抗網絡(GAN)和擴散模型(Diffusionmodels)。

      結合OpenAI官網下的文獻參考,Sora為使用Transformer架構的擴散模型。它從看起來像靜態噪聲的視頻開始生成視頻,然后通過多個步驟消除噪聲來逐漸對其進行轉換。

      如果用通俗但不太嚴謹的話來解釋,之前的GAN模型更多的是對其他圖片“形”的模仿,而擴散模型更多的是對“神”的模仿,比如圖像內涵,圖像與圖像的關系等等。

      隨著訓練計算的增加,樣本質量顯著提高

      圖片來源:Sora技術報告

      在其技術報告中,Sora可以將圖片和視頻轉化為補丁,從而可以用更廣泛的數據訓練。OpenAI將圖片和視頻數據轉化為統一的表示方式——補丁(patches)來進行訓練,補丁類似于大語言模型中的tokens,并且可以高度擴展。通過統一數據的表示方式,Sora可以用更廣泛的數據訓練,使生成的視頻更加真實。

      目前Sora模型還在進行安全測試,僅向有限的創作者開放。據彭博社預計,GPT-4經過6個月的測試后正式開放,參考GPT-4,預計Sora或將于8月向公眾開放。

      政策端大力鼓勵,國內AIGC商業化已全面鋪開

      去年8月底,國內首批大模型產品通過《生成式人工智能服務管理暫行辦法》(下稱《辦法》)備案,可正式上線面向公眾服務。

      去年下半年,一批國內大模型陸續向社會開放,C端商業化逐步鋪開。此前,這些大模型廠商已開始布局B端部分場景,與多家企業簽訂合約。當前國產AIGC在BC兩端同時發力,商業化全面鋪開,已腳踏實地開啟賺錢之路。上述備案完成與《辦法》正式實施日相隔僅半個月,體現監管層對這一新興產業的鼓勵態度。

      去年9月初,工信部和財政部聯合印發《電子信息制造業2023-2024年穩增長行動方案》再次強調了對人工智能和大模型發展的重視,表示要推動先進計算產業發展和行業應用。

      目前,國內AIGC的產業架構分為基礎層、中間層和應用層。


      整個AI生成內容鏈條第一層是基礎層,也是由大語言模型為基礎搭建的AIGC技術基礎設施層。

      第二層為中間層,及垂直化、場景化、個性化的模型和應用工具。預訓練的大語言大模型是基礎設施,在此基礎上可以快速抽取生成場景化、定制化、個性化的小模型,實現在不同領域的應用部署。

      第三層為應用層,面向C端的文字、圖片、視頻生成等內容的生成服務。側重于用戶的使用體驗和需求,使得用戶可以用消費級的顯卡算力挖掘豐富的內容,包括ChatGPT、Sora等等。

      根據中國電子學數據,2021年中國人工智能核心產業市場規模為1300億元,同比增長38.9%。根據《新一代人工智能發展規劃》,到2025年,我國人工智能核心產業規模將超過4000億元,帶動相關產業規模超過5萬億元。

      投資方向怎么選?

      中信證券研報認為,從投資角度來看,Sora背后的涌現能力為自動駕駛、設計等需要現實世界建模的行業提供了明確方向。Gemini在短期內的部分商業場景表現可能會更為出色,尤其是需要結合圖片與文字的多模態應用場景。除去應用端的投資機會,硬件端的需求也必然會隨著多模態的技術進步而不斷提高。

      從AI投資的角度看,嘉實基金大科技研究總監王貴重認為,隨著OpenAI和GPT4的面世,意味著AI從弱人工智能向強人工智能的邁進。目前,AI行業正處在在一個爆發的起點,未來隨著大模型成本的不斷下降,AI賦能各行各業將會成為一種可能。所有跟信息技術相關的領域都會迎來一定程度的重塑,但仍有大量的長尾的應用沒有得到顯著的滿足。

      目前科技投資的整體架構分為底層的基礎設施、芯片層、服務器層,云層,再到上面的大模型、專用模型,最后到各個行業的應用,未來需要在整體的研究圖譜中密切跟蹤各個行業的發展進度。

      最看好的環節依然是AI應用。第一,曾經被互聯網改變的行業會再一次被AI改變。首先是內容,無論是一維媒介文字,二維媒介圖片,三維媒介視頻,四維媒介游戲,還是社交、搜索、短視頻、電商,我們用的互聯網應用都會集成AI功能。第二,軟件會從功能軟件到智能軟件,軟件的能力會進一步提升,幫我們做更多的事情,交互也會更加友好。無論是辦公、OA、CRM、ERP,甚至一些專業的畫圖、EDA等工具。

      *風險提示:以上觀點不構成具體投資建議。基金投資需謹慎。投資人應當認真閱讀《基金合同》、《招募說明書》、《產品資料概要》等基金法律文件,了解基金的風險收益特征及其特有風險,并根據自身的投資目的、投資期限、投資經驗、資產狀況等判斷基金是否和投資人的風險承受能力相適應。基金管理人不保證基金一定盈利,也不保證最低收益或本金不受損失。基金過往業績及其凈值高低并不預示其未來業績表現,基金管理人管理的其他基金的業績并不構成本基金業績表現的保證。