亚洲一区二区电影_青青操久久_亚洲狠狠婷婷综合久久久久_国产欧美日韩在线观看精品

今日最新!AI契約論④:AIGC產業鏈發展車馳船快,風險暗礁“涌現”
2023-05-31 19:37:23 來源:21世紀經濟報道 編輯:

21世紀經濟報道 記者郭美婷 蔡姝越 實習生胡暄悅 麥子浩 廣州、上海報道

編者按:


(資料圖)

在2023年過去的幾個月里,各大公司搶灘大模型、GPT商用化探索、算力基礎設施看漲……如同15世紀開啟的大航海時代,人類交往、貿易、財富有了爆炸性增長,空間革命席卷全球。變革同時,也帶來了秩序的挑戰,數據泄露、個人隱私風險、著作權侵權、虛假信息......此外,AI帶來的后人類主義危機已然擺在桌面,人們該以何種姿態迎接人機混雜帶來的迷思?

此刻,尋求AI治理的共識、重塑新秩序成了各國共同面對的課題。南財合規科技研究院將推出AI契約論系列報道,從中外監管模式、主體責任分配、語料庫數據合規、AI倫理、產業發展等維度,進行剖析,以期為AI治理方案提供一些思路,保障負責任的創新。

在AIGC高速成長的浪潮下,其關聯產業鏈上的各環節均在醞釀著一場技術“質變”。

“賣鏟人”英偉達近期成了這波技術浪潮下的最大贏家之一。由于其主營產品GPU(圖形處理器)在生成式AI應用中提供不可或缺的底層硬件動力,英偉達在近日交出的一季報中預測,其在2024財年Q2的銷售額或將達到110億美元。年初至今,這家美國公司股價漲幅已猛增166%,市值逼近萬億。

這一切的引爆點皆是生成式AI技術。”英偉達CEO黃仁勛在接受媒體采訪時表示。他同時指出,目前,CPU(中央處理器)的發展速度已經放緩,加速計算(Accelerated Computing)成為了未來探索的大方向。

緊接著,殺手級應用出現了。”黃仁勛說。

回過頭來看,今年以來,各路AI大模型紛紛涌現,搭載大模型的ChatGPT、Bard、New Bing、文心一言、通義千問等生成式AI應用亦層出不窮。

雖然這些應用是否已成為“Killer App”還有待商榷,但不可否認的是,ChatGPT在推出僅兩月后便交出了日活突破1億的成績單,足以證明AIGC應用的商業價值和發展前景已被市場認可。

不過,盡管生成式AI技術以革新產業的面貌席卷了科技界,催化了生產流程升級轉型,行業也在密切關注,在這項技術“野蠻生長”的背后,它的產業鏈具體是由哪些環節構成?在各層級產業鏈深入探索這項技術的過程中,可能會遇上哪些“暗礁”?

產業鏈圖譜:數據-算力-模型-應用

嚴格來說,業內熱議的AI大模型實際上分為兩類:決策式AI和生成式AI。

決策式AI主要應用于推薦系統和風控系統的輔助決策、用于自動駕駛和機器人的決策智能體,生成式AI則通過學習歸納已有數據后生成全新的內容,也能解決判別問題。而掀起這輪AI技術浪潮的正是后者。

“AIGC”又稱“生成式AI”(Generative AI)AIGC(AI-Generated Content)即人工智能自動生成內容,被認為是繼專業生產內容(PGC)、用戶生產內容(UGC)之后的新型內容創作方式。其萌芽可以追溯到上世紀50年代。

彼時,人們開始探索如何利用人工智能技術來生成各種類型的內容,但受制于所在時代的科技水平,AIGC的應用始終停留在實驗室中。

2006年,深度學習算法取得巨大突破。接下來人工智能技術的持續進步,AIGC逐漸被應用于電影、游戲、音樂等多個領域,并在2021年底ChatGPT的嶄露頭角而進入大規模爆發時代。

發展至今, AIGC產業鏈已經逐漸成形。業內普遍將其分為四層架構:數據層、算力層、算法/模型層、商業化應用層。

(AIGC產業鏈圖譜。制圖/南財合規科技研究院、21世紀經濟報道記者)

數據層包括數據提供、數據分析以及標注等環節。AIGC的誕生需要海量的數據資源,公開資料顯示,ChatGPT基于8000億個單詞的語料庫(或45TB的文本數據),包含了1750億個參數。8000億是ChatGPT的訓練數據,1750億是它從這些訓練數據中所學習、沉淀下來的內容。

算力層指AI訓練的基礎設施,包括數據中心、服務器,以及高性能的AI芯片。據華泰證券測算,訓練一次ChatGPT模型(13億參數)需要的算力約27.5PFlop/s-day,即以1萬億次每秒的速度進行計算,需要耗時27.5天;而ChatGPT單月運營需要算力約4874.4PFlop/s-day。

算法/模型層主要包括自然語言處理(NLP)、計算機視覺(CV)、音視頻、多模態等各種大模型和算法。當前,國內正在上演“百模大戰”,百度、阿里巴巴、騰訊等大廠紛紛在大模型領域持續發力。

商業化應用層則涵蓋文本、音頻、圖片、影片的生成等,目前更多地與互聯網行業結合,未來或將進一步賦能傳統行業的數字化轉型。

人工智能公司亮風臺高級產品總監魏超群告訴21世紀經濟報道記者,若將AIGC整體產業鏈架構比作一家工廠,那么生產的原材料就是大數據,算力充當著日夜運轉的機器,算法或模型是忙忙碌碌的工人,最終生產出來的產品是AIGC在各場景下的應用。

“這幾個層次相互制約、相互促進。”魏超群提到,從發展歷程來看,最初制約AI發展的是算力上的不足,在算力獲得突破后,模型才得以繼續訓練。后來,算法又成為了瓶頸,而數據是破題良方。隨著喂養數據量的提高,算法的性能也隨之提升。

因此,AIGC的火熱出圈,也為其背后的產業鏈打開了一片市場。據東吳證券預計,AIGC在內容生成中的滲透率將快速提升,應用規模快速擴增,預計2030年AIGC市場規模將超過萬億元人民幣。

新的機遇已然出現。“雖然目前產業鏈的部分賽道已經形成了贏者通吃的局面,如CPU和GPU的行業龍頭已經出現。在大模型層面,各家的優劣還無法做出比較,估計未來也很難形成贏者通吃的局面,因為谷歌發展多年的AI,結果最后被微軟超過了。所以目前市場的局面還不太明朗。”魏超群表示。

除了目前仍處于風口浪尖的AI大模型的開發外,亮風臺預判,算力基礎設施企業跟隨著AI行業發展,能夠保持一定增長,但不會為非常熱門的投資方向,其盈利能力也較為有限。但AI大模型的提升亟需更加精準的數據,從事數據清洗、轉換、分類等的企業也可能成為下一個風口。

發展危機:大模型和數據風險

AIGC產業欣欣向榮的背后,存在潛藏的風險。

單從技術上看,天使投資人、知名互聯網專家郭濤認為,我國硬件基礎設施發展迅速,政策支持和資金扶持力度都較大,但技術發展相對歐美仍有一定落后。當然,在某些垂直領域,如人臉識別等大規模應用場景和生態支撐相關的技術,我國又是超前的。同時,我國的應用落地速度也更快,AIGC的技術在客服、數字人、制造、設計等領域已經有一定規模的應用。

另外,AI大模型和大數據處理分別作為當下和未來下一個行業風口,同時也是最容易帶來安全和倫理風險的環節。

多位受訪專家提到了數據層的數據安全和隱私保護問題。而訓練數據的不合規,也往往將進一步引發后續模型及其所生成內容的倫理風險。

北京大成律師事務所高級合伙人肖颯認為,當前數據層根據AI在訓練、測試、生成等階段受到監管規定的不同,而存在不同的風險和義務。數據收集時,存在侵犯個人信息或他人數據權益的風險;在數據處理階段,存在使用、泄漏商業秘密之風險;在數據跨境階段,存在數據跨境流通違法的風險。

北京理工大學法學院助理教授裴軼則向21記者指出,與互聯網平臺中的“推薦算法”不同,生成式算法可以從頭開始生成全新的數據,而不僅僅是基于已有數據的推薦或預測,通常需要大量的訓練數據來學習數據的分布。

這種特性給AIGC產業鏈上的企業及消費者均帶來了不確定性。對于利用AI大模型生成內容的消費者而言,由于AIGC生成的內容可能缺乏人工審核和驗證,存在信息準確性和可信度的問題,可能對消費者造成誤導和損害;同時,在AIGC應用中,消費者的個人信息可能被用于生成個性化內容。這可能涉及到個人隱私和數據安全的風險,例如未經授權的數據收集、濫用個人信息等;此外,AIGC算法的訓練數據和算法本身可能存在偏見,導致生成的內容偏向特定人群或產生歧視性結果。這可能對用戶的體驗、公平性和社會平等性產生負面影響。

面向企業,裴軼表示,企業在使用AIGC技術時,需要確保遵守適用的法律法規,尤其是涉及用戶數據和隱私保護的規定;此外,企業應對使用AIGC技術所產生的內容質量和準確性承擔責任,如果生成的內容存在錯誤、冒犯性言論或不當信息,可能損害企業的形象和聲譽;版權和知識產權同樣值得關注,使用AIGC技術生成的內容可能涉及他人的版權和知識產權;最后,還要關注AIGC技術應用過程中可能存在的人工智能失控的風險,如果算法出現錯誤、意外的結果或者被濫用,可能導致不可預見的后果和潛在的法律責任。

(AIGC各產業鏈環節中可能存在的風險。制圖/南財合規科技研究院、21世紀經濟報道記者)

統籌:王俊

記者:郭美婷 蔡姝越 胡暄悅 麥子浩

制圖:蔡姝越

關鍵詞:

相關閱讀
分享到:
版權和免責申明

凡注有"環球傳媒網 - 環球資訊網 - 環球生活門戶"或電頭為"環球傳媒網 - 環球資訊網 - 環球生活門戶"的稿件,均為環球傳媒網 - 環球資訊網 - 環球生活門戶獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網 - 環球資訊網 - 環球生活門戶",并保留"環球傳媒網 - 環球資訊網 - 環球生活門戶"的電頭。