可持續(xù)性和風(fēng)險的權(quán)衡:CIO為何考慮使用小型語言模型
生成式AI有著不可否認的前景,但大型語言模型可能不是將其應(yīng)用于企業(yè)的方式?,F(xiàn)在出現(xiàn)了一種基于特定數(shù)據(jù)的、能耗較低的小型模型,這些模型可以讓IT保持掌控權(quán)。
隨著GPT-4通過圖靈測試,微軟將自己的AI助手Copilot融入企業(yè)產(chǎn)品,以及谷歌宣布在意大利市場推出的手機上安裝Gemini應(yīng)用,CIO們正在研究生成式AI技術(shù)以跟上發(fā)展步伐——但不會被技術(shù)熱潮或者商業(yè)提議分散注意力。
意大利研究和教育界專用寬帶網(wǎng)絡(luò)GARR首席技術(shù)官兼基礎(chǔ)設(shè)施部門負責(zé)人Massimo Carboni表示:“生成式AI可以帶來很多好處,但如果沒有適當(dāng)?shù)目紤]就不能采用它。相關(guān)炒作非常多,但高估其可能性的風(fēng)險也同樣很高。在數(shù)字世界中,我們必須越來越小心,AI和生成式AI的第一個風(fēng)險就是過于信任。”
此外Gartner最近估計,全球企業(yè)在生成式AI技術(shù)上的支出并不突出。Gartner預(yù)計今年的IT總投資額為5萬億美金,與2023年相比增長8%,其中生成式AI的占比并不大。相反,支出是由更傳統(tǒng)的力量推動的,例如經(jīng)典IT服務(wù),價值超過1.5萬億美金,同比增長9.7%。
相比之下,大型服務(wù)提供商正在成倍增加對技術(shù)的投資,以支持生成式AI項目,并且預(yù)計到2024年,AI應(yīng)用服務(wù)器將占超大規(guī)模服務(wù)器總投資的近60%。不過,企業(yè)需要更加謹慎。Gartner認為,生成式AI要有一個“故事、計劃、執(zhí)行”的周期,2023年生成式AI被人們所熱議,2024年計劃實施,2025年具體執(zhí)行。
CIO審查下的生成式AI
Inewa公司首席信息官Edoardo Esposito是Elevion Group的成員,該集團是一家活躍于沼氣和生物甲烷生產(chǎn)和能源效率領(lǐng)域的認證ESCO,目前正處于測試Copilot的規(guī)劃階段,因為inewa的IT全部都是在微軟系統(tǒng)上的,而且Copilot產(chǎn)品與Office套件完美集成。這項測試他是和其他高管一起進行的,例如首席財務(wù)官、法律總監(jiān)以及機構(gòu)關(guān)系和監(jiān)管總監(jiān)。
“我們正在測試金融領(lǐng)域的應(yīng)用,比如收入和支出的財務(wù)分析,我認為這方面機會最大。我認為目前它在法律領(lǐng)域的應(yīng)用前景并不樂觀,但我們正在嘗試使用生成式AI來管理合同和研究法律?!?/p>
當(dāng)然,AI不會提供法律建議,但有助于駕馭不斷更新的或者更改的大量規(guī)則。
“即使是利用AI生成一份關(guān)于新法律的簡單摘要,發(fā)送給高管進行審查,也會有所幫助。最終,對于我們這樣的小企業(yè)來說,每月30美元的費用,就像在辦公室里多了一個員工。”
盡管他對簡單任務(wù)實施自動化毫不猶豫,但他并不相信AI可以完全自動化某些復(fù)雜任務(wù),會存在其他問題?!斑@些模型在我看來似乎不可持續(xù),它們有巨大的參數(shù),需要大量的精力來訓(xùn)練,”他說。
AI的不可持續(xù)性
Carboni還強調(diào)了AI的能源密集程度,以及本就很高的成本。
“ICT占全球總能源成本的9%,即2023年約3000億美金。這個比例在過去10年增長了60%,而且還會進一步增長?!?/p>
Carboni認為,培訓(xùn)方面也存在問題?!吧墒紸I正在顛覆傳統(tǒng)的以人為本的方法?,F(xiàn)在不是由人來訓(xùn)練模型,然后改變公司組織,而是人們必須適應(yīng)來自市場的模型。這對我來說是一種風(fēng)險。生成式AI的參與者越少,就越會造成公司對它的依賴以及失去控制?!?/p>
此外,Carboni補充說,AI可能會將數(shù)字功能限制在決定行為和成本等少數(shù)領(lǐng)域,因為AI的進入門檻很高,大多數(shù)公司只能是購買服務(wù),而沒有相應(yīng)的知識來區(qū)分一種產(chǎn)品和另一種產(chǎn)品之間的差異。選擇很少,風(fēng)險在于產(chǎn)品標(biāo)準(zhǔn)化?!八栽谖铱磥?,繼續(xù)內(nèi)部開發(fā)一些東西總是更好的。”
與大型科技公司展開競爭
企業(yè)之間的競爭日益激烈,包括Carboni在內(nèi)的很多人都認為,大型廠商銷售其模型的方式在很多方面都是不公平的,因為一些市場參與者擁有其他參與者所沒有的能力。
“像微軟和谷歌這樣的廠商擁有產(chǎn)品生態(tài)系統(tǒng),這種控制著高達80%數(shù)據(jù)市場的寡頭壟斷,相比其他公司具有巨大的優(yōu)勢。大型科技企業(yè)的戰(zhàn)略還在于整合初創(chuàng)公司,以加強它們對數(shù)據(jù)的主導(dǎo)地位?!币虼耍茈y想象有新進入者能夠與之競爭。提供替代產(chǎn)品的初創(chuàng)公司當(dāng)然存在,而且是開發(fā)算法的一種好方法,但這些還不足以取得成功。
對于Carboni來說,這并不意味著AI的失敗,而是希望深入研究和治理AI。他說:“我相信AI非常重要,我們將致力于此,因為我們有大量數(shù)據(jù)可以利用。我們的目的是推導(dǎo)出一個生成式AI模型,以更好地定義我們內(nèi)部的知識庫。目前,這個模型尚未公開,但如果我們想公開的話,就必須開發(fā)用于外部瀏覽的模型。為此,我們可以使用小型語言模型?!?/p>
小型語言模型:CIO尋求控制權(quán)的一種方式
小型語言模型(SLM)是在比大型語言模型(大型深度學(xué)習(xí)模型,GPT等產(chǎn)品就是基于這種模型的)小得多且更具體的數(shù)據(jù)集上訓(xùn)練機器學(xué)習(xí)算法。初步測試表明,小型語言模型在執(zhí)行任務(wù)時效率更高、成本更低、準(zhǔn)確性更高。事實上,Esposito也在關(guān)注小型語言模型的發(fā)展,認為小型語言模型在商業(yè)用途上更有前景,也更具可持續(xù)性。大型產(chǎn)品具有出色的訓(xùn)練能力,但是通用的,而企業(yè)需要的是垂直應(yīng)用。
Esposito說:“通過API使用大型生成式AI模型,用你自己的數(shù)據(jù)訓(xùn)練你自己的生成式AI產(chǎn)品,需要大量能源資源,這就像把一個數(shù)字同事帶進你的家,但這個同事的成本很高。你必須用你公司的具體信息來訓(xùn)練他,并不斷向他提供新的數(shù)據(jù),讓他了解最新的情況。你還必須為他提供大量的電力。這就是為什么我對大型語言模型不感興趣,但對小型語言模型卻非常感興趣。企業(yè)需要更有針對性、偏見和隱私侵犯風(fēng)險更低的東西?!?/p>
例如,Esposito說,IT可以隔離一個狹窄的語言任務(wù),獲取小型語言模型,將其放在云端,只允許它訪問公司文檔數(shù)據(jù)庫,這樣它就只向模型詢問與這些文檔相關(guān)的問題。
“從第一次實驗來看,似乎不僅能耗降低了,而且出現(xiàn)幻覺的可能性也降低了。畢竟,企業(yè)的AI模型不必知道一切,而只需響應(yīng)某些應(yīng)用。小型語言模型仍然可以進行翻譯、執(zhí)行市場趨勢分析、自動化客戶服務(wù)、管理IT工單、創(chuàng)建業(yè)務(wù)虛擬助手等。在我看來,限制領(lǐng)域并使其專業(yè)化,使其處于IT的控制之下,這似乎更有效率?!?/p>
生成式AI業(yè)務(wù)和小型模型之間的權(quán)衡
控制是關(guān)鍵。布魯諾·凱斯勒基金會(FBK)增強中心總監(jiān)Alessandro Sperduti表示,在AI領(lǐng)域我們面臨著私營公司主導(dǎo)的風(fēng)險。他說:“過去,世界上最重要的AI系統(tǒng)都是在大學(xué)里開發(fā)的,但現(xiàn)在不是了,因為私營科技巨頭已經(jīng)崛起,其消費能力是公眾無法與之競爭的?!?/p>
事實上在科學(xué)界,一些人更愿意通過政治干預(yù)將AI重新置于控制之下,就像高能物理學(xué)和CERN的建立一樣——CERN是一個將多個國家聚集在一起合作進行粒子物理理論和實驗的機構(gòu)。但其他研究人員并不認為某些私人參與者的霸權(quán)會帶來風(fēng)險,只要政府規(guī)范AI工具的使用,就像歐盟通過《人工智能法案》所做的那樣。
“與物理學(xué)領(lǐng)域發(fā)生的情況不同,那里沒有大生意,而在AI領(lǐng)域,利潤非常豐厚,這就是為什么微軟和谷歌等廠商競爭如此激烈的原因。我們每天都會看到超越以往目標(biāo)的新目標(biāo)。這個領(lǐng)域的初創(chuàng)公司確實存在,但與其他行業(yè)相比,數(shù)量是很少的,因為這其中需要巨大的投資。因此我認為,它們是無法真正威脅到現(xiàn)有參與者的主導(dǎo)地位并創(chuàng)造強大競爭態(tài)勢的?!?/p>
然而,在較小的模型方面,Sperduti強調(diào)了檢索增強生成(RAG)系統(tǒng),這種系統(tǒng)使用大型語言模型來回答有關(guān)本地數(shù)據(jù)庫保存的文檔的問題。這樣,文檔將保持私密,不會交給提供大型語言模型的組織。RAG讓公司對數(shù)據(jù)擁有更多的控制權(quán),成本也更低。
“但需要在本地管理大型語言模型,你也可以在本地使用開源語言模型,這些模型比大型語言模型更小,但性能較低,因此可以將其視為一種小型語言模型。”
關(guān)于成本可持續(xù)性,Sperduti表示,大型語言模型通常由大型科技企業(yè)作為一種公用事業(yè)服務(wù)進行管理,就像我們購買電力一樣,而小型模型就像是把渦輪機留在家中進行發(fā)電?!耙虼?,必須進行經(jīng)濟評估,如果模型的使用頻率很高,這可能是有利的。但這是一個必須經(jīng)過仔細分析后才能做出的選擇,要考慮到模型的成本、更新、使用它的人員等等?!?/p>
CIO掌控一切:治理和專業(yè)知識
Carboni還警告說,如果你選擇了小型語言模型,那么IT就要承擔(dān)更大的任務(wù),CIO的生活也不一定會得到簡化。
“在大型語言模型中,大部分數(shù)據(jù)工作都是統(tǒng)計完成的,然后IT會針對特定主題訓(xùn)練模型以糾正錯誤,為其提供有針對性的高質(zhì)量數(shù)據(jù)。而小型語言模型的成本低得多,需要的數(shù)據(jù)也少得多,但正是由于這個原因,統(tǒng)計計算效率較低,因此需要非常高質(zhì)量的數(shù)據(jù),數(shù)據(jù)科學(xué)家需要做大量的工作。否則,使用通用數(shù)據(jù)的話,模型可能會產(chǎn)生很多錯誤?!?/p>
此外,小型語言模型對于企業(yè)來說前景廣闊,甚至大型科技企業(yè)也提供和宣傳小型語言模型,例如谷歌的Gemma和微軟的Phi-3。因此,根據(jù)Esposito的說法,在一個應(yīng)該保持封閉系統(tǒng)的模型中,治理仍然是最根本的。
“小型語言模型更易于管理,并成為公司從AI中獲取附加值的一項重要資產(chǎn),否則,如果是大型模型和開放系統(tǒng)的話,你必須同意與谷歌、微軟和OpenAI共享公司的戰(zhàn)略信息。這就是為什么我更喜歡與可以開發(fā)定制并提供封閉系統(tǒng)的系統(tǒng)集成商展開合作,僅供內(nèi)部使用。我認為,讓員工使用通用產(chǎn)品并將公司數(shù)據(jù)放入其中是不明智的,因為這些數(shù)據(jù)可能是敏感數(shù)據(jù)。數(shù)據(jù)和AI治理對企業(yè)是至關(guān)重要的?!?/p>
CIO的能力也同樣重要。
Carboni說:“在我的工作中,我不僅要評估訪問服務(wù)的成本,還要評估我對服務(wù)的影響力。CIO必須建立自己的技術(shù)知識背景,配備一支能力強的團隊,其中包括大量年輕人,能夠在現(xiàn)代環(huán)境中使用云原生的技術(shù)。這樣,CIO就不會局限于購買產(chǎn)品并期待其性能,而是采取行動并影響產(chǎn)品或者服務(wù)。”
因此,CIO仍是掌舵人。無論生成式AI的發(fā)展軌跡如何,IT領(lǐng)導(dǎo)者都希望能夠決定方向、應(yīng)用和目標(biāo)。