【資料圖】
經(jīng)濟觀察網(wǎng) 記者 周應(yīng)梅
7月7日,京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬在2023世界人工智能大會上接受包括經(jīng)濟觀察網(wǎng)在內(nèi)的媒體采訪時表示,京東在大模型上一直進行技術(shù)積累與布局,并深度結(jié)合了京東和產(chǎn)業(yè)的需求,已經(jīng)陸續(xù)發(fā)布了十億級、百億級參數(shù)的大模型。今年的京東探索者科技大會上,京東即將發(fā)布千億級參數(shù)大模型。
今年以來,大模型產(chǎn)品批量涌現(xiàn),根據(jù)世界人工智能大會官方微信披露數(shù)據(jù),2023年的大會上聚齊了三十多個大模型及相關(guān)產(chǎn)品。何曉冬認為,有市場競爭是好事,從2016年以來就感受到競爭非常激烈,這也說明市場有需求,其次,競爭中產(chǎn)生的技術(shù)和產(chǎn)品才是真正有生命力的。
何曉冬表示,當你的技術(shù)過了一個門檻以后,就會出現(xiàn)百花齊放的情景,各種各樣的衍生形態(tài)都會出來,包括AI生成的繪畫、數(shù)字人、人機對話等應(yīng)用的出現(xiàn),其實是因為基礎(chǔ)的深度學(xué)習為代表的技術(shù)過了一個門檻。
何曉冬稱京東大模型并不是馬上就產(chǎn)生的,而是多年的鋪墊。他提及2020年時京東就關(guān)注到了深度學(xué)習模型和語言生成,當時也開啟了語言模型研發(fā)。當AI通用算法生成語言時免不了會生成事實錯誤內(nèi)容,這樣的情況在to C端或許可以調(diào)侃,但在電商領(lǐng)域是無法容忍的?!凹夹g(shù)只有和現(xiàn)實世界的真實場景和產(chǎn)品產(chǎn)生緊密融合,才有可能真正產(chǎn)生AI落地的價值?!焙螘远f。
2021年京東針對零售電商場景中內(nèi)容生成專業(yè)度不足問題,提出了十億級K-PLUG算法模型,目前模型已經(jīng)在京東的發(fā)現(xiàn)好貨等場景廣泛應(yīng)用;2022年針對模型泛化性不足,京東提出了百億級模型Vega;百億級模型之后,今年京東再推出千億級大模型。
何曉冬認為,大模型有它的好處,可以容納多種技能,互相之間沒有太多沖突,多個行業(yè)都可以覆蓋。帶來的困難是它的推理過程和部署成本會更高,因此對于一些特定場景,模型不一定求大。
何曉冬在本屆人工智能大會的公開演講中提及,京東言犀大模型在語言方向已經(jīng)有大量的使用,寫了超過30億字的營銷文案,使得營銷文案生成做到了自動化和智能化。他表示,其它已有的應(yīng)用領(lǐng)域還包括數(shù)字人直播、智能政務(wù)熱線、銀行數(shù)字員工等。
何曉冬認為,大模型的可靠性問題不解決,就無法在產(chǎn)業(yè)場景中廣泛應(yīng)用。他提到,為保證大模型的可靠性,三年以來京東在這方面進行了一系列改進,會把特定的行業(yè)知識注入文本訓(xùn)練中,比如要寫新品文案推薦會讓它參考產(chǎn)品說明書;另外,還會設(shè)計一個損失函數(shù),出現(xiàn)錯誤或者重要的內(nèi)容沒被抓取到,就會有額外損失,有一個懲罰模型,最終讓模型學(xué)會從可信的信源里獲取基礎(chǔ)知識。
目前大模型朝著通用大模型和垂直行業(yè)模型兩個方向發(fā)展。何曉冬稱,垂直行業(yè)模型訓(xùn)練成本和訓(xùn)練難度其實更高,但部署和應(yīng)用成本會盡量降下來,因為直接關(guān)系到客戶的成本。要做好行業(yè)模型,行業(yè)領(lǐng)域的Know-How非常重要,也需要足夠的基礎(chǔ)常識作背景,才能帶來好的體驗。
關(guān)鍵詞: