(相關(guān)資料圖)
8月31日,商湯科技日日新大模型旗下自然語言應(yīng)用“商量SenseChat”正式面向廣大用戶開放服務(wù)。
商湯“商量SenseChat”今年4月正式推出,是國內(nèi)最早的基于千億參數(shù)大語言模型之一,并不斷迭代更新。目前,基模型為商湯聯(lián)合多家國內(nèi)頂級科研機構(gòu)發(fā)布的書生·浦語InternLM-123B,擁有1230億參數(shù),在語言、知識、理解、推理和學(xué)科五大能力上均處于行業(yè)領(lǐng)先水平,并在全球51個知名評測集(包括MMLU,AGIEVAL,ARC,CEval,Race,GSM8K等)共計30萬道問題集合上測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型,在主要評測中12項成績超越GPT-4,排名第一。
商量SenseChat背后依托商湯AI大裝置SenseCore,其上線GPU數(shù)量由2023年3月底的27000塊提升至日前的約30000塊,算力規(guī)模提升20%至6ExaFLOPS,可有效支持語言大模型的訓(xùn)練、升級迭代和服務(wù)。
在訓(xùn)練數(shù)據(jù)方面,商湯每月可產(chǎn)出約2萬億token的高質(zhì)量數(shù)據(jù),支持更加強大的基模型的訓(xùn)練,預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token。同時,商湯還投入了數(shù)百臺服務(wù)器搭載千卡GPU的計算資源,采用算法結(jié)合人工的方法對原始語料數(shù)據(jù)進行分門別類的精細化清洗,以確保數(shù)據(jù)的質(zhì)量、安全性和價值觀都符合要求。
截至目前,商湯商量在金融、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè)與超過500家客戶建立了深度合作,通過提供多種靈活的API接口和服務(wù),為客戶提供大模型的各項AI技術(shù)和服務(wù),低門檻、低成本、高效率地實現(xiàn)各類生成式AI應(yīng)用。
商湯“日日新SenseNova”大模型體系和生成式AI產(chǎn)品系列,包括商量、秒畫、如影、瓊宇、格物,分別對應(yīng)著自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI應(yīng)用。未來,商湯將依托強大的基模型,以及在算力、數(shù)據(jù)、算法基礎(chǔ)上的積累和豐富Know-how,持續(xù)升級商湯日日新大模型體系下的多種生成式AI產(chǎn)品,滿足各類用戶的需求。
(編輯 李波)
關(guān)鍵詞: