國內(nèi)AI大模型“百模之戰(zhàn)”又迎來新的挑戰(zhàn)者。
5月6日,科大訊飛董事長劉慶峰、研究院院長劉聰正式發(fā)布訊飛星火認知大模型,在現(xiàn)場實測向大模型提問。劉慶峰稱,當(dāng)前訊飛星火認知大模型在文本生成、知識問答、數(shù)學(xué)能力三大能力上已超ChatGPT。
(資料圖片)
“雖然目前大模型技術(shù)還有有待攻克的缺陷,比如新知識難以及時更新、事實類問答容易‘張冠李戴’,史實、傳統(tǒng)典籍等容易‘編造情節(jié)’等,但這些問題在今年會有明顯的改進?!眲c峰公布了年內(nèi)訊飛星火認知大模型技術(shù)持續(xù)升級的三個關(guān)鍵里程碑節(jié)點:
年內(nèi)訊飛星火認知大模型技術(shù)持續(xù)升級的三個關(guān)鍵里程碑節(jié)點。
6月9日,將突破開放式問答、多輪對話能力明顯提升、數(shù)學(xué)能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升,希望能幫助到更多的合作伙伴及開發(fā)者團隊;10月24日,將實現(xiàn)通用模型對標(biāo)ChatGPT,中文超越ChatGPT的當(dāng)前版本,英文能做到相當(dāng)水平,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。
據(jù)劉慶峰介紹,算力方面科大訊飛將聯(lián)手華為,“使我們未來認知大模型的持續(xù)進化,要在我們自主可控的平臺上,不斷地提升?!?/p>
評測訊飛星火認知大模型
“孫悟空和奧特曼也偷偷潛入了會場,他們都爭著想做訊飛星火認知大模型的代言人,還為此吵了一架,請根據(jù)上述信息創(chuàng)作一個故事。”劉慶峰在發(fā)布會上向大模型提問。
隨后,澎湃科技(www.thepaper.cn)記者也向星火認知大模型詢問了這個問題,得到以下結(jié)果:
澎湃科技向大模型詢問上述問題后得到的結(jié)果。
劉慶峰稱,在長文本生成上,訊飛星火大模型在國內(nèi)明顯領(lǐng)先,在中文方面超過了ChatGPT,并且在持續(xù)進步中。
在語言理解方面,劉聰現(xiàn)場問道:“俗話說男子漢大丈夫?qū)幩啦磺?,但是俗話又說男子漢大丈夫要能屈能伸,請問這兩句話怎么理解?”
澎湃科技向大模型詢問上述問題后得到的結(jié)果。
劉聰還問道:“如果一個小伙子跟女朋友吵架了,他應(yīng)該寧死不屈還是能屈能伸呢?”
澎湃科技向大模型詢問上述問題后得到的結(jié)果。
大模型現(xiàn)場還展示了“情感分析”能力,試圖體現(xiàn)其跟人類共情的潛力。
劉慶峰問道:“今天小明參加比賽獲得了冠軍,拿到獎杯后他默默地站了一分鐘。今天我上課被老師批評了,走出教室后我默默地站了一分鐘。請問上面這兩個默默地站了一分鐘分別表達了什么心情?”
澎湃科技向大模型詢問上述問題后得到的結(jié)果。
劉慶峰稱,科大訊飛現(xiàn)在的語言理解能力相比ChatGPT還略有差距,但已超越國內(nèi)同類產(chǎn)品。
“1+N”落地應(yīng)用計劃
“我們要向OpenAI致敬和學(xué)習(xí),同時也要快速追趕并努力超越,而這需要一套科學(xué)系統(tǒng)的評測體系?!眲c峰說。
科大訊飛通過認知智能全國重點實驗室牽頭設(shè)計了通用認知大模型評測體系,后與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討,最后形成了覆蓋7大類481個細分任務(wù)類型。
據(jù)劉慶峰介紹,從ChatGPT關(guān)注的48個主要任務(wù)方向和訊飛開放平臺上400多萬開發(fā)者團隊的需求分析,通用人工智能應(yīng)當(dāng)具備七大維度能力,包括文本生成、語言理解,知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等。
對于大模型的落地應(yīng)用計劃,劉慶峰透露,2022年12月15日科大訊飛已正式啟動“1+N”認知大模型專項攻關(guān),其中“1”就是指通用認知智能大模型,“N”就是大模型在教育、辦公、汽車、人機交互等各個領(lǐng)域的落地。
在本次發(fā)布會上,圍繞星火認知大模型“1+N”架構(gòu)中“N”個領(lǐng)域的內(nèi)容,科大訊飛還發(fā)布了大模型在教育、辦公、汽車、數(shù)字員工等多個方向的行業(yè)應(yīng)用成果。
據(jù)科大訊飛介紹,在教育方面,“大模型+AI學(xué)習(xí)機”可以讓AI像老師一樣批改作文,像口語老師一樣實景對話。在辦公方面,“大模型+智能辦公本”可以根據(jù)手寫要點自動生成會議紀(jì)要。在汽車內(nèi),“大模型+智能座艙”可以實現(xiàn)車內(nèi)跨業(yè)務(wù)、跨場景人車自由交流。對于“大模型+數(shù)字員工”,其基于自然語言生成業(yè)務(wù)流程和RPA,可以幫助企業(yè)員工完成大量重復(fù)性工作。
除了上述領(lǐng)域外,科大訊飛表示,訊飛星火認知大模型還將賦能包括醫(yī)療、城市、政法、工業(yè)等在內(nèi)的更多行業(yè),滿足更多專業(yè)領(lǐng)域的需求,向更廣闊的產(chǎn)業(yè)領(lǐng)域延伸。
(原題:科大訊飛發(fā)布認知大模型,提出481項通用認知大模型評測指標(biāo))
標(biāo)簽: