MOSS系統(tǒng)負責(zé)人邱錫鵬表示,最新的MOSS已經(jīng)能夠在中文能力上超過ChatGPT,可以通過使用工具來為用戶提供幫助,并在預(yù)防“有害道德”方面做了很多優(yōu)化。
邱錫鵬認為,通用大模型除了算力需求大以外,目前依然在可信性、安全性、邏輯性等方面存在許多挑戰(zhàn),里面有非常多的科學(xué)問題并沒有被解決,這些都需要高校研究團隊進行重大科研攻關(guān)。
7月7日,在2023世界人工智能大會“大模型時代的通用人工智能產(chǎn)業(yè)發(fā)展機遇以及風(fēng)險”論壇上,復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授、MOSS系統(tǒng)負責(zé)人邱錫鵬表示,國內(nèi)首個對話式大型語言模型MOSS在今年2月發(fā)布后,還在連續(xù)不停地迭代,“最新的MOSS已經(jīng)能夠在中文能力上超過ChatGPT?!?/p>
(資料圖片僅供參考)
邱錫鵬在演講中表示,目前MOSS可以通過使用工具來為用戶提供幫助。例如MOSS本身不會繪畫,但它可以調(diào)用文字生成圖片的插件來達到效果。而對于算數(shù)運算,MOSS也可以調(diào)用計算器和解方程器來完成復(fù)雜的數(shù)學(xué)解題。如果向MOSS詢問原有知識庫里沒有的實時信息,MOSS可以調(diào)用搜索引擎,根據(jù)反饋的結(jié)果進一步回答,例如每天抓取新聞,為用戶匯總新聞鏈接與內(nèi)容。
邱錫鵬透露,MOSS發(fā)布后,團隊把一部分精力放在如何打通使用工具的能力,并在4月推出了開源插件版的模型MOSS-Plugin?!白鳛槟P秃屯饨缃换サ囊环N非常重要的方式,插件能力在未來是非常重要的?!彼f。
值得一提的是,MOSS在預(yù)防“有害道德”方面也做了很多優(yōu)化?!皩τ谶`背道德的問題,MOSS會避免回答,我們通過優(yōu)化讓MOSS具有非常強的道德感。”邱錫鵬同時表示,MOSS還可以進行角色扮演,實現(xiàn)個性化上的優(yōu)化。
此外,邱錫鵬表示,現(xiàn)在所謂的大型語言模型成本高,主要是集中在第一階段,即預(yù)訓(xùn)練(Pretraining)?!拔覀兊拇竽P筒皇谴蠊静拍芡娴闷?,以后高校、普通愛好者和學(xué)生都可以玩大模型?!?邱錫鵬指出,后面階段的成本相對來說并不是特別高,例如預(yù)訓(xùn)練后的監(jiān)督微調(diào)、迭代優(yōu)化、推理部署、模型評測等階段。但這些階段才是真正的挑戰(zhàn),“前面的預(yù)訓(xùn)練階段并不適合所有人來研究,但是后面有非常多的科學(xué)問題需要我們進一步研究。”
大模型僅僅只是工程問題,高校和學(xué)術(shù)團體做大模型沒有意義?邱錫鵬并不這么認為。公司投入金錢與工程師來推進工程的確重要,但大模型如果僅僅靠公司是沒辦法真正做好的?!按竽P屠镉蟹浅6嗟目茖W(xué)問題需要廣大研究者參與。如果離開了學(xué)術(shù)團隊,大模型可能會缺少非常多的理論和技術(shù)支撐?!?/p>
邱錫鵬進一步指出,“通用大模型除了算力需求大以外,目前依然在可信性、安全性、邏輯性等方面存在許多挑戰(zhàn),這里面有非常多的科學(xué)問題并沒有被解決,比如智能如何涌現(xiàn)、復(fù)雜推理如何實現(xiàn)、高效架構(gòu)、學(xué)習(xí)策略,以及如何做更好的知識融合,這些都需要高校研究團隊進行重大科研攻關(guān)?!?/p>
復(fù)旦團隊將圍繞MOSS持續(xù)開展大模型其他方面的研究,包括能力強化、知識對齊、模態(tài)融合和開源開放,進一步邁向通用人工智能。
邱錫鵬在論壇中還介紹了正在建設(shè)中的開源語言模型平臺OpenLMLab,該平臺的下層將對接國產(chǎn)通用框架和預(yù)訓(xùn)練模型庫,而上層會面向大模型生態(tài)方面的應(yīng)用。
據(jù)介紹,OpenLMLab集對話模型、模型微調(diào)、模型對比和模型評測等領(lǐng)域于一體。MOSS是該開源平臺的對話模型,而COLLiE是模型微調(diào)的工具庫,將來會進行強化學(xué)習(xí)迭代。此外,該平臺支持AI生成文本檢測軟件Sniffer和快速對比多個對話大模型效果的工具ChatZoo。
邱錫鵬在演講結(jié)尾還介紹了一款名為Gaokao的工具,基于高考題目進行模型評測?!拔覀冋J為,現(xiàn)在有許多大模型的榜單都不太全面或權(quán)威,然而人類的考試是非常全面和權(quán)威的,例如高考?;谒?,我們可以評測各種大模型的能力。高考的題目還有另一個好處,由于每年高考題目都會更新,基本上大模型不太會存在刷題的嫌疑,因此每年都可以有新題目來比較不同的大模型?!?/p>
(原標題:《復(fù)旦邱錫鵬:MOSS中文能力已超ChatGPT,可進行角色扮演》)
標簽: