中國投資界 > 商業(yè) > 正文

清華大學(xué)發(fā)布《大語言模型綜合性能評估報告》：GPT-4第一，文心一言更懂

時間：2023-08-11 10:39:32 來源：IT之家閱讀量：6323

，近日，清華大學(xué)新聞與傳播學(xué)院教授、博士生導(dǎo)師沈陽所在團隊發(fā)布了《大語言模型綜合性能評估報告》，報告顯示總得分率 GPT-4 第一，百度文心一言在三大維度 20 項指標(biāo)中綜合評分國內(nèi)第一，超越 ChatGPT，其中中文語義理解排名第一，部分中文能力超越 GPT-4。

據(jù)了解，報告本次評估選取了 GPT-4、ChatGPT 3.5、文心一言、通義千問、訊飛星火、Claude、天工 7 個大語言模型，圍繞生成質(zhì)量、使用與性能、安全與合規(guī)三大維度，全面考察大語言模型上下文理解、中文語義理解、誤導(dǎo)信息識別、邏輯推理、內(nèi)容安全性、隱私保護等 20 項指標(biāo)。綜合來看，文心一言語義理解能力突出，特別是具備更好的中文理解能力，更懂中國文化，同時時效性強、內(nèi)容安全把握細(xì)微，這源于其知識增強、檢索增強和對話增強的技術(shù)創(chuàng)新。

在生成質(zhì)量方面，基于對語義理解、輸出表達(dá)、適應(yīng)泛化的綜合評測，文心一言得分率 76.98%，僅次于 GPT-4，領(lǐng)先于包括 ChatGPT 在內(nèi)的其他大語言模型。其中，在部分中文語義理解方面，文心一言以 92% 的得分率排名榜首。

IT之家注意到，在安全合規(guī)方面，基于對內(nèi)容安全性、偏見和公平性、隱私保護等綜合評測，文心一言得分率 78.18%，與 GPT-4 并列排名第一。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接，用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

聲明：本網(wǎng)轉(zhuǎn)發(fā)此文章，旨在為讀者提供更多信息資訊，所涉內(nèi)容不構(gòu)成投資、消費建議。文章事實如有疑問，請與有關(guān)方核實，文章觀點非本網(wǎng)觀點，僅供讀者參考。

相關(guān)新聞