在近日舉辦的GOSIM2025大會(huì)上,清華大學(xué)聯(lián)合中國(guó)軟件評(píng)測(cè)中心共同推出了一份聚焦大模型服務(wù)性能的權(quán)威榜單——《2025大模型服務(wù)性能排行榜》。其中,派歐云計(jì)算(上海)有限公司(簡(jiǎn)稱“PPIO”)憑借在DeepSeek-R1-0528模型吞吐測(cè)試中的卓越表現(xiàn),榮登榜首。
該榜單通過(guò)深度剖析延遲、吞吐、可靠性等核心指標(biāo),依托專業(yè)團(tuán)隊(duì)開(kāi)展的長(zhǎng)周期、高頻次、多時(shí)段數(shù)據(jù)評(píng)測(cè),全面展現(xiàn)了不同MaaS(Model as a Service)供應(yīng)商的服務(wù)質(zhì)量。評(píng)測(cè)過(guò)程中,平臺(tái)以匿名用戶身份對(duì)各MaaS平臺(tái)進(jìn)行端到端性能測(cè)試,確保了評(píng)測(cè)結(jié)果的客觀性與公正性。
此次評(píng)測(cè)覆蓋了DeepSeek-R1-0528、DeepSeek-V3.1、Kimi-K2-Instruct等多個(gè)具有代表性的大模型。在參與評(píng)測(cè)的20余家MaaS供應(yīng)商中,PPIO的表現(xiàn)尤為搶眼。
具體來(lái)看,在DeepSeek-R1-0528模型的吞吐測(cè)試中,PPIO以每秒45.17個(gè)Token的處理能力拔得頭籌。同時(shí),在DeepSeek-V3.1、Kimi-K2-Instruct等模型的測(cè)試中,PPIO在吞吐和延遲性能方面也均躋身前五。
吞吐和延遲是衡量模型性能的兩個(gè)關(guān)鍵指標(biāo)。吞吐能力反映了平臺(tái)在單位時(shí)間內(nèi)能夠處理的Token數(shù)量,高吞吐意味著平臺(tái)能夠支持更多用戶同時(shí)使用,尤其適用于大規(guī)模應(yīng)用場(chǎng)景。而延遲則衡量了用戶從輸入到獲得首個(gè)回復(fù)所需的時(shí)間,低延遲意味著更快的響應(yīng)速度,對(duì)用戶體驗(yàn)至關(guān)重要。
PPIO在這兩個(gè)維度上的出色表現(xiàn),不僅證明了其能夠提供流暢的實(shí)時(shí)交互體驗(yàn),還能在高并發(fā)和大規(guī)模任務(wù)處理中保持穩(wěn)定。這背后,是PPIO在算力調(diào)度、模型部署、系統(tǒng)優(yōu)化等推理優(yōu)化核心技術(shù)上的深厚積累。
作為國(guó)內(nèi)領(lǐng)先的獨(dú)立分布式云計(jì)算服務(wù)商,PPIO始終致力于優(yōu)化AI基礎(chǔ)設(shè)施。其目標(biāo)是為人工智能、智能體、實(shí)時(shí)音視頻處理、具身智能等新一代應(yīng)用場(chǎng)景,提供高性價(jià)比、超彈性、低延遲的一站式智算、模型及邊緣計(jì)算服務(wù)。