Copyright 2015-2024 多趣味 版權(quán)所有 京ICP備2015051670號
近日,GitHub上一項(xiàng)研究引發(fā)業(yè)界熱議。研究作者稱,華為盤古大模型與阿里巴巴通義千問Qwen - 2.514B模型在參數(shù)結(jié)構(gòu)上“驚人一致”。 作者實(shí)證比較發(fā)現(xiàn),PanguProMoE模型與Qwen - 2.514B模型在注意力參數(shù)分布上平均相關(guān)性達(dá) 0.927,遠(yuǎn)超其他模型對比正常范圍,網(wǎng)友質(zhì)疑PanguProMoE存在抄襲。 盤古大模型團(tuán)隊(duì)在GitHub回應(yīng),否認(rèn)抄襲指控,認(rèn)為作者評估方法不科學(xué)。 截止發(fā)稿前,華為官方暫未置評。