官方表示,當(dāng)前,大模型正處在產(chǎn)業(yè)落地前期,高質(zhì)量的數(shù)據(jù),是大模型實(shí)現(xiàn)產(chǎn)業(yè)化的關(guān)鍵要素。
對于以ChatGPT、文心一言為代表的生成式AI,海量的數(shù)據(jù)訓(xùn)練、人工標(biāo)注、指令微調(diào)、基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF),可以讓大模型與人類價(jià)值觀、思維方式不斷對齊,使大模型更加可用。
據(jù)介紹,為保障數(shù)據(jù)標(biāo)注質(zhì)量,百度智能云搭建了全流程數(shù)據(jù)服務(wù)人才梯隊(duì),?跀(shù)據(jù)標(biāo)注基地現(xiàn)擁有數(shù)百名專職大模型數(shù)據(jù)標(biāo)注師,標(biāo)注師的本科率達(dá)到100%。
百度智能云方面表示,目前已經(jīng)在全國與各地政府合作,共建了十多個(gè)數(shù)據(jù)標(biāo)注基地,累計(jì)為當(dāng)?shù)靥峁┏^1.1萬個(gè)穩(wěn)定就業(yè)崗位,間接帶動(dòng)5萬人就業(yè)。