2024.11- 至今
江蘇潤和軟件股份有限公司助理軟件開發(fā)工程師
大模型訓(xùn)練數(shù)據(jù)標(biāo)注
參與某大模型訓(xùn)練(CV方向)的數(shù)據(jù)標(biāo)注項目,將視頻切片成圖像數(shù)據(jù)并對人物動作進(jìn)行分類,實現(xiàn)大模型的行為識別功能。
累計處理1200 條原始數(shù)據(jù),標(biāo)注準(zhǔn)確率達(dá)95%(通過抽檢驗證)。參與制定標(biāo)注規(guī)范文檔,統(tǒng)一標(biāo)注標(biāo)準(zhǔn),提高團(tuán)隊標(biāo)注效率。
終端數(shù)據(jù)處理
負(fù)責(zé)某平臺涉政敏感圖片風(fēng)控,包括旗幟、標(biāo)識、事件等敏感元素的識別與分類,累計處理30000 圖像,準(zhǔn)確率達(dá)98%。
負(fù)責(zé)手機(jī)語音助手的多場景對話數(shù)據(jù)標(biāo)注(NLP方向),累計處理60000 條用戶真實交互語音,主要工作內(nèi)容包括:精準(zhǔn)文本
轉(zhuǎn)寫,實現(xiàn)語音到文本的逐字轉(zhuǎn)寫。依照標(biāo)注規(guī)范表,對方言、口吃、重復(fù)、模糊等的語音進(jìn)行修正,為手機(jī)語音助手的語音識別
功能提供數(shù)據(jù)集。通過數(shù)據(jù)處理的積累,準(zhǔn)確率達(dá)99%(通過上級審核驗證)。