職位描述
該職位信息待核驗,請仔細了解後再進行投遞!
我們正在尋找一位對AI技術充滿熱情、注重細節的工程師,負責將前沿的AI評測基準(Benchmark)適配並遷移到我們專有的AI Agent評測框架上。你的工作將直接決定我們如何量化和評估AI模型的智能水平,是連接AI研究與工程化落地的核心橋梁。核心職責:評測集遷移與適配:深入理解業界主流的AI/Agent評測集,負責將其數據結構、評測邏輯和評估指標,精準地適配並遷移到公司內部的統一評測框架上,解決適配遷移過程中麵臨的各自問題。評測任務執行與監控:負責大規模評測任務的部署、執行與監控,確保評測過程的穩定性和數據產出的準確性。結果分析與報告:對評測結果進行初步的數據清洗和格式化,為算法團隊提供清晰、可靠的性能數據報告,並能定位因適配問題導致的數據異常。任職要求:教育背景:計算機相關專業,本科及以上學曆, 2年以上相關工作經驗。編程能力:有一定的python開發能力,熟悉JSON、YAML等數據格式,熟悉Linux開發環境,能夠使用Shell腳本進行自動化任務。評測能力: 具備處理複雜評測邏輯的能力,理解Judge評測範式,了解Agent的評估指標,不僅限於文本生成質量,還包括對規劃能力、工具調用成功率等維度,了解代碼類評測基準(如HumanEval, SWE-bench),能夠確保評測集遷移準確性。理解與溝通能力:nenggoukuaisuyuedubinglijiejishulunwenhekaiyuanxiangmuwendang,zhunquebawopingcejidehexinluoji。nenggouyusuanfayanjiuyuanhekuangjiakaifagongchengshijinxinggaoxiaogoutong,qingxibiaodashipeiguochengzhongyudaodewentihexuqiu。
工作地點
地址:杭州餘杭區浙江省杭州市餘杭區五常街道雲創社區阿裏巴巴西溪園區2號樓
📍
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
BJCH..HR
武漢佰鈞成技術有限責任公司
-
請選擇
-
1000人以上
-
股份製企業
-
轉塘雲棲小鎮

杭州
2年以上
本科
2026-04-29 02:24:04
361人關注
注:聯係我時,請說是在杭州人才網上看到的。
