崗位職責(zé):
1. 參與基于深度學(xué)習(xí)和大語言模型(如 Transformer、GPT、BERT 等)的算法開發(fā)、優(yōu)化及部署;
2. 負責(zé)大語言模型的微調(diào)、優(yōu)化、推理加速及部署
3. 研究并實現(xiàn)前沿的自然語言處理(NLP)技術(shù),提升模型在文本生成、語義理解、問答系統(tǒng)等任務(wù)上的表現(xiàn);
4. 參與大模型訓(xùn)練數(shù)據(jù)的清洗、整理和增強,提升模型的泛化能力和魯棒性;
5. 設(shè)計并優(yōu)化模型評估方法,提升訓(xùn)練和推理效率,降低計算資源消耗;
6. 參與相關(guān)應(yīng)用系統(tǒng)的開發(fā),包括 API 接口封裝、模型服務(wù)化、工程部署等;
7. 關(guān)注前沿 AI 研究成果,分析行業(yè)趨勢,并推動新技術(shù)的落地和應(yīng)用;
8. 配合產(chǎn)品團隊,支持基于大模型的智能應(yīng)用(如智能助手、自動摘要、代碼生成等)的開發(fā)與優(yōu)化。
任職要求:
1. 計算機、人工智能、數(shù)學(xué)、統(tǒng)計學(xué)或相關(guān)專業(yè),碩士及以上學(xué)歷(優(yōu)秀者可放寬至本科);
2. 熟悉深度學(xué)習(xí)框架(如 TensorFlow、PyTorch),具有大規(guī)模模型訓(xùn)練和優(yōu)化經(jīng)驗;
3. 熟悉 Transformer 結(jié)構(gòu),掌握主流大語言模型(如 GPT、LLaMA、T5、Mistral)的架構(gòu)及訓(xùn)練方法;
4. 具備扎實的 Python 編程能力,熟悉 C++/CUDA 者優(yōu)先;
5. 具備 NLP 相關(guān)任務(wù)(如文本分類、文本生成、知識圖譜等)的實戰(zhàn)經(jīng)驗;
6. 具備良好的數(shù)學(xué)基礎(chǔ),熟悉優(yōu)化算法、概率統(tǒng)計、信息論等相關(guān)知識;
7. 具備較強的團隊合作能力、學(xué)習(xí)能力和問題解決能力,能夠快速適應(yīng)新技術(shù);
8. 發(fā)表過相關(guān)學(xué)術(shù)論文(如 NeurIPS、ICLR、ACL、CVPR)或有開源項目經(jīng)驗者加分。
9. 對機器數(shù)據(jù)模型有了解者加分(如Yolo,ResNet等)。
加分項:
1. 有大模型 LoRA、QLoRA、MoE 相關(guān)經(jīng)驗;
2. 具備模型蒸餾、剪枝、量化等模型優(yōu)化經(jīng)驗;
3. 熟悉 AI 推理加速(如 TensorRT、ONNX Runtime)或高性能計算(HPC);
4. 熟悉云端 AI 訓(xùn)練與推理環(huán)境(如 Hugging Face、DeepSpeed、ColossalAI)。